terça-feira, 17 de maio de 2022

O problema de Frege

Coloca o problema da diferença de valor cognitivo entre nomes diferentes para o mesmo objeto[i]

SSR[ii] começa com a questão da identidade, com enunciados do tipo x = y (é). Héspero é Fósforo.  Nome (verbo) nome. Nesse caso, se igual, se trata do mesmo objeto, o que pode não ser o caso quando, por exemplo, Pelé = Maradona. Ruffino chama a atenção para a tradução do termo alemão entre identidade e igualdade no português, que ele prefere pelo primeiro, já que a identidade, estritamente falando, é do objeto com ele mesmo.

Depois de tratar da natureza da identidade, Ruffino aborda a forma da identidade, que separa dois nomes pelo símbolo da identidade (=) ou o verbo ser na terceira pessoa do singular, conforme dito acima. O “é” significa duas coisas dos ponto de vista lógico, uma é a identidade e outra é subsunção ou instanciação de uma categoria por um objeto. Por exemplo, a estrela é vermelha, quer dizer que a estrela instancia a propriedade de ser vermelha, qual seja, vermelho predica a estrela. No outro caso, a relação é do objeto com ele mesmo.

Portanto, “a é b”, pode ser “a tem uma propriedade b”, de categorias diferentes, um particular e um universal, já a identidade se dá entre coisas do mesmo nível, por exemplo, Pelé é Edson Arantes do Nascimento. Bem, essa é uma certa confusão do verbo ser, dada pela linguagem e o que, inclusive, levou Frege a tentar deixar mais claras tais relações, como no desenvolvimento da linguagem formal, tratando cada relação com símbolos diferentes.

A partir da discussão da identidade, Frege chega na questão do sentido, além da referência, que é um caso particular de um problema mais geral no qual, aonde ocorre um nome dentro de uma expressão linguística, ao trocar o nome por outro do mesmo objeto, haverá uma diferença de valor cognitivo entre as duas expressões. “O rei Pelé jogou no Santos” e “Edson Arantes jogou no Santos” são duas sentenças com nomes diferentes para a mesma entidade, mas que, para um estrangeiro, será uma informação nova. Termina Ruffino: como explicar essa diferença cognitiva se estamos falando do mesmo objeto o tempo todo?



[i] Um resumo, quase transcrição de https://www.youtube.com/watch?v=kcFTJBF_gS0, “Filosofia da Linguagem - Ep. 2: O problema de Frege”.

[ii] Sobre Sentido e Referência.

segunda-feira, 16 de maio de 2022

Além da referência, o sentido

Sobre o objeto da filosofia da linguagem em uma introdução às ideias de Frege [i]

Se a semântica estuda significados, a filosofia da linguagem é um estudo geral do significado e, nesse sentido, não empírico, isto é, não é um levantamento do significado que as pessoas atribuem a cada palavra ao longo do tempo, etc. Logo, a semântica filosófica vai olhar o tipo do significado de acordo com categorias linguísticas como, por exemplo, os advérbios, adjetivos, nomes próprios, etc.

Dentre essas categorias, os nomes próprios possuem um tipo de significado peculiar porque versam sobre apenas um indivíduo, embora caiba ressaltar que nem todo sujeito gramatical é um nome próprio[ii]. De todo modo, há indivíduos particulares como George Bush, Edson Arantes ou Caçapava, que se ligam a objetos. Já a expressão “amarelo” é um adjetivo, qual seja, uma propriedade de uma multiplicidade de objetos. Também "caneta" se refere a todos os objetos com a propriedade de ser caneta. Mesmo os algarismos são nomes, do ponto de vista semântico. Por exemplo, 10, um número dez, um objeto. Do que se conclui, do que foi dito, que um nome próprio designa um objeto particular, por oposição aos universais, relações, etc.

Então, Ruffino retoma questão de Kripke[iii]: que tipo de significado os nomes próprios têm e por quê? Bem, esta é uma reflexão antiga, mas que fica sistemática a partir de Frege (XIX): a problemática dos nomes próprios e sua contribuição semântica em uma proposição[iv]. Mas Kripke rompe com a tradição inaugurada por Frege, que se interessava pela natureza da aritmética e por sua fundamentação epistêmica. Ora, em que é baseada uma ciência que trata de operações sobres números? Desde Platão, a aritmética é paradigma de uma ciência conhecida à priori. Se a matemática pode ser aprendida contando-se objetos, sua justificação é dada de maneira inata. Não está na experiência, mas na razão, ideias, formas, etc. Mas, para Frege, qual a fonte?

A aritmética, conforme Kant chamou a atenção, tem aplicabilidade universal. Frege, para entender as fontes da aritmética, procurou representar as etapas do raciocínio aritmético para verificar se havia elemento empírico ou a intuição pura kantiana, daí uma ciência sintética a priori. Frege, por seu lado, acreditava ser analítica.

Em1879, ele trata da escrita conceitual pela proposta de uma linguagem formal para modelar raciocínios matemáticos. Considerado o pai da lógica contemporânea, traz uma teoria geral dos significados que compunham essa linguagem [simbólica]. Linguagem artificial que representa os raciocínios lógicos e introdução dos quantificadores. Dada a época, havia uma pressão pelo rigor matemático, e de raciocínios clarificantes que podiam se dar nessa linguagem formal.

Já em1892, Sobre o sentido e a referência apresenta a referência como significado: “isso significa aquilo”. Ele investiga a conotação semântica: que tipo de significado linguístico as expressões têm. E mostra que os nomes próprios não tem um único significado, conforme falamos acima, mas dois: um é a coisa no mundo que a palavra designa, um indivíduo, referência, entidade no mundo. Entretanto, além da referência, o sentido (sínn), é uma caraterística objetiva das palavras. Ruffino explica que, para cada pessoa, um nome pode conter um significado com conotação subjetiva, mas há um sentido objetivo que é [quase] o mesmo para todos.

Por exemplo, há duas designações de Vênus: a estrela da tarde e a estrela da manhã, Héspero e Fósforo. Mas o nome próprio designa um objeto particular e, nesse caso, há duas expressões que apontam para Vênus. Isto é, há duas perspectivas ou modos de apresentação para uma mesma referência. Há um segundo conteúdo cognitivo diferente e que é o mesmo para todo mundo. Sem saber que se tratava da mesma referência, havia os dois sentidos diferentes de Vênus. Assim como o número sete, que pode ter diversos sentidos objetivos, como os dias da semana, o número da sorte ou o número de gols da Alemanha. São perspectivas diferentes, diferentes formas de apresentação.

Enfim, há aqui um pontapé na problemática que Frege desenvolve em SSR e que trataremos, com a ajuda de Ruffino, com mais detalhes adiante.


[i] Um resumo, quase transcrição de https://www.youtube.com/watch?v=KwIcKdLdVs0, “Filosofia da Linguagem - Ep. 1: Introdução à Semântica Fregeana” e https://www.youtube.com/watch?v=kcFTJBF_gS0.

[ii] Aqui Ruffino lembra dos quantificadores: nenhum, todo, etc.

[iii] Que é mote do curso.

[iv] Proposição: sentença com significado.

quinta-feira, 28 de abril de 2022

Frege, filósofo da linguagem?

Traz um panorama das preocupações de Gottlob Frege[i]

Filho argumenta que Frege não deve ser considerado um filósofo da linguagem porque a questão do significado não é central na sua filosofia. De acordo com o autor, Frege tem um projeto de fundamentar a aritmética na lógica, projeto que é um dos precursores da lógica moderna e conhecido como logicismo[ii]. Além disso, essa proposta viria na esteira kantiana de tratar a matemática como um conhecimento a priori, mas compostos de intuições puras e, nesse sentido, com proposições sintéticas a priori. Entretanto, para Frege, a geometria, sim, dependeria de intuições puras, haja vista a sua dependência espacial, já a aritmética, caso rompendo com essa premissa, seria feita de proposições analíticas.

Isso posto, não se pode negar a contribuição de Frege para a filosofia da linguagem, embora seu conhecido artigo Sobre o sentido e a referência busque mais resolver problemas de sua lógica formal do que estabelecer uma teoria semântica. Em SSR, sempre de acordo com Filho, Frege investiga se a identidade é uma relação entre objetos ou entre os nomes dos objetos, para concluir que há problemas em ambos os casos, tornando-se necessário lançar mão do sentido. Pois bem, nas sentenças:

(1) A Estrela da Manhã é a Estrela da Manhã

(2) A Estrela da Manhã é a Estrela da Tarde

Temos que, (1) é mera tautologia, mas (2) traz uma informação nova, nada menos que uma descoberta astronômica e, aí, tais sentenças têm conteúdo cognitivo diferente. Bem, se a identidade fosse apenas de objetos, qual seja, do tipo a = a, estaríamos falando sempre de Vênus, mas isso não explicaria a diferença de conteúdo cognitivo entre ambas. Então, a identidade de objetos não da conta dessas sentenças de identidade que se referem ao mesmo objeto, mas que tem conteúdo cognitivo diverso.

Por outro lado, a identidade também não poderia ser uma identidade entre os nomes de objetos, pois essas atribuições podem ser arbitrárias e não trazem conteúdo cognitivo relevante como em 4 = IV ou 4 = <símbolo de espadas>. Já em 4 = <raiz quadrada de 16> há um conteúdo cognitivo relevante, muito além da trivialidade de a = a ou da arbitrariedade que acabamos de mencionar. Então, nem o símbolo (o nome do objeto), nem a referência (o objeto) são suficientes para a identidade, donde surge o sentido como modos diferentes de apresentar um mesmo objeto. Conforme Filho: “Agora, de SSR em diante, é a noção referência que cumpre o papel de valor semântico das expressões da linguagem formal de Frege” (p. 13). Como ele acaba de realizar através do uso dos nomes próprios para fazer a distinção entre sentido e referência.

Porém, o que traz complicações ao tomar Frege para a realização de análises de linguagem é que, na continuação de SSR e conforme explica Filho, Frege usará o valor de verdade[iii] como para o papel de referência para sentenças, ou seja, seu valor, mas isso atende a um ponto de vista da linguagem formal. Ora, isso faz com que:

(3) Aristóteles é grego e

(4) 2 + 2 = 4

Tenham a mesma referência, soando estranho do ponto de vista de uma teoria do significado. Mais ainda, como valores de verdade são objetos, há uma equiparação entre sentenças e nomes próprios que torna essa teoria indesejável do ponto de vista da linguagem.



[i] Resgata trechos da aula inaugural do curso de Filosofia da UFSJ, ministrada no dia 21 de agosto de 2008 pelo professor Abílio Rodrigues Filho. Acesso em 09/04/2022 pelo endereço eletrônico: https://ufsj.edu.br/portal-repositorio/File/Ab%EDlio%20Rodrigues.pdf.

[ii] Nosso intuito inicial era começar um estudo mais aprofundado da filosofia da linguagem por Gottlob Frege, que parece ser o pai da lógica moderna, até nos depararmos com esse texto que estamos tratando.

[iii] Na Conceitografia (CG) Frege tentou usar conteúdos conceituais como valores semânticos de sentenças, mas sem sucesso. A noção de conteúdo conceitual versa que duas sentenças têm o mesmo conteúdo conceitual quando são intersubstituíveis, porém essa tese apresentou inúmeros problemas que viriam a ser resolvidos na SSR. Vale ressaltar que a CG cria uma linguagem formal como um sistema completo de lógica proposicional e de predicados jamais visto desde Aristóteles.

segunda-feira, 25 de abril de 2022

A nossa teoria sobre como o mundo é

Introdução e os principais pontos de Linguagem e Verdade[i]

Pettersen inicia a aula com uma citação de Palavra e Objeto (1960), da p. 13, que trata da linguagem como arte social, construída intersubjetivamente e cujo significado provém do que é expresso e observável. Ou seja, a linguagem é pública e mesmo a filosofia se expressa nessa linguagem, na forma como falamos e que a molda, e que também molda as possibilidades de refletir, de negar, etc. A filosofia depende da língua falada e da linguagem como ordenadora do pensamento, conforme ressalta Pettersen, o que vai contra uma ideia de filosofia universal. A questão da intersubjetividade ressalta que somos pautados pelos interlocutores e dentro de um contexto cuja chave de leitura / tradução deve ser dada para que nosso pensamento se torne acessível.

Segundo Pettersen, Quine pretende responder como entender o pensamento de um grupo completamente distinto do nosso e que se expressa em uma linguagem que não conhecemos, no que se chama tradução radical. Ele verifica a radicalidade do pensamento e de como ele está expresso em uma língua.

Resumidamente, o que veremos aqui é o primeiro capítulo, no qual Quine passa do como aprendemos a linguagem até o discurso científico, apoiando-se em dois princípios: o empirismo, que é fonte de evidência e o behaviorismo. Já no segundo capítulo, em uma próxima resenha, Quine veremos o argumento da tradução radical, ou seja, de como comunicar o discurso para outra pessoa, da qual não temos conhecimento prévio.

Então, o capítulo 1, cujo título é Linguagem e Verdade, já mostra a busca de Quine por proposições verdadeiras. Ele parte do conhecimento empírico por meio de nossa superfície sensorial e, aí, começa o processo de entificação, bem como o aprendizado da linguagem por observações da pronuncia alheia. E esse empirismo, de acordo com Pettersen, é um antidoto ao relativismo ou incerteza e, sendo base do conhecimento, é fundante da linguagem comum e da ciência, que é evolução autoconsciente do senso comum (e também a filosofia como continuação da ciência). Se a linguagem depende do contexto, conforme Wittgenstein, Quine acrescenta que é necessária uma fonte de validação.

Já sobre o behaviorismo, um “ai” pode ser aprendido pela sociedade como dor e, nesse caso, gera uma recompensa de nossa parte ou se percebemos um blefe, por exemplo, pode ocorrer penalização. Lembremos do reflexo condicionado de Pavlov[ii] com seu cão – aprendizado por repetição e Skinner que baseia a tese de comportamento humano no behaviorismo, sendo seguido por Quine.

Isso posto, há uma triangulação (professor-texto-aluno) para que o aprendizado ocorra, há três aspectos:

1. Do ponto de vista do aluno, ele percebe as coisas do mundo de maneira similar (empírico).

2. As coisas também são similares do ponto de vista do aluno e do professor (intersubjetivo).

3. Professor possa corrige e incentiva o aluno (recompensa-punição).

Entretanto, há uma uniformidade linguística, já que a forma externa do falar é igual, embora a parte interna de cada um, do aprendizado, seja diversa[iii]. Quer dizer, temos a mesma percepção de mundo. E vamos aprendendo a partir de palavras simples, que são unidades, que depois vão se juntando em frases mais complexas. Então, frases mais longas são feitas de fragmentos, alguns já aprendidos e outros que vão sendo aprendidos e testados, verificados. Já o aprendizado por ostensão[iv] necessita de conhecimento de fundo, de entender o sinal, etc. Se o padrão de condicionamento varia entre cada pessoa, há pontos de congruência em geral.

Ora, se o caminho de aprendizado da linguagem comum é aquele experimental, por que o da filosofia não seria? Bem, para Quine aprendemos a linguagem a partir de frases inteiras, contextualmente ou por analogia ou, por fim, por descrição. Isto é, aprender uma linguagem é aprender uma teoria sobre como o mundo é. A língua portuguesa nos dá uma visão de mundo, assim como outras línguas dão visões de mundo diferentes. A visão de mundo depende do conhecimento prévio, mesmo entre pessoas da mesma língua de acordo com suas vivências.

Quine pontua que há aspectos da linguagem que estão afastados da experiência[v], mas as porções ligadas ao mundo nos permitem entrar no campo da linguagem, nos comunicar e atingir a objetividade necessária. A partir daí, toda a linguagem deve ser organizada em nossa teoria do mundo, da mesma forma que um cientista, com simplicidade (organizar o conhecimento da maneira mais simples e, aqui, Pettersen lembra da navalha de Ockham), familiaridade, que é: explicar novas questões a partir das velhas leis familiares de nossa visão de mundo e, por fim, a razão suficiente, que se dá por meio de uma explicação racional, conforme herança de Leibniz, informa Pettersen. 

Por fim, Quine ressalta que não reduziu sua ambição de modo que caia em uma doutrina relativista, mas continua dentro de uma teoria de mundo particular baseada nas crenças do momento e, com o uso do método científico, aperfeiçoando e sendo capaz de julgar a verdade seriamente, com as devidas correções que sempre hão de se fazerem necessárias. Se a melhor ferramenta que temos para falar sobre o mundo natural é a ciência e a que traz as melhores evidências de explicação, sigamos com o vínculo empirismo.


[i] Resenha de Quine - Capítulo I de Palavra e Objeto, disponível em: https://www.youtube.com/watch?v=u-n_XW40_5s, https://www.youtube.com/watch?v=E3ClMyjcpkU e https://www.youtube.com/watch?v=elL_xRAeRrw. Prof. Bruno Pettersen. Willard van Orman Quine (1908-2000). Alguns trabalhos: Dois Dogmas do Empirismo, Sobre o que há, Relatividade Ontológica, e Epistemologia Naturalizada.

[ii] “Ivan Pavlov, um médico russo do início do século 20, treinou cachorros para que eles ficassem com água na boca sem que houvesse nenhuma comida por perto. Funcionava assim: toda vez que os bichos eram alimentados, o médico tocava uma sineta. Com o tempo, os cães começaram a associar as badaladas à comida. Conforme Superinteressante: https://super.abril.com.br/ciencia/o-que-e-o-cao-de-pavlov/.

[iii] As árvores possuem as mesmas formas, vistas de longe, mas os galhos internos são diferentes.

[iv] Ato ou efeito de mostrar, https://www.dicio.com.br/ostensao/.

[v] Em Hume todo conhecimento vinha da experiência, no esquema impressão-ideia, o que não é o caso de Quine que trabalha no campo da linguagem, conforme nota da aula. 

terça-feira, 5 de abril de 2022

A pedra fundadora da sociologia da ciência

Visa conceituar o reportório usado por Merton ao inserir a ciência como objeto de investigação sociológica[i]

Shinn e Ragouet conceituam a abordagem de uma ciência funcionalista e estratificada como tendo uma perspectiva sociológica diferenciacionista. Isso porque, nessa visão, não basta, por exemplo, elencar os pais da ciência moderna ou as teorias científicas, suas ideias e fatos, já que tudo isso, por si só, não explica o desenvolvimento da ciência. Para o sociólogo da ciência, dentro da perspectiva funcionalista, é recorrendo ao processo de institucionalização da ciência, com suas normas e um sistema de retribuição, que se pode explicar a existência da ciência.

A sociologia da ciência nasce a partir da tese de doutorado de Robert Merton, em 1938, que analisa, de um ponto de vista sociológico, a revolução científica que ocorreu no final do século XVII, na Inglaterra. Naquele contexto, segundo Merton, a ciência surge como um subsistema social quase autônomo, baseado em valores e normas específicos que demarcam suas fronteiras. Há organismos como a Royal Society, fundada em 1662, que constituem uma comunidade científica dividida em papéis científicos que subordinam as descobertas e teorias científicas, fazendo com que os trabalhos de cientistas como Newton e Boyle sejam insuficientes para operar a transformação do modo de conhecimento da sociedade.

Ora, a Royal Society Londrina é um espaço que permite o estabelecimento de procedimentos, modelos de excelência e protocolos de avaliação que trazem a profissionalização científica e, com isso, sua autonomia. Porém, há dois fatores da época que impulsionam a ciência: por um lado, as transformações econômicas de uma nação que tem ambições imperialistas fazem com que a ciência responda a desafios tecnológicos; por outro, o puritanismo inglês que, embora não sendo uma condição social necessária, conjuga valores com a ciência, como: revelar a ordem da natureza que seria reflexo da ordem divina, se orientar por atitudes como rigor, esforço e aprendizado, pelo conhecimento, reflexão e crítica, além da noção de realização material. Tudo isso gera um ambiente ideológico que favorece o florescimento da ciência.

E são as instituições, academias de ciências que também aparecem em outros países que trazem um papel regulador dos critérios de certificação científica e validação, bem como um sistema de retribuição e premiação que instaura uma hierarquia dentro das comunidades científicas tornando a ciência sistema distinto e relativamente autônomo, que pode resistir à intrusões e pressões de atores políticos e econômicos.

Para Merton, a comunidade científica se divide em quatro papéis: a maior parte entre pesquisadores e professores (pesquisa e ensino), os mais seniores mais participantes da administração e o papel de sentinela que é compartilhado por todos e diz respeito à definição da orientação da pesquisa, avaliação dos resultados e controle dos atores. Em um artigo de 1942, Merton define as quatro normas que constituem o ethos da ciência: o universalismo, referente aos critérios impessoais que devem ser perseguidos pelos cientistas; o comunalismo, que visa o bem público e contrário à ideia de propriedade intelectual; o desinteresse, isto é, procura pela verdade, honestidade e intersubjetividade; e o ceticismo organizado que rejeita a autoridade e aberto a críticas.

São essas normas que fazem da ciência um sistema distinto assegurando-lhe estabilidade e regulação. Isto, segundo alguns diferenciacionistas, seriam normas da ciência pura em oposição à ciência aplicada guiada pela patente ou segredo industrial inserida em um sistema autoritário de relações e sob a forma de uma expertise técnica destinada a resolver problemas pontuais associados ao lucro empresarial. Porém, enfatizam os autores, nem sempre os pesquisadores se guiam por tais normas citando como exemplo o Projeto Apolo, nos anos 60, no qual os cientistas eram movidos pelo ganho pessoal e ambição, colocando em dúvida a existência do ethos científico. Então, elas tenderiam a serem normas mais ideais do que operatórias.



[i] Controvérsias sobre a ciência: por uma sociologia transversalista da atividade científica. Terry Shinn e Pascal Ragouet. Tradução de Pablo Rubén Mariconda e Sylvia Gemignani Garcia. São Paulo: Associação Filosófica Scientiae Studia: Editora 34, 2008. Páginas 14 a 23.

segunda-feira, 7 de fevereiro de 2022

Níveis de processamento linguístico

Enumera as camadas linguísticas que um bom processador de língua natural deve percorrer, além de trazer aspectos de divisão no campo da linguísticas e notas de implementação[i]

Introdução

Pardo traz questões iniciais sobre a nossa relação com a linguagem, com o mundo pela linguagem e mesmo se a nossa cognição sofisticada depende da linguagem. A linguagem seria algo genético? É uma manifestação do inconsciente (Lacan)? Pensamos em alguma língua, por exemplo, em português? Harari[ii], conforme mostra Pardo, destaca o papel da linguagem em nossa evolução e cunha a Revolução Cognitiva em um período entre 70 a 30 mil anos atrás, tendo como teoria mais aceita mutações genéticas acidentais. Já Daniel Everett[iii], que morou no Brasil, traz o pensamento de Chomsky da linguagem inata, a gramática universal, codificada geneticamente. Se é assim, já nasceríamos com a gramática. Mas Everett rechaça essa ideia, por falta de provas de tal hereditariedade ou gene da linguagem (FOXP 2), existente em outros animais. É aí que entra o dilema da IA, a dificuldade de nós explicarmos nosso cérebro. E a dificuldade de um cérebro artificial[iv]. Isso mostra como essas questões linguísticas influenciam a tecnologia da linguagem.

Níveis de processamento da língua

Para observar os níveis linguísticos podemos nos utilizar da ferramenta do LX-Center[v]. Há o silabificador que quebra sílabas das palavras, segmentando-as; o POS-tag (etiquetador de partes do discurso) anota as classes gramáticas[vi] das sentenças; parser (analisador) de dependência, é um analisador sintático, além das classes gramaticais: sujeito, predicado, etc.; parser de constituintes, que monta a estrutura sintática em forma de árvore, grupos nominais, grupos verbais; reconhecimento de entidades: pessoa, organização, localidade, etc., precisa de contexto e análise semântica[vii]; entre outros. É uma boa ferramenta, mas podemos ver que ainda comete erros. Mas, afinal, pergunta Pardo: de que uma máquina precisa para entender a nossa fala e interagir adequadamente?

Há vários níveis de conhecimento que se dividem em uma cadeia de complexidade e abstração. Abaixo a categorização dos conhecimentos, mostrando o eixo do texto falado separadamente[viii], embora os níveis estejam todos conectados.

Fonética e Fonologia. O primeiro é o sistema físico de produzir sons e o segundo está no contexto da língua, fonemas, transcrição fonética[ix], como pronunciar cada som.  

Morfologia. São os componentes das palavras, morfemas: raiz ou radical, vogal temática, prefixo, sufixo, etc.

Morfossintaxe. Junta palavras e frases para achar as classes gramaticais, vê o comportamento da palavra dentro da frase, substantivo, preposição, verbo, etc. É a etiquetação morfossintática (POS-tag). Segundo Pardo, chegam a um acerto de 98% em português. Aí estaria o “2 milhões de pessoas morreram”, exemplo de Thiago, se milhões é numeral ou substantivo, etc. A dificuldade com os advérbios, que estariam na “caixinha do resto”, que não couberam em outras classes gramaticais.

Sintaxe. A sintaxe foca na formação das sentenças, como as palavras se combinam. Ocorre no nível da frase, em que posição as palavras ocorrem. As funções: sujeito, predicado, objetos, etc. A estruturação: sintagma nominal, sintagma verbal. É possível ver graficamente e ver os constituintes, fazer a sua análise de dependência. As árvores chegam a 96, 97% de acerto.

Semântica. É o significado, há vários modelos e representações. Significado de palavras, expressões, orações e mesmos textos inteiros. Lexical, composicional e textual. Bola para ser chutada. Bota: calçado. Bater as botas? É para tirar a terra ou morrer? Significado não composicional. Pode-se tentar categorizar cada palavra, conforme o exemplo abaixo.

Significado por classes, como traços semânticos a partir de taxonomias do concreto e o abstrato, animado e inanimado, etc., são as ontologias. É o que os word embeddings tentam fazer. Há papéis semânticos, como o agente, o tema, o instrumento, etc. “O menino chutou a bola”. Menino é agente, é humano. Bola é tema, artefato. Há relações lexicais: sinônimos (casa/lar), antônimos, hiperonímias, holonomia (todo e parte) e assim por diante.  Expressões idiomáticas, metáforas, ironias, etc. Banco de sangue ou banco para sentar: polissêmico, pois há primitiva em comum, sempre é um depósito. Manga de camisa ou manga fruta? É homonímia, pois não tem primitiva em comum, não se sabe o processo que chegou a esses significados, talvez pela falta de conhecimento da origem de cada uso da palavra.

Pragmática e Discurso. O último nível, acima da semântica, está além da sentença, é o nível do todo. Está no nível do relacionamento entre as frases, correferências, intenções, tópicos. Por exemplo, a dificuldade de um assistente virtual de manter o contexto, o histórico da conversa. De uma indecisão de duas frases pode surgir uma dúvida em uma terceira. Há conexões no nível discursivo.

Já a pragmática tem a ver com o contexto de uso, os participantes do diálogo. Força, educação, hierarquia, atitude, etc. Quem está falando? Coisas que estão fora do texto, estilos de escrita e fala, formalidades, protocolos. São coisas da esfera da sociolinguística.

Implementação

Então, tais níveis de conhecimento devem ser formalizados para uso por computadores, e levando em consideração a interação entre eles, ou seja, a simultaneidade. Levar em consideração ambiguidades, variedades, vagueza. São situações que humanos podem tratar, mas que as máquinas precisam ser preparadas. “O coelho foi servido” e “O homem foi servido” são exemplos ilustrativos.

Diante disso, devemos quebrar o problema em partes: a fase linguística, onde o foco é o corpus, fase de representação na qual são formalizadas as regras, criação de embeddings e fase de implementação que é o desenvolvimento, pré-processamento, confecção da interface, ou seja, o sistema em si[x].  No trajeto tenta-se chegar ao máximo possível na fase de implementação. Sem esquecer que cada área tem que aprender um pouco das outras áreas, seja um informata saber de Saussure ou um linguista de Turing.

Podem haver sistemas com pouco conhecimento linguístico (mais simples) e outros mais profundos, mais semânticos. O conhecimento pode ser representado simbolicamente com árvores, com tabelas, estatísticas. Regras são mais rígidas e padrões mais facilmente aprendidos. O conhecimento também pode ser obtido por linguistas ou de maneira automática e depois revisto.

Disputas linguísticas

Pardo cita Robert Dale, sobre combinar técnicas simbólicas (racionalistas) e não simbólicas (empiristas). São correntes filosófico-linguísticas. Chomsky impulsionou o racionalismo entre os anos de 60-85, postulando uma linguagem inata devido à complexidade para aquisição da linguagem. É a linha da gramática universal, do gerativismo. Então deveríamos olhar para dentro do cérebro, como pensamos, isto é, extrair regras de inferência por meio da inteligência artificial. Chomsky enfatiza um órgão da linguagem que realiza cálculos combinatórios e permite a recursividade. O empirismo anterior a Chomsky (20-60) se baseava em operações gerais de associação e reconhecimento de padrões, ressaltando a importância dos estímulos sensoriais.

Nesse sentido, vem a necessidade do recorte de textos pela criação de córpus. Daí vem a pergunta inversa: como aprendemos tão pouco se há tantos dados? É um direcionamento para o aprendizado de máquina, que vem com a importância que o empirismo adquire novamente. Chomsky estava mais interessado na competência linguística, no conhecimento do falante, ao passo que os empiristas focam no desempenho linguístico, isto é, o uso. Busca de padrões e convenções, não se guiando tanto pelos princípios categóricos que podem variar. Olham-se hoje os córpus e a busca por erros. Já para Eric Laporte, essas diferenças já não são tão evidentes. Há um ciclo entre intuição e exemplos.

Histórico PLN e teoria

Por outro lado, PLN fundou-se nas décadas de 40 e 50 com o uso de gramáticas e autômatos. Os próximos 20 anos dividiram-se entre simbólicos e estatísticos e a criação dos primeiros córpus on-line. A década de 70 trouxe quatro paradigmas: estocástico, lógico, interpretação textual e discurso. Já a partir de 80 o empirismo voltou com força e destacou-se a medição de dados e avaliação de resultados. O fim da década de 90 é de fortalecimento da área de PLN junto com a web, modelos baseados em dados e exploração comercial. De 2000 para cá a predominância é do aprendizado de máquina (redes neurais), sejam supervisados ou não, aprendizado profundo, grandes conjuntos de dados e modelos distribucionais (numéricos).

Em PLN há uma classificação básica de recursos estáticos (dicionários, léxicos, córpus com ou sem anotação), ferramental de processamento (tokenizadores, analisadores sintáticos, classificadores de polaridades) e aplicações (ferramentas de usuário final, tradutores, revisores ortográficos, minerador de opinião). Em termos de tendências, disparam tópicos de pesquisas relacionadas ao processamento dos textos de redes sociais, análises de sentimentos, assistentes inteligentes, abordagem multimodal (vídeo, imagem, som, legendas). Os embedding treinados pela indústria (word2vec, BERT). Também tratamento de língua cruzada, escalável e agnóstico ao uso específico. Por outro lado, há usos minoritários como preservação de línguas indígenas. E é por aí que vamos nos achando...



[i] Esse texto é uma síntese da aula 2 da disciplina de Processamento de Linguagem Natural, ministrada pelo Prof. Thiago A. S. Pardo no ICMS-USP-SC.

[ii] Sapiens: Uma Breve História da Humanidade é um livro de Yuval Harari publicado primeiramente em 2014, embora tenha sido lançado originalmente em Israel em 2011, com o título Uma Breve História do Gênero Humano (Wikipédia).

[iii] Linguagem: a história da maior invenção da humanidade. Daniel L. Everett.

[v] Recursos linguísticos e tecnologia para português - Universidade de Lisboa | NLX - Grupo de Linguagem Natural e Fala: https://portulanclarin.net/workbench/lx-syllabifier/.

[vi] Preposição, pontuação, nome próprio, etc.

[vii] Por exemplo, cita Pardo, nas bases do ICMC: jornalística e tweets – há muita diferença.

[viii] Um corpus não é meramente um dataset, pois tem fenômenos linguísticos!!

[ix] IPA (https://www.internationalphoneticassociation.org/): is the major as well as the oldest representative organization for phoneticians

[x] Proposta de Bento Carlos Dias da Silva (https://bv.fapesp.br/pt/pesquisador/91982/bento-carlos-dias-da-silva/ ).

quarta-feira, 26 de janeiro de 2022

Introdução ao processamento de linguagem natural

Trata-se do primeiro texto de uma série que visa desvelar, mais tecnicamente do que filosoficamente, o processamento de linguagem natural, mas não sem buscar por bases linguísticas e refletir sobre pontos críticos[i]

A despeito de um uso já bastante disseminado, como, por exemplo, os corretores ortográficos, tradutores automáticos, reconhecedores de fala, assistentes virtuais e sistemas de recomendação, o processamento de linguagem natural (PLN) também avança em tarefas menos cotidianas (ainda), entre elas decodificação de códigos secretos[ii], tradutores universais capazes de ouvir um idioma e fazer a conversão a outro simultaneamente[iii] e, por fim, o famoso projeto GPT[iv], da empresa OpenAI, que é capaz de escrever diversos tipos de gêneros textuais.

Se a maioria das aplicações acima estão em franca evolução, Pardo ressalta alguns desafios, a começar pela exigência científica de que as ferramentas não só sejam competentes, mas tenham que desempenhar[v]. Isso implica, por exemplo, que o PLN deve ter uma decodificação universal, mas que não podemos nos esquecer de reflexões sobre a própria linguagem, entre elas, sua contemporaneidade com a evolução do cérebro/mente[vi], mesmo suas implicações com consciência humana, ou o que nos diferenciaria dos animais[vii], a semântica da língua, contexto linguístico [cultural], estrutura sintática e morfológica, que ela é hierárquica e recursiva, etc. Tudo isso leva ao objetivo de construir a inteligência artificial [de máquina], referente ao processamento de linguagem natural, com sua dependência de técnicas e dados.[viii]

PLN é transdisciplinar[ix], pois envolve fundamentação linguística, representações linguístico-computacionais, estatística e métodos computacionais, que envolvem técnicas simbólicas, redes neurais, etc., além de representação do conhecimento, que veremos aqui em um texto a parte.

De acordo com Pardo, consta que 2001 - Uma Odisseia no Espaço inspirou a ciência e a tecnologia, inclusive com a busca do PLN pela criação de um mecanismo que possibilidade copiar HAL – o robô da nave, ou seja, com muito conhecimento linguístico: fonética, fonologia, morfologia, vocabulário, semântica, uso das palavras, gramática, composição do discurso (conexão de várias frases) e, por fim, conhecimento de mundo para poder ter um diálogo inteligível com um ser humano, quer dizer, aprendizado do senso comum.

Ora, considerando a língua humana uma língua natural, código de comunicação, e a linguagem como algo que envolve os mecanismos físicos e cognitivos utilizados na comunicação, etc., deveríamos falar de um processamento de língua natural, à despeito do termo popularizado processamento de linguagem natural, que é uma sub área da IA. PLN, então, visa habilitar o computador a lidar com a língua, como se fosse uma pessoa.

O PLN, conforme o material, teria surgido na 2ª Guerra Mundial, através das tentativas de ingleses e americanos de descobrir os códigos russos. Embora tenha criado expectativas, logo houve uma frustação que passa a trazer resultados por volta dos anos 2000, não como uma inteligência que nos substituirá, mas que serve para nos apoiar.

Pardo lembra das origens das pesquisas, como o programa Eliza[x] que não tinha conhecimento suficiente de mundo e não era capaz de entender o contexto linguístico, por exemplo, não saber o que é era uma alergia. Isso significa que dá para conversar com a máquina, mas fazê-la entender é algo ainda difícil de conseguirmos implementar.

Já o GPT, citado anteriormente, usa rede neural em camadas com mecanismos de atenção (transformer) com capacidade de identificar o que é mais importante. Ele gera o texto a partir dos corpora que ele compõe, mas, ainda que muito superior à Eliza está muito longe do ser humano[xi]. Por fim, Pardo enumera outra série de ferramentas e aplicações que podem ser analisadas durantes as pesquisas de PLN, como WolframAlpha (https://www.wolframalpha.com/input/?i=what+time+is+it+now). Start para perguntas e respostas (http://start.csail.mit.edu/answer.php?query=what+time+is+it+now%3F), os famosos Watson (IBM) que usa computação cognitiva e teria superado humanos em um jogo, os assistentes virtuais Siri (Apple), Alexa (Amazon) e o da Google.

Por fim, Pardo cita o LX-Suite[xii] que permita fazer testes de análises linguísticas e um primeiro contato com os termos da área de PLN. Ele faz o parse das sentenças e termos como o VISL (https://visl.sdu.dk/visl/pt/), que é um dos mais usados em língua portuguesa. Há também o OpenWordnet-PT que pode ser usado para desenvolvimento de programas em NLTK usando Python.

Bom, como pudermos ver nessa primeira aula, há muito para aprender e percorrer no caminho do PLN. Mãos à obra!



[i] Essa reflexão / artigo é uma síntese da aula introdutória da disciplina espelhada “SCC0633/5908 Processamento de Linguagem Natural”, ministrada pelo Prof. Thiago A. S. Pardo no ICMC-USP-SC e, na presente data (25/01/2022), com material aberto e disponível na internet.

[ii] Conforme slide do professor Pardo How Revolutionary Tools Cracked a 1700s Code, http://www.nytimes.com/2011/10/25/science/25code.html.

[v] Sobre desempenho, podemos lembrar da crítica foucaultiana de Byung-Chul Han (https://www.reflexoesdofilosofo.blog.br/2018/05/paradigmas-do-seculo-xxii.html), mas mais concretamente não podemos nos esquecer das críticas de um Ellul (https://www.reflexoesdofilosofo.blog.br/2021/07/em-busca-do-metodo-mais-eficaz.html) ou Feenberg.

[vii] Talvez uma discussão inócua, mas que passa pela capacidade de comunicação dos animais e a nossa, “mais avançada”, comunicação pela linguagem.

[viii] Pardo cita Big Data e mineração de dados, inclusive as críticas relacionadas e “desperdício de processamento”, isso consequência da dataficação, como sabemos.

[ix] Termo criado por Piaget em 1979, é o conhecimento de uma forma plural (https://www.significados.com.br/transdisciplinaridade/), ou seja, holística e contextualizada, rompendo a divisão das áreas do conhecimento e visando a compreensão dos fenômenos em sua totalidade.

[xi] Pode ser testado aqui: https://app.inferkit.com/demo.