Linguística quantitativa

A linguística quantitativa é uma subdisciplina da linguística geral e, mais especificamente, da linguística matemática. A lingüística quantitativa trata da aprendizagem de línguas, sua evolução e aplicação, bem como a estrutura das línguas naturais. Ela estuda línguas usando métodos estatísticos , mas também outros campos matemáticos. Seu objetivo mais exigente é a formulação de leis linguísticas e, em última análise, de uma teoria geral da linguagem, ou seja, um conjunto de leis linguísticas interdependentes. A lingüística sinérgica (sinergia sendo uma abordagem transdisciplinar) foi, desde o início, especialmente projetada para esse fim. A linguística quantitativa é empiricamente baseada nos resultados das estatísticas linguísticas, que correspondem às estatísticas da linguagem ou de objetos linguísticos. Esta área não está necessariamente ligada a ambições teóricas substanciais. A linguística de corpus e a linguística computacional são outras áreas que fornecem evidências empíricas importantes . Assim, a linguística quantitativa é um conceito muito amplo, pois abrange todos os métodos matemáticos aplicados na linguística. Como em todos os estudos transdisciplinares, a relação entre matemática e linguística (seja qual for o estudo) é uma dificuldade. Feitos originalmente por engenheiros , matemáticos, etc., esses links também interessam aos lingüistas hoje.

História

As primeiras abordagens à linguística quantitativa datam do mundo grego e indiano antigo. Uma das fontes históricas consiste em aplicações de combinatória a questões linguísticas. Outro é baseado em estudos estatísticos básicos. A taquigrafia e a criptografia são os primeiros campos linguísticos a ter uma abordagem quantitativa. Os criptógrafos estabeleceram tabelas de frequência de letras, e o estenógrafo Jean-Baptiste Estoup foi o primeiro a calcular as frequências relativas de palavras em um texto.

Leis da linguagem

Na linguística quantitativa, o conceito de direito designa um sistema de leis deduzido de hipóteses teóricas, formulado matematicamente e validado por um processo científico  : eles devem passar por numerosos experimentos e "resistir" a todas as refutações possíveis. Köhler escreve sobre essas leis: "Além disso, pode ser mostrado que essas propriedades dos elementos linguísticos e as relações entre eles estão em conformidade com leis universais que podem ser formuladas estritamente matematicamente, assim como são. Comuns nas ciências naturais. Lembre-se de que essas leis são estocásticos por natureza [aleatórios, invertíveis] e não são observados em todos os casos (isso não seria necessário nem possível), mas sim que determinam as probabilidades dos eventos ou as proporções estudadas; É fácil encontrar contra-exemplos .No entanto, estes casos não violam as leis correspondentes, porque as variações em torno da média estatística não só são admissíveis, mas mesmo essenciais, são - mesmo quantitativamente determinadas com exatidão pelas leis correspondentes. A situação é idêntica à das ciências naturais , que há muito tempo abandonou as velhas concepções determinísticas e causais do mundo para substituí-las por modelos probabilísticos. "

Algumas leis lingüísticas

Há um grande número de propostas de leis linguísticas, entre as quais:

Esta lei se aplica a outras unidades: letras ou caracteres de complexidade diferente, por exemplo. O mesmo vale para as distribuições de sons ( fonemas , unidade de som) de durações diferentes.

Lingüística e teoria da informação

A teoria da informação deriva da estatística em linguística. Teorizado por Claude Shannon , quantifica a informação de um conjunto de mensagens graças à codificação computacional segundo as leis da probabilidade. Nascido após a Segunda Guerra Mundial , é aplicado aos telefones para reduzir o custo do transporte de informações. Ele oferece um modelo geral de comunicação usado em linguística, mostrado abaixo:

Vamos acrescentar que o ruído designa o que perturba a transmissão da mensagem (por exemplo, longa distância, desatenção, ruído no senso comum). Para ilustrar este modelo, o transmissor pode ser um alto-falante, um dispositivo de rádio etc., o canal l ar, linha telefônica etc. Assim, o linguista Roman Jakobson usa esse modelo para definir seis funções de linguagem diferentes, que variam de acordo com os parâmetros desse modelo (ou seja, canal, remetente, ect de mensagem). Cada unidade linguística (por exemplo, letra, fonema, ect) é codificada; um vínculo é feito entre a unidade da mensagem e a unidade do código. Reduzir o custo de emissão significa, portanto, reduzir o número de links. Este último depende do número de unidades, mas também de sua frequência de aparecimento: assim, uma unidade é caracterizada por sua frequência de aparecimento (mais ou menos alta). Isso supõe um cálculo da frequência dos elementos linguísticos; nisso é uma aplicação direta de estatísticas. A informação fornecida por uma unidade é inversamente proporcional à sua frequência (intuitivamente, podemos dizer que uma unidade rara fornece informações). A redundância significa um sinal que não fornece nenhuma informação, de modo que a probabilidade é 1. Um sistema não redundante não contém tais unidades:

Sistema redundante Sistema não redundante
Contendo unidades sem informação Não contendo unidades sem informação
Exemplos: combinação de sons ou sistema alfabético Exemplo: sistema digital
Aplicação: "j'pr'l'tr '" = "Eu pego o trem", "Posso ir amanhã" = "Posso ir amanhã" Aplicação: "82,7" ≠ "823,74"

O estudo da redundância se estende a todos os elementos linguísticos; tem um valor prático (economia da informação, eliminação de informação supérflua) ou artístico (especialmente na poesia).

Estilístico

O estudo de estilos poéticos e não poéticos pode ser baseado em métodos estatísticos; além disso, é possível realizar pesquisas correspondentes com base em formas (parâmetros) específicas que as leis linguísticas assumem em textos de estilos diferentes. Nesses casos, a lingüística quantitativa apóia a pesquisa em estilística: um dos objetivos gerais é fornecer evidências tão objetivas quanto possível, incluindo pelo menos parte do campo dos fenômenos estilísticos, com referência às leis da linguagem. Um dos pressupostos centrais da linguística quantitativa é que certas leis (por exemplo, a distribuição de comprimentos de palavras) requerem modelos diferentes, pelo menos valores de parâmetros diferentes das leis (distribuições ou funções) dependendo do tipo de um texto. No estudo dos poemas, os métodos quantitativos em linguística formam uma subdisciplina do estudo quantitativo da literatura ( estilometria ).

Lingüística e lógica

Uma vez que a lógica está preocupada com a articulação do pensamento e a linguagem que o expressa, há uma ligação entre a linguística e a lógica (conforme refletido nos ensinamentos da escola primária , por exemplo, análise lógica . Da lógica que justifica a prescrição não é, no entanto, uma questão da linguística). As noções de inferência ou transitividade aplicam-se à linguística e à lógica. Um enunciado lógico às vezes é limitado por imprecisões linguísticas: assim, a natureza exata da coordenação pela conjunção "e" é um problema semântico , assim como a transitividade entre um elemento e sua classe. Esta última incerteza é baseada em ambigüidades lógicas: vejamos, por exemplo, as proposições "um gato é um animal" e "um elefante é um animal". Podemos inferir que "um pequeno gato é um pequeno animal"? E que "um pequeno elefante é um pequeno animal"?

Linguistas neste campo

Veja também

Notas

  1. "  linguística quantitativa  " , em fracademic.com ,2012(acessado em 23 de agosto de 2019 )
  2. Reinhard Köhler: Gegenstand und Arbeitsweise der Quantitativen Linguistik . In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein International Handbuch. de Gruyter, Berlin / New York 2005, pp. 1-16.
  3. Reinhard Köhler: Lingüística sinérgica . In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein International Handbuch. de Gruyter, Berlin / New York 2005, pp. 760–774. ( ISBN  3-11-015578-8 ) .
  4. NL Biggs: The Roots of Combinatorics. In: Historia Mathematica 6, 1979, pp. 109–136.
  5. cf. nota 1, pp. 1-2.
  6. cf. referências: Köhler, Altmann, Piotrowski (eds.) (2005)
  7. H. Guiter, MV Arapov (eds.): Estudos sobre a Lei de Zipf. Bochum: Brockmeyer 1982. ( ISBN  3-88339-244-8 ) .
  8. Alexander Mehler: Eigenschaften der textuellen Einheiten und Systeme . In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein International Handbuch. de Gruyter, Berlin / New York 2005, p. 325-348, esp. Quantitative Stilistik , pp. 339–340. ( ISBN  3-11-015578-8 ) ; Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. Lüdenscheid: RAM-Verlag 2008, ( ISBN  978-3-9802659-5-9 ) .
  9. Grzybek, Peter, & Köhler, Reinhard (eds.) (2007): Métodos Exatos no Estudo da Linguagem e do Texto. Dedicado a Gabriel Altmann por ocasião do seu 75º aniversário. Berlim / Nova York: ovelha Gruyter
  10. de: Benutzer: Dr._Karl-Heinz_Best
  11. índice
  12. por: Sergei Grigorjewitsch Tschebanow
  13. Best, Karl-Heinz (2009): William Palin Elderton (1877-1962). Glottometrics 19, pág. 99-101 (PDF ram-verlag.eu ).
  14. Homepage_Gertraud Fenk
  15. por: Ernst Förstemann ; Karl-Heinz Melhor: Ernst Wilhelm Förstemann (1822-1906) . In: Glottometrics 12, 2006, pp. 77–86 (PDF ram-verlag.eu )
  16. Dieter Aichele: Das Werk von W. Fucks . In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein International Handbuch . de Gruyter, Berlin / New York 2005, pp. 152–158. ( ISBN  3-11-015578-8 )
  17. de: Gustav Herdan
  18. Dimensão Herdan - Leis da Lingüística Quantitativa
  19. por: Luděk Hřebíček
  20. de: Friedrich Wilhelm Kaeding
  21. (de) Snježana Kordić , Wörter im Grenzbereich von Lexikon und Grammatik im Serbokroatischen [“  Palavras na área de fronteira do léxico e da gramática em Serbocroat  ”], Munique, Lincom Europa, col.  "Estudos em eslava linguística" ( N O  18),2001, 280  p. ( ISBN  3-89586-954-6 , OCLC  47905097 , LCCN  2005530314 , DNB  963264087 , SUDOC  083721398 , apresentação on-line ) , p.  280
  22. (de) Snježana Kordić , Der Relativsatz im Serbokroatischen [“  A cláusula relativa em Serbocroat  ”], Munique, Lincom Europa, col.  "Estudos em eslava linguística" ( N O  10),1999( Repr.  2002 e 2005) ( 1 st  ed. 1999), 330  p. ( ISBN  978-3-89586-573-2 e 3-89586-573-7 , OCLC  42422661 , DNB  956417647 , apresentação online , leitura online ) , p.  330
  23. Georg-August-Universität Göttingen - Lehfeldt, Werner, Prof. em. Dr.
  24. Festschrift por ocasião do 70. aniversário: Problemas da Lingüística Geral, Germânica e Eslava. Artigos para o 70º aniversário do Professor V. Levickij. Herausgegeben von Gabriel Altmann, Iryna Zadoroshna, Yuliya Matskulyak. Books, Chernivtsi 2008. (No ISBN.) Levickij dedicado: Glottometrics , Heft 16, 2008; Emmerich Kelih: Der Czernowitzer Beitrag zur Quantitativen Linguistik: Zum 70. Geburtstag von Prof. Dr. Habil. Viktor V. Levickij. In: Naukovyj Visnyk Černivec'koho Universytetu: Hermans'ka filolohija. Vypusk 407 , 2008, pp. 3-10.
  25. Human-Language-Computer - página inicial da equipe, ZJU
  26. Karl-Heinz Melhor: Paul Menzerath (1883-1954) . In: Glottometrics 14, 2007, pp. 86–98 (PDF ram-verlag.eu )
  27. Shizuo Mizutani; Retrato por ocasião do seu 80. aniversário em: Glottometrics 12, 2006 (PDF ram-verlag.eu ); sobre Mizutani: Naoko Maruyama: Sizuo Mizutani (1926). O Fundador da Lingüística Quantitativa Japonesa. In: Glottometrics 10, 2005, pp. 99–107 (PDF ram-verlag.eu ).
  28. Charles Muller: Iniciação à estatística linguística . Paris: Larousse 1968; Alemão: Einführung in die Sprachstatistik . Hueber, Munique, 1972.
  29. Rajmund G. Piotrowski, RG Piotrovskij; cf. Lei de Piotrowski: http://lql.uni-trier.de/index.php/Change_in_language
  30. de: Piotrowski-Gesetz
  31. Journal of Quantitative Linguistics 4, Nr. 1, 1997 (Festschrift in Honor of Juh. Tuldava)
  32. Dr. Andrew Wilson - Lingüística e Língua Inglesa na Lancaster University
  33. de: Albert Thumb
  34. de: Eberhard Zwirner

Referências

links externos