Tweets indígenas

Indígenas Tweets é um site que arquiva e exibe mensagens do Twitter ( tweets ) postadas em determinados idiomas minoritários . Originalmente, o site focava em línguas indígenas e tinha como objetivo ajudar os povos indígenas a se conectarem entre si. Posteriormente, o site foi aberto para línguas minoritárias não indígenas.

Em sua página inicial , o site exibe uma lista de línguas minoritárias cujos tweets gravou . Depois de selecionar um idioma, o usuário é levado a uma mesa com todas as pessoas que tuitaram naquele idioma. O site fornece a foto do perfil de cada seguidor do Twitter, bem como estatísticas sobre o número de pessoas que os seguem. O site também fornece a porcentagem de tweets que esse assinante postou em diferentes idiomas e tem uma seleção de temas populares em vários idiomas minoritários.

História

O site foi criado em março de 2011Kevin Scannell, pesquisador em linguística computacional no Departamento de Ciência da Computação da Universidade de St. Louis , St. Louis , Missouri , Estados Unidos .

Quando foi criado em março de 2011, o site listou 35 línguas minoritárias. O16 de abril de 2011, tweets foram postados em 76 idiomas. O26 de abril, o site estava interessado em 82 idiomas. Essas línguas incluem o Kamilaroi, bem como as línguas mais conhecidas, como o crioulo haitiano e o basco, que ocuparam respectivamente o primeiro e o segundo lugares no ranking das línguas com mais twitters, o terceiro lugar foi para o galês . Dentrojunho de 2015, O crioulo haitiano foi destronado pelo basco e pelo kiswahili .

Mineração de dados

Os Tweets Indígenas usam um banco de dados de palavras e frases para identificar pessoas que falam as línguas minoritárias listadas. Durante uma entrevista emabril de 2011Na BBC , Scannell disse que passou 8 anos construindo um banco de dados de quase 500 idiomas revisando blogs , artigos de jornais e sites .

“Muitas pessoas olham com apreensão para a tecnologia e coisas como tradução automática e redes sociais porque acham que irão promover a expansão de um idioma universal, bem como da cultura americana e inglesa. Eu vi coisas como Twitter e mídia social como uma oportunidade para línguas minoritárias. Um site como os Tweets Indígenas é um bom exemplo de site que permite que as pessoas se conectem e se comuniquem em seu próprio idioma naturalmente online. "

- Kevin Scannell, abril de 2011

O site categoriza os tweets pesquisando no banco de dados por palavras e frases específicas para determinados idiomas minoritários. A ferramenta de classificação do site não pode identificar o idioma de um tweet a partir de uma palavra se essa palavra existir em vários idiomas. Para evitar o problema, Scannell só usa palavras e frases em seu banco de dados que aparecem em um idioma.

Referências

  1. Lee, Dave, “  Microblog em língua materna no Twitter  ”, BBC News ,8 de abril de 2011( leia online [ arquivo de22 de abril de 2011] , acessado em 22 de abril de 2011 )
  2. Scannel, Kevin, “  site de Kevin Scannell  ” , Universidade de Saint-Louis ,2012(acessado em 11 de maio de 2012 )
  3. "האם האינטרנט יציל את הקולות שהוא משתיק" Haaretz (em hebraico). arquivado do original em 22 de abril de 2011. Acessado em 22 de abril de 2011.
  4. Martin, Javier (2011-04-16). "Rastreando lenguas minoritarias". El País. arquivado do original em 22 de abril de 2011. Acessado em 22 de abril de 2011.
  5. "Preservando as Línguas Indígenas no Twitter". Arquivado do original em 22 de abril de 2011. Acessado em 22 de abril de 2011