Link quebrado

Um link morto , link quebrado , link quebrado ou link quebrado é um hiperlink que redireciona para um site ou uma página da web não existe mais. Na escala da web , o fenômeno corresponde ao decaimento de links , conhecido em inglês como link rot .

Causas

Um link pode ser interrompido por vários motivos. A explicação mais simples e comum é que a página da web não existe mais, o que na maioria das vezes leva a um erro HTTP 404 , que indica que o servidor respondeu bem, mas a página específica não foi encontrada. Outros códigos de retorno também são possíveis, a página pode ter sido movida ou renomeada no servidor, ou o próprio servidor pode ter sido movido ou renomeado.

Outros motivos pelos quais um link está quebrado incluem:

Prevalência

Vários estudos examinaram a prevalência de links quebrados na web, entre a literatura acadêmica e bibliotecas digitais . Em 2003, o experimento feito por Fetterly et al. descobri que a cada semana cerca de um em cada 200 links deixava de ser válido. Nelson e Allen (2002) examinaram o decaimento do link em bibliotecas digitais e descobriram que 3% dos objetos não estavam mais acessíveis após um ano.

Em 2004, outro estudo mostrou que subconjuntos de links da Internet (que visam tipos de arquivo específicos ou que são hospedados por instituições acadêmicas) podem ter vidas efetivas radicalmente diferentes. Os URLs de publicações parecem ter uma vida útil mais longa na Internet do que outros URLs. Um estudo de 2015 da Weblock analisou mais de 180.000 links de recursos no corpus de três grandes editoras de acesso aberto e encontrou uma vida útil média de 14 anos, confirmando um estudo de 2005 que descobriu que metade dos URLs encontrados nos artigos da D-Lib Magazine ainda estavam ativos 10 anos após a publicação. Outros estudos encontraram uma taxa mais alta de links podres na literatura acadêmica, mas mostram uma expectativa de vida de pelo menos quatro anos. Um estudo de Bioinformática da BMC analisou cerca de 15.000 links em resumos de índices de citação da Thomson Reuteur Web of Science e concluiu que a mediana a vida útil de uma página da web era de 9,3 anos, e apenas 62% das páginas foram arquivadas.

Um estudo realizado em 2016-2017 no Yahoo! Directory (o diretório do Yahoo !, que parou de ser atualizado em 2014, após 21 anos de desenvolvimento), concluiu que a vida útil dos links era de dois anos.

Prevenção e detecção

As estratégias para evitar links ruins podem se concentrar em onde colocar o conteúdo para que a probabilidade de ele permanecer lá seja maior, bem como usar links de autoridade com menor probabilidade de serem quebrados ou reparar links cujo destino foi excluído ou realocado.

Criar URLs que não mudem com o tempo é a maneira fundamental de evitar links ruins. Tim Berners-Lee e outros pioneiros da Internet são campeões do planejamento preventivo.

As estratégias de autoridade de link incluem:

As estratégias para proteger os links existentes incluem:

A detecção de links quebrados pode ser feita manualmente ou automaticamente. Os métodos automáticos incluem plug-ins para sistemas de gerenciamento, bem como verificadores de link quebrado independentes, como o Link Sleuth do Xenu. A verificação automática pode não detectar links que apontam para 404 ou links que retornam uma resposta 202 OK, mas apontam para conteúdo que foi alterado.

Referências

  1. (in) P. Habibzadeh, "  Decay of References to websites in Articles Published in General Medical Journals: Mainstream vs Small Journals  " , Applied Clinical Informatics , vol.  4, n o  4,2013( DOI  10.4338 / aci-2013-07-ra-0055 , ler online , acessado em 7 de setembro de 2015 )
  2. "  A morte de um TLD  " [ arquivo de26 de julho de 2018] , em blog.benjojo.co.uk (acessado em 27 de julho de 2018 )
  3. P. Habibzadeh , “  Decay of References to Web sites in Articles Publicados em General Medical Journals: Mainstream vs Small Journals  ”, Applied Clinical Informatics , vol.  4, n o  4,2013, p.  455–464 ( PMID  24454575 , PMCID  3885908 , DOI  10.4338 / aci-2013-07-ra-0055 )
  4. "  Hiberlink  " [ arquivo de29 de janeiro de 2015] , Hiberlink.org (acessado em 15 de janeiro de 2015 )
  5. (em) Dennis Fetterly, Mark Manasse, Mark e Janet Najork Wiener, "  A wide-scale study of the Evolution of Web pages  " , WWW '03 Proceedings of the 12th international conference on World Wide Web ,2003, p.  669-678 ( ISBN  1-58113-680-3 , DOI  10.1145 / 775152.775246 , leia online )
  6. (em) Michael L. Nelson e Danette B. Allen , "  Object Persistence and Availability in Digital Libraries  " , D-Lib Magazine , vol.  8, n o  1,janeiro de 2002( DOI  10.1045 / janeiro de 2002-nelson )
  7. Wallace Koehler , “  Um estudo longitudinal de páginas da web continuou: uma consideração sobre a persistência do documento  ”, Information Research , vol.  9, n o  22004( leia online [ arquivo de11 de setembro de 2017] , acessado em 31 de janeiro de 2019 )
  8. "  Relatório de bloqueio de todos os tempos  " [ arquivo de4 de março de 2016] ,agosto de 2015(acessado em 12 de janeiro de 2016 )
  9. Frank McCown, Sheffan Chan, Michael L. Nelson e Johan Bollen (2005) “  A disponibilidade e Persistência da Web referências em D-Lib revista  ” Proceedings of the 5th Preservação Workshop Internacional Arquivamento Web e Digital (IWAW'05) . Acessado em 12/10/2005. 
  10. Diomidis Spinellis , “  The Decay and Failures of Web References  ”, Communications of the ACM , vol.  46, n o  1,2003, p.  71-77 ( DOI  10.1145 / 602421.602422 , leia online )
  11. Steve Lawrence , David M. Pennock , Gary William Flake , Robert Krovetz , Frans M. Coetzee , Eric Glover , Finn Arup Nielsen , Andries Kruger e C. Lee Giles , “  Persistence of Web References in Scientific Research  ”, Computer , vol.  34, n o  22001, p.  26–31 ( DOI  10.1109 / 2.901164 )
  12. Jason Hennessey e Steven Xijin Ge , “  Um Estudo Disciplinar Cruzado de Decaimento de Link e a Eficácia de Técnicas de Mitigação  ”, BMC Bioinformatics , vol.  14,2013, S5 ( PMID  24266891 , PMCID  3851533 , DOI  10.1186 / 1471-2105-14-S14-S5 )
  13. Hans van der Graaf , "  A meia-vida de um link é de dois anos  " [ arquivo du17 de outubro de 2017] , no blog do ZOMDir (acessado em 31 de janeiro de 2019 )
  14. Tim Berners-Lee , "  Cool URIs Don't Change  " [ arquivo de2 de março de 2000] ,1998(acessado em 31 de janeiro de 2019 )
  15. Leighton Walter Kille , "  o crescente problema da Internet" link Rot "e Melhores Práticas para a mídia e online Publishers  ' [ Arquivo12 de janeiro de 2015] , Journalist's Resource, Harvard Kennedy School,8 de novembro de 2014(acessado em 16 de janeiro de 2015 )
  16. sistemas podem sofrer interrupções em seu serviço, tornando os URLs temporariamente indisponíveis.
  17. Parham Habibzadeh , “  Os sistemas de arquivamento atuais são confiáveis ​​o suficiente?  ”, International Urogynecology Journal , vol.  26, n o  10,30 de julho de 2015, p.  1553 ( ISSN  0937-3462 , PMID  26224384 , DOI  10.1007 / s00192-015-2805-7 )
  18. "  Arquivo da Internet: Biblioteca Digital de Livros, Filmes, Música e Máquina de Wayback Gratuitos  " [ arquivo26 de janeiro de 1997] ,10 de março de 2001(acessado em 7 de outubro de 2013 )
  19. Gunther Eysenbach e Mathieu Trudel , “  Going, going, still there: Using the WebCite service to arquivar permanentemente as páginas da web citadas  ”, Journal of Medical Internet Research , vol.  7, n o  5,2005, e60 ( PMID  16403724 , PMCID  1550686 , DOI  10.2196 / jmir.7.5.e60 )
  20. Jonathan Zittrain , Kendra Albert e Lawrence Lessig , “  Perma: Definição do escopo e abordagem do problema da rotatividade de links e referências em citações legais  ”, Legal Information Management , vol.  14, n o  212 de junho de 2014, p.  88–99 ( DOI  10.1017 / S1472669614000255 , leia online )
  21. "  Berkman Center da Harvard University lança o Amber, uma ferramenta de" auxílio mútuo "para que blogueiros e proprietários de sites ajudem a manter a Web disponível | Berkman Center  ” [ arquivo de2 de fevereiro de 2016] , em cyber.law.harvard.edu (acessado em 28 de janeiro de 2016 )
  22. John Mueller , "  FYI on Google Toolbar's Features Latest  " [ arquivo13 de setembro de 2008] , Blog da Central do webmaster do Google,14 de dezembro de 2007(acessado em 9 de julho de 2008 )
  23. Ziv Bar-Yossef, Andrei Z. Broder, Ravi Kumar e Andrew Tomkins (2004) “Sic transit gloria telae: para uma compreensão da decadência da Web” Anais da 13ª conferência internacional sobre a World Wide Web - WWW '04 : 328– 337 p. ( DOI : 10.1145 / 988672.988716 ). 

Veja também

Artigos relacionados

Bibliografia