Iniciativa de Codificação de Texto

Iniciativa de codificação de texto TEI
Características
Extensão .tei
Desenvolvido por Consórcio de Iniciativa de Codificação de Texto
Versão inicial 1987
Tipo de formato Linguagem de marcação
Baseado em Extensible Markup Language
Padrão 5 ª  edição
Local na rede Internet tei-c.org

A Text Encoding Initiative (abreviado como TEI, em francês "Initiative pour encodage du texte") é um formato de marcação e uma comunidade acadêmica internacional no campo das humanidades digitais com o objetivo de definir recomendações para a codificação de recursos digitais, e mais particularmente de textual documentos . Desde 1987, o modelo teórico se adaptou a diferentes tecnologias, primeiro na forma de um SGML DTD , depois XML . Em sua versão P5 (2007), o esquema TEI é representado em vários idiomas, em particular no Relax NG . O esquema TEI é um núcleo em torno do qual giram muitas atividades coordenadas na forma de comitês democráticos e internacionais para, em particular, liderar a manutenção e o crescimento do esquema, escrever documentação, desenvolver ferramentas genéricas, fornecer suporte em listas de transmissões e divulgar o formato.

Metas

Segundo um dos seus fundadores, Lou Burnard , o objectivo do TEI é "fornecer recomendações para a criação e gestão em formato digital de todo o tipo de dados criados e utilizados por investigadores nas Ciências Humanas e Sociais  ".

Segundo ele, os três principais motivos para usar o TEI são:

  1. “XML-TEI preocupa-se mais com o significado do texto do que com a sua aparência”.
  2. "XML-TEI é independente de qualquer ambiente de software específico".
  3. “O XML-TEI foi desenhado pela comunidade científica que também se encarrega do seu desenvolvimento contínuo”.

Origem: os "princípios de Poughkeepsie"

O projeto TEI começou em 13 de novembro de 1987em torno de Nova York, em Poughkeepsie . Uma conferência organizada com co-financiamento da Agência Federal de Humanidades dos Estados Unidos ( National Endowment for the Humanities ) e da União Europeia resultou em um texto definindo seus objetivos. Muito antes da fundação do W3C , um grupo começou a definir recomendações para a codificação de textos de computador. Passados ​​mais de trinta anos, esses princípios continuam relevantes para descrever a intenção do TEI, tanto em seus documentos e seu código, quanto em sua organização. A maneira mais fácil é oferecer uma tradução desses princípios para entender o que é.

As recomendações visam fornecer um formato padrão para promover o intercâmbio de textos nas ciências humanas e sugerir princípios abstratos para a codificação de textos. Eles devem definir uma sintaxe recomendada para este formato, definir uma metalinguagem para a descrição das estruturas de codificação de texto e, em seguida, descrever este formato e essas estruturas, tanto nesta metalinguagem como na linguagem natural. As recomendações também devem fornecer conjuntos de convenções de codificação adequadas para vários aplicativos diferentes. Em particular, eles devem incluir um conjunto mínimo de convenções para a codificação de novos textos. As recomendações serão elaboradas por várias comissões coordenadas por uma comissão organizadora representativa das principais organizações envolvidas (financeiramente ou não). Será feita uma distinção entre a documentação (metadados) dos textos ( Comissão para a Documentação do Texto ), a representação dos componentes textuais ( Comissão para a Representação do Texto ), a análise e interpretação do texto ( Comissão para a Análise e Interpretação do Texto ) e a definição de metalinguagem., bem como a descrição de estruturas textuais propostas ou existentes ( Comitê de Metalinguagem e Sintaxe ). A compatibilidade com os padrões existentes será mantida o maior tempo possível. Várias grandes bibliotecas de texto concordam, em princípio, em apoiar as recomendações do TEI em sua função como um formato de intercâmbio, encorajando todos os patrocinadores a apoiar o desenvolvimento de ferramentas para facilitar esse intercâmbio. A conversão de textos digitais existentes para este novo formato envolve a tradução de suas convenções para a sintaxe do novo formato. Nenhuma informação adicional é necessária para a conversão para este novo formato.

O TEI é, portanto, uma organização que se reúne para definir um formato de codificação. Desde o início, foi feita uma distinção entre a representação de componentes textuais, que não depende de um ou mais pesquisadores e pode se aplicar a uma grande comunidade a longo prazo, e a interpretação específica de um experimento, um projeto de pesquisa, uma escola ., ou uma disciplina. Essas informações até agora foram escritas na forma de tags, em um esquema XML (ou SGML); mas também se reflete como princípios abstratos , independentes de todas as tecnologias, para facilitar a importação de outros formatos, bem como a transcodificação em formatos futuros.

História (layout e organização)

O TEI foi iniciado em 1987 por três sociedades científicas , a Association for Computers and the Humanities , a Association for Computational Linguisticse a Association for Literary and Linguistic Computing .

Atualmente, o Consórcio TEI é uma instituição sem fins lucrativos financiada por seus 64 membros, incluindo: o Serviço de Tecnologias de Pesquisa da Universidade de Oxford ( Reino Unido ); o Scholarly Technology Group da Brown University ( Estados Unidos ); um grupo de pesquisa de língua francesa, em Nancy , formado por ATILF , INIST e LORIA  ; o Electronic Text Center e o Institute for Advanced Technology in the Humanities da University of Virginia ( Estados Unidos ); OpenEdition (França).

O consórcio está organizado em diferentes órgãos. O Conselho de Administração do TEI decide sobre a direção estratégica e a gestão financeira. O Conselho Técnico TEI mantém e desenvolve as recomendações, bem como os sistemas TEI. Os Grupos de Trabalho TEI são grupos especializados liderados pelo conselho técnico que deve fazer propostas concretas de recomendações (por exemplo, bibliografia, codificação de caracteres, etc.). Finalmente, os grupos de interesse especial do TEI são grupos que trabalham em torno de um assunto relacionado ao TEI, mas não necessariamente com a intenção de alimentar recomendações (por exemplo: ferramentas, correspondência, ensino, etc.).

Exemplo introdutório

Para ilustrar a filosofia do TEI, é como poderia ser codificado o extrato do Cid de Pierre Corneille .

Tentamos representar:

Ato II, Cena 2
DON RODRIGUE Para mim, Comte, duas palavras.
A CONTA          Falar.
DON RODRIGUE                  Tire-me da dúvida.
Você conhece bem Don Diègue?
A CONTA          sim.
DON RODRIGUE                  Vamos falar baixo, escute.
Você sabia que este velho era a mesma virtude,
O valor e a honra de seu tempo? Você sabe ?

Com o HTML, teríamos uma codificação limitada aos aspectos de “ layout ”   .

<h1>Acte II, Scène 2</h1> <br /> <b>DON RODRIGUE</b> À moi Comte, deux mots. <br /> <b>LE COMTE</b>&nbsp;&nbsp; ... &nbsp;Parle

Com o esquema TEI, obteríamos isto:

<div type="act" n="II" xml:id="II"><head>Acte II</head> <div type="scene" n="2" xml:id="II2"><head>Scène 2</head> <sp><speaker>Rodrigue</speaker> <l part="I">À moi, comte, deux mots.</l></sp> <sp><speaker>Comte</speaker> <l part="M">Parle</l></sp> <sp><speaker>Rodrique</speaker> <l part="F">Ôte-moi d'un doute</l></sp> <sp><speaker>Comte</speaker> <l part="I">Connais-tu bien Don Diègue ?</l></sp> <sp><speaker>Comte</speaker> <l part="M">Oui</l></sp> <sp><speaker>Rodrigue</speaker> <l part="F">Parlons bas, écoute.</l> <l>Sais-tu que ce vieillard fut la même vertu,</l> <l>La vaillance et l'honneur de son temps ? Le sais-tu ?</l></sp> ... </div> ... </div>

O TEI permite descrever a estruturação do texto tal como foi concebido e não a sua versão final (apresentação). Na verdade, “as convenções desenvolvidas no âmbito do TEI visam permitir a descrição da forma como um documento foi criado, bem como a forma como foi estruturado: páginas, parágrafos, linhas, capítulos, diálogos, sublinhados, adições marginais, rasuras, etc. "

Este exemplo mostra em particular o aninhamento de atos e parágrafos: dois elementos <div>aninhados (com uma linguagem como XPath , é possível extrair um ato ou uma cena), a divisão do diálogo por elementos <sp>, a definição dos interlocutores por elementos <speaker>(é facilmente possível lançar consultas para localizar os lugares onde Rodrigue cita Chimène) bem como a precisão da descrição da versificação por elementos <l>(linha) com indicações sobre a posição de um elemento de diálogo no início, fim ou meio de verso graças aos atributos part.

Conceito de marcação

Estrutura geral

  • <teiHeader> : metadados do arquivo
  • <text> : texto transcrito
  • <front> : documentos preliminares (privilégio, dedicatória, índice ...) + página de título <titlePage>
  • <body> : corpo do texto
  • <back> : documentos pós-introdutórios (privilégio, índice, errata ...)

Estrutura de metadados

  • <titleStmt>( declaração do título ): conjunto de informações sobre o título do documento digital e quem o criou.
  • <title> : título do documento digital
  • <author> : autor do documento digital (se for documento nativo)
  • <editor> : responsabilidade secundária pelo documento digital (se for documento nativo)
  • <respStmt> : responsabilidade intelectual (= colaboradores no arquivo digital, por exemplo, o transcritor, codificador etc.) <nome>: nome do interessado
  • <resp> : função
  • <date> : data

Comparação com outros esquemas

TEI não é a única linguagem de marcação de documento. Seu nascimento deve muito à padronização oficial da SGML ISO 8879: 1986 que já estabeleceu os princípios fundamentais que inspiram o TEI. Na verdade, uma aplicação SGML deve distinguir estritamente um esquema ( DTD ), uma folha de estilo que isola as informações de apresentação e documentos puramente semânticos, marcados de acordo com este esquema.

Na mesma época, outras aplicações SGML apareceram, algumas das quais ainda existem, DocBook (1991), EAD (1993) ou HTML (1993). Esses três exemplos permitirão situar melhor o TEI em comparação com outros ambientes e necessidades que usam o mesmo padrão SGML. Docbook, EAD e HTML ajudam a situar a diferença do TEI porque muitos membros da comunidade estão muito familiarizados com esses outros esquemas e se relacionam com eles. Concentrando-se primeiro na codificação de textos patrimoniais, este esquema diz respeito principalmente a círculos acadêmicos, instituições de conservação (bibliotecas, arquivos) e, às vezes, a editoras.

Docbook

Desde o início, o Docbook se concentrou em documentação técnica e, mais especificamente, em TI. Ao associar o desenvolvimento de software UNIX (comercial e gratuito) a uma editora de livros de computador O'Reilly , o esquema deu a si mesmo vários destinos a serem satisfeitos automaticamente a partir de um único documento marcado: impressão, página de manual (manual do UNIX para o console) e, em seguida, HTML . A comunidade é organizada como um projeto de software livre, com um comitê que se reúne regularmente para presidir o crescimento ordenado do esquema de acordo com as sugestões dos usuários.

Este diagrama é comparável em tamanho ao TEI (v5, ~ 400 elementos), mas mais limitado porque mais preciso em seus objetivos. O Docbook, por exemplo, distingue explicitamente entre os elementos, <book>, <chapter>, <preface>, <article>, <section>…enquanto o TEI tem essencialmente um único elemento de estruturação neste nível <div>, que pode ser especificado por um atributo @type. O TEI não sugere uma lista de valores para qualificar os tipos de divisões, de forma que uma aplicação TEI não saiba a priori como lidar com as divisões, mesmo que seja apenas para extrair um índice que pare no nível do capítulo. No entanto, deve-se entender que o DocBook se destina principalmente à produção de novos documentos, que o esquema pode ser normativo e impor uma definição limitada dos componentes de um livro. O TEI possibilita a produção de novos documentos, mas sua missão principal é a codificação duradoura dos textos patrimoniais. No entanto, um manuscrito, uma correspondência, uma peça, muitos tipos de documentos não são estruturados de acordo com as noções de capítulos e seções. Se todos os componentes textuais da tradição tivessem produzido um elemento como no Docbook, o diagrama arriscava-se a uma inflação incontrolável, com quebra-cabeças indecidíveis (ex: se uma carta é um capítulo estruturante de uma correspondência, podemos escolher o mesmo elemento? Para uma carta citado em romance estruturado em capítulos?).

A atenção do TEI ao texto complica muito sua tarefa de processamento de documentos. O mero desenvolvimento de folhas de estilo não fornece resultados satisfatórios para toda a variedade de documentos possíveis. Docbook, graças à restrição de seus objetivos, é um modelo de implantação de aplicativo de um esquema (ex: a maioria das distribuições linux possui um pacote para o esquema Docbook e transformações XSLT ).

EAD

Como o TEI, o EAD ( descrição  arquivística codificada: descrição arquivística codificada) diz respeito a documentos patrimoniais; mas se trata de um diagrama de negócios, restrito em sua abordagem e sua visão do documento. É antes de tudo a transposição para XML da norma geral e internacional para descrição arquivística , ISAD (G). O EAD codifica principalmente inventários de acervos arquivísticos, mas possui elementos e atributos suficientes para transcrever o texto dos documentos.

O EAD pegou muito emprestado do TEI <eadheader> : <fildesc>, <titlestmt>, <publicationstmt>, <profiledesc>, <creation>, <langusage> …, ele também poderia fornecer mais, por exemplo, por seu dispositivo para indexar entidades nomeadas (pessoas, lugares, datas, etc.). Se os dois diagramas podem compartilhar certos objetos e elementos, as diferenças permitem qualificar melhor o TEI. O EAD não contém mais de 150 elementos porque deve ser totalmente compreendido pelos arquivistas que o empregam. Embora a EAD tenha uma origem acadêmica (1993, Berkeley ), ela foi posteriormente assumida pela Society of American Archivists, apoiada pela Biblioteca do Congresso .

É muito estável ao longo do tempo: a versão 1 data de 1998 (SGML), a versão 2 data de 2002 e consiste principalmente na transposição da versão 1 para XML, a terceira versão foi publicada em 2016. EAD pode representar uma espécie de interoperabilidade ideal para XML legado documentos, mas esse resultado vem com uma grande limitação.

Html

O HTML é apresentado como uma aplicação SGML, pretendendo respeitar os princípios da separação entre semântica e apresentação, com uma centena de elementos. No entanto, os elementos semânticos <abbr> abréviation, <dfn> définition, <samp> exemplesão frequentemente misturados com a aparência . Essa confusão era necessária porque no início dos navegadores não existia uma linguagem adequada para definir as folhas de estilo da tela, que passou a ser CSS . Para que um subconjunto do TEI fosse o formato da Internet, seriam necessários mais vínculos com a indústria, o equilíbrio de seu consenso poderia aceitar elementos como , de acordo com um dos princípios de Poughkeepsie "As recomendações devem incluir um mínimo conjunto de convenções para a codificação de novos textos ". Observe que o Docbook também não foi assumido pelo W3C, mas desde 2014, o HTML5 tirou algumas lições semânticas desses diagramas, introduzindo os elementos . <i> italic italique, <b> bold gras, <s> strike barré, <u> underline souligné, <body bgcolor="blue">, <table border="1"><i>, <b>, <s>, <u><article>, <section>, <header>, <footer>

Pensamento modular do diagrama

Os 582 elementos do TEI (em 2020) constituem um dicionário muito importante, com uma combinação potencialmente imprevisível. Essa complexidade seria difícil de dominar em sua totalidade, tanto por usuários quanto por desenvolvedores, se não fosse por agrupamentos e hierarquia.

Como qualquer linguagem de programação, as sintaxes de esquema permitem fatorar instruções repetitivas. Por exemplo, a estrutura de conteúdo de um parágrafo, ele pode incorporar texto e várias marcas: itálico, nomes de pessoas, aparato crítico ... Um item de lista, uma nota de rodapé ou uma citação, é claro. Outros elementos textuais podem compartilhar uma estrutura de conteúdo semelhante a um parágrafo. Não seria racional repetir a mesma declaração para cada contêiner de nível de parágrafo, especialmente porque isso complicaria a manutenção do esquema (se, por exemplo, um elemento for introduzido, ele deve ser adicionado em todos os lugares onde possa ser relevante. ) A partir do SGML, os DTDs propuseram o mecanismo de entidades de parâmetros, no modelo de macros . Uma linguagem de esquema XML, portanto, torna possível definir atalhos para substituir uma declaração maior.

Assim, por exemplo, o TEI tem um macro.paraContent que define o conteúdo de 52 elementos diferentes. A modularização de um grande esquema não é específica do TEI, o EAD tem uma macro para.content , HTML fala sobre o conteúdo do fluxo e o Docbook afirma que os parágrafos, como aspas ou títulos, contêm todos os elementos embutidos . Além disso, como uma macro pode conter uma macro, recursivamente, um diagrama pode se tornar uma verdadeira ontologia do objeto que ele modela. O que é original no TEI é mostrar essas macros na documentação, porque elas não são apenas uma conveniência do desenvolvedor, mas uma tentativa científica de descrever todos os textos possíveis.

Este ideal de organização é, no entanto, equilibrado pelo efeito social dos grupos de trabalho na origem da documentação. De acordo com os princípios de “Poughkeepsie”, o esquema TEI deve ser descrito tanto para máquinas quanto para humanos. O edifício constituiu-se, portanto, a partir do cruzamento do efeito de duas lógicas aplicadas aos textos: a inteligência, concebendo o plano geral, e o processamento de dados, validando os detalhes. O resultado é uma estruturação da documentação que apareceu em 1992 no índice do TEI P2. A ordem e a organização desses capítulos variaram nos últimos vinte anos, mas não os títulos, que podem ser encontrados quase idênticos em 2015. Cada capítulo em prosa documenta um módulo quase independente do esquema, se embora o TEI não seja um esquema, mas uma biblioteca de esquemas livremente combináveis. O consórcio oferece ainda um formulário online, o Roma , para que cada um possa construir o seu próprio perfil TEI, adaptado ao seu corpus.

Por exemplo, o kernel de tags principais e regras gerais inclui o cabeçalho TEI ou a página de título eletrônica ( cabeçalho TEI ) e tags comuns a todos os esquemas ( tags disponíveis em todos os DTDs TEI ). As tags de descrição de texto específicas Conjuntos de tags de base incluem o conjunto de tags de base para prosa (prosa), o conjunto de tags de base para versos (poesia), o conjunto de tags de base para drama (teatro), o conjunto de tags de base para transcrições de textos falados (oral ), o conjunto de tags de base para dicionários impressos (dicionários), etc. Finalmente, os outros conjuntos de tags adicionais incluem ferramentas para interpretar links, segmentação e alinhamento ( segmentação e alinhamento ), níveis de confiança de marcação interpretativa ( Certeza ), manuscritos ( Manuscritos, Bibliografia Analítica e Descrição Física do Texto de Origem ), entidades nomeadas ( Adicional Tags para nomes e datas ), gráficos ( gráficos, digrafos e árvores ), figuras como tabelas, fórmulas, imagens, pontuações, etc. ( Gráficos, Figuras e Ilustrações  ; Fórmulas e Tabelas ) e corpora linguístico ( Conjunto de Tags Adicionais para Corpora de Linguagem ). Essas outras marcas também incluem ferramentas para análise linguística de sentenças, orações, frases, palavras, etc. ( Mecanismos Analíticos Simples ), dispositivos para outras análises possíveis, como fonética, semântica, pessoas, etc. ( Feature Structure Analysis ), bem como aparato crítico ( Text Criticism and Apparatus ).

Relevância da modularidade

Essa aparente liberdade modular, entretanto, esbarra na relevância das divisões impostas. A partir do TEI P4 (2001), o índice não prioriza mais os capítulos, o que mascara a articulação desses diferentes grupos de tags. No entanto, redescobrimos a intenção inicial de fazer uma distinção profunda entre o que diz respeito à descrição dos textos e a sua interpretação. Essa distinção permanece altamente relevante e sempre precisa ser lembrada, mesmo que haja necessariamente alguma imprecisão nas bordas.

Quando entramos em detalhes, os capítulos não são igualmente felizes. O capítulo sobre dicionários, por exemplo, assinado por Nancy Ide  (en) e Jean Véronis , é de qualidade de modelagem ainda atual. Por outro lado, a distinção tradicional entre verso e prosa vai de encontro à realidade dos textos. O teatro clássico é notoriamente em verso ou prosa. O romance parece, por exemplo, um gênero típico de prosa, mas Alice no País das Maravilhas ou O Livro da Selva contêm canções e, portanto, versos. Um romance francês, por exemplo Balzac, irá citar cartas ou cartazes publicitários. A crítica literária pode citar teatro ou poesia. Quando se trata de buscar os elementos mais relevantes para descrever um texto, é necessário extrair exemplos e ideias de todos os capítulos. As divisões da ontologia TEI realmente não funcionam. Esta ordem foi útil na produção da documentação e permanece bastante lógica como plano expositivo, mas é ao mesmo tempo muito restritiva e insuficiente assim que se entra em contato com os textos.

Os dispositivos propostos para interpretação são muito desiguais . O capítulo sobre gráficos, por exemplo, agora parece obsoleto desde o uso generalizado de RDF - OWL , que é muito mais amplamente usado, com amplo suporte de software. Em 1990, era compreensível que o TEI devesse conter todos os tipos de ferramentas de marcação. Desde a especificação dos namespaces XML (1999), parece muito mais relevante inserir uma linguagem especializada como OWL no TEI.

A atual universalidade do HTML pode até sugerir torná-lo o núcleo do TEI, de modo que se concentre em sua contribuição acadêmica, ao invés de repetir, por exemplo, o mesmo aparato para tabelas, que difere do HTML apenas nos nomes.

Essa ciência acadêmica do texto computadorizado, no entanto, merece se tornar o padrão da revolução do livro eletrônico em andamento na edição, a fim de considerar a codificação dos textos na fonte, desde a produção.

Desde 2015, uma padronização do TEI foi implementada na publicação acadêmica, especialmente na França, por meio do desenvolvimento da cadeia de publicação de multimídia Métopes, por iniciativa da divisão de Documentos Digitais da Maison de la Recherche em ciências humanas de da Universidade de Caen e através do software de publicação digital Lodel desenvolvido desde 2010 pela infraestrutura do OpenEdition Center (USR 2004, antigo Center for Open Electronic Publishing , CLEO). O TEI também é do interesse de editoras privadas, por exemplo, Librairie Droz , confrontada como muitas outras com a distribuição de multimídia, tanto em papel como livro eletrônico, ou bancos de dados de texto online.

O vocabulário do TEI está se espalhando e com ele o desejo pela sustentabilidade, para que os textos hoje codificados sejam compreendidos pelas gerações subsequentes.

Notas e referências

  1. Lou Burnard , “Introdução” , em What is the Text Encoding Initiative? , OpenEdition Press, col.  "Enciclopédia Digital",28 de outubro de 2015( ISBN  978-2-8218-5581-6 , leia online )
  2. Os princípios de Poughkeepsie
  3. (em) "  Casa  " no National Endowment for the Humanities (NEH) (acessado em 12 de outubro de 2018 )
  4. “  Text Encoding Initiative  ” , no SourceForge (acessado em 14 de agosto de 2020 ) .
  5. (in) "  A Associação de Computadores e Humanidades |  » , Em ach.org (acessado em 12 de outubro de 2018 )
  6. (em) "  Portal do membro ACL | The Association for Computational Linguistics Member Portal  ” , em www.aclweb.org (acessado em 12 de outubro de 2018 )
  7. (in) "  EADH - The European Association for Digital Humanities |  » , Em www.allc.org (acessado em 12 de outubro de 2018 )
  8. Informações de 1º de agosto de 2013. Fonte: http://members.tei-c.org/Institutions
  9. (in) "  Research Support  " em www.oucs.ox.ac.uk (acessado em 12 de outubro de 2018 )
  10. (en-US) “  Center for Digital Scholarship  ” em www.stg.brown.edu (acessado em 12 de outubro de 2018 )
  11. (in) "  Sobre o Centro Etext | Grupo de produção digital da biblioteca da Universidade da Virgínia  ” em dcs.library.virginia.edu (acessado em 12 de outubro de 2018 )
  12. "  The Institute for Advanced Technology in the Humanities  " , em www.iath.virginia.edu (acessado em 12 de outubro de 2018 )
  13. Atividades - Iniciativa de Codificação de Texto
  14. Conselho de Administração - Iniciativa de Codificação de Texto
  15. http://www.tei-c.org/Activities/Council/index.xml
  16. http://www.tei-c.org/Activities/Workgroups/
  17. http://www.tei-c.org/Activities/SIG/index.xml
  18. Exemplo de Jacques Ducloy, "  Publicação científica em digital - ilustrado com Hamlet e Le Cid no TEI  ", no site da Apropriação por investigação de tecnologias do projecto IST (ARTIST), 3 de Fevereiro de 2006.
  19. Grégory Fabre e Sophie Marcotte , Práticas de Publicação Digital , Montreal, University of Montreal Press,2014, 219  p. ( ISBN  978-2-7606-3203-5 , leitura online ) , cap.  10 (“A organização dos metadados”), p.  175
  20. http://www.tei-c.org/release/doc/tei-p5-doc/fr/html/ref-div.html
  21. http://www.w3.org/TR/REC-html32#sgml
  22. http://www.tei-c.org/release/doc/tei-p5-doc/en/html/ref-macro.paraContent.html
  23. http://obvil-dev.paris-sorbonne.fr/developpements/eadfr/def_m.para.content.html?nav
  24. http://www.w3.org/TR/html5/dom.html#flow-content-1
  25. http://www.tei-c.org/release/doc/tei-p5-doc/en/html/index.html
  26. http://www.tei-c.org/Roma/
  27. http://www.tei-c.org/Vault/P4/doc/html/
  28. "  METOPES Métodos e ferramentas de edição estruturada | Maison de la Recherche en Sciences Humaines  ” , em www.unicaen.fr (consultado em 15 de outubro de 2020 )
  29. "  Página inicial | Maison de la Recherche en Sciences Humaines  ” , em www.unicaen.fr (consultado em 15 de outubro de 2020 )
  30. "  Apresentação do OpenEdition  " , em www.openedition.org (acessado em 15 de outubro de 2020 )

Veja também

Artigos relacionados

Bibliografia

  • Nancy M. Ide, C. Michael Sperberg-McQueen, “A Iniciativa de Codificação de Texto: Sua História, Metas e Desenvolvimento Futuro”, em Computadores e Humanidades. Editado por Nancy M. Ide e Jean Véronis, 1995 .
  • Elli Mylonas, Allen Renear, "The Text Encoding Initiative at 10: Not Just An Interchange Format Anymore - but a New Research Community", Computers and the Humanities 33, n o   1-2, 1999  : (doi: 10.1023 / A: 1001832310939 )
  • Christian Wittern, Arianna Ciula, Conal Tuohy, “The Making of TEI P5”, Literary and Linguistic Computing , 24, no. 3, 2009 , p. 281-296.
  • Lou Burnard , O que é a Iniciativa de Codificação de Texto? , Marseille, OpenEdition Press, 2015 ( ISBN  9782821855816 ) , DOI : 10.4000 / books.oep.1237

links externos