Os dados abertos e os dados abertos são dados digitais, incluindo acesso e uso são deixados livres para os usuários, que podem ser de fontes privadas, mas principalmente públicas, em particular produzidos por uma comunidade ou instituição pública. São distribuídos de forma estruturada segundo um método e uma licença aberta garantindo o seu livre acesso e reutilização por todos, sem restrições técnicas, legais ou financeiras.
O acesso aos dados visa, por um lado, permitir aos cidadãos controlar melhor a administração, por outro lado, utilizar esses dados, o que implica que este direito de acesso seja acompanhado de um direito de reutilização.
Esses direitos de acesso e reutilização fazem parte do pensamento que considera a informação pública como um bem comum (conforme definido por Elinor Ostrom ) cuja divulgação é de interesse público e geral .
A abertura dos dados é, portanto, ao mesmo tempo uma filosofia de acesso à informação, um movimento de defesa das liberdades e uma política pública .
Alguns países foram pioneiros, incluindo Estados Unidos , Reino Unido , Austrália e Canadá e depois França . O movimento se espalhou notavelmente sob o impulso de ONGs como a Open Knowledge Foundation (OKFN) e a Open Government Partnership (PGO).
Os dados são abertos se todos puderem acessá-los, usá-los, modificá-los e redistribuí-los livremente, qualquer que seja sua finalidade.
O Open Data é um movimento de atores em campanha por dados abertos. É também uma política pública que consiste em abrir os dados públicos de forma a promover a inovação aberta no setor público, prestar contas aos cidadãos e melhorar a transparência da ação pública e, finalmente, colocar recursos à disposição do setor privado. .
O artigo 15 da Declaração dos Direitos do Homem e do Cidadão de 1789 menciona que a sociedade tem o direito de exigir que qualquer funcionário público em sua administração preste contas. Este artigo constitui a base jurídica do direito de acesso à informação pública.
A Lei de Liberdade de Informação , implementada em 1967, cria o direito à informação para os cidadãos. Foi alterado em particular em 2007 pela Lei do Governo OPEN .
FrançaOs Dados Abertos são uma extensão da abordagem adotada pela lei de 17 de julho de 1978 relativa ao acesso a documentos administrativos, mesmo que não requeira a publicação de dados digitais, nem a publicação proativa de informações. Simplesmente reconhece o direito de obter comunicação de documentos em poder de uma administração, qualquer que seja sua forma ou meio.
Na União Europeia, a Diretiva 2003/98 / CE (" Informações do Setor Público " (PSI )) do Conselho da União Europeia de 17 de novembro de 2003 sobre a reutilização de dados públicos e a diretiva INSPIRE em 2008 incentivam os dados abertos .
A Diretiva 2019/1024 “ Diretiva de Dados Abertos” de 2019 substitui a de 2003.
Estados UnidosCom a eleição de Barack Obama , a abertura de dados públicos passa a ser um eixo central do governo americano com a Open Government Initiative, além de citar os critérios para publicação de dados abertos.
Em seu discurso de posse, Barack Obama anunciou sua intenção de “criar um nível de abertura governamental sem precedentes” , com o objetivo de “fortalecer a democracia e promover sua eficiência e eficácia no governo” .
Dentro março de 2009, o governo dos EUA lança o portal federal de dados abertos data.gov . Em dezembro do mesmo ano, a portaria de governo aberto estabelece os três pilares da cooperação entre o Estado e os cidadãos, quais sejam: transparência governamental, participação e colaboração. Vivek Kundra , principal sistema de informação federal ( Chief Information Officer ) na administração Obama, observa que "a divulgação desses dados levou a uma economia de aplicativos [...] houve uma explosão desses desenvolvedores de comunidades" .
Reino UnidoNo Reino Unido , o artigo publicado pelo The Guardian em 2006 “Devolva as joias da coroa” clama por uma liberalização dos dados públicos e serve como “o momento inicial do movimento de dados abertos ” .
Gordon Brown lançou o portal de dados abertos Data.gov.uk em janeiro de 2010 sob a liderança de Tim Berners-Lee .
FrançaNa França , certas autoridades locais, como Rennes ou Paris , iniciaram uma abordagem de dados abertos em 2010. A nível nacional, em fevereiro de 2011, o governo criou a missão Etalab , um serviço do Primeiro-Ministro responsável pela coordenação desta política de dados abertos públicos, e lançou um portal específico, data.gouv.fr , em dezembro do mesmo ano.
Na cúpula do G8 em 2013 , os Chefes de Estado do G8 assinaram uma " Carta do G8 para a abertura de dados públicos ".
Na França, a lei para uma República Digital de outubro de 2016 na França, que estabelece o princípio da abertura de dados públicos comunicáveis padrão e cria a noção de serviço público de dados , dá aos dados abertos uma base legislativa.
São os dados abertos da Public Health France sobre a pandemia de Covid-19 que permitiram a uma comunidade de analistas publicar gráficos e mapas acompanhando a pandemia em nível nacional, entre eles Guillaume Rozier .
A abertura de dados de finanças públicas tem estado no centro do movimento de dados abertos desde o seu início. Em 2007, no Reino Unido, Jonathan Gray projetou o projeto "Para onde vai meu dinheiro ", uma visualização dos dados de gastos do governo do Reino Unido que permite aos cidadãos acessá-los facilmente.
Dados científicos abertos e acesso aberto são dois tópicos relacionados, mas distintos. O acesso aberto diz respeito a publicações científicas, muitas vezes revisadas por pares. A abertura de dados científicos pode dizer respeito aos dados em que se baseiam estes artigos, ou a qualquer base de dados de natureza científica (por exemplo, registos meteorológicos ou outros), de forma a permitir a reprodução dos experimentos realizados, de forma a confirmá-los ou para invalidá-los.
Também podem ser dados de institutos de pesquisa científica públicos (ou privados que se beneficiam de financiamento público, ou que desejam voluntariamente abrir e compartilhar seus dados), muitas vezes ao mesmo tempo que a divulgação gratuita dos resultados da pesquisa; fala-se então neste contexto de “livre acesso” ou “livre disseminação” , cuja primeira definição foi dada pela Declaração Internacional de Acesso Aberto de Budapeste, realizada em14 de fevereiro de 2002, conhecido pela sigla BOAI (da English Budapest Open Access Initiative ) .
A partir daí, muitas outras iniciativas surgiram em outras partes do mundo, como, por exemplo, a Declaração de Berlim de 2003 sobre o acesso gratuito ao conhecimento nas ciências e humanidades ; seguida em março de 2005, a partir de Southampton , uma nova Declaração chamado Berlin III de reforçar as medidas adotadas como parte de Berlim I .
O projeto de sequenciamento do genoma humano foi viabilizado por um Open Data Consortium criado por proposta de Jim Kent (en) em 2003, cujos beneficiários serão, entre outros, países em desenvolvimento onde universidades e centros de pesquisa nem sempre possuem acesso a revistas científicas.
Em 2010, a União Europeia lançou o projeto legislativo sobre a abertura de dados de transporte através da diretiva dos Sistemas de Transporte Inteligente (STI) e clarificou a sua aplicação em 2017 com o Regulamento Delegado (UE) 2017/1926.
Na França, a abertura de dados relativos ao transporte é regida por várias leis. Em primeiro lugar, a Lei Macron de 2015 obriga as autoridades organizadoras dos transportes a fornecer dados regulares sobre o transporte de passageiros. Em seguida, a Lei Lemaire de 2016, através da obrigação de abrir dados de interesse geral, como os produzidos no âmbito das delegações de serviço público (DSP) , alarga o campo de dados a serem abertos. Isso diz respeito, em particular, aos dados de transporte porque o DSP é o modo de gestão mais usado para o transporte urbano de passageiros na França.
A Lei de Orientação para a Mobilidade (LOM) de 2019 especifica essas obrigações para abrir dados e as estende. Ele especifica que é a autoridade organizadora da mobilidade (AOM) que é responsável por coordenar o fornecimento de dados. A abertura destes dados tem como objetivo facilitar o desenvolvimento de aplicações e serviços MaaS (Mobility as a service) que reúnem várias soluções de viagens.
Esses dados são dados estáticos e dinâmicos de viagem e tráfego, bem como dados históricos de tráfego. Na verdade, a LOM explica, através do Artigo L1115-1 do Código de Transporte , que os dados a serem abertos são aqueles especificados no apêndice do Regulamento Delegado (UE) 2017/1926, aqui estão alguns exemplos:
O LOM vai além do regulamento europeu, que apenas obriga a publicação de dados estáticos, e estende a abertura dos dados aos dados dinâmicos, aos pontos de carregamento para veículos elétricos ou híbridos e aos serviços de caronas que devem fornecer um ponto de acesso à sua oferta de serviço .
A governança de dados abertos também é especificada pela LOM . O Artigo L1115-2 menciona que a AOM ou os operadores de transporte devem garantir "o fornecimento de dados dentro dos padrões e atualizações por meio do Ponto de Acesso Nacional (NAP)". Na França, o ponto de acesso nacional é o site transport.data.gouv, que em abril de 2021 coletou 441 conjuntos de dados.
A licença de publicação não é imposta pela LOM, mas é a estrutura da Lei Lemaire de 2016 que se aplica e permite abrir os dados sob a licença Etalab ou sob a licença ODbL (Open Database License) .
Por último, no que diz respeito ao formato dos dados , o regulamento europeu impõe normas que facilitam a interoperabilidade : escolha de normas ou especificações NeTEx ou TAP PSI e SIRI para tempo real . No entanto, muitos dos dados publicados por operadores privados e autoridades públicas estão no formato GTFS . Em última análise, o NAP fornecerá um conversor de dados gfts para o formato NETEX para permitir que a AOM cumpra o regulamento.
O ecossistema de dados abertos inclui atores da sociedade civil, como o Open Data Institute ou a Open Knowledge Foundation ou OpenStreetMap , administrações públicas, empresas privadas, atores do mundo da pesquisa, atores do mundo do jornalismo, financiadores e organizações internacionais.
Em 2010, a Sunlight Foundation estabeleceu uma lista de dez critérios que caracterizam os dados abertos. Para que um dado seja considerado "aberto", ele deve ser:
Em 2010, Tim Berners-Lee propôs uma escala de qualidade de dados aberta (1 a 5 estrelas).
★ | Dados não filtrados (possivelmente degradados), por exemplo, enviados com qualquer formato |
★ ★ | Dados disponíveis de forma estruturada (por exemplo, dados tabulares em CSV , XML , Excel , RDF ) |
★ ★ ★ | Dados livremente exploráveis - legalmente (ver licenças), - tecnicamente (em formatos não proprietários, não no Excel em particular) |
★ ★ ★ ★ | Dados identificados por URLs (com data de atualização) para que possamos "apontar" um link para eles (e possivelmente encontrá-los atualizados) |
★ ★ ★ ★ ★ | Dados vinculados a outros dados, para contextualizá-los e enriquecê-los |
Esta escala diz respeito a dados digitais básicos, mas seus critérios podem ser adaptados a dados agregados ou informações públicas mais complexas (fotos, vídeos, relatórios, estudos, etc. que também deverão ser colocados online, de preferência com metadados de qualidade . E também podem incluir hipertexto no caso de relatórios e estudos, ou mesmo certos vídeos)
O objetivo principal era colocar os dados produzidos pelo Estado ou outros online sem esperar pela implementação de uma comunidade de interesses privados ( Cf. o debate apresentado abaixo sobre o paradoxo do frango ou do frango. O ovo ) o que poderia retardar a disponibilidade de dados na rede e, portanto, indiretamente retardar o surgimento de avanços tecnológicos dentro do movimento da Web Semântica , do qual Tim Berners-Lee é um dos promotores.
Em diversos campos de pesquisa, apesar dos apelos por boas práticas de transparência e compartilhamento de dados, os dados brutos não são comunicados pelos autores, nem mesmo aos revisores.
Muitas fraudes científicas na pesquisa não puderam ser detectadas precocemente pelos comitês de revisão porque os autores se recusaram a compartilhar seus dados (até mesmo com seus co-autores às vezes), especialmente no campo da psicologia, onde 50% dos experimentos apresentam resultados não reproduzíveis, que coloca sérios problemas de confiança nos resultados e desencadeou uma iniciativa denominada Peer Reviewers 'Openness Initiative , segundo a qual, quando não existem razões éticas para não o fazer, a transparência e a abertura dos dados devem ser valores fundamentais da ciência, em particular para permitir o trabalho dos revisores.
Existem vários meios modernos de compartilhamento de dados científicos, incluindo pré-publicação e pós-publicação. Além disso, os autores que compartilham seus dados veem suas chances de serem citados aumentar.
Na Grã-Bretanha , o cruzamento de dados abertos permitiu uma redução de 30% na conta de consumo de energia em prédios públicos em apenas dois meses.
Os dados abertos permitem, de maneira ideal, uma concorrência justa entre todas as empresas. No entanto, estudos sociológicos na Índia e no Canadá mostraram que o acesso e o uso de dados abertos são condicionados por critérios materiais (eletricidade, posse de equipamentos de informática) e sociais (educação).
Além disso, segundo alguns estudos, a divulgação destes dados públicos dividiria por cinco o capital necessário para o exercício de uma atividade profissional no setor da telefonia móvel . O relatório MEPSIR de 2006, financiado pela Comissão Europeia, estima que o mercado europeu ligado à reutilização da informação pública representa 27 mil milhões de euros.
Além disso, o impacto econômico direto e indireto foi estimado em 140 bilhões de euros por ano para a Europa.
A partir de 2016, vários governos têm planos em vigor para desenvolver inteligência artificial . Esses governos sublinharam o papel essencial dos dados abertos para o desenvolvimento de um setor econômico de inteligência artificial.
Existem opiniões divergentes sobre a implementação de dados abertos que se resumem ao “ Paradoxo do Ovo e da Galinha ”:
A abertura dos dados requer a afixação de uma licença definindo as condições em que esses dados podem ser copiados, distribuídos, reutilizados livremente. Como os contextos legais variam de um país para outro, várias licenças são usadas hoje em todo o mundo.
Open data commons é um projeto lançado no Reino Unido em dezembro de 2007 pela Open Knowledge Foundation . A primeira licença gratuita do projeto foi desenvolvida em março de 2008 por Jordan Hatcher e D r Charlotte Waelde.
Essas licenças podem ser aplicadas a bancos de dados e os dados que eles contêm podem ser considerados isoladamente. A Open Knowledge Foundation desenvolveu três tipos de licenças de dados gratuitas que se baseiam em sua legislação interna, ela própria baseada no modelo anglo-saxão e que difere dos direitos romano-germânicos, ou seja, o direito civil, com uma proteção moral mais reconhecida e bem-sucedida direitos. Portanto, a aplicação de algumas dessas licenças a obras intelectuais não é válida na França, mas pode ser considerada para a divulgação de dados públicos na medida em que são, por definição, públicos.
Licença e dedicação de domínio públicoO Domínio Público e Licença (PDDL) dá a possibilidade de usar, copiar, modificar, redistribuir um banco de dados sem qualquer restrição. É uma licença de tipo de domínio público livre de todos os direitos. Os dados podem, portanto, ser utilizados de forma totalmente gratuita e o autor abre mão de seus direitos morais.
Open Database CommonsEsta licença, que se encontra na sigla ODC-by, autoriza a utilização, cópia, redistribuição, modificação, produção de obras derivadas da base de dados, desde que indique o nome do autor da base de dados original. Esses princípios podem ser encontrados na licença Creative Commons By .
Licença Open Data Commons Open DatabaseA licença ODbL é baseada em direitos autorais e direitos de banco de dados sui generis. Ele permite que os usuários copiem, distribuam, usem, modifiquem e produzam um trabalho derivado de um banco de dados sujeito a redistribuí-lo sob as mesmas condições impostas pela licença original. Também envolve a indicação do nome do autor do banco de dados original.
Com exceção da licença CC-0 especialmente projetada, as licenças da família Creative Commons não são adequadas para uso em banco de dados. Na verdade, centram-se apenas nos direitos de autor e negligenciam o direito sui generis das bases de dados: corre-se o risco de, por um lado, torná-los ineficazes (o cumprimento das suas obrigações já não está vinculado à transmissão de direitos.) E, por outro, fazer incerto o estado dos dados disseminados ao abrigo dessas licenças (o possível direito sui generis de as bases de dados não serem partilhadas).
De acordo com a lei francesa, os dados públicos são considerados susceptíveis de conter informações sensíveis, seja porque permitem a identificação de uma pessoa, ou porque estão sujeitos a direitos autorais, segredo de Estado ou para considerações de defesa nacional . Neste contexto, os dados não podem ser divulgados livremente sem autorização prévia ou devem ser anonimizados. Assim que os direitos de transmissão forem garantidos, as licenças serão aplicadas. Diferentes organizações desenvolveram licenças gratuitas aplicáveis a qualquer tipo de conteúdo, público ou criação da mente. Esses são modelos de licença de negócios simples que não exigem conformidade. Podem ser celebrados contratos inéditos, desde que respeitado o direito interno, tanto no que se refere ao disposto nas leis de 17 de julho de 1978 ou mesmo de 6 de janeiro de 1978, quanto no que diz respeito às normas de ordem pública aplicáveis ao contrato. . Na França, até cinco licenças de reutilização diferentes foram afixadas para abrir os dados. Em 2013, a harmonização de práticas conduziu à utilização de duas licenças padrão utilizadas em proporções equivalentes: a Open License e a Open Database License.
Licença do Ministério da Justiça francêsO Ministério da Justiça tomou a iniciativa de projetar uma licença adaptada aos dados públicos, a Licença de Informação Pública Reutilizável Gratuitamente, comumente chamada de LIP.
Dá a possibilidade de reaproveitar gratuitamente os dados do Diretório do ministério, mesmo para fins comerciais, sob a condição de citar as fontes, a data de atualização, para não alterar os dados e não distorcer o significado.
Também está previsto que o usuário só pode autorizar uma nova reutilização sob licença sob a condição de agregar valor aos dados originais.
Licença AbertaEsta licença criada pela ETALAB deve ser usada em particular em data.gouv.fr.
Licença de banco de dados abertoA licença ODbL foi traduzida para o francês pela cidade de Paris a fim de adaptá-la ao uso nacional. Uma variedade de projetos usam esta licença, de OpenStreetMap a comunidades locais (Paris, Nantes, Toulouse…).
A Open Knowledge Foundation publicou o índice global de dados abertos .
A World Wide Web Foundation publica o barômetro de dados abertos para medir a abertura dos dados e seu impacto por país.
A OCDE publica um ranking denominado Dados de Governo Aberto sobre a abertura de dados públicos em seus países membros.
Todos os anos, no final de fevereiro ou início de março, a Open Knowledge Foundation organiza o Open data day (in) .