Apache Drill

Apache Drill

Em formação
Desenvolvido por Apache Software Foundation
Primeira versão 4 de janeiro de 2015
Última versão 1.18.0 (5 de setembro de 2020)
Depósito github.com/apache/drill e git: //git.apache.org/drill.git
Status do projeto Desenvolvimento
Escrito em Java
Licença Licença Apache
Local na rede Internet drill.apache.org

Apache Drill é uma estrutura de software de código aberto que oferece suporte a aplicativos distribuídos em tempo real para a análise interativa de conjuntos de dados em grande escala. Drill é a versão de código aberto do sistema Dremel do Google que está disponível como um serviço de infraestrutura chamado Google BigQuery. Uma meta de design afirma explicitamente que o Drill é capaz de escalar para 10.000 ou mais servidores e processar petabytes de dados e bilhões de registros em segundos. Drill é um projeto de nível superior para o Apache.

O Drill oferece suporte a muitos bancos de dados NoSQL e muitos sistemas de arquivos como HBase , MongoDB , MapR-DB, HDFS , MapR-FS, Amazon S3 , Armazenamento de Blob do Azure, Google Cloud Storage, Swift, NAS e arquivos locais. Uma única consulta pode juntar dados de data warehouses separados. Por exemplo, você pode anexar o perfil do usuário presente em uma coleção no MongoDB com os logs do Hadoop .

O Drill Optimizer reestrutura automaticamente um plano de execução de consulta para aproveitar as vantagens dos recursos de processamento de data warehouses internos. Além disso, o Drill oferece suporte à localidade dos dados, por isso é interessante colocar o Drill e um armazenamento de dados em vários nós.

Características

Apoiar

Drill é focado principalmente em armazenamentos de dados não relacionais, como Hadoop, NoSQL e armazenamento em nuvem. Os seguintes armazenamentos de dados são atualmente suportados:

Novos datastores podem ser desenvolvidos na forma de plug-ins. O Drill usa um único modelo de dados JSON que permite consultar armazenamentos de dados in-situ não relacionais (muitos desses sistemas de armazenamento são complexos ou sem esquema).

Veja também

Referências

  1. "  https://projects.apache.org/json/projects/drill.json  " (acessado em 8 de abril de 2020 )
  2. Versão 1.18.0  " ,5 de setembro de 2020(acessado em 6 de setembro de 2020 )
  3. "A Apache Software Foundation anuncia o Apache ™ Drill ™ como um projeto de nível superior .
  4. "Apache Drill - SQL sem esquema para Hadoop, NoSQL e Cloud Storage . Drill.apache.org.
  5. "Perguntas frequentes - Apache Drill" . drill.apache.org .

Publicações

Algumas publicações influenciaram o nascimento e a concepção. Aqui está uma lista parcial:

links externos