Desenvolvido por | Apache Software Foundation |
---|---|
Primeira versão | 4 de janeiro de 2015 |
Última versão | 1.18.0 (5 de setembro de 2020) |
Depósito | github.com/apache/drill e git: //git.apache.org/drill.git |
Status do projeto | Desenvolvimento |
Escrito em | Java |
Licença | Licença Apache |
Local na rede Internet | drill.apache.org |
Apache Drill é uma estrutura de software de código aberto que oferece suporte a aplicativos distribuídos em tempo real para a análise interativa de conjuntos de dados em grande escala. Drill é a versão de código aberto do sistema Dremel do Google que está disponível como um serviço de infraestrutura chamado Google BigQuery. Uma meta de design afirma explicitamente que o Drill é capaz de escalar para 10.000 ou mais servidores e processar petabytes de dados e bilhões de registros em segundos. Drill é um projeto de nível superior para o Apache.
O Drill oferece suporte a muitos bancos de dados NoSQL e muitos sistemas de arquivos como HBase , MongoDB , MapR-DB, HDFS , MapR-FS, Amazon S3 , Armazenamento de Blob do Azure, Google Cloud Storage, Swift, NAS e arquivos locais. Uma única consulta pode juntar dados de data warehouses separados. Por exemplo, você pode anexar o perfil do usuário presente em uma coleção no MongoDB com os logs do Hadoop .
O Drill Optimizer reestrutura automaticamente um plano de execução de consulta para aproveitar as vantagens dos recursos de processamento de data warehouses internos. Além disso, o Drill oferece suporte à localidade dos dados, por isso é interessante colocar o Drill e um armazenamento de dados em vários nós.
Drill é focado principalmente em armazenamentos de dados não relacionais, como Hadoop, NoSQL e armazenamento em nuvem. Os seguintes armazenamentos de dados são atualmente suportados:
Novos datastores podem ser desenvolvidos na forma de plug-ins. O Drill usa um único modelo de dados JSON que permite consultar armazenamentos de dados in-situ não relacionais (muitos desses sistemas de armazenamento são complexos ou sem esquema).
Algumas publicações influenciaram o nascimento e a concepção. Aqui está uma lista parcial: