Os dados brutos (também conhecidos como dados primários) são dados não interpretados de uma fonte primária , com características a ela associadas e que foram submetidos a algum tratamento ou qualquer outra manipulação.
Os dados brutos podem ser inseridos em um programa de computador ou usados em procedimentos manuais, como análise estatística de uma pesquisa.
Podem ser dados binários de dispositivos de armazenamento eletrônico, como unidades de disco rígido .
Os dados brutos contêm mais ou menos informações factuais . Muitas vezes são quantitativos , presumidos como confiáveis se o instrumento que os produziu foi devidamente calibrado e se o processo de coleta não é tendencioso e se estão corretamente contextualizados.
No campo da investigação científica (onde é necessário poder repetir um experimento para o verificar ou validar), os factos apresentados ou validados sem fornecer acesso a dados brutos são cada vez mais sujeitos a precauções. Está ficando suspeito não mantê-los porque, nos últimos anos, os custos de armazenamento diminuíram e tem havido um aumento de escândalos relacionados a erros de conhecimento induzidos a partir de dados brutos.
No entanto, de acordo com Geoffrey C. Bowker (2005), “Devemos abrir o debate - embora não haja nenhum sério - sobre as diferentes temporalidades , espacialidades e materialidades que provavelmente representamos graças às nossas bases. Dados , com, em vista, um desenho que permite a máxima flexibilidade, e permite, tanto quanto possível, o surgimento da polifonia e da policronia . A expressão “dados brutos” é tanto um oxímoro quanto uma má ideia; pelo contrário, os dados devem ser preparados com cuidado. " .