Um domínio de proteína é uma parte de uma proteína capaz de adotar uma estrutura de forma autônoma ou parcialmente autônoma do resto da molécula. É um elemento modular da estrutura das proteínas que pode, portanto, ser composto pela montagem de vários desses domínios. Isso é chamado de proteína de múltiplos domínios.
Os domínios de proteína geralmente formam uma estrutura compacta e estável e às vezes podem ser produzidos de forma independente (por engenharia genética, clivagem proteolítica, etc.). Eles podem carregar certas funções específicas da proteína completa: ligação de ligantes , interação com outras macromoléculas, sítio catalítico , etc.
Um determinado domínio de proteína é geralmente caracterizado por sua estrutura tridimensional e por um certo número de aminoácidos conservados em sua estrutura primária. O mesmo domínio de proteína pode estar presente em proteínas diferentes (veja a figura) com várias funções. Essa organização modular de proteínas em domínios é uma das alavancas da evolução molecular que permite que sejam usadas em combinação como blocos de construção para construir uma ampla variedade de proteínas.
A definição de um domínio de proteína é assim articulada em torno de três conceitos: unidade básica de estrutura , unidade básica de função , unidade básica de dobramento .
O tamanho típico de um domínio de proteína varia entre 30 e 500 aminoácidos, com uma média de cerca de cem aminoácidos.
A existência de intermediários no dobramento de cada um dos monômeros da proteína foi demonstrada por Michel Goldberg em 1969, que designou como “glóbulos” essas regiões de cadeias polipeptídicas que se dobram autonomamente, em torno de centros de nucleação. Independentes, antes do desenvolvimento da estrutura terciária completa da proteína. Em 1973, um modelo semelhante foi proposto por Donald B. Wetlaufer sob o nome de "domínio", termo que foi finalmente adotado.
Existe uma grande diversidade de domínios de proteína, mas, no entanto, mais limitada do que a de proteínas inteiras. Algumas estimativas apresentam a figura de apenas alguns milhares de estruturas possíveis para um domínio globular. Podemos reconhecer elementos recorrentes na arquitetura desses domínios, o que tornou possível fazer uma classificação.
Certos domínios são muito comuns e estão presentes em muitas proteínas. O motivo de reconhecimento de RNA ou domínio RRM foi assim encontrado nas sequências de não menos do que 928 proteínas codificadas no genoma humano .