O estudo randomizado duplo-cego , randomizado , randomizado ou duplo-cego (ou duplo-cego ) é uma abordagem experimental usada em muitas disciplinas de pesquisa, como medicina , ciências sociais e psicologia , ciências naturais , como física e biologia .
Nas farmácias, é utilizado no desenvolvimento de novos medicamentos e na avaliação da eficácia de um processo ou tratamento. Por exemplo, durante um estudo de drogas, nem o paciente nem o prescritor sabem se o paciente está usando a droga ativa ou o placebo . O papel de tal protocolo, que é relativamente complicado de configurar, é reduzir tanto quanto possível a influência nas variáveis medidas que o conhecimento de uma informação sobre o paciente poderia ter (primeiro "cego") .e no médico (segundo "cego"). É a base da medicina baseada em evidências .
Há ainda um refinamento adicional com o procedimento denominado “triplo cego” ou “triplo cego”, onde o terceiro “cego” é o pesquisador que realiza o tratamento estatístico dos dados. Embora menos comum, essa abordagem oferece um nível de prova ainda mais aprimorado.
O uso de estatísticas para demonstrar a eficácia de um tratamento remonta ao XIX ° século : o físico Pierre Charles Alexandre Louis (1787-1872) mostrou que o tratamento da pneumonia por sanguessugas não era benéfico, mas prejudicial.
Os primeiros estudos em "single cego" , o paciente sem saber se recebe o tratamento real ou um placebo , surgem no final do século E para comprovar o engano do magnetismo animal desenvolvido por Franz-Anton Mesmer , como outros " técnicas magnéticas . Armand Trousseau (1801-1867) inventou as primeiras pílulas de placebos, feitas de farinha de rosca, e demonstrou assim sua equivalência em termos de eficácia com os medicamentos homeopáticos .
Um dos problemas da pesquisa médica é que não se pode variar um parâmetro deixando o outro constante: a vida é feita de equilíbrio e a variação de um parâmetro repercute nos demais (reação de equilíbrio corporal, homeostase ). Outro problema é que as pessoas reagem de maneiras muito diferentes, e a reação de uma pessoa pode variar dependendo de quando o estudo é feito; algumas pessoas se recuperam da doença por conta própria, outras respondem à medicação mais ou menos bem, e até mesmo o tratamento pode às vezes ter efeitos benéficos ou negativos, mesmo que o tratamento em si seja ineficaz ( efeito placebo ). A ideia é diminuir a influência da subjetividade dos stakeholders.
Como é impossível se libertar da diversidade humana, ela deve ser levada em consideração no estudo . Formam-se então dois grupos de pacientes, um recebendo um tratamento contendo o princípio ativo (o medicamento), o outro recebendo um placebo (tratamento sem princípio ativo , geralmente apresentado na mesma forma galênica ). A distribuição do princípio ativo / placebo é feita de forma aleatória e nem a pessoa que faz o tratamento nem a que o administra sabem se existe algum princípio ativo ( duplo-cego ). O levantamento do véu só é feito após processamento estatístico.
Só podemos dizer que um tratamento tem efeito se observarmos uma diferença estatisticamente significativa entre os dois grupos, ou seja, que a probabilidade de que a diferença observada entre os dois tratamentos seja devida apenas ao acaso, esteja abaixo de um determinado limiar fixo. . Na medicina, esse limite é frequentemente estabelecido em 5%.
Nenhum tratamento é 100% eficaz (em todos em todos os casos). A cura natural também não é sistemática. Portanto, é necessário estudar um número suficientemente grande de casos para poder excluir um enviesamento estatístico .
Coloquemo-nos num caso “binário”: a pessoa cura ou não cura. Portanto, temos dois grupos, o grupo "m" que recebeu a droga e o grupo "p" que recebeu o placebo.
Grupos de tamanho idênticoAssumiremos que cada grupo consiste em n pessoas (são do mesmo tamanho).
No grupo “m”, o número de pessoas que se recuperaram é O m ( O para “observado”). No grupo “p”, o número de pessoas que se recuperaram é O p . As respectivas taxas de cura p m e p p são, portanto:
p m = O m / n p p = O p / nA tabela de resultados é:
Grupo "m" | Grupo "p" | |
---|---|---|
Curado | O m | O p |
Não curado | n - O m | n - O p |
Usamos um teste χ² de independência, ou teste χ² de Pearson: temos duas hipóteses
Sob a hipótese nula , os dois grupos podem ser mesclados. Portanto, temos um grupo de 2 × n pessoas e um número de curas igual a O m + O p . A taxa de cura p 0 na hipótese nula é, portanto,
p 0 = ( O m + O p ) / (2 × n )Assim, na hipótese H 0 , o número de curas no grupo "m" como no grupo "p" deve ser E ( E para "esperado", ou "esperado" em inglês):
E = p 0 × nDevemos, portanto, ter a seguinte tabela.
Grupo "m" | Grupo "p" | |
---|---|---|
Curado | E | E |
Não curado | n - E | n - E |
O χ² é a soma, para todas as células da tabela, das diferenças quadradas entre o valor teórico e o valor observado, dividido pelo valor teórico:
qualquer um neste caso
Este valor deve ser comparado com o valor tabulado, considerando um risco de erro, normalmente 5%, e o número de graus de liberdade, que é o produto
(número de linhas na tabela - 1) × (número de colunas na tabela - 1),ou seja, 1 grau de liberdade aqui. Colocamo-nos no caso de um teste bilateral, ou seja, apenas procuramos saber se os valores são diferentes ou não, sem prejulgar o sentido da diferença.
Erro permitido ( p ) | 50% ( p = 0,5) |
10% ( p = 0,1) |
5% ( p = 0,05) |
2,5% ( p = 0,025) |
1% ( p = 0,01) |
0,1% ( p = 0,001) |
---|---|---|---|---|---|---|
χ² | 0,45 | 2,71 | 3,84 | 5.02 | 6,63 | 10,83 |
Portanto, para um risco de erro de 5%:
Agora temos um grupo "m" de tamanho n m com curas O m , e um grupo "p" de tamanho n p com curas O p . A tabela de valores observados é:
Grupo "m" | Grupo "p" | |
---|---|---|
Curado | O m | O p |
Não curado | n m - O m | n p - O p |
Nós temos
p 0 = ( S m + ó p ) / ( n m + n p ).Na hipótese H 0 , o número de curas no grupo "m" deve ser E m e o número de curas no grupo "p" deve ser E p :
E m = p 0 × n m E p = p 0 × n pDevemos, portanto, ter a seguinte tabela.
Grupo "m" | Grupo "p" | |
---|---|---|
Curado | E m | E p |
Não curado | n m - E m | n p - E p |
O χ² é:
é
.Este valor é igualmente comparado ao valor tabulado para validar ou invalidar a hipótese nula.
Exemplo O grupo “m” tem 98 pessoas e 19 se recuperaram; o grupo “p” tem 101 pessoas e 8 já se recuperaram. Portanto, temos as seguintes tabelas:Grupo "m" | Grupo "p" | |
---|---|---|
Curado | 19 | 8 |
Não curado | 79 | 93 |
De acordo com a regra clássica, os números teóricos E i devem ser maiores ou iguais a 5 (cf. teste χ²> Condições de teste ). Isso significa que são necessárias pelo menos vinte pessoas, já que temos quatro turmas. Na verdade, é necessário mais, pois as frequências raramente são iguais a 0,5.
Se p é a probabilidade do evento no qual estamos interessados en é o tamanho da população estudada, então estimamos que devemos ter:
n × p ≥ 5 e n × (1 - p ) ≥ 5visto que (1 - p ) é a frequência do evento complementar, ou seja:
n ≥ 5 / p e n ≥ 5 / (1 - P )Em alguns casos, o estudo não classifica os pacientes em grupos curados / não curados, mas mede um parâmetro quantificável, por exemplo, a duração da doença (em dias), o nível de uma determinada substância, o valor de tal parâmetro fisiológico ( por exemplo, fração de ejeção do ventrículo esquerdo, glicemia, etc.). Essa quantificação - ou digitalização - da doença às vezes é difícil de fazer, por exemplo, no caso de dor , depressão .
Nesse caso, o parâmetro é avaliado paciente por paciente. Isso resulta em dois conjuntos de valores, um para o grupo "m" e outro para o grupo "p". Esses conjuntos de valores são geralmente resumidos por dois valores, a média E i e o desvio padrão σ i :
A primeira pergunta a fazer é a lei segundo a qual os valores seguem dentro de um grupo. Na maioria das vezes, considera-se que seguem uma distribuição normal , mas é necessário lembrar de verificá-la .
Os intervalos de confiança são então determinados : para cada um dos grupos, os valores entre os quais a média estaria com 95%, ou 99% de probabilidade, são determinados se tivéssemos acesso a um número infinito de pacientes. A lei do aluno é usada para isso : o intervalo de confiança é da forma
[ E - t γ ni -1 · σ; E + t γ ni -1 · σ]onde t γ ni -1 é o quantil da lei de Student para:
Para que os dois grupos sejam distinguidos, as expectativas E m e E p devem estar distantes o suficiente para não aparecer no intervalo de confiança do outro grupo.
Força de trabalho ( n ) | Nível de confiança (α) | ||||
---|---|---|---|---|---|
50% (α = 0,5; γ = 0,25) |
90% (α = 0,9; γ = 0,05) |
95% (α = 0,95; γ = 0,025) |
99% (α = 0,99; γ = 0,005) |
99,9% (α = 0,999; γ = 0,000 5) |
|
5 | 0,741 | 2.132 | 2.776 | 4.604 | 8,610 |
10 | 0,703 | 1.833 | 2.262 | 3.250 | 4.781 |
20 | 0,688 | 1.729 | 2.093 | 2.861 | 3.883 |
50 | 0,679 | 1.676 | 2,009 | 2.678 | 3.496 |
100 | 0,677 | 1.660 | 1,984 | 2.626 | 3,390 |
∞ | 0,674 | 1.645 | 1.960 | 2.576 | 3.291 |
Risco alfa: risco de falso negativo.
Risco beta: poder do teste (seletividade entre as duas populações).
O teste duplo-cego também se aplica quando se deseja testar a eficácia de um novo tratamento em relação a outro, sendo este último denominado "tratamento de referência": trata-se de determinar se o novo tratamento proposto é significativamente mais eficaz do que o anterior. 1.
O teste duplo-cego também é comumente utilizado fora da área médica quando se deseja realizar um estudo livre de vieses de percepção, ciente ou não do assunto a ser testado (preconceitos). Este é particularmente o caso durante estudos comparativos de marketing ou para testes organolépticos (medição da qualidade do sabor de um alimento por um júri).
No contexto da pesquisa biomédica, um estudo duplo-cego pode levar a dificuldades em detectar uma subeficácia do tratamento testado em comparação com seu comparador, ou uma maior frequência de efeitos indesejáveis (o cego evita se um grupo de tratamento é significativamente diferente antes revelador). Em ensaios clínicos onde o monitoramento parece crítico (ensaios multicêntricos multinacionais, por exemplo, onde o monitoramento pode ser complexo), pode ser decidido criar um Comitê de Monitoramento e Acompanhamento , independente do patrocinador, que examina os dados (sem levantamento de ' cego) durante as análises intermediárias.
Embora a eficácia estatística dos estudos duplo-cegos esteja fora de dúvida, eles apresentam problemas éticos. Na verdade, se os testes envolverem cobaias animais, se envolverem patologias benignas ou tratamentos de eficácia duvidosa presumida ( homeopatia ), então não há problema em usar placebos . A situação, porém, é diferente no caso de patologias graves, que envolvem testes em humanos. O fornecimento de placebos aos pacientes, enquanto estudos-piloto têm, por exemplo, sido capazes de confirmar a eficácia de um tratamento, ultrapassa os limites da ética médica e dos princípios anunciados pela Declaração de Helsinque . Na verdade, os responsáveis pelos estudos muitas vezes tendem a liberar sua responsabilidade assinando o consentimento informado do paciente, enquanto na maioria das vezes o paciente não tem outra alternativa a não ser dar o seu acordo senão recusar qualquer tratamento, sendo pouco capaz de julgar a relevância ou pontualidade dos testes a que é submetido.
O uso de estudos duplo-cegos e, portanto, o uso de placebos, às vezes é bastante automático, senão sistemático como no caso do FDA , embora às vezes possamos nos contentar em comparar a eficácia de dois tratamentos, tendo validado pelo menos a Fase 2 de um estudo clínico , sem uso de grupo controle , para verificar a ausência de viés de seleção, em benefício dos pacientes. No entanto, nenhum regulamento nesse sentido foi adotado na França em 2020, o que permitirá que as opiniões dos comitês de proteção individual sejam formuladas .