Análise Fatorial

A análise fatorial é um termo que agora se refere a vários métodos de grandes tabelas retangulares que analisam dados para identificar e priorizar os fatores correlacionados aos dados colocados nas colunas.

No sentido anglo-saxão do termo, a análise fatorial se refere a um método da família das estatísticas multivariadas , usado para descrever um conjunto de variáveis ​​observadas, por meio de variáveis ​​latentes (não observadas). Para reduzir o número de variáveis, o método calcula essas variáveis ​​latentes como combinações lineares das variáveis ​​observadas. Fundada no início do XX °  século por Charles Spearman , este método é usado em psicologia e particularmente psicometria . Na metodologia Q , Stephenson, um aluno de Spearman, distingue entre a análise do fator R, que se concentra nas diferenças interindividuais, e a análise do fator Q, que se concentra nas diferenças intraindividuais. Na França, a terminologia “análise fatorial” representa outra família de métodos mais recentes e aplicações muito mais amplas que afetam a maioria das disciplinas que lidam com grandes tabelas de dados. Esta família é composta principalmente pela análise de componentes principais (PCA) e análise fatorial de correspondência (CFA), desenvolvida por Jean-Paul Benzecri em Rennes e depois em Paris a partir dos anos sessenta.

Definição

Na língua dos médicos franceses, o termo análise fatorial designa uma subfamília de métodos de análise de dados , ao lado de métodos de classificação automática . Na análise fatorial no sentido francês, associamos às linhas e colunas de uma tabela de dados uma nuvem de pontos evoluindo em um grande espaço. Mais precisamente, se a tabela tem linhas e colunas e tem o termo geral (na interseção da linha e da coluna ), construímos:

A análise fatorial (no sentido da escola francesa) analisa as nuvens e por meio de representações sobre eixos e planos dessas nuvens que respeitam ao máximo as proximidades e distâncias entre pontos. Essas representações são obtidas projetando cada uma dessas nuvens em suas direções principais de inércia (também chamadas de “eixos principais”). Na maioria dos casos, fica-se satisfeito com a representação nas primeiras direções de inércia, mesmo no primeiro plano (conhecido como plano 1,2), onde se observa a silhueta mais extensa da nuvem de pontos. Mais precisamente, para escolher o número de eixos ou planos a observar, contamos com a porcentagem de informação que está representada em cada uma dessas projeções. As representações obtidas mostram os elementos mais importantes da diversidade dos dados e permitem a pesquisa dos principais fatores descritivos. Eles são uma visualização insubstituível da tabela de dados.

Métodos de análise fatorial

Os métodos fatoriais se beneficiam de uma propriedade notável conhecida como dualidade. As coordenadas dos pontos da nuvem (in ) obtidas pela projeção em seus eixos principais estão vinculadas às coordenadas de (in ) em seus eixos principais. As duas representações (de e de ) devem ser estudadas juntas (ou mesmo representadas juntas como é o caso em AFC e ACM) e descrever a mesma estrutura da tabela de dados, uma das linhas e outra das colunas.

Os métodos de análise fatorial são complementares e foram desenvolvidos progressivamente em paralelo com a generalização dos meios de cálculo informatizados de acordo com as diferentes necessidades das disciplinas e equipas.

A análise fatorial de correspondência merece menção especial. Desenhado no início dos anos 1960 por Jean-Paul Benzécri , então professor da Faculdade de Ciências de Rennes, foi o ponto de cristalização da Escola Francesa de Análise de Dados. Desde a primeira apresentação da análise fatorial de correspondências , a ênfase está na geometria: construção de nuvens de pontos de linhas e colunas, definição de uma métrica (= distância: a famosa distância de chi²) adaptada nos espaços usados ​​( e ), simultânea representação de linhas e colunas permitidas pela dualidade, etc. As apresentações francesas da análise de componentes principais devem muito à análise fatorial de correspondência.

A análise fatorial no sentido francês é, portanto, uma família de métodos exploratórios: abordamos os dados sem suposições a priori; olhamos o que os dados têm a dizer.

Nisso, eles se opõem à análise fatorial de Spearman, às vezes chamada de confirmatória. Alguns consideram que a análise fatorial confirmatória é, de certa forma, o próximo passo para a análise fatorial exploratória. Serve, como o próprio nome sugere, para confirmar o modelo em estudo. Este é um caso especial de modelagem de equações estruturais. Na prática, os usuários nunca implementam os dois tipos de métodos nos mesmos dados, cada um com suas próprias opções.

Finalmente, a prática da análise fatorial no sentido francês vai muito além da implementação de uma família de métodos. Com o tempo, toda uma metodologia foi criada, cujos elementos mais marcantes são a inclusão de elementos adicionais e a sequência: análise fatorial e classificação.

Veja também

Notas e referências

  1. McKeown, Bruce. , Metodologia Q ,2013, 96  p. ( ISBN  978-1-4522-4219-4 e 1452242194 , OCLC  841672556 , leia online )
  2. (em) W. Stephenson , "  Technique of Factor Analysis  " , Nature , vol.  136, n o  3434,Agosto de 1935, p.  297-297 ( ISSN  0028-0836 e 1476-4687 , DOI  10.1038 / 136297b0 , ler online , acessado em 26 de abril de 2019 )
  3. O livro Escofier & Pagès 2008. representa bem o ponto de vista francês sobre a análise fatorial.
  4. No livro Escofier & Pagès 2008. O Capítulo 5 apresenta em detalhes esse núcleo comum a todos os métodos fatoriais.
  5. Um capítulo inteiro de Pagès 2013. é dedicado ao AFMH.
  6. Uma data importante na análise dos dados franceses é 1973, data da publicação do tratado de Benzécri et al.
  7. Esta primeira apresentação é a tese de Brigitte Escofier-Cordier , defendida em 1965 na Universidade de Rennes. Esta tese foi publicada em Escofier-Cordier 1969.
  8. É o caso das referências já citadas, mas de muitos outros trabalhos como Husson, Lê & Pagès 2009.

Bibliografia

Jean-Paul Benzécri et al. , Análise de dados: 1 Taxonomia , Paris, Dunod ,1973, 615  p. ( ISBN  2-04-003316-5 )

Jean-Paul Benzécri et al. , Análise de dados: 2 Análise de correspondência , Paris, Dunod ,1973, 619  p. ( ISBN  2-04-007335-3 )

Brigitte Escofier-Cordier, “  Fatorial Analysis of Correspondences  ”, Cahiers du BURO (University Office for Operational Research) , vol.  13,1969, p.  25-59 ( leia online [PDF] )

Brigitte Escofier e Jérôme Pagès, Análise de fatores simples e múltiplos: objetivos, métodos e interpretação , Paris, Dunod, Paris,2008, 318  p. ( ISBN  978-2-10-051932-3 )

François Husson, Sébastien Lê e Jérôme Pagès, Análise de dados com R , Presses Universitaires de Rennes ,2009, 224  p. ( ISBN  978-2-7535-0938-2 )

Jérôme Pagès, Análise fatorial múltipla com R , Les Ulis, EDP sciences, Paris,2013, 253  p. ( ISBN  978-2-7598-0963-9 )

links externos

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">