Índice de Dunn

O índice Dunn é uma medida de qualidade de uma partição de um conjunto de agrupamento de dados .

É a razão entre a distância máxima que separa dois elementos classificados em conjunto e a distância mínima que separa dois elementos classificados separadamente.

É um índice que não se baseia em uma distância específica e, portanto, pode ser usado em uma ampla variedade de situações.

Uma alternativa ao índice de Dunn é o índice de Davies-Bouldin .

Expressão

Posição do problema

Se observarmos a matriz de dados, cada linha corresponde a um indivíduo (ou observação) e cada coluna corresponde a um preditor (ou variável). Observamos o número de indivíduos e o número de preditores:

X=(x11...xp1⋮⋮x1NÃO...xpNÃO){\ displaystyle X = \ left ({\ begin {array} {ccc} x_ {1} ^ {1} & ... & x_ {p} ^ {1} \\\ vdots && \ vdots \\ x_ {1 } ^ {N} & ... & x_ {p} ^ {N} \\\ end {array}} \ right)}

Observe a dessemelhança entre indivíduos e (respectivamente, linha e de ). Observe o número de grupos que queremos formar.

Um algoritmo de particionamento dará uma função de atribuição cuja relevância procuramos avaliar por meio de uma pontuação. O conjunto de pontos pertencentes a um grupo é então dado por .

Expressão de índice de Dunn

O índice (ou pontuação) de Dunn ,, é baseado na média de pontos de cada grupo e no diâmetro do grupo .

Sua expressão será:

SD=min1⩽k<k′⩽Kd(µk,µk′)max1⩽k⩽KΔk{\ displaystyle S_ {D} = {\ frac {\ displaystyle \ min _ {1 \ leqslant k <k '\ leqslant K} d (\ mu _ {k}, \ mu _ {k'})} {\ displaystyle \ max _ {1 \ leqslant k \ leqslant K} \ Delta _ {k}}}} Pode variar um pouco de acordo com as implementações (definição do diâmetro de um grupo, distância entre centros substituída por outra distância entre grupos ).

Propriedades

Faixa de variação

O índice de Dunn varia entre 0 (pior classificação) e (melhor classificação).

Complexidade


Notas e referências

  1. Um parente difuso do processo ISODATA e seu uso na detecção de clusters compactos bem separados, Dunn, Joseph C., Journal of Cybernetics, 1973.
  2. (em) "  Clustering Indexes  " em cran.r-project.org (acessado em 19 de junho de 2019 )

Veja também

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">