salut,
quand on fait une classification avec fc-means ou k-means, on doit savoir le nombre de classes au départ, alors comment fait-on ce choix? et comment sait-on s'il est optimal ou non ?
merci
salut,
quand on fait une classification avec fc-means ou k-means, on doit savoir le nombre de classes au départ, alors comment fait-on ce choix? et comment sait-on s'il est optimal ou non ?
merci
Tu peux trouver le nombre de classes optimales en effectuant ta classification sur 1 classe puis 2, puis 3, ... . Pour chacune des classifications, tu calcules la distance intra-classe. Enfin, tu traces la courbe résultante (ie: distance interclasse en fonction du nombre de classe). Tu verras (normalement) un point d'inflexion sur ta courbe (ie: une cassure, ça doit décroitre fortement puis tout doucement d'un seul coup). Ce point d'inflexion correspond à ton nombre optimal de classe.
Bonsoir,
normalement, lorsque l'on fait du clustering on connaît le nombre de classe que l'on souhaite.
Si ce n'est pas le cas, tu peux toujours utiliser les cartes auto-organisatrices de Kohonen.
Sinon, certaines recherches ont permis de déterminer automatiquement le nombre de classe optimal. Voilà quelques références :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47 @article{LML99, Author = {Xin Li and Man Wai Mak and Chi Kwong Li}, Journal = {Journal of Advanced Computational Intelligence and Intelligent Informatics}, Keywords = {Clustering, RCPL algorithm, Optimal cluster number, Competitive learning, Elliptical basis function networks}, Month = {April}, Number = {6}, Pages = {467-473}, Title = {Determining the Optimal Number of Clusters by an Extended RPCL Algorithm}, Volume = {3}, Year = {1999}} @inproceedings{HalkidiVazirgiannis01, Address = {Washington, DC, USA}, Author = {Maria Halkidi and Michalis Vazirgiannis}, Booktitle = {IEEE Internationnal Conference On Data Mining}, Keywords = {Clustering, Optimal cluster number}, Pages = {187-194}, Publisher = {IEEE Computer Society}, Title = {Clustering Validity Assessment: Finding the optimal partitioning of a data set}, Year = {2001}} @article{KLL04, Address = {Oxford, United Kingdom}, Author = {Dae-Won Kima and Kwang H. Leea and Doheon Lee}, Journal = {Pattern Recognition}, Keywords = {Fuzzy cluster validity, Fuzzy clustering, Clustering, Optimal cluster number}, Number = {10}, Pages = {2009-2025}, Publisher = {Elsevier Science}, Title = {On cluster validity index for estimation of the optimal number of fuzzy clusters}, Volume = {37}, Year = {2004}} @inproceedings{ALSN06, Author = {O. Ammor and A. Lachkar and K. Slaoui and N. Rais}, Booktitle = {IEEE on Advances in Cybernetic Systems}, Keywords = {Clustering, Optimal cluster number, Overlapping cluster}, Pages = {26-31}, Title = {New Efficient Approach to Determine the Optimal Number of Clusters in Overlapping Cases}, Year = {2006}}
Consignes aux jeunes padawans : une image vaut 1000 mots !
- Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
- Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
-ton poste tu dois marquer quand la bonne réponse tu as obtenu.
Partager