Statistiques :: CalinskiHarabasz

Statistiques :: CalinskiHarabasz est une extension Perl de la règle d'arrêt de grappes proposée par Calinski et Harabasz (CH).
Télécharger maintenant

Statistiques :: CalinskiHarabasz Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • Perl Artistic License
  • Prix:
  • FREE
  • Nom de l'éditeur:
  • Anagha Kulkarni
  • Site Internet de l'éditeur:
  • http://search.cpan.org/~anaghakk/Statistics-CalinskiHarabasz-0.01/lib/Statistics/CalinskiHarabasz.pm

Statistiques :: CalinskiHarabasz Mots clés


Statistiques :: CalinskiHarabasz La description

Statistiques :: CalinskiHarabasz est une extension Perl de la règle d'arrêt de grappes proposée par Calinski et Harabasz (CH). Statistiques :: CalinskiHarabasz est une extension Perl de la règle d'arrêt du cluster proposée par Calinski et Harabasz (CH) .Synopsis Utilisation Statistiques :: Calinskiharabasz; ch (entrementfile, "agglo", 10); Le fichier d'entrée est attendu dans le format "dense" - fichier d'entrée d'échantillon: 65 11 00 11 00 00 01 10 01 11 00 01 10 00 01 11 00 1 CH Utilisez le Critère de ratio de variance analogue aux statistiques f f-à estimer le nombre de grappes une donnée donnée appartient naturellement. Ils minimisent la somme des carrés de grappe / groupe de carrés (WGSS) et optimisent entre la fonction de cluster / somme de SQUARE (BGSS) exportation "CH" fonction par défaut.InputInputFileTheeTheTeTaset d'entrée est attendue dans le format de matrice "dense". La matrice dense d'entrée est attendue dans un fichier texte brut où la première ligne du fichier donne les dimensions de l'ensemble de données, puis le jeu de données dans un format matriciel devrait suivre. Les contextes / observations doivent être le long des lignes et les caractéristiques doivent être le long de la colonne. EG: 65 11 00 11 00 00 01 10 00 11 10 01 10 00 01 11 00 1 La première ligne (65) donne le nombre de lignes (observations) et Le nombre de colonnes (fonctionnalités) présentes dans la matrice suivante. Suite à chaque ligne enregistre la fréquence de l'occurrence de la fonctionnalité de la colonne de l'observation donnée. Ainsi caractéristiques1 (1ère colonne) se produit une fois dans l'observation1 et en infrit une fois dans toutes les autres observations, tandis que la fonctionnalité3 ne se produit pas dans l'observation1.CompteringMethode de clustering Mesures pouvant être utilisées sont les suivantes: 1. RB - Bisections répétées 2. RBR - Bisections répétées pour le raffinement de K-Way 3. Direct - Direct K-Way Clustering 4. Agglo - Clustering Agglomératif 5. Graphique - Gravage - graphique - Gravage de clusters à base de partitionnement 6. BAGGLO - Clustering d'agglomératifs biaisé partitionné Vuethis est une limite supérieure approximative du nombre des grappes qui peuvent être présentes dans l'ensemble de données. Ainsi, pour un ensemble de données que vous vous attendez à être séparé dans 3 clusters, cette valeur doit être définie une valeur entière supérieure à celle du nombre d'entiers unique 3.OutPUTA, qui est l'estimation du nombre de clusters présentes dans le jeu de données d'entrée. Exigences: · Perl · Ce module utilise une suite de programmes C appelés Cluto à des fins de clusterage. Ainsi, Cluto doit être installé pour ce module pour être fonctionnel.


Statistiques :: CalinskiHarabasz Logiciels associés