Rubryx

RubryX est un programme de classification des sites Web.
Télécharger maintenant

Rubryx Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • Trial
  • Nom de l'éditeur:
  • Vladimir Polyakov
  • Systèmes d'exploitation:
  • Windows All
  • Taille du fichier:
  • 336 KB

Rubryx Mots clés


Rubryx La description

RubryX est une application logicielle de la classification des sites Web. Il permet de classer une grande majorité d'informations textuelles spécialisées et de générer des catalogues Web, des bibliothèques électroniques, des systèmes de référence en raison de l'information d'experts et d'une analyse de texte intégral. L'objectif du programme est de classer les documents les plus efficaces. Pour une solution réussie de la tâche, une sélection précise de la classe et de la valeur seuil de l'indice K est requise. Les classes doivent être sélectionnées de manière à minimiser leur intersection et que la plupart des documents sont couverts. Index K doit être choisi de sorte que les documents impairs ne soient pas inclus dans la classe (la valeur K est trop petite) et les documents appropriés ne sont pas triés (la valeur K est trop grande). Un certain nombre de classifications préliminaires peuvent être nécessaires. Pour les classifications préliminaires, effectuez un échantillon d'environ 1% de la majeure partie de la majeure partie des documents. Par exemple, pour 100000 sites Web à classer, 1000 sites suffisent pour des expériences préliminaires. D'une part, 1000 sites sont un échantillon représentatif, d'autre part, la classification d'un tel exemple sur des ordinateurs à jour prendra quelques instants. Pendant la classification, une partie des documents peut être exclue de toutes les classes. Ces documents devraient être soigneusement étudiés. Il est possible que de nouvelles classes soient ajoutées à la liste. Une partie des documents résiduels peut ne pas convenir au catalogue généré. Y compris une grande quantité de documents dans différentes classes signifie que le sujet du catalogue a été mal divisé en classes. Ayant obtenu de bons résultats dans la classification des échantillons, l'ensemble des documents peut être classé. Par conséquent, vous obtenez un certain nombre de sites Web d'informations qualitatives correspondant au nombre de classes. LIMITATIONS: essai de 30 jours


Rubryx Logiciels associés

Turbocachart

TurboChart est une bibliothèque de génération de graphiques avancée qui facilite la production de cartes belles entreprises et scientifiques ...

202 592 KB

Télécharger

Printdata

Gérer et imprimer les enregistrements de la fiche de données sur des rapports standard ou personnalisé dans Excel. ...

181 1.72MB

Télécharger