Cleartk

une boîte à outils pour développer des composants de traitement de langues naturelles statistiques en Java
Télécharger maintenant

Cleartk Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • BSD
  • Prix:
  • FREE
  • Nom de l'éditeur:
  • ClearTK Team
  • Site Internet de l'éditeur:
  • http://code.google.com/p/cleartk/
  • Systèmes d'exploitation:
  • Mac OS X
  • Taille du fichier:
  • 435 KB

Cleartk Mots clés


Cleartk La description

Une boîte à outils pour développer des composants de traitement de langues naturelles statistiques en Java La boîte à outils Cleartk est basée sur le Cadre Apache UIMA pour Text Analysy.Cleartk est un projet développé au Centre de recherche sur la langue et l'éducation (clair) à l'Université du Colorado à Boulder. En résumé, Cleartk fournit un cadre pour développer des composants statistiques de traitement des langues naturelles (NLP) en Java et fournit deux bibliothèques: Cleartk-Framework et Cleartk-Toolkit, qui sont brièvement résumés ci-dessous.Clartk Framework fournit une infrastructure pour le développement de l'UIMA. Les moteurs d'analyse qui utilisent l'apprentissage statistique comme fondement de la prise de décision et de la création d'annotation. Le Cadretk Framework fournit les éléments suivants: · Une bibliothèque d'extraction de fonctionnalités riche · une interface commune et des emballages pour des bibliothèques d'apprentissage de la machine populaires basées sur des modèles tels que l'entropie maximale, des machines vectorielles de support et des champs aléatoires conditionnels. Il prend actuellement en charge la libsvm, OpenNLP Maxent, les classificateurs de maillet, les champs aléatoires conditionnels de maillet, SvMlight. L'approche des développeurs permet d'utiliser une approche de la meilleure race en permettant d'échanger une bibliothèque d'apprentissage d'une machine à une autre de manière à ce que le code qui implémente la logique de base du moteur d'analyse ne soit pas à modifier. · L'application fournit une approche agnostique système de type. Le cadre Cleartk ne dépend pas ou ne fournit aucun système de type spécifique. Le code fourni par le cadre est destiné à être utilisé comme base pour la création de nouveaux moteurs d'analyse dans votre environnement, de sorte que vous puissiez créer des composants spécifiques à vos besoins et à vos besoins. · Le framework peut être téléchargé à partir de la page Téléchargements, décoché à partir du référentiel Subversion en tant que projet Eclipse ou ajouté en tant que dépendance maven si vous utilisez Maven pour créer votre projet (voir ci-dessous). Cleartk Toolkit: Toolkit Cleartk fournit des composants UIMA et / ou infrastructure pour traiter des tâches spécifiques. La boîte à outils fournit les éléments suivants: · Les lecteurs de collecte des corpus couramment utilisés (par exemple Congll, Ace, Penntreebank, Genia, Timeml) · Infrastructure de création de composants PNL pour des tâches spécifiques telles que le marquage de la part de la parole, des chunkings bio-style, une entité nommée Reconnaissance, analyse syntaxique, étiquetage de rôle sémantique, résolution temporelle, etc. · emballages de composants communs de PNL, tels que les composants Snowball Stemmer et OpennLP. · La boîte à outils ClearTK fournit un système de type et de nombreux composants (et tests d'unités) dépendent de ce système de type. Cependant, nous avons travaillé dur pour faire une grande partie du code dans l'agnostique de type Toolkit Type-System par des composants de paramétrage par types ou en effectuant des composants extensibles via la typage générique. · La boîte à outils n'est actuellement disponible que sous forme de projet ECLISPE pouvant être vérifiée à partir des exigences de référentiel Subversion: · Java


Cleartk Logiciels associés

Apache Pivot

Plate-forme de bâtiment RIA basée sur Java qui combine les caractéristiques améliorées d'une boîte à outils RIA moderne avec la robustesse de la plate-forme Java ...

234 16.7 MB

Télécharger

Mydas

Un serveur de système d'annotation distribué Java (DAS) avec une API simple pour développer des sources de données ...

144 400 KB

Télécharger