Le projet Lemur

Application de la modélisation de la langue et de la récupération d'informations
Télécharger maintenant

Le projet Lemur Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • Freeware
  • Prix:
  • FREE
  • Nom de l'éditeur:
  • The Lemur Team
  • Site Internet de l'éditeur:
  • http://www.lemurproject.org/
  • Systèmes d'exploitation:
  • Mac OS X
  • Taille du fichier:
  • 63.6 MB

Le projet Lemur Mots clés


Le projet Lemur La description

Demande de modélisation de la langue et de récupération d'informations Le Lemur Toolkit est une application gratuite et open source conçue pour faciliter la recherche dans la modélisation de la langue et la récupération de l'information. Le Lemur Toolkit inclut des technologies telles que la récupération ad hoc et la récupération distribuée, la situation infrarouge, la résumation, le filtrage et la classification. Voici quelques caractéristiques clés du "Projet Lemur": · Langues de requête structurées sophistiquées (en utilisant les demandes et InDRI) · Prise en charge de la récupération de documents XML et structuré · Utilisé généralement avec une large gamme de collections de test de recherche (par exemple, TRec CD 1-5, WT10G, RCV1, GOV, GOV2) · Indexez vos pages Web avec une capacité de recherche de site «hors de la case» · Interfaces interactives pour Windows, Linux et Web · Applications de récupération et de cluster de documents distribuées · Code multi-plate-forme, rapide et modulaire écrit en C ++ · C ++, Java et C # API · Logiciel libre et open source · Utilisé depuis plus de 6 ans par une communauté d'utilisateurs importante et croissante Indexage: · Méthodes d'indexation multiples pour les collections de petites, moyennes et à grande échelle (téraoctet) · Support intégré pour le texte anglais, chinois et arabe · Porter et krovetz mot stemming · Indexation incrémentielle · Prise en charge d'indexation hors de la zone pour TRec Texte, Web TRec, texte brut, HTML, XML, PDF, MBOX, Microsoft Word et Microsoft PowerPoint · Index en ligne et décalage des annotations de texte (par exemple, une partie de la parole et des entités nommées) · Index Document Attributs Récupération: · Soutient les principales approches de modélisation de la langue telles que INDRI et KL-DIVERGENCE, ainsi que votre espace vectoriel, TF.IDF, Okapi et Demandes · Rétroaction de pertinence et de pseudo-pertinence · Expansion à terme générique (en utilisant INDRI) · Récupération de passage et d'élément XML · Récupération transversale · Lissage via Dirichlet Priors et Chaînes Markov · Prend en charge les prieurs de documents arbitraires (par exemple, grade de page, profondeur de l'URL) Quoi de neuf dans cette version: · 2799440 Terminfo renvoyé par Indriterminfolist n'a aucune position · 2794361 HarvestLinks ne parvient pas à créer des annuaires de récolte · 2788507 KrovetzSystemmerTransformation peut déborder un tampon · 2788504 Anchortextannotator peut déborder un tampon · 2787935 Pagerank décharge noyau si le chemin des liens est mauvais · 2784994 Mauvais article · 2783665 TextTokenizer met prématurément les attributs de balises citées · 2782954 Indri :: Parse :: HTMLPARSER :: La poignée peut déborder un tampon · 2772914 IREVALGUI.JAR donne des résultats fous · 2772846 BIN / IREVAL.JAR est un fichier .jar non valide (Lemur V48) · 2770916 CORRUPTION DE TABLE DE DOCUMENTELLEMENTAIRE AVEC DU TRANSPORT PLUS · 2747981 WarcDocumentiterator manquent des documents dans le fichier WARC · 2747707 TextTokenizer ne reconnaît pas certains attributs d'étiquettes cités


Le projet Lemur Logiciels associés

Yami

Interface conviviale pour administrer des bases de données MySQL ...

1,418 692 KB

Télécharger

Simple

Un outil gratuit et simple qui permettra aux développeurs d'utiliser la mise en uvre de la CVMO Python ...

181 15 KB

Télécharger