Swish-e

Projet open source qui vous aidera à indexer des fichiers et des pages Web
Télécharger maintenant

Swish-e Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • GPL
  • Prix:
  • FREE
  • Nom de l'éditeur:
  • The Swish-e Project
  • Site Internet de l'éditeur:
  • http://swish-e.org/
  • Systèmes d'exploitation:
  • Mac OS X
  • Taille du fichier:
  • 1.4 MB

Swish-e Mots clés


Swish-e La description

Projet open source qui vous aidera à indexer des fichiers et des pages Web Swish-E est un système open source rapide, flexible et libre pour l'indexation des collections de pages Web ou d'autres fichiers. Swish-e convient parfaitement aux collections d'un million de documents ou plus petites. Utilisation de l'analyseur GNOME LIBXML2 et une collection de filtres, Swish-E peut indexer un texte brut, Microsoft Word / PowerPoint / Excel, E-mail, PDF, HTML, XML, et à peu près tout fichier pouvant être converti en texte XML ou HTML. . Swish-E est également souvent utilisé pour compléter les bases de données comme la SGBM MySQL pour une recherche de texte intégral très rapide. Voici quelques caractéristiques essentielles de "Swish-e": · Indexez rapidement un grand nombre de documents sous différents formats, y compris le texte, le HTML et le XML. · Utilisez "filtres" pour indexer d'autres types de fichiers tels que PDF, GZIP ou PostScript. · Inclut une araignée Web pour indexer des documents distants sur HTTP. Suit les règles d'exclusion des robots (y compris les balises META). · Peut utiliser un programme externe pour fournir des documents à Swish-e, tels qu'une araignée avancée pour votre serveur Web ou un programme pour lire et formater des enregistrements à partir d'une base de données relationnelle. · Document "Propriétés" (un sous-ensemble du document source, généralement défini comme des éléments Meta ou XML) peut être stocké dans l'index et renvoyé avec les résultats de recherche. · Les résumés de documents peuvent être renvoyés à chaque recherche. · Mot stemming, soundex, métaphone et indexation à double métaphone pour la recherche "floue" · Recherche de phrases et de recherche générique · Limiter les recherches sur les liens HTML. · Utilisez des expressions régulières puissantes pour sélectionner des documents pour l'indexation ou l'exclusion. · Limitez facilement les recherches aux pièces ou à tous votre site Web. · Les résultats peuvent être triés par pertinence ou par un nombre quelconque de propriétés en ordre croissant ou décroissant. · Limiter les recherches dans certaines parties de documents tels que certaines balises HTML (méta, titre, commentaires, etc.) ou sur des éléments XML. · Peut signaler des erreurs structurelles dans vos documents XML et HTML. · Le fichier d'index est portable entre les plates-formes. · Une bibliothèque Swish-e est fournie pour permettre l'intégration de Swish-e dans vos applications pour une recherche très rapide. Un module PERL est disponible qui fournit une API standard pour accéder à Swish-e. · Comprend des exemples de script de recherche avec des résumés contextuels et une phrase de recherche et une phrase. Peut être utilisé avec des systèmes de modèles Perl populaires. · Swish-e est rapide. · Il est open source et gratuit! Vous pouvez personnaliser Swish-e et vous pouvez contribuer à vos nouvelles fonctionnalités de fantaisie au projet. · Soutenu par des groupes d'utilisateurs et de développeurs en ligne. Quoi de neuf dans cette version: · Manipulation «dégonfler» fixe dans SPIDER.PL · Ré-indexation requise · Correction d'un bug stemmer introduit dans 2.4.4 · Maintenant Fork / EXED pour exécuter des filtres · Avertissements fixes signés / non signés de GCC 4.x · Makefile.mingw inclus dans la distribution


Swish-e Logiciels associés