| DataParkSearch DataParkSearch Engine est une source de recherche Web de Sources ouvertes complète publiée sous la licence générale Générale GNU et conçue pour organiser la recherche sur un site Web, un groupe de sites Web, intrane. |
Télécharger maintenant |
DataParkSearch Classement & Résumé
- Nom de l'éditeur:
- Datapark Corp.
- Site Internet de l'éditeur:
- Systèmes d'exploitation:
- Any Linux Distribution
- Taille du fichier:
- 2.1 MB
DataParkSearch Mots clés
DataParkSearch La description
DataParkSearch Engine est une source de recherche Web à base de sources ouvertes complète publiée sous la licence GNU General Public et conçue pour organiser la recherche sur un site Web, un groupe de sites Web, un intranet ou un système local. Principales caractéristiques * Prise en charge des systèmes HTTP, HTTPS, FTP, NNTP et URL de News. * Schéma d'URL virtuel HTDB pour l'indexation des bases de données SQL. * Index Texte / HTML, Texte / XML, Texte / Plain, Audio / MPEG (MP3) et Image / GIF MIME Types Nativement. * Prise en charge des analyseurs externes pour les autres types de documents, y compris Microsoft Word, Excel, RTF, PowerPoint, Adobe Acrobat PDF et Flash. * Peut indexer des sites multilingues à l'aide de la négociation de contenu. * Peut rechercher tous les formulaires de mots à l'aide des affixes ISPell et des dictionnaires. * Extransion de requête synonyme, acronyme et abréviation basée sur des dictionnaires modifiables, spécifiés par la langue et le chartet. * Mots d'arrêt, synonymes et listes d'acronymes. * Options pour interroger tous les mots, tous les mots à proximité des autres, des mots ou des requêtes booléennes. Un sous-ensemble de VQL (langue de requête Verity) est pris en charge. * Classement de popularité basé sur un modèle de réseau de neurones. * Les résultats peuvent être triés par pertinence (en utilisant le calcul vectoriel), le classement de la popularité comme «goo» (ajout de poids pour les liens entrants) et «NEO» (modèle de réseau neuronal), dernière heure modifiée et par «importance» (une combinaison de Rédition de pertinence et de popularité). * Prend en charge une large gamme de jeux de caractères Prise en charge avec le jeu de caractères automatisé et la détection de la langue. * Offre une option de recherche insensible à accentuer. * Fournit une segmentation de phrase (toboggan) pour le chinois, le japonais, le coréen et le thaïlandais. * Inclut un indexeur et une fenêtre Web CGI, ainsi qu'un module de recherche pour Apache Web Server (MOD_DPECH). * Gère des noms de domaine internationalisés (IDN). * L'algorithme d'extraction récapitulatif résume automatiquement chaque document en plusieurs phrases. * Utilise si elle est modifiée - depuis pour un transfert efficace de fichiers modifiés uniquement.
DataParkSearch Logiciels associés