Analyseur HTML

bibliothèque pour analyser le contenu HTML
Télécharger maintenant

Analyseur HTML Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • LGPL
  • Prix:
  • FREE
  • Nom de l'éditeur:
  • Derrick Oswald
  • Site Internet de l'éditeur:
  • Systèmes d'exploitation:
  • Mac OS X
  • Taille du fichier:
  • 323 KB

Analyseur HTML Mots clés


Analyseur HTML La description

Bibliothèque d'analyser le contenu HTML HTML Parser est une bibliothèque Java gratuit et open source utilisée pour analyser HTML de manière linéaire ou imbriquée. Principalement utilisé pour la transformation ou l'extraction, les filtres HTML fonctionnent, les visiteurs, les balises personnalisées et les JavaBeans faciles à utiliser. C'est un paquet rapide, robuste et bien testé.extractextraction englobe tous les programmes de récupération d'informations qui ne sont pas destinés à préserver la page source. Cette couverture utilise comme: · Extraction de texte, pour une utilisation en tant qu'entrée pour les bases de données de moteurs de recherche de texte, par exemple · Extraction de liaison, pour ramper via des pages Web ou une récolte d'adresses e-mail d'écriture de courrier électronique, pour la saisie de données programmatiques à partir de pages Web · Extraction de ressources, collecte d'images ou de son · Une extrémité avant de navigateur, la phase préliminaire de la page d'affichage de la page · Vérification des liens, assurant des liens sont valides · la surveillance du site, la vérification des différences de pages au-delà de difforme simplisteIl existe plusieurs installations dans le code HTMLParser CodeBase pour aider à l'extraction, y compris les filtres, les visiteurs et les JavaBeans. TransformationTransformation comprend tous les traitements où l'entrée et la sortie sont des pages HTML. Certains exemples sont les suivants: · Réécriture d'URL, modifier tout ou partie des liens sur une page · Capture de site, en déplaçant du contenu de la bande à un disque local · Censorsie, supprimer des mots et des expressions offensées à partir de pages · Nettoyage HTML, Correction des pages erronées · Suppression de l'annonce, Excisition URL référençant la publicité · Conversion en XML, déplacement des pages Web existantes aux exigences XML: · Java Quoi de neuf dans cette version: · Le projet HTMLPARSER a été mis à jour avec une nouvelle licence, un nouvel environnement de construction, un nouveau référentiel et un nouveau site Web. Pour identifier ce changement radical, la version a été revu à 2.0. · En réponse aux demandes de la communauté Apache, la licence HTMLParser a été modifiée de la bibliothèque GNU ou une licence de publicité générale de GNU, à la licence publique courante d'Apache (http://opensource.org/licenses/cpl1.0.txt) . · Le référentiel HTMLPARSER a été changé de CVS en Subversion (http://subversion.tigris.org/). · Soutenir l'intégration automatique dans d'autres projets, l'environnement de construction a changé d'Ant à Maven 2 (http://maven.apache.org/). Cela a permis de mettre à jour le site Web (http://htmlparser.org).


Analyseur HTML Logiciels associés

Efficacement

une bibliothèque libre pour fournir un mécanisme de sérialisation universel pour un type de données C ++ ...

44 122 KB

Télécharger

Proscène

facilite la création de scènes 3D interactives implémentées avec le langage de traitement ...

190 328 KB

Télécharger