Htmllist

extraire les données des pages HTML qui ont une sorte de motif répétitif
Télécharger maintenant

Htmllist Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • BSD License
  • Prix:
  • FREE
  • Nom de l'éditeur:
  • Erez Bibi
  • Site Internet de l'éditeur:
  • http://frontiernet.net

Htmllist Mots clés


Htmllist La description

Extraire des données de pages HTML qui ont une sorte de motif répétitif HTMllist est un outil écrit dans Python qui essaie de trouver un motif répétitif dans une page HTML contenant une sorte de liste (comme Digest Pages). Il extrait le texte sous-html qui crée le motif et tente d'extraire des informations utiles. L'idée est que dans une page de données HTML typique contenant une liste d'éléments, il y aura un modèle répétitif pour l'il humain (le Format de page). Si ce modèle sera le plus répandu dans la page (ce sera le cas dans la plupart des pages), nous pourrons le reconnaître et «gratter» les données pertinentes. Exigences: · Python


Htmllist Logiciels associés

Xml marteau

L'application XML Hammer est un outil gratuit et open-source qui simplifie les actions XML élémentaires. ...

174

Télécharger

Brillant

Le projet Brightmare est un outil qui traduit les équations en latex au texte ASCII / UTF-8. ...

140

Télécharger