Wp2txt

Extrait du texte du fichier de vidage Wikipedia rapide et facile.
Télécharger maintenant

Wp2txt Classement & Résumé

Publicité

  • Rating:
  • Nom de l'éditeur:
  • Yoichiro Hasebe
  • Taille du fichier:
  • 5.2 MB

Wp2txt Mots clés


Wp2txt La description

WP2TXT est une petite application facile à utiliser spécialement conçue pour vous aider à extraire des données de texte brut du fichier de vidage Wikipedia (codée en XML / compressé avec BZIP2) en décapant tous les balises MediaWiki et d'autres métadonnées. Il est initialement destiné à être utile pour les chercheurs qui recherchent un moyen facile d'obtenir des corpus multilingues à source ouverte, mais peuvent être utiles à d'autres fins.


Wp2txt Logiciels associés