Pdftextstream

Une bibliothèque d'extraction de texte PDF et de métadonnées disponible pour Java, Python et .NET.
Télécharger maintenant

Pdftextstream Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • Other/Proprietary Li...
  • Prix:
  • USD 1900.00 | BUY the full version
  • Nom de l'éditeur:
  • Snowtide Informatics Systems, Inc.
  • Site Internet de l'éditeur:
  • http://snowtide.com/

Pdftextstream Mots clés


Pdftextstream La description

Une bibliothèque d'extraction de texte PDF et de métadonnées disponible pour Java, Python et .NET. Le projet PDFTEXTextstream est une bibliothèque d'extraction de texte PDF et de métadonnées disponible pour Java, Python et .NET.IT prend en charge toutes les versions de la spécification de document PDF (y compris V1.6, utilisée par Acrobat 7), extraction du texte codé à double octet Ensembles de caractères (y compris chinois, japonais et coréen), décryptage de documents cryptés de 40 bits et 128 bits et extraction de toutes les métadonnées de document fournies par des documents PDF (y compris les données de formulaire, les signets et les annotations). L'intégration facile avec Jakarta Lucene est incluse. Exigences: · Apache Lucene Quoi de neuf dans cette version: · Ajout d'une méthode .isstruckthrough () à com.snowtide.pdf.textUnit, indiquant si un personnage a une strikethrough à travers elle. · Soutien amélioré PDFTextstream pour les mappages de caractères intégrés. · Le calcul de l'espace blanche entre les mots a été corrigé pour rendre compte correctement pour les espaces blancheurs qui sont explicitement codés dans les documents PDF source. · La manipulation de la technologie de contenu composite améliorée de PDFTextstream, qui pourrait précédemment pourrait échouer dans certaines gammes de contenu PDF «ignorée» pendant l'extraction. · Correction d'un bogue dans VisualOutputTarget où le texte d'une seule ligne serait divisé sur plusieurs lignes · Aménagement vertical amélioré du texte extrait à l'aide de VisualOutputTarget · Amélioration des extraits de VisualOutputTarget produits pour éliminer les espaces supplémentaires parasites entre les mots étroitement adjacents


Pdftextstream Logiciels associés

Agilien

Agilian est un environnement de modélisation complet conçu pour appliquer une modélisation agile. ...

88

Télécharger

Mot

GLOSSWORD est un système permettant de publier des dictionnaires, des glossaires et des encyclopédies. ...

231

Télécharger