J4L OCR TOOLS Classement & Résumé
- Nom de l'éditeur:
- J4L Components
- Systèmes d'exploitation:
- Windows All
J4L OCR TOOLS Mots clés
J4L OCR TOOLS La description
J4L OCR Tools est un ensemble puissant de composants conçus pour inclure les capacités OCR dans les applications Java. Cela signifie que vous pouvez recevoir des faxes ou numériser des documents et extraire des informations commerciales des images. Les 2 composants principaux sont: · Un wrapper Java pour le moteur OCR Tesseract. Le moteur OCR Tesseract est livré sous la licence Apache 2.0 et nous prenons en charge une version compilée uniquement pour Windows. · Un analyseur de document texte. Le processus de reconnaissance d'images peut donc être divisé en 2 étapes: · Le composant prend un fichier image (TIF, PNG, JPG, etc.) et renvoie le texte de celui-ci. Le wrapper Java effectuera cette opération en utilisant Tesseract. Sinon, vous pouvez utiliser n'importe quel autre moteur OCR. · Dans la deuxième étape, votre application Java doit comprendre le texte renvoyé par le moteur OCR. Ceci est fait par l'analyseur de document. L'analyseur de document utilise en tant qu'entrée que la chaîne de texte (données) et un fichier XML décrivant la structure du document et l'OUPUT est un document professionnel soit en tant qu'objet Java ou sous forme de fichier XML.
J4L OCR TOOLS Logiciels associés