Extraction du texte d'un PDF vers un fichier texte

Présentation
La classe PdfObject est insatiable en fournissant le nom du fichier pdf en premier argument et le nom du ficher text en second argument.
La méthode pdf2text de cet objet copie le texte du pdf vers le fichier texte.
Cette classe utilitaire repose sur la librairie APACHE PdfBox
Téléchargement
Compatibilité
Linux Windows
1  0 
Téléchargé 149 fois Voir les 2 commentaires
Détails
Voir tous les téléchargements de l'auteur
Licence : Autre
Date de mise en ligne : 26 avril 2015




Avatar de flarose flarose - Nouveau Candidat au Club https://www.developpez.com
le 09/07/2015 à 15:37
j aimerai bien tester ce code car il m interesse mais deja je bloque pour importer les "org.apache" ...
Avatar de autran autran - Rédacteur https://www.developpez.com
le 22/07/2015 à 19:18
Tu dois télécharger le jar PdfBox bien entendu
ou pour maven :
Code xml : Sélectionner tout
1
2
3
4
5
<dependency> 
  <groupId>org.apache.pdfbox</groupId> 
  <artifactId>pdfbox</artifactId> 
  <version>...</version> 
</dependency>
Developpez.com décline toute responsabilité quant à l'utilisation des différents éléments téléchargés.
Responsables bénévoles de la rubrique Java : Mickael Baron - Robin56 -