Bonjour,
Je souhaite convertir en php des fichier .DOC (et éventuellement .DOCX) en fichiers PDF et en fichiers texte brut.
Pouvez-vous me conseiller ?
Serait-ce mieux d'enregistrer au préalable les fichiers .DOC et .DOCX en XML ?
Merci
Philippe
Bonjour,
Je souhaite convertir en php des fichier .DOC (et éventuellement .DOCX) en fichiers PDF et en fichiers texte brut.
Pouvez-vous me conseiller ?
Serait-ce mieux d'enregistrer au préalable les fichiers .DOC et .DOCX en XML ?
Merci
Philippe
Bonjour
Intéresse-toi à Pandoc (https://pandoc.org/) qui permet de convertir de multiples formats vers ... de multiples formats.
DOCX -> Markdown / PDF / HTML / TXT / ... pas de souci pour lui.
Quelques exemples : https://pandoc.org/demos.html
Bonne journée.
Bonjour,
Je constate que les fichiers .doc sont directement lisibles en file_get_contents et que le caractère ETX (ASCII 3) ou EOT (ASCII 4) me permet de trouver la fin du texte brut.
Mais dans certains fichiers .doc testés, il y a des ETX et des EOT qui ne correspondent pas au coeur du texte brut du document, et je souhaite les neutraliser.
Quelqu'un ayant été confronté à ce problème a-t-il trouvé la solution pour récupérer la bonne zone de texte brut ?
Merci
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager