rOpenSci | pdftools + tesseract para extraer texto en español
Reported on: Jul 15, 2021

pdftools + tesseract para extraer texto en español

English • By Silvia Gutiérrez • Featuring: pdftools, tesseract

rOpenSci package or resource used*

pdftools, tesseract

What did you do?

Convertí un texto-imagen en pdf a un texto legible para computadoras usando el OCR de Tesseract y la función de pdf_ocr_text()

URL or code snippet for your use case*

Código en Github

Sector

academic / non-profit

Field(s) of application

humanidades ¡y cualquier otra disciplina que use pdfs!