Pero no siempre funcionan. Solo son eficaces para archivos pequeños
y si no tienen sellos ni firmas manuscritas.
Para texto, funciona muy bien Easy PDF to Text
Y tiene opciones de conversión en varios formatos:
https://easypdf.com/
3. Un recurso muy bueno para extracción de datos es Document
Cloud: https://www.documentcloud.org/ ; al mismo tiempo que sube un
documento PDF (una vez que se obtiene una cuenta), corre un OCR
(sistema de reconocimiento óptico de caracteres), que permite extraer
texto de imágenes escaneadas. El texto extraído se lee en la pestaña
“texto”. Sirve para texto, más no para tablas.
Vea un ejemplo aquí:
https://www.documentcloud.org/documents/5772210-4478819A01
Abajo a la izquierda, puede seleccionar ver el documento (document) o
Plain text (la versión con la extracción ya realizada)
4. Una de las mejores herramientas gratis para extraer tablas de PDFs
y obtener los datos en formato tabla es Tabula.
https://tabula.technology/
Deberán descargar el archivo a su computadora. Es seguro. Y se abre
sobre la Web, es decir, si tienen Chrome abierto como navegador. No
funciona sobre otros navegadores.
El procedimiento es sencillo: se sube un PDF; luego se selecciona la
tabla y es posible repetir esta acción en diferentes páginas para
finalmente descargar el documento en CSV, que es formato de datos
separados por comas: este se puede estructurar nuevamente en
columnas, marcando la primera columna, luego yendo a la pestaña
datos, ordenar en columnas, delimitados por comas y finalizar.