Importante
Extract tabular data
Buscador de google
Mas info
https://academy.datawrapper.de/article/135-how-to-extract-data-out-of-pdfs
https://docparser.com/blog/extract-tables-from-pdf/
Herramientas
https://smallpdf.com/es/pdf-a-excel (Muy malo)
Una maravilla https://pdftables.com/
https://www.pdftron.com/pdf-tools/pdf-table-extraction/ A veces funciona
https://app.docparser.com/stack/create (Mucho potencial pero es muy COMPLICADA)
https://nanonets.com/ (La version gratis hace un gran trabajo pero tambien es Paga)
https://www.extracttable.com/ (Para imágenes)
https://docsumo.com/free-tools/extract-tables-from-pdf-images (Bastante bien, un poco dificil, tiene un EDITOR DE OCR)
https://appzend.herokuapp.com/tableextract/ (La tabla tiene que ser bastante clara)
https://pdf.to/excel (se acerca bastante)
https://www.pdftoexcel.org/ (Tarda 30 minutos y te lo envia por mail)
Tabla semiestructurada, usando EXCALIBUR Y CAMELOT (python)
https://towardsdatascience.com/data-extraction-from-a-pdf-table-with-semi-structured-layout-ef694f3f8ff1
https://developpaper.com/excalibur-a-web-tool-for-pdf-extraction/
http://theautomatic.net/2019/05/24/3-ways-to-scrape-tables-from-pdfs-with-python/


No hay comentarios:
Publicar un comentario