import PyPDF2
def extraer_texto_pdf(pdf_path):
texto_extraido = ""
# Abre el archivo PDF en modo binario
with open(pdf_path, 'rb') as archivo_pdf:
# Crea un objeto PDFReader
lector_pdf = PyPDF2.PdfFileReader(archivo_pdf)
# Recorre todas las páginas del PDF
for pagina_numero in range(lector_pdf.numPages):
# Obtiene el objeto de la página
pagina = lector_pdf.getPage(pagina_numero)
# Extrae el texto de la página
texto_extraido += pagina.extractText()
return texto_extraido
# Ruta al archivo PDF que deseas procesar
ruta_pdf = 'ejemplo.pdf'
# Llama a la función para extraer el texto
texto_extraido = extraer_texto_pdf(ruta_pdf)
# Imprime el texto extraído
print(texto_extraido)
Application
===========
Path and name: X:\workshop\2024\pdf\bin\pdf.Exe (32 bits)
Size: 4,774,912 bytes
Compiler version: Harbour 3.2.0dev (r2104281802)
FiveWin version: FWH 21.11
C compiler version: Borland/Embarcadero C++ 7.6 (32-bit)
Windows version: 6.2, Build 9200
Time from start: 0 hours 0 mins 0 secs
Error occurred at: 01/26/24, 12:29:23
Error description: (DOS Error -2147352567) WINOLE/1007 (0x800C0005): SPEAK
Args:
[ 1] = C c:\curl.txt
[ 2] = N 4
Stack Calls
===========
Called from: => TOLEAUTO:SPEAK( 0 )
Called from: Source\pdfread.prg => MAIN( 8 )
%PDF-1.3
%Äåòåë§ó ÐÄÆ
4 0 obj
<< /Filter /FlateDecode /Length 3182 >>
stream
paquitohm wrote:Hola Antonio,
¿ Hay alguna forma facil de llamar a un codigo python desde Harbour ?
¿ Se requiere tener python instalado supongo ? ¿ La minima expresion de python cual seria ?
En todo caso, lo que haré será investigar ese tema. Ese enlace puede ser un buen supletorio en determinados casos
Salu2
karinha wrote:No te sirve SUMATRAPDF.exe ?
Regards, saludos.
paquitohm wrote:Hola Antonio,
Gracias por tu respuesta
Lo de tener que instalar Python en cada maquina de los clientes me supone un inconveniente
¿ No habrá algunas libreria o algo asi para dejar en la carpeta de la aplicacion sin necesidad de instalar todo ?
Salu2
Sí, existen varias formas de crear archivos ejecutables en Python que se pueden ejecutar sin necesidad de tener instalado el intérprete de Python. Algunas de las herramientas más populares son:
PyInstaller: Permite crear ejecutables de un solo archivo o de una carpeta, y soporta múltiples sistemas operativos. También permite incluir recursos externos como imágenes o archivos .ui12.
py2exe: Es una herramienta específica para Windows que convierte los scripts de Python en archivos .exe. Tiene algunas limitaciones, como no soportar Python 3.7 o superior3.
cx_Freeze: Es una herramienta multiplataforma que crea ejecutables a partir de scripts de Python. Soporta Python 3.6 o superior, y permite incluir módulos adicionales3.
Para utilizar estas herramientas, es necesario instalarlas con el comando pip install <nombre de la herramienta>, y luego ejecutarlas con el nombre del script de Python que se quiere convertir en ejecutable. Cada herramienta tiene sus propios argumentos y opciones que se pueden consultar en su documentación oficial.
htmlView( FullName( cPdfFileName ) )
// C:\FWH\SAMPLES\HTMLPDF.PRG
#include "FiveWin.ch"
STATIC oWnd
FUNCTION Main()
LOCAL oBar
DEFINE WINDOW oWnd TITLE "HtmlViewPdf"
DEFINE BUTTONBAR oBar _3D OF oWnd
DEFINE BUTTON OF oBar ACTION HtmlViewPdf()
SET MESSAGE OF oWnd TO "HtmlViewPdf" NOINSET CLOCK DATE KEYBOARD
ACTIVATE WINDOW oWnd MAXIMIZED
RETURN NIL
FUNCTION HtmlViewPdf()
HTMLVIEW( "C:\TEMP\FWINTRO.PDF" ) // USE ACROBAT
RETURN NIL
// FIN / END
Return to FiveWin para Harbour/xHarbour
Users browsing this forum: No registered users and 41 guests