Comparteix a través de


Accions de la PDF

Les accions PDF us permeten extreure imatges, text i taules de fitxers PDF i organitzar pàgines per crear documents nous.

Per extreure text d'un fitxer PDF, utilitzeu l'acció Extreu text de PDF . L'exemple següent extreu text d'un interval específic de pàgines d'un fitxer protegit amb contrasenya. La contrasenya s'especifica a la configuració avançada .

Per extreure textos disposats en forma tabular, habiliteu Optimize per a dades estructurades per millorar el format i la precisió dels resultats.

Captura de pantalla de l'acció Extreu text de PDF.

Per extreure taules d'un fitxer PDF, desplegueu les taules Extreu de l'acció PDF , seleccioneu el fitxer i especifiqueu les pàgines de les quals voleu extreure.

L'acció produeix la variable ExtractedPDFTables que conté una llista d'informació de la taula PDF. Per trobar informació sobre aquest tipus de llista, aneu a Tipus de dades avançats.

Nota

  • L'acció Extreu taules de PDF no utilitza el reconeixement òptic de caràcters (OCR), de manera que no podeu extreure text no copiable dels PDF escanejats.
  • La biblioteca que hi ha darrere de l'acció de tant en tant extreu dades PDF addicionals que no són taules. Aquesta funcionalitat minimitza el risc d'ometre accidentalment una taula real.

Captura de pantalla de les taules Extreu de l'acció PDF.

A part d'extreure informació dels fitxers PDF, podeu crear un document PDF nou a partir d'un fitxer existent mitjançant l'opció Extreu pàgines de fitxers PDF a una nova acció de fitxer PDF.

L'exemple següent selecciona una combinació de pàgines específiques i un interval de pàgines.

Captura de pantalla del fitxer Extreu pàgines del fitxer PDF a la nova acció del fitxer PDF.

Extreu el text del PDF

Podeu extreure text d'un fitxer PDF mitjançant l'acció "Extreu text del PDF". A les propietats de l'acció podeu definir el fitxer PDF d'origen i les pàgines de les quals s'ha d'extreure text. Sota les propietats d'acció avançada podeu definir una contrasenya en cas que el fitxer PDF estigui protegit i si el motor ha d'optimitzar per a dades estructurades o no.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Fitxer PDF No Fitxer El fitxer PDF del qual extreure text. Introduïu un camí de fitxer, una variable que contingui un fitxer o una ruta de text
Pàgines que s'extrauran N/A Totes, individuals, gamma Totes Especifica quantes pàgines cal extreure: totes les pàgines, una sola pàgina o un interval de pàgines
Número de pàgina únic No Valor numèric Número de l'única pàgina de la qual s'ha d'extreure el text
Número de pàgina inicial No Valor numèric Número de la primera pàgina de l'interval de pàgines del qual s'ha d'extreure el text
Número de pàgina final No Valor numèric Número de l'última pàgina de l'interval de pàgines del qual s'ha d'extreure el text
Contrasenya Entrada encriptada directa o Valor del text La contrasenya de l'arxiu PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya
Optimitza per a les dades estructurades N/A Valor booleà Fals Especifiqueu si s'ha de detectar la disposició amb format al document i extreure'n el text en conseqüència

Variables generades

Argument Type Descripció
ExtretPDFTagüent Valor del text El text extret

Excepcions

Excepció Descripció
El fitxer PDF no existeix El fitxer no existeix al camí proporcionat
Contrasenya no vàlida La contrasenya proporcionada no és vàlida
No s'ha pogut extreure el text S'ha produït un error en intentar extreure el text

Extreu les taules del PDF

Podeu extreure taules contingudes en un fitxer PDF mitjançant l'acció Extreu taules de PDF . A les propietats de l'acció podeu definir el fitxer PDF i l'interval de pàgines del qual s'extrauran les taules. Sota les propietats d'acció avançada podeu definir una contrasenya en cas que un fitxer PDF estigui protegit, definir si la taula té capçaleres o no, i finalment si les taules que creuen els marges de la pàgina s'han de fusionar o no.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Fitxer PDF No Fitxer El fitxer PDF per extreure taules. Introduïu un camí de fitxer, una variable que contingui un fitxer o una ruta de text
Pàgines que s'extrauran N/A Totes, individuals, gamma Totes Especifica de quantes pàgines s'extreuen les taules: totes les pàgines, una sola pàgina o un interval de pàgines
Número de pàgina únic No Valor numèric Número d'una sola pàgina de la qual s'extreuen les taules
Número de pàgina inicial No Valor numèric Número de la primera pàgina de l'interval de pàgines de les quals s'extreuen les taules
Número de pàgina final No Valor numèric L'últim número de pàgina de l'interval de pàgines de les quals s'extreuen les taules
Contrasenya Entrada encriptada directa o Valor del text La contrasenya de l'arxiu PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya
Combina les taules que creuen els marges de pàgina N/A Valor booleà Cert Especifica si s'han de combinar les taules que creuen els marges de pàgina a l'interval de pàgines especificat
La primera línia conté noms de columna N/A Valor booleà Cert Especifica si la primera línia de la taula conté noms de columna

Variables generades

Argument Type Descripció
PDFTables extrets Llista d'informació de la taula PDF Les taules extretes amb la seva informació com una llista

Excepcions

Excepció Descripció
El fitxer PDF no existeix El fitxer no existeix al camí proporcionat
Contrasenya no vàlida La contrasenya proporcionada no és vàlida
No s'han pogut extreure les taules S'ha produït un error mentre s'intentava extreure les taules

Extreu les imatges del PDF

Per extreure imatges d'un fitxer PDF podeu utilitzar l'acció Extreu imatges de PDF . En els paràmetres d'acció podeu definir el fitxer PDF i les pàgines de les quals extraieu imatges, la convenció de nomenclatura de les imatges extactades i la ubicació de destinació de les imatges desades. També podeu definir una contrasenya si el fitxer PDF està protegit a la configuració avançada.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Fitxer PDF No Fitxer El fitxer PDF per extreure imatges. Introduïu un camí de fitxer, una variable que contingui un fitxer o una ruta de text
Contrasenya Entrada encriptada directa o Valor del text La contrasenya de l'arxiu PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya
Pàgines que s'extrauran N/A Totes, individuals, gamma Totes Especifica quantes pàgines cal extreure: totes les pàgines, una sola pàgina o un interval de pàgines
Número de pàgina únic No Valor numèric Número de l'única pàgina de la qual s'han d'extreure les imatges
Número de pàgina inicial No Valor numèric El primer número de pàgina del rang de pàgines per extreure imatges
Número de pàgina final No Valor numèric L'últim número de pàgina del rang de pàgines de les quals extreure imatges
Nom de les imatges No Valor del text Com comença el nom de les imatges. Exemple de nom d'imatges extretes: GivenName_1, GivenName_2
Desa les imatges a No Carpeta La carpeta per guardar les imatges extretes com a fitxers png

Variables generades

Aquesta acció no produeix cap variable.

Excepcions

Excepció Descripció
Contrasenya no vàlida La contrasenya proporcionada no és vàlida
No s'han pogut extreure les imatges Indica que s'ha produït un error en extreure imatges de les pàgines donades del PDF
La carpeta no existeix Indica que la carpeta no existeix
El fitxer PDF no existeix El fitxer no existeix al camí proporcionat

Extreu les pàgines del fitxer PDF a un fitxer PDF nou

Podeu crear un fitxer PDF nou extraient pàgines d'un fitxer PDF existent utilitzant les pàgines del fitxer PDF a una nova acció de fitxer PDF. En els paràmetres d'acció podeu definir el fitxer PDF d'on extraieu les pàgines, les pàgines a extreure, la ubicació del nou fitxer PDF i què hauria de passar si ja existeix un fitxer amb el mateix nom i extensió. Finalment, sota les propietats avançades es pot definir una contrasenya en cas que el PDF d'origen estigui protegit.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Fitxer PDF No Fitxer El fitxer PDF per extreure pàgines. Introduïu un camí de fitxer, una variable que contingui un fitxer o una ruta de text
Contrasenya Entrada encriptada directa o Valor del text La contrasenya de l'arxiu PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya
Selecció de pàgines No Valor del text Els números d'índex de les pàgines a conservar (per exemple, 1,3,17-24)
Ruta PDF extreta No Fitxer Camí on s'emmagatzemarà el fitxer PDF extret
Si l'arxiu existeix N/A Sobreescriure, No sobreescriure, Afegeix el sufix seqüencial Afegeix sufix seqüencial Especifica què cal fer en cas que el fitxer PDF de sortida ja existeixi

Variables generades

Argument Type Descripció
PDF extret Fitxer El nou fitxer PDF

Excepcions

Excepció Descripció
Contrasenya no vàlida La contrasenya proporcionada no és vàlida
El fitxer PDF no existeix El fitxer no existeix al camí proporcionat
Pàgina fora dels límits Indica que una o més pàgines estan fora dels límits del fitxer PDF
Selecció de pàgines no vàlida Indica que les pàgines proporcionades no són vàlides per al fitxer PDF
No s'ha pogut extreure el PDF nou Indica que s'ha produït un error en intentar extreure el nou PDF

Combina fitxers PDF

Combina diversos fitxers PDF en un de nou.

Podeu utilitzar l'acció Combina fitxers PDF per agafar dos o més fitxers PDF i combinar-los en un sol fitxer. Els fitxers a combinar es poden proporcionar en forma de llista, o entre cometes dobles i separats per un delimitador. També podeu proporcionar contrasenyes per als fitxers PDF, en cas que estiguin protegits amb contrasenya.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Fitxers PDF No Llista de fitxers Els fitxers a combinar. Adjunteu diversos fitxers entre cometes dobles (") i separeu-los per un delimitador, o utilitzeu una llista de fitxers
Camí del PDF combinat No Fitxer Camí on s'emmagatzemarà el fitxer PDF combinat
Si l'arxiu existeix N/A Sobreescriure, No sobreescriure, Afegeix el sufix seqüencial Afegeix sufix seqüencial Especifica què cal fer en cas que el fitxer de destinació ja existeixi
Contrasenyes Entrada encriptada directa o Valor del text Les contrasenyes delimitades. L'ordre ha de ser el mateix que l'ordre dels PDF d'entrada. Deixeu-ho en blanc si els PDF no estan protegits amb contrasenya
Delimitador No Valor del text , Un delimitador de contrasenya personalitzat. Aquest delimitador no hauria de formar part de cap de les contrasenyes

Variables generades

Argument Type Descripció
PDF combinat Fitxer Fitxer PDF combinat

Excepcions

Excepció Descripció
El fitxer PDF no existeix El fitxer no existeix al camí proporcionat
Contrasenya no vàlida La contrasenya proporcionada no és vàlida
No s'han pogut combinar els fitxers PDF Indica que s'ha produït un error mentre es combinaven els fitxers