Accions de la PDF
Les accions PDF us permeten extreure imatges, text i taules de fitxers PDF i organitzar pàgines per crear documents nous.
Per extreure text d'un fitxer PDF, utilitzeu l'acció Extreu text de PDF . L'exemple següent extreu text d'un interval específic de pàgines d'un fitxer protegit amb contrasenya. La contrasenya s'especifica a la configuració avançada .
Per extreure textos disposats en forma tabular, habiliteu Optimize per a dades estructurades per millorar el format i la precisió dels resultats.
Per extreure taules d'un fitxer PDF, desplegueu les taules Extreu de l'acció PDF , seleccioneu el fitxer i especifiqueu les pàgines de les quals voleu extreure.
L'acció produeix la variable ExtractedPDFTables que conté una llista d'informació de la taula PDF. Per trobar informació sobre aquest tipus de llista, aneu a Tipus de dades avançats.
Nota
- L'acció Extreu taules de PDF no utilitza el reconeixement òptic de caràcters (OCR), de manera que no podeu extreure text no copiable dels PDF escanejats.
- La biblioteca que hi ha darrere de l'acció de tant en tant extreu dades PDF addicionals que no són taules. Aquesta funcionalitat minimitza el risc d'ometre accidentalment una taula real.
A part d'extreure informació dels fitxers PDF, podeu crear un document PDF nou a partir d'un fitxer existent mitjançant l'opció Extreu pàgines de fitxers PDF a una nova acció de fitxer PDF.
L'exemple següent selecciona una combinació de pàgines específiques i un interval de pàgines.
Extreu el text del PDF
Podeu extreure text d'un fitxer PDF mitjançant l'acció "Extreu text del PDF". A les propietats de l'acció podeu definir el fitxer PDF d'origen i les pàgines de les quals s'ha d'extreure text. Sota les propietats d'acció avançada podeu definir una contrasenya en cas que el fitxer PDF estigui protegit i si el motor ha d'optimitzar per a dades estructurades o no.
Paràmetres d’entrada
Argument | Opcional | Accepta | Valor per defecte | Descripció |
---|---|---|---|---|
Fitxer PDF | No | Fitxer | El fitxer PDF del qual extreure text. Introduïu un camí de fitxer, una variable que contingui un fitxer o una ruta de text | |
Pàgines que s'extrauran | N/A | Totes, individuals, gamma | Totes | Especifica quantes pàgines cal extreure: totes les pàgines, una sola pàgina o un interval de pàgines |
Número de pàgina únic | No | Valor numèric | Número de l'única pàgina de la qual s'ha d'extreure el text | |
Número de pàgina inicial | No | Valor numèric | Número de la primera pàgina de l'interval de pàgines del qual s'ha d'extreure el text | |
Número de pàgina final | No | Valor numèric | Número de l'última pàgina de l'interval de pàgines del qual s'ha d'extreure el text | |
Contrasenya | Sí | Entrada encriptada directa o Valor del text | La contrasenya de l'arxiu PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya | |
Optimitza per a les dades estructurades | N/A | Valor booleà | Fals | Especifiqueu si s'ha de detectar la disposició amb format al document i extreure'n el text en conseqüència |
Variables generades
Argument | Type | Descripció |
---|---|---|
ExtretPDFTagüent | Valor del text | El text extret |
Excepcions
Excepció | Descripció |
---|---|
El fitxer PDF no existeix | El fitxer no existeix al camí proporcionat |
Contrasenya no vàlida | La contrasenya proporcionada no és vàlida |
No s'ha pogut extreure el text | S'ha produït un error en intentar extreure el text |
Extreu les taules del PDF
Podeu extreure taules contingudes en un fitxer PDF mitjançant l'acció Extreu taules de PDF . A les propietats de l'acció podeu definir el fitxer PDF i l'interval de pàgines del qual s'extrauran les taules. Sota les propietats d'acció avançada podeu definir una contrasenya en cas que un fitxer PDF estigui protegit, definir si la taula té capçaleres o no, i finalment si les taules que creuen els marges de la pàgina s'han de fusionar o no.
Paràmetres d’entrada
Argument | Opcional | Accepta | Valor per defecte | Descripció |
---|---|---|---|---|
Fitxer PDF | No | Fitxer | El fitxer PDF per extreure taules. Introduïu un camí de fitxer, una variable que contingui un fitxer o una ruta de text | |
Pàgines que s'extrauran | N/A | Totes, individuals, gamma | Totes | Especifica de quantes pàgines s'extreuen les taules: totes les pàgines, una sola pàgina o un interval de pàgines |
Número de pàgina únic | No | Valor numèric | Número d'una sola pàgina de la qual s'extreuen les taules | |
Número de pàgina inicial | No | Valor numèric | Número de la primera pàgina de l'interval de pàgines de les quals s'extreuen les taules | |
Número de pàgina final | No | Valor numèric | L'últim número de pàgina de l'interval de pàgines de les quals s'extreuen les taules | |
Contrasenya | Sí | Entrada encriptada directa o Valor del text | La contrasenya de l'arxiu PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya | |
Combina les taules que creuen els marges de pàgina | N/A | Valor booleà | Cert | Especifica si s'han de combinar les taules que creuen els marges de pàgina a l'interval de pàgines especificat |
La primera línia conté noms de columna | N/A | Valor booleà | Cert | Especifica si la primera línia de la taula conté noms de columna |
Variables generades
Argument | Type | Descripció |
---|---|---|
PDFTables extrets | Llista d'informació de la taula PDF | Les taules extretes amb la seva informació com una llista |
Excepcions
Excepció | Descripció |
---|---|
El fitxer PDF no existeix | El fitxer no existeix al camí proporcionat |
Contrasenya no vàlida | La contrasenya proporcionada no és vàlida |
No s'han pogut extreure les taules | S'ha produït un error mentre s'intentava extreure les taules |
Extreu les imatges del PDF
Per extreure imatges d'un fitxer PDF podeu utilitzar l'acció Extreu imatges de PDF . En els paràmetres d'acció podeu definir el fitxer PDF i les pàgines de les quals extraieu imatges, la convenció de nomenclatura de les imatges extactades i la ubicació de destinació de les imatges desades. També podeu definir una contrasenya si el fitxer PDF està protegit a la configuració avançada.
Paràmetres d’entrada
Argument | Opcional | Accepta | Valor per defecte | Descripció |
---|---|---|---|---|
Fitxer PDF | No | Fitxer | El fitxer PDF per extreure imatges. Introduïu un camí de fitxer, una variable que contingui un fitxer o una ruta de text | |
Contrasenya | Sí | Entrada encriptada directa o Valor del text | La contrasenya de l'arxiu PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya | |
Pàgines que s'extrauran | N/A | Totes, individuals, gamma | Totes | Especifica quantes pàgines cal extreure: totes les pàgines, una sola pàgina o un interval de pàgines |
Número de pàgina únic | No | Valor numèric | Número de l'única pàgina de la qual s'han d'extreure les imatges | |
Número de pàgina inicial | No | Valor numèric | El primer número de pàgina del rang de pàgines per extreure imatges | |
Número de pàgina final | No | Valor numèric | L'últim número de pàgina del rang de pàgines de les quals extreure imatges | |
Nom de les imatges | No | Valor del text | Com comença el nom de les imatges. Exemple de nom d'imatges extretes: GivenName_1, GivenName_2 | |
Desa les imatges a | No | Carpeta | La carpeta per guardar les imatges extretes com a fitxers png |
Variables generades
Aquesta acció no produeix cap variable.
Excepcions
Excepció | Descripció |
---|---|
Contrasenya no vàlida | La contrasenya proporcionada no és vàlida |
No s'han pogut extreure les imatges | Indica que s'ha produït un error en extreure imatges de les pàgines donades del PDF |
La carpeta no existeix | Indica que la carpeta no existeix |
El fitxer PDF no existeix | El fitxer no existeix al camí proporcionat |
Extreu les pàgines del fitxer PDF a un fitxer PDF nou
Podeu crear un fitxer PDF nou extraient pàgines d'un fitxer PDF existent utilitzant les pàgines del fitxer PDF a una nova acció de fitxer PDF. En els paràmetres d'acció podeu definir el fitxer PDF d'on extraieu les pàgines, les pàgines a extreure, la ubicació del nou fitxer PDF i què hauria de passar si ja existeix un fitxer amb el mateix nom i extensió. Finalment, sota les propietats avançades es pot definir una contrasenya en cas que el PDF d'origen estigui protegit.
Paràmetres d’entrada
Argument | Opcional | Accepta | Valor per defecte | Descripció |
---|---|---|---|---|
Fitxer PDF | No | Fitxer | El fitxer PDF per extreure pàgines. Introduïu un camí de fitxer, una variable que contingui un fitxer o una ruta de text | |
Contrasenya | Sí | Entrada encriptada directa o Valor del text | La contrasenya de l'arxiu PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya | |
Selecció de pàgines | No | Valor del text | Els números d'índex de les pàgines a conservar (per exemple, 1,3,17-24) | |
Ruta PDF extreta | No | Fitxer | Camí on s'emmagatzemarà el fitxer PDF extret | |
Si l'arxiu existeix | N/A | Sobreescriure, No sobreescriure, Afegeix el sufix seqüencial | Afegeix sufix seqüencial | Especifica què cal fer en cas que el fitxer PDF de sortida ja existeixi |
Variables generades
Argument | Type | Descripció |
---|---|---|
PDF extret | Fitxer | El nou fitxer PDF |
Excepcions
Excepció | Descripció |
---|---|
Contrasenya no vàlida | La contrasenya proporcionada no és vàlida |
El fitxer PDF no existeix | El fitxer no existeix al camí proporcionat |
Pàgina fora dels límits | Indica que una o més pàgines estan fora dels límits del fitxer PDF |
Selecció de pàgines no vàlida | Indica que les pàgines proporcionades no són vàlides per al fitxer PDF |
No s'ha pogut extreure el PDF nou | Indica que s'ha produït un error en intentar extreure el nou PDF |
Combina fitxers PDF
Combina diversos fitxers PDF en un de nou.
Podeu utilitzar l'acció Combina fitxers PDF per agafar dos o més fitxers PDF i combinar-los en un sol fitxer. Els fitxers a combinar es poden proporcionar en forma de llista, o entre cometes dobles i separats per un delimitador. També podeu proporcionar contrasenyes per als fitxers PDF, en cas que estiguin protegits amb contrasenya.
Paràmetres d’entrada
Argument | Opcional | Accepta | Valor per defecte | Descripció |
---|---|---|---|---|
Fitxers PDF | No | Llista de fitxers | Els fitxers a combinar. Adjunteu diversos fitxers entre cometes dobles (") i separeu-los per un delimitador, o utilitzeu una llista de fitxers | |
Camí del PDF combinat | No | Fitxer | Camí on s'emmagatzemarà el fitxer PDF combinat | |
Si l'arxiu existeix | N/A | Sobreescriure, No sobreescriure, Afegeix el sufix seqüencial | Afegeix sufix seqüencial | Especifica què cal fer en cas que el fitxer de destinació ja existeixi |
Contrasenyes | Sí | Entrada encriptada directa o Valor del text | Les contrasenyes delimitades. L'ordre ha de ser el mateix que l'ordre dels PDF d'entrada. Deixeu-ho en blanc si els PDF no estan protegits amb contrasenya | |
Delimitador | No | Valor del text | , | Un delimitador de contrasenya personalitzat. Aquest delimitador no hauria de formar part de cap de les contrasenyes |
Variables generades
Argument | Type | Descripció |
---|---|---|
PDF combinat | Fitxer | Fitxer PDF combinat |
Excepcions
Excepció | Descripció |
---|---|
El fitxer PDF no existeix | El fitxer no existeix al camí proporcionat |
Contrasenya no vàlida | La contrasenya proporcionada no és vàlida |
No s'han pogut combinar els fitxers PDF | Indica que s'ha produït un error mentre es combinaven els fitxers |