Automator podesáté – extrahujte formátovaný text z PDF souborů

Automator podesáté – extrahujte formátovaný text z PDF souborů

Určitě jste již někdy zkoušeli zkopírovat a vložit text z PDF souboru do Pages nebo Microsoft Office. Většinou text ztratí své formátování a to může být nepříjemné.

Ztrávil jsem příliš mnoho drahocenného času vracením textu do jeho původní podoby při zkopírování z PDF. Říkal jsem si, že určitě musí být snadnější cesta, vždyť většina věcí jde na macu udělat velice snadno. Naštěstí se mi povedlo narazit na následující tip.

Extrahujte formátovaný text z PDF

Krok první

Otevřeme si Automator (je uložený ve složce Aplikace), z nabídky vybereme Sled úloh a klikneme na tlačítko Vybrat. (viz obr. 1)

pdf2txt01

Krok druhý

Ve sloupci akcí vybereme Soubory a složky a přetáhneme akci Požádat o položky Finderu do okna pro sled úloh (viz. obr. 2)

pdf2txt02

Krok třetí

Ve sloupci akcí vybereme PDF a přetáhneme akci Extrahovat text PDF pod akci přidanou v prvním kroku (obr. 3)

pdf2txt03

Krok čtvrtý

Máme skoro hotovo, pouze je potřeba změnit výstup z Prostý text na Formát RTF. Tímto se nám zachová jak formátování tak i styly písma.

pdf2txt031

Krok pátý a poslední

Uložíme vytvořenou akci jako aplikaci. Příště, když budeme potřebovat extrahovat text z PDF stačí otevřít námi vytvořenou aplikaci, vybrat PDF soubor a máme hotovo.

pdf2txt04

Autor

Dlouholetý uživatel produktů Apple všeho druhu a věčný experimentátor. Dne 1.1.2012 po několikaletém rozmýšlení založil tento blog pro začínající i zkušené uživatele a pokud může vždy se snaží pomoct. Držitel Apple Certified Associate - Mac Integration 10.7, Apple Certified Associate - Mac Integration 10.8. Apple Certified Support Professional 10.7 a Apple Certified Technical Coordinator 10.7