PDF - Ako vytvoriť, či upraviť "index" v pdf dokumente
Väčšina pdf dokumentov je bez INDEXU, alebo s úplne rozhádzaným, nepoužiteľným, "čímsi". Dá sa to upravovať napr. v programe PDFmod, ale je to také "kostrbaté" a pri veľkom pdf-ku pomalé. Našiel som ale návod: How to add bookmarks to a PDF document on Linux, ktorý to rieši vcelku prijateľne.
Autorovi návodu týmto ďakujem :)
V nadpise je síce „bookmarks“, čo prekladáme ako "záložky", ale v prehliadači (po slovensky), je to ako "INDEX", čo je vlastne OBSAH
Takže, ak píšem dokument, knihu, ... a správne formátujem nadpisy, pri exporte do pdf formátu sa mi obsah tvorený štruktúrou nadpisov zobrazí práve v tomto INDEXE
Ak si niekto tento dokument otvorí, vie, čoho sa týka, čo obsahuje. Pri čítaní si môže pridávať vlastné záložky "BOOKMARKS" alebo poznámky alebo zvýrazňovať text, ....
----------
Funkcie sú prístupné napr. v libreoffice a xreader (kancelársky balík a prehliadač dokumentov v linuxmint -e) :)
----------
Prečo to riešim?
Len mizivé promile pdf dokumentov je s indexom – obsahom. Áno, viem, je to spôsobené spôsobom tvorby pdf dokumentov. Toto poznanie mi to však vôbec neuľahčuje.
Väčšinu dokumentov si síce stiahnem práve preto, že obsahujú niečo, čo ma zaujalo, ale ak si to nepoznačím ihneď, tak po čase neviem, čo v ňom mám hľadať. A často nepomôže ani nadpis dokumentu.
Formátované nadpisy zobrazené v indexe to výrazne uľahčujú, no a záložky a poznámky sú na nezaplatenie. :)
Ako vytvoriť, či upraviť "index" v pdf dokumente II.
vyššie uvedený postup mi nebral diakritiku, hľadal som riešenie a našiel :)
https://fntsample.sourceforge.net/pdfoutline.html
a dostal som sa tam odtiaľto: https://manpages.ubuntu.com/manpages/trusty/man1/pdfoutline.1.html
- takže si doinštalujte fntsample, ktoré má *ubu a mint v repozitári, jeho súčasťou je aj pdfoutline, ktorý potrebujeme
- v adresári, kde je zdrojový dokument zdroj.pdf vytvorte outline.txt alebo si to nazvite inak
tento outline.txt má mať formát, ako je v odkaze, teda:
<level> <page> Outline text
kde
<level> je úroveň nadpisu v osnove
medzera
<page> je číslo strany, na ktorú sa vytvorí odkaz
medzera
Outline text je nadpis, názov záložky, popis problematiky, ...
vytvorte si to napr. v obyčajnom textovom editore alebo v lo-calc -u, alebo ...
má to vyzerať nejak takto:
#sú tam medzery, ako ich vidíte
0 1 Názov dokumentu 1 1 Nadpis 2 1 Nadpis 2 2 Nadpis 1 3 Nadpis
- otvorte terminál v adresári, kde sú tieto dva dokumenty a zadajte:
pdfoutline zdroj.pdf outlines.txt výstup.pdf
a vytvorí sa dokument výstup.pdf, ktorý nemá problém s diakritikou :)
#návod zo zdroja v pdf formáte prikladám ako prílohu
#ak by vyskočila chybová hláška ako napr:
GLOB(0x56168ea32550) not a PDF file version 1.x at /usr/share/perl5/PDF/API2/Basic/PDF/File.pm line 245.
otvorte si pdf dokument v MasterPDFEditor 4 a uložte ho s nejakým názvom.
Ak to uložíte, exportujete, ..., z iného programu, inak, takmer určite stratíte možnosť editácie (teda, ak bol editovateľný), ale to je už iné téma :)
Ako vytvoriť, či upraviť "index" v pdf dokumente III.
Master PDF Editor - známy/neznámy
Hrajem sa s tými záložkami a aj keď tá druhá metóda je dobrá, násobne lepšia, ako tá prvá, neprestávam hľadať spôsob, ako si tú prácu uľahčiť. Pridávam teda ďalší spôsob.
Master PDF Editor mnohí poznáte a jeho bezplatnú verziu mám aj ja a čas od času použijem. A má funkciu, o ktorej som nevedel, teda ani nehľadal :), pridávanie a editácia záložiek, ergo, vytváranie a editácia Indexu.
Nebudem to rozpisovať, iba v skratke:
- v ľavom stĺpci sa prepnite do druhej záložky,
- tu kliknite na prázdne miesto
- v texte pdf dokumentu si myškou označte nadpis alebo text, na ktorý má odkazovať záložka
#poklepanie na text nefunguje, neoznačí ho - kliknite naň pravým tlačidlom myšky a zvoľte "Pridať záložku", zobrazí sa ako položka v ľavom stĺpci
- ak chcete vnorenú položku, v ľavom stĺpci kliknite nie na prázdne miesto ale na už existujúcu (nadradenú) položku a vytvorte novú záložku
- v ľavom stĺpci viete so záložkami manipulovať uchopením myškou
- nezabudnite si prácu ULOŽIŤ !!!
- výsledok nie je dokonalý, overte si vlastnosti výstupného súboru, nie každému to musí vyhovovať
Použitie je intuitívne, rýchlo si ho osvojíte. Prajem príjemnú zábavu.
Ukážka vytvoreného indexu
Z jedného pdf dokumentu, kde som vytvoril INDEX, som vybral 35 strán ako ukážku. V indexe zmizli čísla stránok, ktoré v tomto výstrižku nie sú. Prikladám to dole, ako prílohu.
Prílohy
Pre pridávanie komentárov sa musíte prihlásiť.
Veru tak. Čítať 200-sto stranový návod bez indexu a linkov je náročné na orientáciu. Dík za blog.
Presne tak. A napríklad LibreOffice či OpenOffice majú v exportných možnostiach pre PDF zaškrtávacie políčka na vytvorenie indexov (volá sa to, že značkované pdf.
A určite to dokážu aj kdejaké exporty z TeX-u a pod.
Je škoda, že sa na to kašle...
Trocha OT, zaujímalo by ma koľko % možností Libre/Open BFU poznajú a teda využívajú...
musím sa bfu zastať :)
tovar je pre toho, kto na to má
informácia je pre toho, kto jej rozumie
kancelársky balík ako LO je nástroj, silný, musím podotknúť, pre toho, kto ho potrebuje a ten si zistí aj jeho možnosti, pretože ich potrebuje
že LO použije aj bfu, a to len, ako písací stroj, mi nevadí
ak si niekto dá tú námahu, že prepíše starú knihu do pc, niekoľko desiatok, stoviek strán, ..., je to iniciatívny bfu, za čo ho treba pochváliť a poďakovať mu
ak pri tom nepoužije napr. Nadpisy ......, ale miesto toho použije "Tučné" písmo, tak to ma vytáča, ale napriek všetkému, vďaka aj za takto vytvorené pdf, inak by sme ho nemali, a my si s tým musíme nejak poradiť :)
ak to ale robí niekto, kto sa tým možno aj živí, tak to je smutné, zlé, nežiadúce, hrozné až úžasné, trestuhodné, ..., no ale ako to zmeníš?
zo skúsenosti ľudia čo v životipise majú office - pokročily (alebo dokonca expert) o LO nikdy nepočuli a väčšina ani nevie že CTRL+B im spraví tmavý text,
nejaké nadpisy a autopmatické obsahy, či index sú niečo o čom počuli raz pri písaní diplomovky aj to im pomohol celemú ročníku jeden spolužiak čo to vedel
nepreháňam - sú to reálne skúsenosti z pohovorov
Teda neviem, akú verziu LO máš Ty ale mne Ctrl+B spraví tučný text, nie tmavý.
:-D ja ho volám čierny (ale som nechcel aby to vyznelo rasisticky)
niektoré dokumenty, knihy stoja za tú námahu, to je fakt
ale...
ak použijem diakritiku, čo teda určite chcem urobiť, tak mi do indexu vysype text s marťanským písmom
a som tam, kde som bol, je to nepoužiteľné
viete mi, prosím, poradiť, ako upraviť ten príkaz, aby sa text v indexe zobrazil v mnou zvolenom, napísanom jazyku?
niečo ako lang-sk?
riešenie na problém s diakritikou som našiel a zápis hore som doplnil
to prvé riešenie, tiež nie je zlé ale to druhé je o výrazne jednoduchšie a spĺňa aj moju požiadavku ohľadom diakritiky
do zápisu som pridal ďalší spôsob (III.)
obrovské množstvo pdf dokumenov nemá index a to hovorím o dokumentoch, ktoré boli napísané v nejakom textovom editore a prevedené do pdf !!!
nemám mso, neviem teda posúdiť, či autorí nepoužívajú "Nadpisy" alebo je problém pri prevode do pdf v tých editoroch alebo v tých OS
môžete to, prosím, niekto s mso overiť?
k II. spôsobu som pripísal riešenie jednej možnej chyby
dopísal som čosi o ukážke a pridal prílohu :)