Zdravím, priatelia,
z pdf dokumentu chcem skopírovať časť textu. Označím ho myškou ctrl+c a vložím ctrl+v do txt súboru. Dostanem poriadny miš-maš. Znaky písané azbukou sú prevedené do rôznych iných "náhrad?" - je to nečitateľné.
Viete mi niekto pomôcť, čo s tým?
PDF s azbukou
Pre pridávanie komentárov sa musíte prihlásiť.
Podľa mňa to súvisí s dvoma vecami. Za prvé, aké kódovanie je v zdroji a aké máš nastavené na cieľovom programe, kde to vkladáš. Za druhé, závisí to od použitého fontu. Už sa mi stalo, že niektoré fonty nemali všetky znaky, ktoré bolo treba a pomohla výmena fontu za iný. Takže problém je v jednom alebo druhom, prípadne v obidvoch súčasne. Ja osobne tipujem, že problém je v použitom kódovaní.
ak vezmem pdf 1 v azbuke, skopírujem text a vložím pomocou xed do txt súboru, všetko je v poriadku, čítam/vidím azbuku
ak vezmem pdf 2, tak v txt je chaos
mne to pripadá,
1) ako by v pdf2 neboli pribalené všetky písma,
nie som si však istý, či rozmýšľam správnym smerom... a ak áno, ako ich do toho pdf vložím, alebo, čo s tým poznaním
2) netuším :(
prikladám vzorku textu pdf2:
Otestoval som to vloženie vo windowse a robí mi to to isté. Evidentne ti tam chýba font, ktorý obsahuje správne písmená. Ale ako s tým naložiť ti neviem pomôcť, jedine, že by si si taký font nainštaloval a potom v tom prenesenom texte v tých úsekoch zmenil použitý font.
tak k tomuto konkrétnemu textu som zistil, že to nie je klasická azbuka (žiaden "umelecký" štýl dnešnej azbuky),
je to niečo staršie, musím hľadať, čo to je a stiahnuť si to písmo,
niekde bude, keďže niekto vytlačil aj ten úryvok :)