hocr2pdf a diakritika

Sekcia: Aplikácie & Desktop 09.02.2011 | 11:22
Avatar Michal kubuntu, debian  Používateľ
Ahojte, skúšam OCRkovať dokumenty a či už tesseract alebo cuneiform vytvoria hocr výstup ktorý je OK (viac menej podľa kvality zdroja).
Problém nastane keď začnem spájať výsledok za pomoci hocr2pdf. Výsledný text v PDF má preč niektoré písmená s diakritikou (napr. č) a iné sú zas úplne mimo. Máte niekto nápad čo s tím?
Vyššie uvedené zoskupenie písmen vyjadruje len to, že som skúšal či mi fungujú tlačítka na klávesnici. Akákoľvek spojitosť s reálnymi udalosťami a/alebo osobami je čisto náhodná.
    • Re: hocr2pdf a diakritika 10.02.2011 | 17:03
      lieko   Návštevník
      skus zmenit kodovanie alebo font

      ale konkretne neviem