pdf do txt

Sekcia: Aplikácie & Desktop 10.07.2008 | 01:42
Avatar majo984 Debian,Knoppix,Mandriva  Používateľ
ahojte mam par knih v pdf a chcel by som ich koli elektronickej citacke knih previest do txt formatu. prosim poradte mi nejaky "softik" alebo prikaz. niektore pdf su chranene proti kopirovaniu. pdf-ka obsahuju obrazky aj text a ide mi vylucne o kopirovanie textu. dakujem za kazdu radu alebo napad ktory by pomohol
    • Re: pdf do txt 10.07.2008 | 09:07
      Avatar uid0 Debian  Používateľ
      pdftotext, pdftops a ps2txt

      necakaj ale bezchybny prevod, s tou ochranou neviem, ale mam pocit, ze mi to slo

      na nechranene sa da najst online prevodnik od adobe (ktory kruto nefungoval, aspon mne), mozno to robi aj gmail na prilohy
      Debian. apt-get into it…
      • Re: pdf do txt 10.07.2008 | 13:30
        Avatar majo984 Debian,Knoppix,Mandriva  Používateľ
        pdftotext funguje aj na tych chranenych pdf ale je absolutne nepouzitelny. Je hrozne co ten program dokaze s tymi znakmi spravit. a cez gmail to tiez nejde :'(
        • Re: pdf do txt 10.07.2008 | 13:33
          --   Návštevník
          preco chces vytahovat text z chraneneho pdf suboru ak si to autor toho suboru nepraje? ten subor asi nie je chraneny iba tak zo zabavy...
    • Re: pdf do txt 10.07.2008 | 11:20
      Avatar borg Fedora  Administrátor
      ta ochrana proti kopirovaniu je onicom. staci mat klienta/soft ktory ju ignoruje a je po ochrane.
      • Re: pdf do txt 10.07.2008 | 11:46
        --   Návštevník
        nie je nahodou taky soft proti podmienkam pre slobodne pouzivanie specifikacie pdf?
        • Re: pdf do txt 10.07.2008 | 11:57
          Avatar borg Fedora  Administrátor
          neviem, licenciu som necital. ale dodrziavanie persmissions je vecou klienta.
          • Re: pdf do txt 10.07.2008 | 12:09
            --   Návštevník
            niekde som o tom davnejsie cital (ak sa nemylim :-). a preto ze tie permissions su vecou klienta tak preto adobe dala tu podmienku lebo inac by tie premissions nemali zmysel. len neviem ako to je teraz ked je to iso standard.
            • Re: pdf do txt 10.07.2008 | 12:10
              Avatar borg Fedora  Administrátor
              to netusim ani ja
          • Re: pdf do txt 10.07.2008 | 16:34
            Avatar Miroslav Bendík Gentoo  Administrátor
            V KPDF sa dá nastaviť (nastavenia / rešpektovať obmedzenia). Po vypnutí by mala fungovať tlač do súboru a výsledne ps by sa mohlo teoreticky dať previesť na text. Ešte tu existuje alternatívne riešenie -> vyexportovať všetko do obrázkov a prehnať cez OCR (na linuxe nie je ktovie koľko kvalitných OCR programov ...)
            • Re: pdf do txt 10.07.2008 | 17:04
              Avatar majo984 Debian,Knoppix,Mandriva  Používateľ
              ano to kpdf funguje. vdaka za pomoc. Trosku to trvalo oznacit nieco cez 600stran ale uz to mam :) velmi pekne dakujem