Full-textové prohledávání komixů a jiných obrázků

03.03.2019 | 01:05 | Monika_Kokešová | Zaujímavý článok

V bitmapových obrázcích bývají často ukrytá užitečná data, která jsou ovšem běžně nepřístupná. V článku Full-textové prohledávání komixů a jiných obrázků (dostupné přes Tor) autor prakticky ukazuje, jak si postahovat komixy např. z Roota a rozpoznat v nich text pomocí OCR nástroje Tesseract. Následně Ghostscriptem vkládá všechny komiksy do jednoho velkého PDF, ve kterém jde vyhledávat text (který byl původně jen shlukem grafických bodů v bitmapách). Uvedený postup lze použít i k užitečnějším věcem, jako např. indexování nestrukturovaných dat na disku.

    • RE: Full-textové prohledávání komixů a jiných obrázků 04.03.2019 | 11:55
      Avatar Livan Manjaro s XFCE, Q4OS s KDE  Používateľ

      Sorry ale prečo je takýto článok schovaný na dark webe? Ja si kvôli tomu tor inštalovať nemienim.

      • RE: Full-textové prohledávání komixů a jiných obrázků 04.03.2019 | 14:32
        Avatar WlaSaTy   Návštevník

        Ak dostali povolenie od vlastníkov autorských práv (alebo ich zástupcov) na tvorbu a distribúciu odvodeného diela (oskenovaný text), alebo ak sa jedná o diela dostupné ako Public Domain, tak by ma ten dôvod tiež zaujímal.

        • RE: Full-textové prohledávání komixů a jiných obrázků 04.03.2019 | 15:27
          Avatar Monika_Kokešová   Návštevník

          Povolení autor nemá, ale zveřejnil jen skript, nikoli výsledné PDF. Pokud si PDF vyrobí každý uživatel sám pro osobní potřebu, mělo by to být v pořádku i podle práva.

          • RE: Full-textové prohledávání komixů a jiných obrázků 04.03.2019 | 21:13
            Avatar WlaSaTy   Návštevník

            Takže autor sa teda schoval na darkweb aby mu nemohli našiť navádzanie?

      • RE: Full-textové prohledávání komixů a jiných obrázků 04.03.2019 | 15:25
        Avatar Monika_Kokešová   Návštevník

        Dark webe? Vždyť na tom vašem "normálním" internetu se dějí mnohem víc dark věci - cenzura, odposlechy, plošné sledování...

        • RE: Full-textové prohledávání komixů a jiných obrázků 04.03.2019 | 17:46
          Avatar Livan Manjaro s XFCE, Q4OS s KDE  Používateľ

          Keby to bolo niečo kriminálne, tak pochopím, že sa to nachádza na dark webe ale v tomto prípade je to kontraproduktívne. Aby som si to mohol pozrieť, musím si inštalovať tor, čo nie všetci sú ochotní urobiť. Ani ja nie, pretože ma to zasa až tak nezaujíma.

          • RE: Full-textové prohledávání komixů a jiných obrázků 06.03.2019 | 18:20
            Avatar bedňa LegacyIce-antiX  Administrátor
            Keby to bolo niečo kriminálne, tak pochopím

            Pretože ťa dnes skriminalizajú aj protiústavne.

            TorBrowser sa dá nainštalovať na kliknutie, to že sa ti to nechce spraviť je tvoja voľba rovnako ako autora softvéru, ktorý sa chce vyhnúť ŠTBákom a ukazuje ako si chrániť súkromie.

            Kámo zlaté časy slobody sú tatam.

            Táto správa neobsahuje vírus, pretože nepoužívam MS Windows. http://kernelultras.org
            • RE: Full-textové prohledávání komixů a jiných obrázků 06.03.2019 | 20:08
              Avatar WlaSaTy   Návštevník
              Pretože ťa dnes skriminalizajú aj protiústavne.

              Porušenie copyrightu je podľa európskych noriem protiprávne, bez ohľadu na evanieliá o zadarmovom sprístupnení pre všetkých. A to aj diel starších jednej generácie (20 rokov). A navádzanie tiež.

              Teda s myslím že stále platnou slovenskou výnimkou "pre vlastnú potrebu".

              On ten návod môže byť fajn, napríklad ak si človek zaplatí kurz ku ktorému dostane PDF s slajdami vo formáte obrázkov o bežnej dĺžke tak pol tisícovky strán (alebo aj viac). Je to vlastne taký komix bez postavičiek. A prekopať si to na text pre vlastnú potrebu je fajn. Preto taký návod schvaľujem.

              Ale tu je reálna pravdepodobnosť že si to niekto prevedie na text, a "zverejní" odvodené dielo. Hoci aj keby išlo o preklad do jazyka do ktorého to autor nechce preložiť, i keď to mohol v origináli zverejňovať zdarma. Holt, voči autorskému zákonu sa s obľubou bojuje partizánčinou, ale výsledok je v tom prípade vždy negatívny.