Full-textové prohledávání komixů a jiných obrázků
V bitmapových obrázcích bývají často ukrytá užitečná data, která jsou ovšem běžně nepřístupná. V článku Full-textové prohledávání komixů a jiných obrázků (dostupné přes Tor) autor prakticky ukazuje, jak si postahovat komixy např. z Roota a rozpoznat v nich text pomocí OCR nástroje Tesseract. Následně Ghostscriptem vkládá všechny komiksy do jednoho velkého PDF, ve kterém jde vyhledávat text (který byl původně jen shlukem grafických bodů v bitmapách). Uvedený postup lze použít i k užitečnějším věcem, jako např. indexování nestrukturovaných dat na disku.
Pre pridávanie komentárov sa musíte prihlásiť.
Sorry ale prečo je takýto článok schovaný na dark webe? Ja si kvôli tomu tor inštalovať nemienim.
Ak dostali povolenie od vlastníkov autorských práv (alebo ich zástupcov) na tvorbu a distribúciu odvodeného diela (oskenovaný text), alebo ak sa jedná o diela dostupné ako Public Domain, tak by ma ten dôvod tiež zaujímal.
Povolení autor nemá, ale zveřejnil jen skript, nikoli výsledné PDF. Pokud si PDF vyrobí každý uživatel sám pro osobní potřebu, mělo by to být v pořádku i podle práva.
Takže autor sa teda schoval na darkweb aby mu nemohli našiť navádzanie?
Dark webe? Vždyť na tom vašem "normálním" internetu se dějí mnohem víc dark věci - cenzura, odposlechy, plošné sledování...
Keby to bolo niečo kriminálne, tak pochopím, že sa to nachádza na dark webe ale v tomto prípade je to kontraproduktívne. Aby som si to mohol pozrieť, musím si inštalovať tor, čo nie všetci sú ochotní urobiť. Ani ja nie, pretože ma to zasa až tak nezaujíma.
Pretože ťa dnes skriminalizajú aj protiústavne.
TorBrowser sa dá nainštalovať na kliknutie, to že sa ti to nechce spraviť je tvoja voľba rovnako ako autora softvéru, ktorý sa chce vyhnúť ŠTBákom a ukazuje ako si chrániť súkromie.
Kámo zlaté časy slobody sú tatam.
Porušenie copyrightu je podľa európskych noriem protiprávne, bez ohľadu na evanieliá o zadarmovom sprístupnení pre všetkých. A to aj diel starších jednej generácie (20 rokov). A navádzanie tiež.
Teda s myslím že stále platnou slovenskou výnimkou "pre vlastnú potrebu".
On ten návod môže byť fajn, napríklad ak si človek zaplatí kurz ku ktorému dostane PDF s slajdami vo formáte obrázkov o bežnej dĺžke tak pol tisícovky strán (alebo aj viac). Je to vlastne taký komix bez postavičiek. A prekopať si to na text pre vlastnú potrebu je fajn. Preto taký návod schvaľujem.
Ale tu je reálna pravdepodobnosť že si to niekto prevedie na text, a "zverejní" odvodené dielo. Hoci aj keby išlo o preklad do jazyka do ktorého to autor nechce preložiť, i keď to mohol v origináli zverejňovať zdarma. Holt, voči autorskému zákonu sa s obľubou bojuje partizánčinou, ale výsledok je v tom prípade vždy negatívny.