Mikroformáty sú, v krátkosti povedané, spôsob označenia ľuďom čitateľných dát tak, aby boli pochopiteľné aj pre počítače. Ako fungujú, a ako môžu obohatiť web?
Začnem príkladom: hCard je mikroformát používaný pre vyznačenie adresy (e-mailu, telefónneho čísla a pod.) Nasledovný kód na stránke nrsr.sk označuje adresu NRSR:
<p><strong>Národná rada Slovenskej republiky</strong>, Námestie Alexandra Dubčeka 1, 812 80 Bratislava 1</p>
<p>tel.: +421 2 5972 1111, e-mail: <a href="mailto:info@nrsr.sk">info@nrsr.sk</a></p>
Z toho však žiaden software nemôže byť múdry. Alternatívny zápis vo formáte hCard:
<div class="vcard">
<div class="fn org">Národná rada Slovenskej republiky</div>
<div class="adr">
<div class="street-address">Námestie Alexandra Dubčeka 1</div>
<div>
<span class="locality">Bratislava</span>,
<span class="postal-code">812 80</span>
</div>
<div class="country-name">Slovakia</div>
</div>
<div>tel.: <span class="tel">+421 2 5972 1111</span></div>
<div>e-mail: <span class="email">info@nrsr.sk</span></div>
</div>
Tento zápis je pri vhodnom naformátovaní CSS príslušných tried ľahko čitateľný nielen človekom, ale aj softwarovým systémom rozpoznávajúcim hCard.
Ako vidno, jedná sa len o rožšírenie nad (X)HTML – tu konkrétne boli použité triedy tagov
<div> a <span>
, môžem však použiť odstavce, zoznamy, tabuľky...
Medzi ďalšie mikroformáty patrí napríklad hResume pre označenie životopisu, hCalendar pre vyznačenie udalostí, hReview pre recenzie, XFN pre vytváranie sietí známych a priateľov a podobne. Za mikroformát sa považuje aj rel="nofollow", ktorý inštruuje vyhľadávač, aby odkaz nezvyšoval rating jeho cieľa.
Mikroformáty radikálne zjednodušujú získavanie relevantných informácií z inak čistého plaintextu. Hudbou nie príliš vzdialenej budúcnosti potom môže byť napríklad nasledujúca situácia: vo svojom prehliadači podporujúcom mikroformáty otvorím stránku e-shopu. Prehliadač pri každom produkte zobrazuje ikonu naznačujúcu, že informácie o ňom sú dostupné ako hReview. Tým mi umožní vybrať si niekoľko z nich a porovnať ich. Keď prejdem myšou po e-mailovej adrese, zobrazí sa popup umožňujúci okamžite začať písať mail, prípadne uložiť si ju do adresára. V rohu je adresa, tú si po výbere danej položky z kontextového menu môžem zobraziť vo svojej obľúbenej internetovej mape, prípadne preniesť do GPS navigácie. Keďže všetku spomínanú funkčnosť zabezpečuje prehliadač, je plne konfigurovateľná pre moje potreby, a autora stránky nestojí takmer žiadnu námahu.
Toto všetko si môžete vyskúšať už dnes, napríklad pomocou rozšírenia Operator pre Firefox. Ten zvýrazňuje mikroformáty na stránkach a umožňuje základné operácie s informáciami, ktoré nesú. Po nainštalovaní odporúčam zájsť na microformats.org :) Ale aj samotný blackhole.sk, respektíve Drupal, na ktorom beží, používa jeden mikroformát: konkrétne rel-tag na označovanie kategórií článkov.
Mikroformáty zatiaľ nepoužíva veľa stránok, pretože sú ešte mladé. Po ich druhých narodeninách sa ale zdá, že ak sa im podarí rozšíriť, stanú sa veľkým prínosom pre sémantický web.
Zdroje:
http://microformats.org/
http://en.wikipedia.org/wiki/Microformats
a moja hlavná inšpirácia http://www.lupa.cz/clanky/s-mikroformaty-prijde-web-3-0/
velmi dobre pouzitie microformatov je v prehliadaci v novom iphone - funguje ako odkaz, obsahuje tel. cislo a po kliknuti sa to cislo vytoci :-) mikroformaty su podla mna velmi dobry smer, akym web moze ist
==
are you canadian?!
Podla mna je to zasa zbytocnost, ked na zapisanie adresy si musim pamatat 10 nazvov tried. Okrem toho sa prenasa priblizne dvojnasobne mnozstvo dat a pri dnesnej pouzitelnosti niecoho takeho to podla mna nema zmysel. Prvi, ktori zacnu takto napisane adresy vyuzivat, budu spamboty a podobne neziaduce zivly. Ked to chce totiz niekto uz optimalizovat az do takejto miery pre robotov, tak nepredpokladam, ze je pouzitelna nejaka ochrana proti jednoduchemu ziskaniu mailu (zapis do obrazku a pod.). Zaroven to rozsiri aj moznosti automatizovaneho phisingu, kedze je vierohodnejsie, ak niekomu pride mail aj s jeho adresou a telefonnym cislom, na ktory je registrovany napr. nejaky ucet, ako ked by tam nebolo o tom uzivatelovi dokopy nic.
Predpokladam, ze ak to uplatnenie najde, ale najskor az za velmi dlhu dobu a potom to uz ludia nebudu tak velmi pouzivat, lebo bude nieco novsie a lepsie.
add. data: imho aj ked vsetky html fajly zdvojnasobia svoju velkost, tak to nebude zaberat taku "kopu" miesta ako multimedia. add. zapamatat si: myslim, ze vacsina veci vseobecne v programovani ide copy+paste+edit. takze je blbost si vsetko pamatat. okrem toho, cim castejsie danu vec pouzivas, tym skor sa ju naucis aj spamati prirodzene. add. spam - ten tu bude aj tak. ja viem, ze prevencia je dobra vec, ale imho spamfiltre vedia zvladnut vela veci.
ina moznost bola v planovanom (pravdepodobne sa neuskutocni, resp. sa nebude pouzivat na web) xhtml2 - tagy ako <article> a pod. vsetko bohuzial zalezi na IE8.
==
are you canadian?!
zaujimava myslienka, ale naozaj mam z nej skor strach v podobe zneuzitia od spambotov.
podla mna napriklad na linuxe to bude mizerne vyuzitelne, pretoze taky mikroformat casto potrebuje helper aplikacie a mne sa z firefoxu nepodarilo pouzit ani obycajny hypertextovy odkaz protokolu mailto:
Skor by som sa bal zneuzitia spambotmi, aj ked, vdaka DOMu sa bude dat vcelku lahko skoro kazdy spambot odzubat...
---
Cuchat s nadchou, to je ako sniffovat bez promiscu.
no to sa da aj teraz, v kazdom pripade by musel google implementovat javascript do svojho crawlera :-)
ide vsak o to, urobit web semantickejsi, teda aby bolo jasnejsie, co je co. co je clanok a co je napr. komentar pod clankom. hoci tie helper aplikacie...neviem, je mozny aj tento smer, avsak imho rozsirenia pre firefox by mali byt aj v buducnosti...
==
are you canadian?!
Neviem, ci moj dotaz sformulujem spravne, ale mam taky pocit, ze o chvilku budeme mat datove a vizualne triedy.
Datove budu hovorit o datach ulozenych v elemente a vizualne budu odkazovat na CSS. Pouzivat triedy aj na urcenie typu dat a aj na urcenie vizualnej interpretacie moze byt v urcitych pripadoch neprehladne.
Mozem sice vytvorit v CSS triedu napr. "locality" a v nej nastavit potrebne atributy, ale co ak chcem pridat dalsie dve "vseobecnejsie" triedy, ktore urcuju ako sa bude prvok zobrazovat ? Potom mi vznikne nieco taketo:
<span class="locality odd justified">Bratislava</span>
, kde "locality" je hCard trieda(v CSS urcuje napriklad, ze text bude zvyrazneny), "odd" urcuje neparny riadok a "justified" napr. odsadenie spanu.Ktory teraz hovori o tom ake su tam data? (je to asi aj vec konfliktov v nazvoch tried) Co ak niekto pride s niecim podobnym[IE8 ? :-) ], ale nazve to inak a webdeveloper bude potrebovat podporu oboch? Element bude mat napr. 5 tried - nie je to trosku vela ?
Aj ked je Microformats dobry napad,(dakujem autorovi clanku za jeho lepsie pochopenie), v niektorych pripadoch moze byt trosku matuci.
Ako pisem tento koment, tak si uvedomujem, ze tato vec vadi asi len mne ^_^
mikroformaty ma velmi zaujimaju, tak sa zapojim este raz ;-)
to, ze nejaka trieda nieco znamena, neznamena to, ze sa neda normalne pouzit. tak ako som nizsie pisal o odkazoch "zavolaj mi" pre apple, tak potom tie odkazy samozrejme treba skryt pre ostatne prehliadace (napr.).
podobne ty mozes pouzit definiciu locality
.locality {text-indent:0.5em;}
mikroformaty su akoby sposob rozsirenia html o nove tagy. avsak kvoli spatnej kompatibilite sa musia pisat do class, pripadne rel
==
are you canadian?!
Presne to ma napadlo. Vyhoda xHTML oproti HTML je v tom, ze tag by mal hovorit o tom, co obsahuje a trieda by mala hovorit o tom ako maju byt data zobrazene. Preto boli zrusene tagy ako
<b>
a vymyslene tagy ako<address>
. Mikroformaty robia v podstate to iste ale dozadu. Trieda hovori o tom, ake data tag obsahuje. Je to asi len docasny stav.Ak sa stanu mikroformaty standardom W3C a pripoja ich do specifikacie xHTML bude to super.
ved prave to - standardom w3c -> to by sme sa nacakali na tu byrokraciu...prave mikroformaty to robia tak, ze staci, aby to podporovalo "cielove zariadenie", teda vacsinou prehliadac, ale napr. dnes sa casto javascript pise tak, ze do tagu rel (ktory moze byt u vacsiny elementov myslim), sa napise nieco na identifikaciu.
teda proste funkcnost, ktora nezavisi aj na w3c, aj na prehliadacoch. avsak sucasne nijako nenarusa w3c. a este jedna vec, hoci by ich aj neimplementovali prehliadace, tak stale ich mozu implementovat vyhladavace (a bohuzial mozno spamboty). az to by bolo super :-)
==
are you canadian?!
Z pohladu spambotov to bude asi jedno. Mozno im to urychli pracu, ale urcite to nezmeni princip ich fungovania. Teraz napriklad spamboty hladaju mailove adresy v (x)HTML dokumente cez RegExp, v pripade mikroformatov sa pozru najprv do tagu s triedou "email". Kazdopadne prva metoda je univerzalna a funkcna (skoro) vsade. Ved vzdy je cesta ako ziskat mail adresu.
"Znevazovat" mikroformaty v tomto smere sa mi zda trosku nepodlozene.
Asi zacnem mikroformaty podporovat vo svojich projektoch :)
Hladaju sice cez regexp, ale my sa im v tom snazime branit napriklad pisanim mailu do obrazku, pripadne pisanie mailu cez entity a podobne. Znevazujem ich preto, lebo ked uz chces silou - mocou spristupnit mimo ine aj mailove adresy robotom, musis ich spristupnit aj spambotom. Tu prave ja vidim problem.
Ano, to je tiez uhol pohladu. Neviem ako je to v specifikacii mikroformatov, ale mohli by tam povolit
<img>
tag. Mikroformat interpreter by potom namiesto textu zobrazil priamo obrazok. Situaciu pre vyhladavace by to asi nezmenilo, ale pomohlo by to aspon uzivatelovi. Pripadne by mohli vyhladavace indexovat nieco ako "odkaz na email" > ,,Chces mail? Klikni sem pre zobrazenie."nie, problem je prave v tom, ze google a spamboot je v podstate to iste, len inac naklada s udajmi. samozrejme, bavime sa o tom, ktore udaje zobrazovat - nie je imho nutne tam davat mail - teda pre google to nie je nutne. a len mimochodom, interpreter bezi na strane klienta, takze spambotovi je jedno, co ti na na mikroformat povie interpreter :-)
==
are you canadian?!
Nakoniec mozme povedat, ze mikroformat interpreter je vlastne tiez bot , ktory spracuvava informacie zo stranok :-)
Tej poslednej vete trosku nerozumiem. Mozno sme sa zle pochopili. Tym napadom s vkladanim obrazku som myslel to, ze by sa dala pouzit sucasna ochrana pred spambotom aj v mikroformatoch. Neviem, ci je dovolene davat ako email obrazok. Ak by to umoznoval, resp. by to interpreter implementoval, dostali by sme sa uplne na zaciatok. Spam bot by bol v rovnakej situacii ako keby tam mikroformat nie je :)
EDIT:
Islo by len o to, ze Google Bot by mohol nasmerovat uzivatela na obrazok s mailom aj ked by nevedel ake znaky obsahuje, ale vedel by, ze tam je prave mailova adresa. Spambot by teda tiez vedel, ze tam je, ale nemohol by ju precitat, resp. zneuzit.
Myslim ze takato ochrana e-mailov sa bije s tym konkretnym mikroformatom, a to preto, lebo on caka, ze tam bude v texte napisana e-mailova adresa. A ona tam nieje.
Btw pri chraneni mailov treba mysliet aj na usability pre handicapovanych ludi. Taky obrazok namiesto mailovej adresy by niekomu s poruchou zraku prd pomohol.
Jednoznacne riesenie je, aby zmizol spam. ;-)