Ako fungujú spamfiltre 1.5

11.12.2006 10:29 | betmen
Pri písaní tejto časti už nesedím na riti. Keďže je neskorý piatkový večer som vyvalený na gauči a pokračujem v tvorivej činnosti. Minule som sa rozbujnil o metódach detekcie spamu (aspoň o tých ktoré používam alebo plánujem/som používal). Teraz sa povenujem veci, ktorá už ide od teórie smerom k praktickému využitiu. A to možnostiam integrácie. Primárne by som rozdelil implementáciu tak ako u väčšiny rôznych vecičiek na server side a client side. Začnem z môjho pohľadu od začiatku (od konca sa mi to nepáči). Keby som chcel naviazať na moje predošlé slová (čo aj naviažem), začal by som od primitívneho spôsobu využívania spamfiltra na serveri. Agenti na filtrovanie existovali už dávno pred spamom a tak boli prirodzene prvá možnost, ktorá ľudí podievajúcich sa riešením spamovej otázky obohatila o plody svojej snahy. Neviem ako kedysi za čias billovej puberty, ale dnes sú najrozšírenejší filtrovací agenti procmail a maildrop. V tomto prípade server vezme doručený email predhodí ho filtru a ten je už samoobslužný. Filter zavolá programčok ktorý rozumie spamu a podľa toho s ním naloží. Keď je už požutý tak filter pokračuje akoby sa nechumelilo. Týmto (či už volaním spamfiltra cez procmail/iné alebo cez vlastný skript ktorý porieši aj spamfilter aj procmail/iné) môžeme dať userkom pridanú hodnotu kontroly nad antispamovou politikou. Do svojho houmdajrektorovského súboru na mailfilter si môžu sami dať pravidlá ktoré podľa spamfiltrom prideleného skóre niečo urobia s mailom (okrem natívneho triedenia rôznych zaručene fungujúcich hoaxov atď atď ktoré si niektorí userkovia zbierajú a v dobrej viere nimi zasierajú schránky počestných userkov). Ako hlavnú nevýhodu vidím nemožnosť filtrovať odosielanú poštu. To môže byť problém ak niektorý userko (predpokladáme nie lokálne ale remote využitie) je nezodpovedný a jeho zavírený počítačík sa stane zombíkom nejakej spamerkovej farmy. Ďalšia vec je, že to aspoň na mňa osobne pôsobí neohrabane. Mne bližšou metódou je odhaľovanie spamu ešte počas spracovania mailu serverom. V takom prípade dojde mejloš na server, namiesto do fronty ide do filtra a až potom do fronty. Okrem toho že tým ušetríme pár procesov lebo namiesto procmail+spamfilter spúšťame len spamfilter, môžme spokojne poriešiť aj odchádzajúce mejlíky a tým eliminovať aj vlastných škaredých zlých userkov ktorí majú zavírené strojčeky. Nevýhoda je možno tá, že pokiaľ by som chcel týmto spôsobom využívať viacero navzájom nezlúčiteľných filtrov, tak si musím na to vyrobiť skriptík alebo si niečo nájsť. Ale našťastie dnes takmer všetko spolupracuje (viď spamassassin a jeho moduly). Podobne mu prdneme aj antivírák a sme v ideálnom stave za vodou. Alebo pred vodou a spam je za vodou takže je ďaleko. Alebo opačne. Dobre omáčka je už dosť pomiešaná ale jesť ju budeme až nabudúce (mäsko musíme nechať odstáť v páce). Scenár na spôsob amerického hororu alebo keď z neznámeho dôvodu mailserver spam nefiltruje a sťažovanie sa adminkovi/firme poskytujúcej služby nepomáha prípadne pýtajú niekoľko mešcov dukátov za určite zaručené riešenie ktoré aj tak nakoniec nevyriešia, len zapnú nejaký rbl a zhrabnú si svoju nezaslúženú odmenu. Takým prišiť prsty na rukách o riť. Userko však nie je úplne bezmocný. S mejlom si môže robiť čo chce, veď je jeho a chodí jemu do schránky odkiaľ si ho sťahuje alebo nesťahuje. Preto si userko kľudne nainštaluje spamfilter a používa si ho doma (poväčšinou je to na úkor pohodlia ale oplatí sa keď nie je iná možnosť). Veď si z toho vzali príklad už aj mailoví klienti a snažia sa tiež rozmýšľať o mailoch ako o potenciálnych smetiach. Ako pikošku uvediem keď takáto antispamová ochrana označila kolegovi používajúcemu outlook mail z microsoftu ako spam ]:-) Nevýhody? Z môjho pohľadu vážnejšie nevidím. Možno že hlavný problém je potrebný lepší prehľad v it aby si to userko dokázal urobiť sám (urob si sám v televízii nepomôže a urob si sám z hustler gold už vôbec nie). A otázne je ako pri kolaboratívnych metódach budú antispamové systémy vnímať jeho poväčšine dynamickú ip adresu. Neviem, netestoval som. Túto časť som nazval 1.5 lebo sa mi nehodila k prvému dielu a súčasne nie je dostatočná ani na druhú časť. Najbližšie sa už povenujem praktickým vecičkám.
    • pekne pekne len tak dalej ;] 11.12.2006 | 21:51
      Avatar patie   Návštevník

      pekne pekne len tak dalej ;]

      zivot je tazky - jeden z najtazsich
    • velmi pekny clanok.. o spam 12.12.2006 | 19:12
      jurogls   Návštevník

      velmi pekny clanok.. o spam som sa nikdy nejako nestaral ale aspon som si rozsiril obzor
      -----------------
      "ten kto chce nieco dosiahnut si nepita odpovede ale kde priblizne ich najst"
      homepage

    • me is tim dost 22.12.2006 | 14:27
      damien   Návštevník

      me is tim dost inspiroval...dekuji
      ---------------------------------------
      nadani ucit se je dar;
      schopnost ucit se je dovednost;
      ochota ucit se je volba;

    • Pekne, diky moc 02.01.2007 | 20:49
      nostur   Návštevník

      Pekne, diky moc