Jan Brašna | HereBeDragons™

Spamboti jsou nějací vychc…chytralejší

Není to tak dávno, co k jakés takés ochraně e-mailových adres na webových stránkách stačilo lehké „zaponožkování“ (== obfuskace), tj. prohnání znaků na entity a escape zápis, převážně klíčových prvků jako sekce mailto:, zavináče a podobně. Výstupem pak může být např. takto Sexy!™ výstup, jako provádí nad e-maily automagicky Texy!™:

<a href="mai&#108;&#116;&#111;&#58;&#102;&#111;&#111;&#64;&#101;&#120;&#97;&#109;&#112;&#108;&#101;&#46;&#99;&#111;&#109;">foo&#160;(at)&#160;exam&#173;ple.com</a>

který pak vypadá následovně: foo (at) exam­ple.com

Realita dneška je ale taková, že současní spamboti s tímto zápisem nemají ani nejmenší problém, naopak jsou hyperaktivní a snaží se heuristicky rozpoznat libovolný text, který vyhovuje formátu e-mailové adresy, ačkoliv ani není odkazem.

Musím říct, že nabídku rhybářů, směřovanou na e-mailovou adresu, která slouží jen jako generický příklad či vzor pojmenovávání schránek, jsem vážně nečekal :)

A co si budeme nalhávat, stačí být v něčím adresáři s děravým systémem, a adresa se díky virům/trojanům/mal­ware vesele šíří dál…

Středa, 25. 1. 2006 9.54 | Trvalý odkaz | Trackback

14 komentářů

  1. [1] Vesta

    Vzhledem k tomu, že Texy je hodně používaný SW pro blogování, tak se možná vyplatí napsat robota specielně pro Texy…

    25. 1. 2006 11.03

  2. [2] sloper

    Ako ďalšia prekážka môže slúžiť obalenie adresy javascriptom. Viď. http://www.slo­sar.sk/…at-skry.html

    25. 1. 2006 12.41

  3. [3] rADo

    Nejlepší řešení je antispam na serveru, a mazání spamů.. Od té doby co to dělám mi přijde jen jeden až dva kousky denně, předtím desítky :-)

    25. 1. 2006 13.01

  4. [4] Aleš Janda

    Mně přichází spamy i na adresu, kterou mám uvedenou pouze(!) ve svém programu.

    Předpokládám tedy, že spammer stáhnul ZIP, rozbalil, našel html dokument, podíval se do něj a našel adresu.

    No comment :-(

    25. 1. 2006 13.14

  5. [5] llook

    Pokud by všichni používali Texy, tak by boti ani moc vychcatralí být nemuseli. Pro získání adres by jim stačil následující kód:

    <?php
    $dom = DOMDocument::loadHtml($source);
    foreach ($dom->getElementsByTagName('a') as $a) {
            $href = $a->getAttribute('href');
            if (substr($href, 0, 7) === 'mailto:') {
                    echo $href . '<br />';
            }
    }
    t.

    25. 1. 2006 13.41

  6. [6] dgx

    document.write bohužel není postup podporovaný XHTML, tedy jej nelze obecně (např. v Texy) použít.

    Na skrývání svého vlastního emailu jsem rezignoval dávno, je to boj s větrnými mlýny, který padá při jediné chybičce, jednom profláknutí emailu. Bayesovské filtry fungují docela spolehlivě. I když objevuje se čím dál tím více emailů, se kterými si neporadí, ale jsou to stále řádově procenta či promile.

    Snažím se tedy alespoň chránit emaily čtenářů blogu (viz zdroják La Trine), ale stejně to bude fungovat jen do té doby, než někdo napíše speciálně cíleného robota.

    25. 1. 2006 14.49

  7. [7] Václav Mach

    Mám pocit že mi nějaký spambot přelouskal email který vystavuji na webu ve tvaru
    info – nakreslený zavináč -doména

    Druhá možnost je, že testují názvy domén z WHOIS v kombinaci s pravděpodobnými prefixy, jako je info.

    25. 1. 2006 16.15

  8. [8] rony

    podla mojich skusenosti bohate staci, ze je vasa adresa v schranke nejakeho blba, ktory ma v pocitaci vhodny virus.

    doslova mam pocit, ze s takymi mejlovat znamena nieco ako podavanie stravy na virologickom oddeleni.

    25. 1. 2006 18.47

  9. [9] Karaya1

    [7] něco podobného také využívám, ovšem spam na vystavenou adresu nechodí. Nevím, zda je to způsobeno možná až příliš složitým tagem IMG nebo „nepravděpodobnými“ prefixy, ale funguje to.

    25. 1. 2006 19.10

  10. [10] Pachollini

    No, anebo nějakej chytrák pošle hoax všem lidem, co je má ve schránce na CC a jeden z příjemců má nějakýho trojana, keterej to předá dál. Alespoň si to tak nějak představuju.

    26. 1. 2006 0.50

  11. [11] Hanz

    Pokuď vím, tak jediná do dnešní doby neprolomená ochrana je pomocí Flashe (i když není moc oblíbený, tak na toto se hodí). Stačí vytvořit si malý flash (třeba 160×16px) a vložit ho do zbývajícího textu stránky (v tom flashi bude odkaz na ten email). Jelikož na to jak tahat obsah z flashe nepřišly ani vyhledávače jako je třeba Google, tak by to jít nemělo.

    3. 2. 2006 18.09

  12. [12] 2pu

    Zajimave reseni: http://www.2pu­.net/

    22. 2. 2006 17.59

  13. [13] Anonymous

    No myslím, že pomocí obrázku to nebude zas tak moc žhavý – http://www.my­fonts.com/What­TheFont/ – když se dá poznat font, určitě by se dal rozkódovat i email. A pomocí flashe – to mě nenapadlo, ale co když někdo nemá nainstalovanou podporu flashe v prohlížeči?

    26. 2. 2006 12.28

  14. [14] Hanz

    No ten, kdo Flash player nemá má smůlu. Co se dá dělat, ale pokuď se to udělá pro Flash player například 5, tak je v součastnosti cca 98% všech prohlížečů.

    26. 2. 2006 15.16

RSS komentářů

Vaše postřehy

FinePrint™: Pokud máš chuť plkat mimo téma spotu nebo se tady navážet do ostatních, máš šanci, že komentář půjde do křemíkového pekla. Účelové nebo anonymní příspěvky budu dle rozmaru a bez vysvětlování likvidovat. Podepiš se; pokud se k napsanému nehlásíš, ani to neodesílej. Diskusi mám rád, ne už tak flame a blbce. Mysli na to při psaní.