AIRweb, Adversarial Information Retrieval Web, rappresenta una serie di workshop internazionali di ricercatori e addetti ai lavori nel settore IR applicato al web, per presentare e discutere sulle novità nel mondo della ricerca e recupero delle informazioni.
Quest'anno, l'AIRweb 2007 sarà parte integrante della 16° conferenza internazionale sul World Wide Web (Internation World Wide Web Conference) e si terrà l'8 maggio a Banff, in Canada.
Il comitato organizzativo vede, tra gli altri, alcuni rappresentanti dei maggiori colossi americani come Carlos Castillo di Yahoo Research e Kumar Chellapilla di Microsoft Live Labs. Durante la conferenza di quest'anno, saranno trattati diversi temi, tra i quali alcuni strettamente legati al mondo SEO e allo spamdexing, lo spam e l'utilizzo di tecniche contrarie alle linea guida dei motori di ricerca con lo scopo di raggiungere posizioni di vantaggio nei risultati delle ricerche e veicolare così alti volumi di traffico.
Vediamo alcuni degli argomenti:
- Link spam: nepotistic linking, link farms, scambi link e link bombing.
Mi soffermo sul "nepotistic linking" solo perchè questo termine mi mancava, ma si sa, ormai va di moda il conio.
Nepotismo è una parola che deriva dalla tendenza, nel passato, di certi papi a favorire i propri familiari con cariche e simili. Penso che comportamenti del genere nel sistema di linking e nella costruzione della link popularity sia facilmente intuibile dai motori di ricerca, soprattutto da Big G: la costruzione di un network ad hoc solo per spingere un sito, o schemi di scambio link reciproci tra amici, in cui A linka B e C e B linka C, possono essere facili da scoprire.
Per esperienza personale posso dire che un network proprietario per spingere un sito deve essere costruito e promosso perfettamente come fosse un "sito" qualsiasi; un network in cui tutti linkano tutti senza altri link outbound e con pochissima link popularity, ad esempio, non solo è riconoscibile ma anche penalizzabile.
- Content spam: keyword stuffing, phrase stitching, e altre tecniche per generare testi sintetici.
- Cloaking: inviare contenuti diversi agli utenti e agli spider dei motori di ricerca
- Comment spam: lo spam di link nei commenti di blog e forum
- Spam oriented Blog, splogs (spam blogs usati solo per promuovere siti affiliati), spings (spam pings o trackbacks spam)
- Click fraud detection: incluso sia l'incorraggiamento ai click per profitti che per consumare fondi di competitor.
- Reverse engineering per studiare gli algoritmi di ranking
- Web content filtering: usato da governi, corporazioni e quant'altro per restingere l'accesso a determinati contenuti
- Advertisement blocking: sviluppo di software per bloccare gli annunci pubblicitari durante la navigazione
- Stealth crawling: operazioni di crawling della rete evitando di essere scoperti
- Malicious tagging: per l'inserimento di keywords o per auto promuoversi in generale.
Tag:
airweb2007 (1)
conferenze (1)
information retrieval (2)
spam (2)


