Lo spam è sempre stato uno dei più grandi
problemi che i motori di ricerca devono affrontare. Quando i motori
di ricerca identificano uno spam, la procedura usuale è quella
di bandire dall'indice le relative pagine, siti, domini e anche indirizzi
IP. La rimozione manuale dall'indice però comporterebbe l'impiego
di un numero di persone elevato e avrebbe di conseguenza costi elevati,
andando contro gli obiettivi di Google; risulta pertanto necessario
filtrare lo spam in modo automatico.
Il filtraggio automatico dello spam comporta il rischio di poter penalizzare
webmaster "innocenti"; i filtri devono quindi reagire al potenziale
spam in modo molto sensibile. Con filtri molto sensibili però
il rischio è che lo spam riesca a superare i filtri. Occorre
allora adottare misure ulteriori. Per filtrare lo spam in modo efficace,
potrebbe risultare utile dare un'occhiata ai link.
Nel Forum Notizie di Google "WebmasterWorld", un impiegato
di Google che si firma "GoogleGuy" ha confermato in modo più
o meno chiaro che per l'identificazione dello spam, Google ricorre all'analisi
dei link. GoogleGuy consiglia in continuazione agli webmaster di non
creare link da e verso "pagine non buone". Nella sezione seguente
si discute come si possono identificare gli spam tramite l'analisi della
struttura dei link e in modo particolare come identificare intere reti
di pagine spam, anche se situate in domini diversi.
|