articoli

Google: il migliore motore di ricerca!

di Emiliano Cecchi

Perché Google ha rivoluzionato il modo di fare le ricerche su Internet.


Sono finiti i tempi in cui il Webmaster di turno ingannava i motori di ricerca inserendo liste infinite di parole nascoste ripetute, magari nemmeno attinenti al vero contenuto del proprio sito, ma solo per raggiungere maggiori visitatori possibili, a qualsiasi costo. Sono difatti già molti i motori di ricerca che utilizzano sofisticate tecniche anti-spamming, AltaVista in testa a tutti, che penalizzano e, nei casi più estremi, eliminano le pagine ritenute ingannevoli. In questo campo con il termine "spam" sono appunto indicate quelle pagine create, secondo precisi criteri, per ingannare lo spider, e quindi l'utente che dalla ricerca avrebbe come risultato un elenco falsato.
Google è passato oltre queste tecniche, sviluppando una propria tecnologia che gli autori stessi definiscono di prossima generazione.
Vediamo perché e come funziona.

Prima i più importanti
Google ad ogni ricerca effettuata riesce sempre a mostrare i risultati più importanti, oltre che più attinenti alle parole chiave utilizzate dall'utente.
Google restituisce i risultati più importanti poiché risponde alle interrogazioni utilizzando un metodo automatico di classificazione dei siti Web in ordine di importanza basato sulla struttura dei link presenti nella stessa rete Internet. La tecnologia creata da Google prende il nome di "PageRank".

Come funziona il "PageRank"
Google utilizza l'unica vera caratteristica del Web valorizzandola al massimo: i links, ovvero i collegamenti presenti da una pagina all'altra e da un sito all'altro. Google in pratica interpreta un link che collega una determinata pagina ad un'altra come un voto, quindi misura poi l'importanza di una pagina in base ai "voti" che essa riceve. Ma perché questo. In semplici parole, se il mio sito viene "linkato" da un sito classificato come importante a sua volta acquisterà maggiore valore, questo perché si presume, a giusta ragione, che un sito importante non inserisca un link verso un altro sito se anch'esso non è un buon sito. In definitiva, più link il mio sito riceve da siti importanti, più voti acquisisce e più valore ha. Da ciò ne consegue che i risultati di una ricerca classificati come più importanti e di maggior qualità ricevono un PageRank più alto, ossia vengono inseriti nella parte alta dell'elenco dei risultati. In tal modo, PageRank rappresenta l'indicatore generale dell'importanza che Google attribuisce ad una determinata pagina Web indipendentemente dalla specifica interrogazione che genera l'elenco. L'ordine in cui vengono visualizzati i risultati dipende insomma dalle caratteristiche delle pagine stesse, ossia dai dati del Web che Google analizza utilizzando complessi algoritmi che studiano la struttura dei link.
Naturalmente, una pagina "importante" non è di grande interesse per l'utente se non contiene anche il termine da lui ricercato. Per questa ragione Google usa anche sofisticate tecniche di analisi del testo per trovare pagine che siano nello stesso tempo "importanti" e rilevanti dal punto di vista dell'interrogazione. Per analizzare una pagina, ad esempio, Google considera quello che di questa pagina dicono altre pagine contenenti link che rinviano ad essa.

I risultati delle ricerche
Come accennavamo all'inizio di questo articolo, queste nuove tecniche rendono del tutto impossibile l'interferenza dell'uomo sui risultati delle ricerche. Difatti, diversamente da altri motori di ricerca, Google è progettato in modo tale che nessuno possa "comprare" un PageRank più alto o alterare l'elenco dei risultati per motivi di carattere commerciale.

Oltre alla suddetta tecnica di valutazione dell'importanza delle pagine, Google restituisce solamente pagine che contengono tutti i termini di ricerca inseriti dall'utente, o nel testo della pagina o nelle "ancora" che rimandano a quella pagina. Google analizza anche la vicinanza tra questi termini all'interno di una pagina e dà la priorità a determinate pagine sulla base della vicinanza tra i vari termini di ricerca all'interno della stessa. Vengono privilegiate, in altre parole, quelle pagine in cui i termini risultano molto vicini tra loro, in modo da minimizzare il tempo necessario per scartare risultati irrilevanti.

Nel mostrare le descrizioni dei siti risultanti da una ricerca, Google non visualizza sommari predefiniti, testi inseriti dagli stessi autori o ripresi dai Meta Tag di una pagina Web, ma estrapola la porzione di testo contenente i termini di una ricerca (evidenziandoli) direttamente nei risultati della stessa ricerca.
Cercando così di far risparmiare tempo all'utente, evitandogli di caricare pagine che possono poi rivelarsi irrilevanti, magari perché l'autore del sito nell'inserire la descrizione era stato molto generoso nei confronti del proprio lavoro, nel tentativo forse di farlo credere più ricco di contenuti o, inconsciamente, perché si sa: "ogni guaglione è bello a mamma sua".
Il tutto per rendere sempre più facile e meno dispendiosa la ricerca su Internet.

Concludendo: il migliore!
La tecnica di ricerca, interamente ideata e realizzata "in casa", con le caratteristiche innovative appena descritte; l'impossibilità da parte dei webmasters di falzare i risultati delle ricerche; il business che non"pesa" sugli utilizzatori del motore; la straordinaria velocità di esecuzione che salta subito all'occhio anche dell'utente meno esperto; il miliardo di pagine che riesce ad archiviare; la presenza di versioni in più lingue (italiano compreso), sono alcune delle fondamentali caratteristiche che, ad oggi, ci fanno affermare con sicurezza che: Google è il migliore!

Google - http://www.google.com
Slashdot: Intervista al direttore tecnologico di Google Craig Silverstein (3 luglio 2002)

AUTORE DEL TESTO
Emiliano Cecchi

Pubblicato il: 07/11/2001
 
 
 
 
 
FacebookTwitter
DeliciousComunicati-Stampa.net
I nostri RSSLe nostre Newsletters
Articolo
Freeonline.it - La guida italiana alle risorse gratuite di Internet
©Copyright PuntoWeb.Net Sas - Tutti i diritti riservati, escluso dove diversamente indicato
Freeonline® è un marchio registrato dalla PuntoWeb.Net Sas
Freeonline è un prodotto editoriale della
PuntoWeb.Net S.a.s.