Il Web italiano
48 milioni di pagine nel Web italiano
ed 1 milione e mezzo di ‘File Not Found’
Ad un anno di distanza dalla precedente rilevazione, Il Trovatore (http://www.iltrovatore.it), storico motore di ricerca italiano, annuncia i dati 2002 sulle dimensioni del Web italiano. Dalla ricerca 2002 emerge una lieve contrazione nella crescita di pagine Web per quanto riguarda i domini.it (Italia), .sm (Repubblica di San Marino) e .va (Stato Vaticano).
Un dato rispecchia il delicato momento attraversato dal Web a cavallo della fine 2001 e inizio 2002, caratterizzato dalla scomparsa dalla Rete di alcuni siti, il fallimento di progetti online ed il ridimensionamento di altri. In particolar modo, la riduzione di servizi free, quali e-mail, oroscopi, news, forum, chat all’interno di alcuni siti.
Un dato che, per certi versi, trova conferma anche nel rallentamento nel 2002, rispetto al 2001, dell’attività di registrazione di nuovi domini .it presso la Registration Authority Italiana.
Nel dettaglio IlTrovatore ha preso in esame circa 260 mila siti Web attivi, ovvero tutti quelli pubblicamente accessibili nei domini .it, .sm, .va.
Dall’analisi è emerso che il Web Italiano (it, sm, va) è attualmente costituito da circa 48 milioni di pagine, dato in linea a quello rilevato dagli spider de IlTrovatore nel 2001.
La novità, rispetto alla precedente analisi, è il considerevole aumento delle Url che portano a pagine non più esistenti. Rispetto al 2001, infatti, si è registrato un incremento del 110%: dai 700.000 “File not Found” del 2001, a 1.472.000.
Dalla fotografia scattata da IlTrovatore sul Web Italiano è inoltre emerso che:
sono circa 45,7 milioni le pagine Web raggiungibili nella Rete italiana;
146.000 le pagine Web che hanno cambiato locazione in maniera permanente; l’incremento rispetto al 2001, in cui si registravano 84.000 pagine, è del 73% circa.
553.000 pagine presentano un redirect verso un altro sito contro le 500.000 del 2001, con un aumento del 10,6%. Il dato indica quindi come sia in crescita la tendenza al cambio di url dovuto ad acquisto di domini o cambi di provider;
52.000 pagine Web richiedono la password per l’accesso con un incremento del 73% circa rispetto al 2001, quando le pagine erano 30.000. Dato estremamente interessante poiché dimostra l’aumento di siti con accesso ristretto agli utenti tramite password, procedura generalmente prevista per i servizi a pagamento;
ben 1.472.000 i “File not Found”, cifra addirittura raddoppiata (+110%) rispetto ai 700.000 della misurazione effettuata nel 2001.
Un dato interessante se letto alla luce dell’alta mortalità delle aziende sul Web registrata nella prima metà del 2002. Si possono aggiungere anche altre cause quali la contrazione di siti e portali che offrono meno servizi e meno contenuti rispetto al passato e le scelte di molte aziende che hanno concentrato l’attenzione su servizi economicamente proficui;
111.000 pagine Web danno origine all’”Internal Server Error” con un aumento del 122% rispetto al 2001; dato che evidenzia il progressivo aumento di pagine che non vengono più aggiornate.
circa 53.000 sono le pagine alle quali è vietato l’accesso (Forbidden status 403) ma comunque raggiungibili dagli spider, in diminuzione del 12% rispetto alle 60.00 pagine del 2001. Anche questo è un dato da non trascurare poiché indica la maggiore padronanza delle tecniche di gestione dei siti web da parte dei webmaster. L’accresciuta abilità di chi gestisce siti web permette di non ostacolare l’indicizzazione di un sito pur evitando l’accesso dello spider alle zone riservate.
Attualmente Il Trovatore, con oltre 40 milioni di pagine indicizzate, costituisce l’archivio di ricerca più ampio per quanto riguarda le pagine Web con dominio italiano (.it), di San Marino (.sm) e del Vaticano (.va).
Milano 22 novembre 2002
<<< Altri articoli di: Miniguide
Pubblicato il: 22/11/2002
AUTORE TESTO
IlTrovatore
|