60 sandbox giorno per Google & askjeeves; indici più veloce msn, yahoo prossimo
Motore di ricerca annunci ritardi sono venuto per essere chiamato l'effetto Google Sandbox sono in realtà vere, in pratica, in ciascuno dei primi quattro motori di ricerca di primo livello in una forma o nell'altra. MSN, a quanto pare è il più breve tempo indicizzazione a 30 giorni. Questo articolo è il secondo di una serie dopo l'ragni attraverso un nuovo sito web brand a partire dal 11 maggio 2005 quando il sito ha avuto inizio solo dal vivo in quel giorno sotto un name.First appena acquistato dominio Case Study ArticlePreviously abbiamo guardato i primi 35 giorni e dettagliato il comportamento di scansione di Googlebot, Teoma, MSNbot e Slurp in quanto attraversato le pagine di questo nuovo sito. Abbiamo scoperto il ragno ogni robot mostra un comportamento decisamente diverso scansione delle frequenze e, analogamente, diverse riferimento patterns.For indicizzazione, ci sono da 15 a 20 nuove pagine aggiunte al sito ogni giorno, che sono legati dalla home page per un giorno. Struttura del sito non è tradizionale, senza categorie e una struttura di collegamento a pagine legate all'autore lista i loro articoli, nonché un articolo di "connessi" indice varia da link a pagine contenenti rilevanti content.So simili let's review dove siamo con ogni ragno di scansione e guardare le pagine scansionate e confrontare le pagine indicizzate da ragno AskJeeves engine.The, Teoma ha strisciato la maggior parte delle pagine del sito, ma non gli indici pagine 60 giorni più tardi in questa scrittura. Questo è chiaramente un sito ritardo di maturazione che è modellato sul comportamento Sandbox di Google. Anche se il ragno Teoma da Ask.com ha eseguito la scansione di più pagine di questo sito rispetto a qualsiasi altro motore di oltre un periodo di 60 giorni e sembra essere stanco di scansione in quanto non sono ritornato dal 13 luglio - la loro prima pausa in 60 days.In i primi due giorni, Googlebot inghiottito 250 pagine e non fece ritorno fino a 60 giorni più tardi, ma non ha indicizzato anche in una singola pagina in 60 giorni dal momento che hanno fatto la scansione iniziale. Ma Googlebot sta mostrando un rinnovato interesse per la scansione del sito in quanto questo articolo scansione caso di studio è stato pubblicato il più alto il traffico dei siti. Ora Googlebot sta cercando in qualche pagina ogni giorno. Finora non più di circa 20 pagine a un ritmo decisamente scialbo, un vero e proprio "Crawl", che lo terrà occupato per anni, se continua che slowly.MSNbot strisciato timidamente per i primi 45 giorni, guardando con più di 30 a 50 pagine al giorno, ma non fino a quando non trova un file robots.txt, che avevamo trascurato di postare sul sito per una settimana e poi bobbled la palla come abbiamo cambiato il sito struttura, quindi non per attuare robots.txt in nuovi sottodomini fino al giorno 25 - e poi MSNbot non fece ritorno fino al giorno 30. Se poco altro sono stati scoperti circa iniziale esegue la scansione e indicizzazione, abbiamo visto che MSNbot fa molto affidamento su tale file robots.txt e la corretta attuazione di tale file la velocità crawling.MSNbot è ora la scansione con entusiasmo a qualsiasi tra 200 e 800 pagine al giorno. È un dato di fatto, abbiamo dovuto utilizzare un "-crawl ritardo comando" nel file robots.txt, dopo MSNbot colpiva 6 pagine al secondo la scorsa settimana. L'indice MSN ora mostra 4.905 pagine 60 giorni in questo esperimento. Pagine cache cambio settimanale. MSNbot ha apparentemente constatato che gli piace il modo che abbiamo cambiato la struttura della pagina per includere una nuova funzionalità che collega alle domande poste dai diversi pages.Slurp altro articolo viene stranamente inattiva poi alternativamente iperattivi per periodi di tempo. Il crawler Yahoo esaminerà le 40 pagine di un giorno e poi 4000 la prossima, poi semplicemente guardare la home page per qualche giorno e poi tornare in 3000 pagine per il giorno dopo e di nuovo al solo esame robots.txt per due giorni. La coerenza non è una maledizione subito Slurp. Yahoo ora mostra 6 pagine nel loro indice, uno a una pagina di errori e un altro è un "indice / di" pagina in quanto non abbiamo inviato una home page di sottodomini diversi. Slurp, ma ha scansione facilmente 15.000 pagine al date.Lessons quanto appreso nei primi 60 giorni in un nuovo sito seguente: 1) Google esegue la scansione di 250 pagine sulla prima scoperta di collegamenti al sito. Poi non tornare finché non trovare altri collegamenti e la scansione lentamente. Google non è riuscito a indice nuovo dominio per 60 days.2) Yahoo cerca le pagine di errori e una volta che trovare i link cattiva volontà scansione senza sosta, fino dite loro di fermarlo. Quindi non esegue la scansione a tutti per settimane fino a quando crawling pesantemente un giorno e leggermente la successiva in fashion.3 casuale) MSNbot richiede file robots.txt e una volta che decidono a loro piace il vostro sito, possono eseguire la scansione troppo veloce, che richiede "Crawl-delay" istruzioni che robots.txt file. Attuare immediately.4) bots Bad può ceppo risorse e colpito troppe pagine troppo velocemente fino a quando dico loro di stare fuori. Abbiamo vietato 3 bots definitive dopo aver sbattuto i nostri server per un giorno o due. Osservato "aipbot" scansione prima quindi "BecomeBot" è arrivato e quindi "Pbot" da Picsearch.com pesantemente scansione alla ricerca di file di immagine non abbiamo. Bots Bad, stare fuori. Migliore per attuare le esclusioni robots.txt per tutti, ma all'inizio, se i motori loro crawler ceppo le risorse del server. Abbiamo ritenuto, esclusi i motori di ricerca cinese Baidu.com chiamato quando hanno iniziato la scansione molto presto. Non ci aspettiamo molto traffico proveniente dalla Cina, ma perché escludere una miliardi di persone? Soprattutto perché Google si dice per essere considerato un possibile acquisto di Baidu.com l'ammissione ai cinesi market.The linea di fondo è che abbiamo scoperto tutti i motori sembra ritardare l'indicizzazione del nuovo dominio nomi per almeno trenta giorni. Google finora ha ritardato l'indicizzazione questo nuovo dominio per 60 giorni dal primo scansione. AskJeeves ha eseguito la scansione di migliaia di pagine, mentre nessuno di loro indicizzazione. Indici di MSN più veloce di tutti motori, ma richiede il file robots.txt. Slurp Yahoo striscia di nuovo al largo ancora una volta per 60 giorni, ma solo gli indici sei del totale 15.000 o più pagine scansionate al date.We sembrano aver stabilito che vi è una chiara indicizzazione ritardo, ma se questo sito è specificamente "Sandboxed" e se i ritardi applicare universalmente è meno chiaro. Molti webmaster sostengono che sono stati indicizzati completamente entro 30 giorni dal primo intervento di un nuovo dominio. Avevamo amore a vedere gli altri brano ragni attraverso nuovi siti dopo il lancio per documentare i loro risultati al pubblico in modo che l'indicizzazione e il comportamento di scansione sono proven.ÃƒÆ 'à ¢ â, ¬ Å ¡Ãƒâ € šÃ,  © Copyright 18 luglio 2005 Mike Banks ValentineMike Banche San Valentino è uno specialista di ottimizzazione dei motori di ricerca che opera WebSite101 eCommerce Tutorial e continuerà le relazioni del caso di studio cronaca di indicizzazione di ricerca di Publish101
Fonte dell'articolo: Messaggiamo.Com
Related:
» Credit Secrets Bible
» Cash Making Power Sites
» Home Cash Course
» Automated Cash Formula
Webmaster prendi il Codice Html
Aggiungi questo articolo al tuo sito ora!
Webmaster invia i tuoi Articoli
Nessuna registrazione richiesta. Compila il form e i tuoi articoli sono nella Directory di Messaggiamo.Com