Spelen in googlebots zandbak met slurpen, Teoma, & msnbot - spinnen display uiteenlopende persoonlijkheden
Er is eindeloos webmaster speculatie en zorgen maken over de zogenaamde 'Google Sandbox "- de indexering tijd vertraging voor nieuwe domeinnamen - gekletst om voor ten minste 45 dagen vanaf de datum van de eerste' ontdekking 'door Googlebot. Deze erkende lijst vertraging werd genoemd de "Google Sandbox effect." Ruminations op de algoritmische onderdelen van deze sandbox tijd vertraging hebben sterk uiteen, omdat de indexering met vertraging werd voor het eerst opgemerkt voorjaar van 2004. Sommigen geloven dat het een kwestie van een enkel element van een goede zoekmachine optimalisatie worden zoals het verbinden van campagnes. Link gebouw is de focus van de meeste discussie, maar anderen hebben zich geconcentreerd op de mogelijkheid van grootte van een nieuwe site koppelen of de interne structuur of gewoon specifieke tijd vertragingen als meest relevante algoritmische elements.Rather dan bijdragen aan deze speculatie en verder modderige de Sandbox, zullen we kijken naar een case-study van een site op een nieuwe domeinnaam, opgericht 11 mei 2005 en de specifieke site structuur, opmerkingen activiteit, externe en interne links. We zullen zien hoe dit speelt in zoekmachine spin-activiteit tegen het indexeren van data op de top vier zoeken engines.Ready? We geven data en crawler actie in de dagelijkse lijsten en te zien hoe dit alles speelt op dit ene nieuwe site loop van de tijd .* 11 mei 2005 Basic tekst op groot terrein gepost op nieuw gekochte domeinnaam en gaan leven dag einde. Zoek vriendelijke structuur geïmplementeerd met tekst koppelen optimaal ontdekking van alle inhoud mogelijk door robots. Welkom bijgewerkt met 10 nieuwe tekst inhoudspagina's dagelijks toegevoegd. Ingediend site op Google's "Add URL" indiening pagina .* 12 tot 14 mei - Geen bezoeken van Slurp, MSNbot, Teoma of Google. (Slurp is spin Yahoo en Teoma is van Ask Jeeves) Geplaatst link op WebSite101 nieuwe domein op Publish101.com * 15 mei - Googlebot arriveert en gretig kruipt 245 pagina's op nieuw domein na op zoek naar, maar niet het vinden van het robots.txt-bestand. Oooops! Gotta toevoegen dat robots.txt-bestand! * Mei 16 - Googlebot rendement voor 5 meer pagina's en stopt. Slurp slokt gretig 1480 pagina's en 1892 slecht links! Die slechte banden werden veroorzaakt door onze e-mail maskeren bedoeld om buiten te houden slecht bots. Hoe ironisch slurp houdt deze .* mei 17 - Slurp 1409 vindt meer maskeren links & slechts 209 nieuwe content pagina's. MSNbot bezoeken voor de eerste keer en vraagt om robots.txt 75 keer tijdens de dag, maar laat wanneer hij vaststelt dat bestand ontbreekt! Ten slotte krijgen rond om voeg robots.txt door dag end & stoppen slurp kruipen e-mail maskeren MSNbot links en laat weten dat het veilig is om binnen te komen! * 23 mei - Teoma spin verschijnt voor het eerst en kruipt 93 pagina's. Site krijgt sloeg door BecomeBot, een spin die een pagina hits iedere 5 tot 7 seconden en stammen onze middelen met 2409 snelvuur aanvragen voor pagina's. Toegevoegd BecomeBot robots.txt uitsluiting lijst te houden 'em out .* 24 mei - MSNbot gestopt is weergegeven voor een week sinds het vinden van het robots.txt-bestand ontbreekt. Slurp is showing up om de paar uur kijken naar robots.txt en weer vertrekken zonder iets kruipen nu dat het is uitgesloten van de e-mail maskeren links. BecomeBot lijkt te zijn ter ere van het robots.txt-uitsluiting, maar vraagt om dat bestand 109 keer gedurende de dag. Teoma doorzoekt 139 meer pagina's .* 25 mei - We realiseren ons dat we nodig hebben om opnieuw server resources en database-ontwerp en toewijzen Dit vereist veranderingen in URL's, wat betekent dat alle eerder doorzochte pagina's zijn nu slecht links! Uitvoeren van subdomeinen en zich afvragen wat nu? Slurp verschijnt en vindt duizenden nieuwe e-mail maskeren banden als de robots.txt is niet verhuisd naar nieuwe directory structuren. Spinnen zijn om fouten op nieuwe pagina's bezoeken. Scampering voor het blussen van branden na ingrijpende wijzigingen naar site, missen we deze voor een week. Spider actie is vlekkerige voor 10 dagen totdat we vaststellen robots.txt * 4 juni - Teoma rendementen en doorzoekt 590 pagina's! Geen anderen .* 5 juni - Teoma rendementen en kruipt 1902 pagina's! Geen anderen .* 6 juni - Teoma rendementen en doorzoekt 290 pagina's. Geen anderen .* 7 juni - Teoma rendement en doorzoekt 471 pagina's. Geen anderen .* 8-14 juni Odd spin gedrag, te kijken naar robots.txt alleen .* 15 juni - Slurp krijgt dorst, slokken 1396 pagina's! Geen anderen .* 16 juni - Slurp nog steeds dorst, slokken 1379 pagina's! Nee others.So we een pauze nemen hier op de 5 weken punt en kennis te nemen van de zeer verschillende gedrag van de top crawlers. Googlebot bezoekt eens en kijkt naar een groot aantal pagina's, maar niet terug voor meer dan een maand. Slurp vondsten slechte banden en lijkt verslaafd aan hen als het goed stopt pagina's doorzoeken totdat het wordt verteld te ontslaan de slechte drank, er, dat is links, door ervoor te slurpen robots.txt klap aan zijn zintuigen. MSNbot bezoeken op zoek naar dat robots.txt en zal niet alle pagina's doorzoeken totdat verteld wat NIET te doen door het robots.txt-bestand. Teoma kruipt net als een gek, neemt pauzes, dan komt terug voor more.This gedrag kan imiteren de verschillende persoonlijkheden van de software-ingenieurs die ontworpen zijn. Teoma is vasthoudend en hard werken. MSNBot timide en behoeften instructie en enkele geruststelling is het juiste doen, pakt pagina's langzaam en zorgvuldig. Slurp heeft verslavende persoonlijkheid en onregelmatigheden vertoont op een willekeurig schema. Googlebot neemt een goede lange kijken en bladeren. Wie weet of het terug zal zijn en when.Now laten we eens kijken naar het indexeren door elke motor. Met ingang van dit schrijven op 7 juli, elke motor toont ook verschillende indexeren gedrag als goed. Google toont geen geïndexeerde pagina's doorzocht hoewel het 250 pagina's bijna twee maanden geleden. Yahoo heeft drie pagina's geindexeerd in een duidelijke veroudering routine die geen lijst een van de bijna 8.000 pagina's heeft doorzocht tot op heden (alle niet hierboven gespecificeerde.) MSN heeft 187 geïndexeerde pagina's, terwijl kruipende minder pagina's dan een van de anderen. Ask Jeeves heeft doorzocht meer pagina's tot op heden dan een zoekmachine, is nog niet geïndexeerd page.Each een van de motoren zal laten zien van het aantal geïndexeerde pagina's als u de query exploitant gebruik "site: publish101.com" zonder de aanhalingstekens. MSN 187 pagina's, Vraag het aan niemand, heeft Yahoo 3 pagina's, Google none.The dagelijkse activiteit die niet zijn opgenomen in de drie weken sinds 16 juni hierboven niet dramatisch gevarieerd, met Teoma kruipen een beetje meer dan andere motoren, Slurp schokkerig omhoog en MSN langzaam naar beneden en het verzamelen van 30 tot 50 pagina's per dag. Google is absent.Linking campagne is minimaal met berichten ter discussie staat, een paar artikelen en enkele blog activiteit. Terugkijkend op dit moment is het duidelijk dat een notering vertraging eigenlijk is heel verstandig van het standpunt van de zoekmachines. Onze site herstructurering en bobbled robots.txt uitvoering lijkt te abrupt zijn vastgelopen crawlen, maar de indexering gedrag van elke motor geeft duidelijk verschillend beleid door elk van de grote player.The sandbox is blijkbaar niet alleen Google's speeltuin, maar het is zeker vervelend na bijna twee maanden. Ik denk dat ik zou willen verlaten voor thuis, hebben sommige lunch en een dutje te now.Back klasse voordat we vertrekken voor de dag kiddies. Wat hebben we geleerd vandaag? Kijk vroeg crawler activiteit en zeker te voeren robots.txt vroeg en passen vaak voor slechte bots. Oh ja, en de zandbak behoort tot alle zoeken engines.Mike Banken Valentijn is een zoekmachine optimalisatie specialist die opereert http://WebSite101.com en verslagen van de case study kroniek verder
Artikel Bron: Messaggiamo.Com
Related:
» Credit Secrets Bible
» Cash Making Power Sites
» Home Cash Course
» Automated Cash Formula
Webmaster krijgen html code
Voeg dit artikel aan uw website!
Webmaster verzenden van artikelen
Geen registratie vereist! Vul het formulier in en uw artikel is in de Messaggiamo.Com Directory!