60 dnů pískoviště pro google & askjeeves; indexy nejrychlejší msn, yahoo další
Vyhledávací engine zpoždění výpis přišli být nazýván Google Sandbox efekt je skutečně pravda, v praxi na každém ze čtyř nejvyšší třídě vyhledávače v té či oné podobě. MSN, zdá se, má nejkratší indexování zpoždění na 30 dní. Tento článek je druhý v řadě po pavouky prostřednictvím zbrusu nové webové stránky začíná 11. května 2005, kdy byla první místo se žije v tento den v rámci nově zakoupené doméně name.First Případová studie ArticlePreviously jsme se na prvních 35 dnů a podrobné procházení chování Googlebot, Teoma, Explorer a Slurp jak se pohybuje na stránkách tohoto nového webu. Zjistili jsme, každý robot spider zobrazí zřetelně odlišné chování v plazí frekvencí a podobně odlišné indexování patterns.For odkaz, tam je asi 15 až 20 nových stránek přidáno na web denně, z nichž každá je spojena z domovské stránky na jeden den. Struktury webu je non-tradiční, bez kategorií a propojení struktury vázané na stránky autora seznam jejich výrobků, stejně jako "související články" index různých odkazů na příslušné stránky, které obsahují podobné content.So Podívejme se tam, kde jsme se každý pavouk procházení a podívat se na stránky procházet a porovnávat stránky indexovány engine.The pavouk AskJeeves, Teoma se plazil většina stránek na webu, ale ne indexy stránky 60 dnů později v tomto zápisu. To je jasně stránky stárnoucí zpoždění, které je po vzoru Sandbox chování společnosti Google. Ačkoli pavoučí Teoma od Ask.com má procházet více stránek na tomto místě, než jakýkoli jiný motor než 60 dnů a zdá se být unavený plazení, jelikož jsem se nevrátil, protože 13. července - první zlom v 60 days.In první dva dny, Googlebot zhltnul až 250 stran, a nevrátil se do 60 dnů později, ale nebyla indexována ani jednu stránku za 60 dní, co udělali, že počáteční prohledávání. Googlebot, ale ukazuje obnovený zájem v procházení webu, protože tento článek procházení případové studie byla zveřejněna na několika vysokých provoz stránek. Googlebot je nyní podíváme na několik stránek, každý den. Zatím ne více než cca 20 stran za nevýrazného rozhodně tempo, pravda, "Crawl", který bude udržovat obsadil po celá léta, že v případě pokračování slowly.MSNbot nesměle plazil po dobu prvních 45 dnů, hledá po dobu 30 až 50 stran denně, ale až našli souboru robots.txt, který bychom zanedbali poštou na místě po dobu jednoho týdne a pak bobbled míč, jak jsme změnili místo strukturu, pak se nepodařilo realizovat robots.txt v nových subdomén až do 25. dne - a pak Explorer nevrátil do 30 dnů. Pokud se nic jiného byly objeveny o počáteční prochází a indexování, jsme viděli, že Explorer do značné míry spoléhá na tomto souboru robots.txt a řádné provádění tohoto souboru bude rychlost crawling.MSNbot je nyní hemží nadšení u kdekoli mezi 200 do 800 stránek denně. Jako ve skutečnosti jsme museli použít "Crawl-delay" příkaz v souboru robots.txt po nárazu začal Explorer 6 stran za sekundu minulý týden. Index MSN nyní ukazuje 4905 stránek 60 dnů na tento experiment. Stránky z cache Týdenní výměna. Explorer má zřejmě zjistil, že se jí to líbí, jak jsme změnili strukturu stránky o novou funkci, která na několik dalších otázek z článku pages.Slurp dostane zvláštně neaktivní pak střídavě hyperaktivní pro časová období. Pásové Yahoo bude vypadat na 40 stránkách jeden den a pak další 4000, pak se prostě podívejte na domovské stránky na několik dní a potom skočit zpět na 3000 stran další den a zpět pouze přezkoumat robots.txt pro dva dnů. Konzistence není prokletí utrpělo Slurp. Yahoo nyní ukazuje 6 stránek v indexu, jedné chyby stránku a další je "index / o" stránky, jak jsme se nejedná o vyslaného domovskou stránku několik subdomén. Ale má Slurp lezli snadno 15.000 stránek date.Lessons naučili v prvních 60 dní na nové stránky jsou následující: 1) Google prochází 250 stran o první objev odkazy na stránky. Pak se nevrací, dokud nenajdou další odkazy a procházení pomalu. Google se nepodařilo index nové domény za 60 days.2) Yahoo hledá chyby stránek a jednou najdou špatné odkazy budou procházet neustále, dokud se jim to zastavit. Pak nebude plazit vůbec týdny, dokud plazení těžce jeden den a lehce další náhodně fashion.3) Explorer vyžaduje soubory robots.txt, a jakmile se rozhodnou se jim líbí vaše stránky, mohou procházet příliš rychle, vyžadující "Crawl-delay" instrukcí v tomto souboru robots.txt soubor. Provádět immediately.4) Bad roboty mohou přetěžovat zdroje a zasáhla příliš mnoho stránek příliš rychle, dokud jim řeknete, aby se vyhýbali. Máme zakázány 3 roboty přímo po narazila naše servery za den nebo dva. Uvedl: "aipbot" lezli první pak "BecomeBot" přišel, a pak "Pbot" z Picsearch.com lezli těžce hledá obrazové soubory nemáme. Bad roboty, nepleť. Nejlépe realizovat robots.txt výjimky pro všechny, ale nejlepší motorů, pokud jejich prohledávače kmen serveru zdroje. Zvažovali jsme kromě čínských vyhledávač pojmenován Baidu.com když začali plazit hodně brzy. Neočekáváme, že velká část provozu z Číny, ale proč se vyloučit jedna miliardy lidí? Zejména proto, že Google se říká třeba zvážit případné koupě Baidu.com jako vstup do čínské Přípravou Pointa je, že jsme objevili všechny motory Zdá se, že zpoždění indexování nových domén jména pro nejméně třicet dnů. Google zatím nemá zpoždění indexování TOTO nové domény po dobu 60 dní od první plazení se. AskJeeves lezli má tisíce stran, přičemž žádný z nich indexování. MSN indexuje rychleji než všechny motorů, ale vyžaduje, aby soubor robots.txt. Yahoo Slurp prochází znovu vypnout opět po dobu 60 dnů, ale indexy pouze šest z celkových 15.000 nebo více stran, aby vylezl date.We Zdá se usadili, že existuje jasný indexování zpoždění, ale to, zda tyto stránky je specificky "Sandboxed", a zda zpoždění platí univerzálně, je méně jasná. Mnoho webmasterů tvrdí, že byly indexovány v plném rozsahu do 30 dnů ode dne prvního vysílání novou doménu. Rádi bychom rád vidím jiné pavouky sledovat prostřednictvím nových míst na startu k dokumentu jejich výsledky veřejně tak, aby indexování a prohledávání chování jsou proven.ÃƒÆ 'à ¢ â, ¬ Å ¡ÃƒÂ € SA, © Copyright 18. července 2005 Mike Banks ValentineMike bank Valentine je optimalizace pro vyhledávače odborníka, který provozuje WebSite101 eCommerce výuka a bude pokračovat ve zprávách případové studie kroniku vyhledávání indexování Publish101
Článek Zdroj: Messaggiamo.Com
Related:
» Credit Secrets Bible
» Cash Making Power Sites
» Home Cash Course
» Automated Cash Formula
Webmaster si html kód
Přidejte tento článek do svých webových stránek se!
Webmaster Zašlete svůj článek
Ne nutná registrace! Vyplňte formulář a váš článek je v Messaggiamo.Com Adresář!