Robots des moteurs de recherche - comment ils fonctionnent, ce qu'ils font (part i)
Robots des moteurs de recherche automatisés, parfois appelés "araignées" ou "crawlers", sont les demandeurs de pages Web. Comment fonctionnent-ils? Qu'est-ce que c'est il vraiment faire? Pourquoi sont-elles importantes? On pourrait croire avec toutes ces histoires d'indexation les pages Web pour l'ajouter aux bases de données du moteur de recherche, que les robots seront grands et puissants êtres. Faux. Robots des moteurs de recherche ont seulement les fonctionnalités de base comme celui du début des navigateurs en termes de ce qu'ils peuvent comprendre une page Web. Comme au début des navigateurs, les robots ne peuvent pas faire certaines choses. Les robots ne comprennent pas les cadres, animations Flash, des images ou JavaScript. Ils ne peuvent pas entrer dans les zones protégées par mot de passe et on ne peut pas cliquer sur tous les boutons vous avez sur votre site Web. Ils peuvent être arrêtés froid, tandis que d'indexer une URL générées dynamiquement et a ralenti à un arrêt de navigation JavaScript. Comment est-ce que le travail des robots des moteurs de recherche? Pensez-robots des moteurs de recherche automatisé récupération des données des programmes, parcourir le Web pour trouver de l'information et links.When vous présenter une page Web à un moteur de recherche à la «Soumettre une URL" page, la nouvelle adresse URL est ajoutée à la file d'attente du robot de sites à visiter sur son à la prochaine incursion sur le web. Même si vous n'avez pas soumettre directement une page, de nombreux robots vont trouver votre site en raison des liens d'autres sites que le point de retour à la vôtre. C'est une des raisons pour lesquelles il est important de construire votre popularité de lien et d'obtenir des liens issus d'autres sites d'actualité à yours.When arrivant à votre site Web, les robots automatisés d'abord vérifier pour voir si vous avez un fichier robots.txt. Ce fichier est utilisé pour dire que les robots les zones de votre site est hors-limites à leur égard. Généralement, ces mai être que les répertoires contenant les fichiers binaires ou autres le robot n'a pas besoin de se préoccuper with.Robots percevoir les liens à partir de chaque page qu'ils visitent, et plus tard, de suivre les liens vers d'autres pages. De cette façon, ils se sont surtout de suivre les liens d'une page à l'autre. L'ensemble du World Wide Web est constitué de liens, l'idée étant que vous pouvez suivre liens d'un endroit à l'autre. Voici comment obtenir des robots around.The «intelligentes» à propos de l'indexation des pages en ligne vient du moteur de recherche des ingénieurs qui conçoivent les méthodes utilisées pour évaluer l'information, le moteur de recherche robots récupérer. Pour être introduit dans le moteur de recherche de base de données, l'information est disponible pour les chercheurs d'interrogation du moteur de recherche. Quand un moteur de recherche utilisateur entre sa requête dans le moteur de recherche, il existe un nombre de rapides calculs effectués pour s'assurer que le moteur de recherche présente le bon ensemble de résultats de donner à leurs visiteurs les plus pertinents de réponse à leurs query.You peut voir les pages de votre site, la robots des moteurs de recherche se sont rendus en regardant les journaux de votre serveur ou les résultats de votre journal de programme de statistiques. Identifier les robots vont vous montrer où ils ont visité votre site, quelles pages ils ont visité et comment souvent qu'ils visitent. Certains robots sont facilement identifiables par leurs noms de l'agent utilisateur, comme Google "Googlebot", d'autres sont peu plus obscurs, comme Inktomi's "Slurp". D'autres robots mai figurer dans vos journaux que vous ne peut pas facilement identifier certains d'entre eux semblent mai même d'être humain-powered browsers.Along avec identification individuelle des robots et de compter le nombre de leurs visites, les statistiques peuvent également vous montrer agressif saisies de la bande passante des robots ou des robots que vous mai ne pas vouloir visiter votre site Web. Dans la section des ressources de la fin de cet article, vous trouverez des sites de cette liste les noms et les adresses IP des robots des moteurs de recherche afin de vous aider à de les identifier. Comment fait-on pour lire les pages de votre site Web? Lorsque le moteur de recherche robot visite votre page, il examine le texte visible sur la page, le contenu des différentes balises de votre page de code source (balise de titre, meta tags, etc), et les liens hypertexte sur votre page. Des mots et les liens que le robot trouve, le moteur de recherche décide de ce qui est sur votre page. Il existe de nombreux facteurs utilisés pour déterminer ce que "les questions" et à chaque moteur de recherche a son propre algorithme pour évaluer et traiter les informations. Selon la façon dont le robot est mis en place par le moteur de recherche, l'information est indexée et livrés à la recherche du moteur database.The informations fournies à la base de données devient alors partie du moteur de recherche et annuaire de classement processus. Lorsque le moteur de recherche le visiteur soumet sa requête, le moteur de recherche de fouilles par l'intermédiaire de sa base de données de donner la liste définitive qui est affichée sur les résultats page.The moteur de recherche de bases de données mise à jour à différentes reprises. Une fois que vous êtes dans le moteur de recherche de bases de données, les robots tenir régulièrement vous rendre visite, pour prendre des modifications à vos pages, et de s'assurer qu'ils ont les dernières infos. Le nombre de fois que vous visité dépend de la façon dont le moteur de recherche met en place de ses visites, qui peut varier selon la visite des robots de recherche engine.Sometimes sont incapables d'accéder au site Web qu'ils visitent. Si votre site est à la baisse, ou que vous éprouvez d'énormes quantités de trafic, le robot de mai ne pas être en mesure d'accéder à votre site. Lorsque cela se produit, le site web mai ne pas être ré-indexé en fonction de la fréquence des visites des robots sur votre site Web. Dans la plupart des cas, que les robots ne peuvent pas accéder à vos pages, réessayez plus tard, en espérant que votre site sera accessible then.Resources * SpiderSpotting - Search Engine Watch http://searchenginewatch.com/webmasters/spiders.html Robotstxt.org * Liste des robots et des protocoles pour la mise en place d'un fichier robots.txt. * http://www.robotstxt.org/ Spider-alimentaire Tutorials, des forums et des articles sur les araignées et les moteurs de recherche Search Engine Marketing. http://spider-food.net/ * Spiderhunter.com articles et des ressources sur le suivi de moteur de recherche araignées. * Sim http://www.spiderhunter.com/ Spider Simulator Robot Moteur de Recherche Moteur de recherche mondial a une araignée qui simule ce que les robots des moteurs de recherche lire à partir de votre site Web. http://www.searchengineworld.com/cgi-bin/sim_spider.cgiDaria Goetsch est le fondateur et le Search Engine Marketing Consultant pour la recherche sur l'innovation marketing, une optimisation des moteurs de recherche servant les petites entreprises. Elle est spécialisée dans la promotion des moteurs de recherche depuis 1998, y compris trois ans comme le moteur de recherche spécialiste de O'Reilly Media, Inc, une technique d'édition company.Copyright ÃÆ'à ¢ â, ¬ Å ¡Ãƒâ € šÃ,  © 2002-2005 Recherche Innovation Marketing. http://www.searchinnovation.com Tous droits Reserved.Permission de reproduire cet article est accordée si l'article est reproduit dans son
Source D'Article: Messaggiamo.Com
Related:
» Credit Secrets Bible
» Cash Making Power Sites
» Home Cash Course
» Automated Cash Formula
Webmaster obtenir le code html
Ajouter cet article sur votre site Web dès maintenant!
Webmaster envoyer vos articles
Aucune inscription requise! Remplissez le formulaire et votre article est dans le Messaggiamo.Com répertoire!