Robustezas del Search Engine - cómo trabajan, qué lo
hacen (parte i)
Las robustezas automatizadas del Search Engine, a
veces llamadas las "arañas" o las "correas eslabonadas", son los
buscadores de Web pages. ¿Cómo trabajan? ¿Cuál es él
realmente ? ¿Por qué es él importante?
Usted pensaría con toda la queja de Web pages de la
indexación de direcciones para agregar a las bases de datos del
Search Engine, esas las robustezas serían seres grandes y de gran
alcance. Mal. Las robustezas del Search Engine tienen
solamente funcionalidad básica como el de browsers tempranos en
términos de lo que pueden entender en un Web page. Como los
browsers tempranos, las robustezas apenas no pueden hacer ciertas
cosas. Las robustezas no entienden marcos, películas de
destello, imágenes o Javascript. No pueden incorporar áreas
protegidas contraseña y no pueden chascar todos esos botones que
usted tiene en su Web site. Pueden ser frío parado mientras que
ponen en un índice un URL dinámicamente generado y retardado a una
parada con la navegación del Javascript. ¿Cómo Las Robustezas
Del Search Engine Funcionan?
Piense en las robustezas del Search Engine como de datos
la tela a la información del hallazgo y acoplamientos automatizados
de la recuperación programas, viajar.
Cuando usted somete un Web page a un Search Engine en
"someta la página de un URL", el URL nuevo se agrega a la coleta de
la robusteza de Web site para visitar en su saqueo siguiente hacia
fuera sobre la tela. Incluso si usted no somete directamente una
página, muchas robustezas encontrarán su sitio debido a
acoplamientos de otros sitios que señalen de nuevo el tuyo.
Éste es una de las razones por las que es importante construir
su renombre del acoplamiento y conseguir acoplamientos de otros sitios
tópicos de nuevo el tuyo.
Al llegar su Web site, el cheque automatizado de las
robustezas primero para ver si usted tiene un archivo de robots.txt.
Este archivo se utiliza para decir a robustezas qué áreas de
su sitio son fuera de límites a ellas. Típicamente éstos
pueden ser directorios que contienen solamente binaries u otro archiva
la robusteza no necesita referirse a.
Las robustezas recogen acoplamientos de cada página que
visitan, y siguen más adelante esos acoplamientos a través a otras
páginas. De esta manera, esencialmente siguen los acoplamientos
a partir de una página a otra. El Web mundial entero se
compone de los acoplamientos, la idea original que es que usted
podría seguir acoplamientos a partir de un lugar a otro. Éste
es cómo las robustezas consiguen alrededor.
Los "smarts" sobre las páginas de la indexación de
direcciones en línea vienen de los ingenieros del Search Engine, que
idean los métodos usados para evaluar la información que las
robustezas del Search Engine recuperan. Cuando está introducida
en la base de datos del Search Engine, la información está
disponible para los investigadores que preguntan el Search Engine.
Cuando un usuario del Search Engine incorpora su pregunta en el
Search Engine, hay un número de cálculos rápidos hechos para
cerciorarse de que el Search Engine presenta apenas el sistema derecho
de resultados para dar a su visitante la respuesta más relevante a su
pregunta.
Usted puede ver qué páginas en su sitio han visitado las
robustezas del Search Engine mirando sus registros del servidor o los
resultados de su programa de la estadística del registro.
Identificar las robustezas le demostrará cuando visitaron su
Web site, que las páginas ellas visitaron y cómo visitan a menudo.
Algunas robustezas son fácilmente identificables por sus
nombres del agente del usuario, como "Googlebot" de Google;
otros son más obscuros mordido, como "Slurp" de Inktomi.
Todavía otras robustezas se pueden enumerar en sus registros
que usted no pueda identificar fácilmente; algunas de ellas
pueden incluso aparecer ser browsers humano-accionados.
Junto con identificar las robustezas individuales y la
cuenta del número de sus visitas, la estadística puede también
demostrarle las robustezas anchura de banda-que asen agresivas o las
robustezas que usted no puede desear visitar su Web site. En la
sección de los recursos del extremo de este artículo, usted
encontrará los sitios que los nombres de la lista y las direcciones
del IP de las robustezas del Search Engine para ayudarle a
identificarlas. ¿Cómo Leen Las Páginas En Su Web site?
Cuando la robusteza del Search Engine visita su página,
mira el texto visible en la página, el contenido de las varias
etiquetas en el código de fuente de su página (etiqueta del título,
etiquetas del meta, etc.), y los hyperlinks en su página. De
las palabras y de los acoplamientos que la robusteza encuentra, el
Search Engine decide sobre a cuál es su página. Hay muchos
factores usados para calcular fuera de lo que "importa" y cada Search
Engine tiene su propio algoritmo para evaluar y procesar la
información. Dependiendo de cómo la robusteza se instala con
el Search Engine, la información se pone en un índice y después se
entrega a la base de datos del Search Engine.
La información entregada a las bases de datos entonces se
convierte en parte del proceso de la graduación del Search Engine y
del directorio. Cuando el visitante del Search Engine somete su
pregunta, el Search Engine cava a través de su base de datos para dar
el listado final que se exhibe en la página de los resultados.
La actualización de las bases de datos del Search Engine
en las horas que varían. Una vez que usted esté en las bases
de datos del Search Engine, las robustezas guardan el visitar de usted
periódicamente, para tomar cualquier cambio a sus páginas, y
cerciorarse de tienen el Info más último. El número de
épocas que le visitan depende de cómo el Search Engine instala sus
visitas, que pueden variar por Search Engine.
Las robustezas a veces que visitan no pueden tener acceso
al Web site que están visitando. Si su sitio está abajo, o
usted está experimentando cantidades enormes de tráfico, la
robusteza puede no poder tener acceso a su sitio. Cuando sucede
esto, el Web site no se puede volver a clasificar, dependiendo de la
frecuencia de las visitas de la robusteza a su Web site. En la
mayoría de los casos, las robustezas que no pueden tener acceso sus
páginas intentarán otra vez más adelante, esperando que su sitio
entonces será accesible.
Recursos
* SpiderSpotting - reloj
http://searchenginewatch.com/webmasters/spiders.html del Search
Engine
* Lista de Robotstxt.org de robustezas y de
protocolos para setting-up un archivo http://www.robotstxt.org/ de
robots.txt
* Clases particulares, foros y artículos
del Araña-Alimento acerca de las arañas y de la comercialización
http://spider-food.net/ del Search Engine del Search Engine
* Artículos y recursos de Spiderhunter.com
sobre seguir las arañas http://www.spiderhunter.com/ del Search
Engine
* El mundo del Search Engine del simulador
de la robusteza del Search Engine de la araña de Sim tiene una araña
que simule lo que leen las robustezas del Search Engine en su Web site
http://www.searchengineworld.com/cgi-bin/sim_spider.cgi
Daria Goetsch es el fundador y el consultor de
comercialización del Search Engine para la comercialización de la
innovación de la búsqueda,
compañía
de la
optimización del Search Engine que sirve
pequeñas empresas. Ella se ha especializado en la promoción
del Search Engine desde 1998, incluyendo tres años como el
especialista del Search Engine para ÓReilly Media, Inc., compañía
que publicaba del libro técnico.
Comercialización De la Innovación© De la
Búsqueda Del Copyright Ã?Æ'ââ"¬Å¡Ã?â??Ã" 2002-2005.
http://www.searchinnovation.com todos los
derechos reservados.
Se concede el permiso de reimprimir este artículo si el
artículo se reproduce en su totalidad, sin corregir, incluyendo la
bio información. Incluya por favor un hyperlink
a http://www.searchinnovation.com al usar
este artículo en boletines de noticias o en línea.
Artículo Fuente: Messaggiamo.Com
Related:
» Credit Secrets Bible
» Cash Making Power Sites
» Home Cash Course
» Automated Cash Formula
Webmaster obtener el código html
Añadir este artículo a su sitio web ahora!
Webmaster Envíe sus artículos
No es necesario que se registre! Completa el formulario y su artículo está en el Messaggiamo.Com Directorio!