¿Cómo los Motores de Búsqueda - Web Crawlers por Fahrizal Wibowo

itis los motores de búsqueda que finalmente traen su web a la noticeof los clientes potenciales. Por lo tanto es mejor saber cómo thesesearch motores funcionan realmente y cómo se presentan información a thecustomer iniciar una búsqueda.

Thereare básicamente dos tipos de motores de búsqueda. La primera es por los rastreadores o arañas robotscalled.

searchengines

usespiders a sitios web de índice. Al enviar sus páginas web a asearch motor, completando su página de presentación requerida, thesearch motor de araña índice voluntad todo su sitio. Un ISAN programa 'araña' automatizado que se ejecuta por el sistema de motores de búsqueda. Spidervisits un sitio web, leer el contenido en el mismo lugar, las etiquetas site'sMeta y también seguir los enlaces que el sitio se conecta. Thespider devuelve toda esa información de vuelta a un centraldepository, donde se indexa los datos. Se visitará cada enlace youhave en su página web y el índice de estos sitios también. Algunas arañas willonly índice de un cierto número de páginas de su sitio, por lo que no createa sitio con 500 páginas!

Thespider volverá periódicamente a los sitios para comprobar anyinformation que ha cambiado. La frecuencia con la que este happensis determinado por los moderadores del motor de búsqueda.

ASPIDER es casi como un libro donde se contiene la tabla de contenido, el contenido real y los enlaces y referencias para todo el websitesit encuentra en su búsqueda, y se puede indexar hasta un millón de páginas aday

Ejemplo:.. Excite, Lycos, Altavista y Google

Whenyou pedir un motor de búsqueda para localizar información, se actuallysearching través del índice que se ha creado y no actuallysearching la Web. Diferentes motores de búsqueda producen differentrankings porque no todos los motores de búsqueda utiliza el mismo algoritmo tosearch a través de los índices.

Oneof las cosas que escanea un algoritmo de motor de búsqueda de es thefrequency y localización de palabras clave en una página web, pero puede alsodetect palabra clave artificial relleno

o spamdexing.

A continuación, los algoritmos analizan la forma en que página enlaza con otras páginas enla Web. Al marcar la forma en página enlaza entre sí, un motor puede bothdetermine qué página se trata, si las palabras clave de la pagesare vinculados similares a las palabras clave en la página original.