martes, 19 de mayo de 2009

Funcionamiento de Google (1)

Hoy os voy a hablar sobre el funcionamiento de google. El texto siguiente lo he sacado de la propia página de Google al que le he eliminando un poco del lenguaje técnico para que sea más legible:

Rastreo

El rastreo es el proceso mediante el cual Googlebot descubre páginas nuevas y actualizadas y las añade al índice de Google.
Utilizan una enorme cantidad de equipos informáticos para obtener
(o "rastrear") miles de millones de páginas Web. El programa encargado de recuperar este contenido es Googlebot, también conocido como "robot". Googlebot emplea un proceso basado en algoritmos: a través de programas informáticos, se determinan los sitios que deben rastrearse, la frecuencia y el número de páginas que hay que obtener de cada sitio.

El proceso de rastreo de Google empieza con una lista de URL de páginas web generada a partir de anteriores procesos de rastreo y se amplía con los datos de los sitemaps que ofrecen los webmasters. A medida que Googlebot visita cada uno de estos sitios web, detecta enlaces en sus páginas y los añade a la lista de páginas que debe rastrear. Los sitios nuevos, los cambios en los existentes y los enlaces obsoletos se detectan y se utilizan para actualizar el índice de Google.

Indexación

Googlebot procesa todas las páginas que rastrea para elaborar un índice completo de todas las palabras que detecta y de su ubicación en cada página. Además, procesa la información incluida en las etiquetas y los atributos de contenido clave, como las etiquetas "Title" y los atributos "ALT".

Publicación de resultados

Cuando un usuario introduce una consulta, el sistema busca en el índice las páginas que coinciden con esa consulta y muestra los resultados que considera más relevantes para el usuario. La relevancia se determina a partir de más de 200 factores, uno de los cuales es el PageRank de cada página.
Este parámetro representa la importancia que Google asigna a una página en función de los enlaces procedentes de otras páginas web. En otras palabras, cada enlace a una página de un sitio influye en el PageRank del mismo.
No todos los enlaces son iguales: Google se esfuerza en mejorar el servicio que ofrece al usuario identificando los enlaces fraudulentos y otras prácticas que influyen negativamente en los resultados de búsqueda. Los mejores enlaces son los que se basan en la calidad del contenido del sitio.

No hay comentarios:

Publicar un comentario