Matemáticas de la vida cotidiana. Ejercicio 5. Redacción artículo

 

Antes de que existiesen las maquinas buscadoras (Search Engines) internet era una colección de sitios FTP en los que los usuarios podían buscar archivos compartidos.  Para acceder a internet World Wide Web se convirtió en la interfase de referencia y entonces surgió la necesidad de crear herramientas para buscar y ordenar todos los archivos.

Alrededor de 1994 surgieron distintos navegadores para encontrar la información que interesase. Uno de los primeros fue WebCrawler, este navegador mostraba una lista de páginas para las palabras buscadas. Fue creado por un estudiante de la Universidad de Washington, un año más tarde lo compro América Online y en 2001 Info Space. Aunque tomo cierta relevancia cuando salió fue reemplazado por popularidad por Lycos. Lycos se creo en 2005 como un proyecto de investigación de la Universidad Carnegie Mellon (EEUU), y llegó a ser la página más visitada en 1999.  La compro Terra pero esta fusión no funciono. Otro buscador que se creo en 1995 fue AltaVista, esta fue comprada por Yahoo en 2003 y finalmente cerro. Yahoo se creó en 1995, aunque tuvo éxito en un comienzo, Google ha sido superior por las búsquedas de mejor calidad que ofrece.

Hay que tener en cuenta que Google controla alrededor del 90% de las búsquedas y más del 50% de la publicidad. Para los expertos las claves de su éxito están en la innovación, en el algoritmo PageRank y en la personalización de los resultados de búsqueda.

Google Inc. se creó oficialmente en 1998 llevando al mercado Google Search. Los creadores eran dos informáticos ingenieros, Larry Page y Sergey Brin. Primero trabajar en desarrollar algoritmos para búsquedas trabajando en BackRub en 1996. Consiguieron financiación para desarrollar más su proyecto y es así como llegaron a crear Google basado en el sistema PageRank. Google no solo es el buscador, también lanzaron Google News, Gmail, Google Maps, o Google Chrome entre otros, por lo que ofrecen una amplia gama de servicios.

Page Rank es uno de los algoritmos que emplean para las búsquedas, este mide la importancia de cada página web, calcula la probabilidad de distribución que indica la probabilidad de que una persona clicando en un link aleatorio vaya a llegar a una página en particular. Para ello considera que internet es un grafo, cada pagina web es un nodo. Entre las páginas webs hay conexiones, las aristas entre nodos, que son de una dirección. Cuanto más paginas estén conectadas con una página web en concreto mayor importancia tendrá esa web. Por otro lado, es importante analizar la relevancia de las páginas que están conectadas a una página en concreto. En el dibujo de abajo podemos ver que las bolas verdes son pequeñas porque nadie conecta con ellas. En el caso de la bola roja de la parte superior de la derecha, solo esta conectada con la amarilla (flecha de la amarilla a la roja) pero como la amarilla es muy relevante la roja también lo es aunque solo le llegue una flecha.




Este concepto se puede expresar matemáticamente de la siguiente manera.


El valor PageRank para una pagina u depende del valor de PageRank para cada página v que esta en el set Bu que es el set que contiene todas las páginas que están unidas o conectadas a la pagina u, dividido por el numero L(v) de links desde la página v.

El PageRank ha ido perdiendo importancia, para las búsquedas se están empleado métodos mejorados. Entre otros se tiene en cuenta además de lo mencionado la calidad del contenido, la velocidad de carga, se emplean algoritmos basados en Inteligencia Artificial como RankBrain para mostrar los resultados más relevante para el usuario. La frescura o la fecha de publicación del contenido también es importante. Google tiene en cuneta diversos factores, no todos son públicos, pero es importante tener una alta puntuación en todo para que la página web se situé arriba.

Desde hace unos años Google dejo de publicar el PageRank de las páginas webs pero ahí maneras de estimar el PageRank con algunas herramientas. El motivo de dejar de publicar el ranking fue evitar que las paginas webs adulteren los resultados guiándose por los resultados que tienen y los criterios que se conocen.

 

 

 


Comentarios

Entradas populares