Matemáticas de la vida cotidiana. Ejercicio 5. Redacción artículo
Antes de que existiesen las
maquinas buscadoras (Search Engines) internet era una colección de sitios FTP
en los que los usuarios podían buscar archivos compartidos. Para acceder a internet World Wide Web se
convirtió en la interfase de referencia y entonces surgió la necesidad de crear
herramientas para buscar y ordenar todos los archivos.
Alrededor de 1994 surgieron distintos
navegadores para encontrar la información que interesase. Uno de los primeros
fue WebCrawler, este navegador mostraba una lista de páginas para las palabras
buscadas. Fue creado por un estudiante de la Universidad de Washington, un año
más tarde lo compro América Online y en 2001 Info Space. Aunque tomo cierta
relevancia cuando salió fue reemplazado por popularidad por Lycos. Lycos se
creo en 2005 como un proyecto de investigación de la Universidad Carnegie
Mellon (EEUU), y llegó a ser la página más visitada en 1999. La compro Terra pero esta fusión no funciono.
Otro buscador que se creo en 1995 fue AltaVista, esta fue comprada por Yahoo en
2003 y finalmente cerro. Yahoo se creó en 1995, aunque tuvo éxito en un
comienzo, Google ha sido superior por las búsquedas de mejor calidad que ofrece.
Hay que tener en cuenta que
Google controla alrededor del 90% de las búsquedas y más del 50% de la
publicidad. Para los expertos las claves de su éxito están en la innovación, en
el algoritmo PageRank y en la personalización de los resultados de búsqueda.
Google Inc. se creó oficialmente
en 1998 llevando al mercado Google Search. Los creadores eran dos informáticos ingenieros,
Larry Page y Sergey Brin. Primero trabajar en desarrollar algoritmos para búsquedas
trabajando en BackRub en 1996. Consiguieron financiación para desarrollar más
su proyecto y es así como llegaron a crear Google basado en el sistema
PageRank. Google no solo es el buscador, también lanzaron Google News, Gmail,
Google Maps, o Google Chrome entre otros, por lo que ofrecen una amplia gama de
servicios.
Page Rank es uno de los algoritmos que emplean para las búsquedas, este mide la importancia de cada página web, calcula la probabilidad de distribución que indica la probabilidad de que una persona clicando en un link aleatorio vaya a llegar a una página en particular. Para ello considera que internet es un grafo, cada pagina web es un nodo. Entre las páginas webs hay conexiones, las aristas entre nodos, que son de una dirección. Cuanto más paginas estén conectadas con una página web en concreto mayor importancia tendrá esa web. Por otro lado, es importante analizar la relevancia de las páginas que están conectadas a una página en concreto. En el dibujo de abajo podemos ver que las bolas verdes son pequeñas porque nadie conecta con ellas. En el caso de la bola roja de la parte superior de la derecha, solo esta conectada con la amarilla (flecha de la amarilla a la roja) pero como la amarilla es muy relevante la roja también lo es aunque solo le llegue una flecha.
El valor PageRank para una pagina
u depende del valor de PageRank para cada página v que esta en el set Bu que es
el set que contiene todas las páginas que están unidas o conectadas a la pagina
u, dividido por el numero L(v) de links desde la página v.
El PageRank ha ido perdiendo importancia,
para las búsquedas se están empleado métodos mejorados. Entre otros se tiene en
cuenta además de lo mencionado la calidad del contenido, la velocidad de carga,
se emplean algoritmos basados en Inteligencia Artificial como RankBrain para mostrar
los resultados más relevante para el usuario. La frescura o la fecha de publicación
del contenido también es importante. Google tiene en cuneta diversos factores,
no todos son públicos, pero es importante tener una alta puntuación en todo
para que la página web se situé arriba.
Desde hace unos años Google dejo
de publicar el PageRank de las páginas webs pero ahí maneras de estimar el
PageRank con algunas herramientas. El motivo de dejar de publicar el ranking
fue evitar que las paginas webs adulteren los resultados guiándose por los
resultados que tienen y los criterios que se conocen.
Comentarios
Publicar un comentario