Ir al contenido principal

El algoritmo de Google


Google nació como un proyecto universitario de Larry Page y Serguéi Brin. La compañía se fundó en 1998 y el 27 de septiembre de ese año estrenaron su motor de búsqueda en internet.

El nombre del buscador es un juego de palabras basado en el concepto matemático “gúgol”, que indica 10100, una clara referencia a la magnitud del proyecto, cuyo objetivo era organizar la ingente cantidad de información en la red.

El proyecto comenzó a crecer. En el año 2000 lanzaron las primeras versiones de google.com en 10 idiomas diferentes. Ese mismo año pusieron en funcionamiento Adwords, el programa de anuncios de Google, que en la actualidad reporta el 90% de los ingresos de la empresa. En el año 2001 comenzaron a lanzar diferentes servicios como Google News, Google Maps, Google Calendar, Google Translate, Google Analytics, Google Drive, Gmail… En septiembre de 2008 lanzaron Google Chrome, su propio navegador. Ese mismo año también salió al mercado el primer móvil con sistema Android.

A pesar de todos los servicios que ofrece la empresa, Google nació como un buscador en Internet. Para ello utilizan un algoritmo de búsqueda llamado Page-Rank. Imaginemos que tenemos un conjunto de páginas enlazadas entre sí de la siguiente forma:
Podemos escribir este grafo en forma de tabla. La primera columna representa los nodos de salida, mientras que la primera fila indica los nodos de entrada.


1
2
3
4
1
0
1/3
1/3
1/3
2
0
0
1/2
1/2
3
1
0
0
0
4
1/2
0
1/2
0

Esta tabla indica la probabilidad de ir a cada una de las diferentes páginas desde un nodo determinado a través de los enlaces. Sin embargo, internet no funciona exclusivamente a través de enlaces, sino que disponemos de una barra de navegación mediante la cual podemos dirigirnos a cualquier página sin necesidad de que aquella en la que estamos nos ofrezca el link correspondiente.

Supongamos que los usuarios acceden a una determinada página de la siguiente manera:
     El 85% de las veces a través de los links de la página en la que están.
     El 15% de las veces a través de la barra de direcciones. Teniendo en cuenta que ese porcentaje se reparte entre los otros 3 posibles nodos
Entonces la tabla quedaría de la siguiente forma:


1
2
3
4
1
0
1/3·85/100+15/300
1/3·85/100+15/300
1/3·85/100+15/300
2
0+15/300
0
1/2·85/100+15/300
1/2·85/100+15/300
3
1·85/100+15/300
0+15/300
0
0+15/300
4
1/2·85/100+15/300
0+15/300
1/2·85/100+15/300
0

Que si lo operamos y simplificamos:


1
2
3
4
1
0
1/3
1/3
1/3
2
1/20
0
19/40
19/40
3
9/10
1/20
0
1/20
4
19/40
1/20
19/40
0

Esta información nos puede ayudar a determinar cuál de las páginas es la más relevante. Para ello tendremos que resolver la siguiente ecuación matricial:
Cuya solución sería:
X1=0,363
X2=0,146
X3=0,287
X4=0,204
Esa es la importancia de cada nodo de la red, siendo el de mayor valor el de mayor importancia. En este caso, el nodo más importante es el nodo 1.

Este es a grandes rasgos el funcionamiento de Page-Rank, pero en el caso de Google lo hace con todas las páginas de la red.

Comentarios

Publicar un comentario

Entradas populares de este blog

Conocimiento y escritura

La escritura y el conocimiento van de la mano. Cuando escribimos, podemos expresar nuestras ideas y conocimientos de forma ordenada y duradera. Al mismo tiempo, la escritura tiene un impacto en la forma en que se guarda la información a lo largo de la historia. Nos permite conservar datos importantes y buscar información en libros u otras fuentes escritas, sin necesidad de memorizar todo. La escritura también afecta la forma en que aprendemos y compartimos conocimiento en la sociedad. Es distinto aprender de tradiciones orales limitadas, a tener acceso a libros y textos escritos que nos brindan mucha más información. La escritura nos ayuda a almacenar información de manera precisa y a compartir conocimiento de forma más eficiente. Además, la escritura es una base sólida de referencias. Al escribir textos claros y concisos, podemos preservar el conocimiento sin que se distorsione con el paso del tiempo. A diferencia de la transmisión oral, donde la información puede cambiar o perderse e...

Envases activos e inteligentes

Envases activos Los envases activos son aquellos que utilizan una combinación de gases o sustancias antimicrobianas para aumentar la vida útil de un producto alimentario. Un ejemplo de este tipo de envasado podría ser el siguiente: En la imagen se puede observar una indicación que dice “Envasado en atmósfera protectora”. Por lo tanto, en este caso, se ha sustituido el aire del interior del envase por un conjunto de gases que retrasan la degradación del producto y el crecimiento de microorganismos. De esa manera, se consigue aumentar la vida útil del alimento. Envases inteligentes Los envases inteligentes son aquellos en los que se produce una reacción entre el alimento y el envase. Dicha reacción modifica la etiqueta y, de esa manera, proporciona al consumidor información sobre el estado del producto. Un ejemplo de envase inteligente podría ser el siguiente: En este caso la etiqueta incorpora un sensor que cambia de color si la carne ha estado sometida durante u...

Circulación y globalización. Conferencia del Dr. José Pardo Tomás titulada "Centro y corazón desta gran bola. Globalización y circulación del saber desde México (1520-1620)"

La circulación y la globalización son conceptos estrechamente relacionados que describen cómo las ideas, el conocimiento y las personas se mueven entre diferentes regiones y culturas. En la conferencia del Dr. José Pardo Tomás titulada "Centro y corazón desta gran bola. Globalización y circulación del saber desde México (1520-1620)", se explora cómo estos conceptos se aplicaron al intercambio de conocimiento en el siglo XVI. La circulación se refiere al movimiento de estos elementos, mientras que la globalización se trata de la creación de una red interconectada a nivel mundial. En el siglo XVI, la circulación del conocimiento fue particularmente relevante debido a los intercambios entre la Nueva España y España, así como entre otras colonias y el continente europeo. El término "circulación" es adecuado para describir el movimiento del conocimiento en este período histórico. Durante el siglo XVI, se produjeron importantes intercambios de libros, manuscritos y otros ...