Ir al contenido principal

El algoritmo de Google


Google nació como un proyecto universitario de Larry Page y Serguéi Brin. La compañía se fundó en 1998 y el 27 de septiembre de ese año estrenaron su motor de búsqueda en internet.

El nombre del buscador es un juego de palabras basado en el concepto matemático “gúgol”, que indica 10100, una clara referencia a la magnitud del proyecto, cuyo objetivo era organizar la ingente cantidad de información en la red.

El proyecto comenzó a crecer. En el año 2000 lanzaron las primeras versiones de google.com en 10 idiomas diferentes. Ese mismo año pusieron en funcionamiento Adwords, el programa de anuncios de Google, que en la actualidad reporta el 90% de los ingresos de la empresa. En el año 2001 comenzaron a lanzar diferentes servicios como Google News, Google Maps, Google Calendar, Google Translate, Google Analytics, Google Drive, Gmail… En septiembre de 2008 lanzaron Google Chrome, su propio navegador. Ese mismo año también salió al mercado el primer móvil con sistema Android.

A pesar de todos los servicios que ofrece la empresa, Google nació como un buscador en Internet. Para ello utilizan un algoritmo de búsqueda llamado Page-Rank. Imaginemos que tenemos un conjunto de páginas enlazadas entre sí de la siguiente forma:
Podemos escribir este grafo en forma de tabla. La primera columna representa los nodos de salida, mientras que la primera fila indica los nodos de entrada.


1
2
3
4
1
0
1/3
1/3
1/3
2
0
0
1/2
1/2
3
1
0
0
0
4
1/2
0
1/2
0

Esta tabla indica la probabilidad de ir a cada una de las diferentes páginas desde un nodo determinado a través de los enlaces. Sin embargo, internet no funciona exclusivamente a través de enlaces, sino que disponemos de una barra de navegación mediante la cual podemos dirigirnos a cualquier página sin necesidad de que aquella en la que estamos nos ofrezca el link correspondiente.

Supongamos que los usuarios acceden a una determinada página de la siguiente manera:
     El 85% de las veces a través de los links de la página en la que están.
     El 15% de las veces a través de la barra de direcciones. Teniendo en cuenta que ese porcentaje se reparte entre los otros 3 posibles nodos
Entonces la tabla quedaría de la siguiente forma:


1
2
3
4
1
0
1/3·85/100+15/300
1/3·85/100+15/300
1/3·85/100+15/300
2
0+15/300
0
1/2·85/100+15/300
1/2·85/100+15/300
3
1·85/100+15/300
0+15/300
0
0+15/300
4
1/2·85/100+15/300
0+15/300
1/2·85/100+15/300
0

Que si lo operamos y simplificamos:


1
2
3
4
1
0
1/3
1/3
1/3
2
1/20
0
19/40
19/40
3
9/10
1/20
0
1/20
4
19/40
1/20
19/40
0

Esta información nos puede ayudar a determinar cuál de las páginas es la más relevante. Para ello tendremos que resolver la siguiente ecuación matricial:
Cuya solución sería:
X1=0,363
X2=0,146
X3=0,287
X4=0,204
Esa es la importancia de cada nodo de la red, siendo el de mayor valor el de mayor importancia. En este caso, el nodo más importante es el nodo 1.

Este es a grandes rasgos el funcionamiento de Page-Rank, pero en el caso de Google lo hace con todas las páginas de la red.

Comentarios

Publicar un comentario

Entradas populares de este blog

El jogo bonito

El 31 de mayo de 1998 el viejo San Mamés acogió un partido para la historia. Uno de esos encuentros con los que fantaseaba hasta entonces (con tan solo diez primaveras en mi haber), pero que nunca pensé que pudieran llegar a darse. En un lado del campo jugadores míticos como Urrutia, Ziganda y Urzaiz defendían a mi Athletic. En el otro lado del campo la entonces tetracampeona del mundo, la canarinha, la todopoderosa selección de Brasil, con futbolistas de leyenda como Ronaldo, Bebeto, Rivaldo y Roberto Carlos. Desde entonces han pasado 21 años y este deporte ha cambiado en muchos aspectos, aunque no siempre para mejor. Por suerte, los nostálgicos del fútbol de antaño, subdesarrollado, sin tanta histeria colectiva ni especulación, disponemos de herramientas para regresar y revivir esos momentos que tanto nos hicieron disfrutar del fútbol. Precisamente, esta semana he encontrado la siguiente joya: El 3 de junio de 1997 las selecciones de Brasil y Francia disputaron en Lyon

Luna

El Sistema Solar se formó hace 4600 millones de años a partir de la contracción de una nube de gas y polvo. En el centro se acumuló la mayor parte de la materia, dando lugar a la formación del sol. En otras zonas también se produjeron acumulaciones de materia que dió lugar a los planetas. Aproximadamente 100 millones de años después la Tierra recibió el impacto de un protoplaneta llamado Theia. La colisión hizo que parte de la materia de ambos planetas se uniese y que otra parte fuera expulsada al espacio. Se considera que la Luna se formó a partir de esa cantidad ingente de rocas que se separó tras el impacto. Así se convirtió en nuestro único satélite natural y, desde entonces, ejerce su influencia sobre la Tierra. Una de sus efectos más evidentes es la existencia de las mareas debido a la atracción gravitatoria. Como consecuencia, en la zona de la Tierra más cercana a la Luna se produce una elevación del nivel del mar. Además, en la cara opuesta, dado que la atracción de la Lu

El Club de Pickering

En ambas imágenes se puede observar parte del grupo de mujeres que formaron parte del equipo de investigación dirigido por Edward Pickering (el único hombre que aparece en las fotografías) en el Observatorio Astronómico de Harvard. Edward Pickering fue un astrónomo estadounidense que trabajó analizando los espectros de las estrellas a través de material fotográfico que fue recopilando a lo largo de los años. Con el objetivo de clasificar todo ese material Pickering reunió a un grupo de mujeres que le ayudó a cumplir su propósito. Dicho grupo de investigación fue conocido como el Club Pickering . Las imágenes son de finales del siglo XIX, una época en la que el acceso de las mujeres a estudios superiores era muy restringido. Al contratarlas, Pickering obtenía un grupo con poca formación académica y al que, en consecuencia, podía pagar menos (alrededor de la mitad de lo que hubiera pagado a un hombre) y asignarles tareas repetitivas, obteniendo resultados eficientes y rentables. A pe