Google sabe todo

Posted on 21 junio, 2012

0


Por Mariano Blejman
Que Google tiene la bola de cristal y puede predecir el futuro o saber dónde va a aparecer el próximo foco de la gripe A es una verdad a medias, pero cada vez es una verdad más verdadera. Sin embargo, hay otras cosas que Google puede “saber” a través de una herramienta llamada Google Correlate. A ver: la noticia de que Twitter podía predecir la actividad en la Bolsa de Valores apareció en 2010, cuando una investigación determinó una correlación del 86,7 por ciento entre el humor social en Twitter y el movimiento del mercado bursátil. El descubrimiento ocurrió por casualidad, luego de una investigación desarrollada por Johan Bollen, de la Universidad de Indiana, que encontrara, usando OpenFinder, una herramienta de software libre que clasifica los tweets de manera positiva o negativa, curvas similares a los períodos de la Bolsa que funcionaban a la perfección. Encontraron relación entre 72 adjetivos y buscaron qué palabras se usaban de manera similar. Encontraron finalmente que algunas de las palabras tenían correlación durante ese período con el índice del Dow Jones. Se dudaba, por entonces, de si realmente esto podía permitir “interactuar” con la Bolsa y probablemente sea todavía poco probable.
Pero si Google Trends permite saber cuáles son los temas del momento y su posible evolución de manera lineal, Google Insight es una herramienta mucho más poderosa porque permite predecir actividades de manera geolocalizada y comparar tendencias posibles entre palabras clave. Por ejemplo, en las últimas tres semanas, la palabra “YPF” era más buscada en Argentina que en España, mientras que “Repsol” era más buscada en España que en Argentina.
Similares hallazgos se pueden encontrar con Malvinas/Falkland en esa búsqueda ejerciendo una rápida comprensión de los intereses de las mismas. Las búsquedas sobre “Malvinas” son mucho mayores que las búsquedas sobre “Falkland” a nivel mundial. Las explicaciones pueden ser varias, entre ellas, que no existen muchos lugares llamados “Falkland” fuera de las islas Malvinas, mientras que hay decenas de lugares conocidos con ese nombre en el territorio nacional. O, también, que a muy pocos les importa qué pasa en las Falkland. El caso de Google Flu Trends, en cambio, permite comparar los casos reales de gripe A con las búsquedas de términos específicos en el buscador con un nivel de coincidencia increíble. La herramienta ha sido acreditada científicamente por la revista Nature en un paper publicado el 19 de febrero de 2009 mientras el mundo se enteraba de la existencia de la gripe A.
Pero lo de Google Correlate es el método inverso y al mismo tiempo fascinante: el laboratorio de Google descubrió que comparar búsquedas permite encontrar patrones de relaciones entre comportamientos. Por ejemplo, si uno busca en inglés “liposuction” la búsqueda coincide con “exotic car rental” y cuatro semanas después, el patrón de búsqueda coincide con la palabra “exhaust”. Otro ejemplo: el patrón de búsqueda de aquellos que tipean “yogur”, dos semanas después coincide con el patrón de búsqueda de aquellos que buscan “a permit (un permiso)” o “best places to eat” (los mejores lugares para comer). O sea, se cansaron del yogur y están decididos a salir a comer. Así es: Google Correlate puede predecir lo que la gente va a buscar en las próximas semanas: alguien encontró que aquellos que buscan “sunflower” (girasoles) coinciden con “a bike” (una bicicleta).
En el caso de Argentina, por ejemplo, la palabra “Repsol” (buscada entre 2004 y 2012) tiene un dibujo en caída libre y coincide en su patrón de búsqueda en un 0,9553 (casi igual) que la palabra “Palm”. Lo que se llama tecnología de punta en picada: el mismo gráfico coincide con “traductores”, “win 98”, “telecom”, “image” y “pioneer”. Uno podría imaginar, siguiendo los patrones de búsqueda, que Repsol viene cayendo en interés y presencia en Argentina con un mismo destino previsible que el Windows 98 y ya no se trata de una metáfora literaria sino de un patrón de búsqueda que lo hace coincidente. Desde enero pasado, Google Correlate tiene soporte para 50 países. Hasta entonces, las pruebas de análisis de consumo o desempleo sólo habían estado disponibles para los Estados Unidos. Ahí se puede encontrar una extraña coincidencia entre “debt” (deuda) y “no kids allowed” (no se permiten niños). ¿?
La herramienta tiene una función todavía más divertida: el usuario puede hacer un click en la función “dibujar” y trazar sus propias líneas y observar con qué tipo de patrón de búsqueda coincide. Google Correlate es una derivación de la metodología usada para Google Flu Trends, y fue utilizada como plataforma para estudiar la relación en Estados Unidos entre “refinanciación” (refinance) e “hipoteca” (mortgage), cuyas búsquedas comenzaron a “normalizarse” desde 2008. Hay que tener en cuenta que las correlaciones encontradas no comparan cantidad de búsquedas sino evolución. El “paper” que explica la historia que llevó a Google Correlate a convertirse en una plataforma disponible para los usuarios fue escrito por Matt Mohebbi, Dan Vanderkam, Julia Kodysh, Rob Schonberger, Hyunyoung Choi y Sanjiv Kumar. En el documento los autores advierten que “la privacidad es importante” y que la información de Google Correlate “no puede ser asociada con ninguna persona de manera individual. La información no contiene datos sobre identidad, dirección de IP ni localización gráfica”. Menos mal, ¿saben con qué se correlaciona la palabra “Google” cuando se la busca en Estados Unidos?: recorre el mismo camino que “citalopram” (un depresivo), “county jail” (la cárcel del condado) y “detention center” (centro de detención), entre otras asombrosas coincidencias.
PAGINA 12