Como funciona Google Correlate
¿Qué es Google Correlate?
Ayer apareció Google Correlate un servicio que aún está en fase experimental pero que realmente podría cambiar la forma en que exploramos toda la data de la web.
Para explicar un poco que es Google Correlate, lo más fácil es decir que es, tal como lo dicen ellos mismos, la inversa de Google Trends; mientras que en Google Trends se introducen términos para ver como varían en el tiempo, en Google Correlate es posible cargar una serie de datos y ver que términos se han movido en la misma forma que nuestros datos.
En un post anterior ya había explicado como operaba Google Trends y había mención a Google Flu, el espectacular servicio que permite ver la probabilidad de contraer gripe en una cierta zona. ¿Qué hay detrás? Simplemente Google asume que si la gente busca información sobre "síntomas de la gripe" o "remedios caseros para el resfrío" -por ejemplo- lo más probable es que esa persona esté con gripe. Entonces, si las búsquedas asociadas a la gripe crecen, entonces es más probable que haya crecido el número de personas con gripe, por ende hay más probabilidad de que yo me enferme. Esto mismo hay que llevarlo a escalas de millones de búsquedas y millones de términos. Todo este trabajo fue publicado en la revista Nature. Google Correlate opera con esta lógica, poder explorar que términos hacen relación con cierto volumen histórico de datos. Aquí está el caso para la Gripe.
También con Google Correlate también puedo buscar como se mueven en el tiempo las búsquedas de ciertos términos asociados a un término específico. Por ejemplo, si buscamos que términos están correlacionados con "pérdida de peso" nos encontramos con términos como "pérdida", "peso" y "plan para". Pero el que llama la atención es "destinos de vacaciones". O sea, cuándo aumentan las búsquedas asociadas a "perder peso" también suben las búsquedas asociadas a "destinos de vacaciones". Esto funciona en ambas direcciones (subir o bajar).
Subir datos a Google Correlate
Sin duda lo más potente es que uno puede subir su propia data. Por ejemplo, podríamos cargar una serie de datos (da lo mismo qué) donde siempre hay una aumento de los valores durante octubre. Al buscar correlaciones nos daremos cuenta de que todos los términos que también incrementan sus búsquedas en esos periodos son los asociados a Halloween. Esto es bastante trivial, pero sería muy interesante por ejemplo para una empresa que tiene aumentos de ventas en ciertos periodos y no tiene tan claro qué produce la estacionalidad.
Por último lo más entretenido: dibujar la correlación! es posible también dibujar una línea y a partir de dicha línea encontrar correlaciones. En este ejemplo dibujé una línea que cae desde el 2004 y el término que está más correlacionado con esta línea es "freehand mx". Adobe mató a Freehand hace un par de años (2007) para potenciar a Illustrator y desde el 2004 que no hay nuevas versiones.
Todo el funcionamiento y como se llegó a esto está explicado en el mismo sitio y para hacerlo más sencillo dibujaron un comic. ¿Qué gana Google con esto? Es una conversación bien larga pero en rigor mantener su ecosistema: mejores búsquedas, mejor contenido, mejor publicidad contextual, más ganancias.
Nota: El número que acompaña al término es el coeficiente de correlación de Pearson. No es mucho lo que se puede decir del valor en si mismo, sólo importa que sea cercano a 1 para hablar de una correlación positiva, o cercano a -1 para que sea negativa. 0 No hay correlación.
Ayer apareció Google Correlate un servicio que aún está en fase experimental pero que realmente podría cambiar la forma en que exploramos toda la data de la web.
Para explicar un poco que es Google Correlate, lo más fácil es decir que es, tal como lo dicen ellos mismos, la inversa de Google Trends; mientras que en Google Trends se introducen términos para ver como varían en el tiempo, en Google Correlate es posible cargar una serie de datos y ver que términos se han movido en la misma forma que nuestros datos.
En un post anterior ya había explicado como operaba Google Trends y había mención a Google Flu, el espectacular servicio que permite ver la probabilidad de contraer gripe en una cierta zona. ¿Qué hay detrás? Simplemente Google asume que si la gente busca información sobre "síntomas de la gripe" o "remedios caseros para el resfrío" -por ejemplo- lo más probable es que esa persona esté con gripe. Entonces, si las búsquedas asociadas a la gripe crecen, entonces es más probable que haya crecido el número de personas con gripe, por ende hay más probabilidad de que yo me enferme. Esto mismo hay que llevarlo a escalas de millones de búsquedas y millones de términos. Todo este trabajo fue publicado en la revista Nature. Google Correlate opera con esta lógica, poder explorar que términos hacen relación con cierto volumen histórico de datos. Aquí está el caso para la Gripe.
También con Google Correlate también puedo buscar como se mueven en el tiempo las búsquedas de ciertos términos asociados a un término específico. Por ejemplo, si buscamos que términos están correlacionados con "pérdida de peso" nos encontramos con términos como "pérdida", "peso" y "plan para". Pero el que llama la atención es "destinos de vacaciones". O sea, cuándo aumentan las búsquedas asociadas a "perder peso" también suben las búsquedas asociadas a "destinos de vacaciones". Esto funciona en ambas direcciones (subir o bajar).
Subir datos a Google Correlate
Sin duda lo más potente es que uno puede subir su propia data. Por ejemplo, podríamos cargar una serie de datos (da lo mismo qué) donde siempre hay una aumento de los valores durante octubre. Al buscar correlaciones nos daremos cuenta de que todos los términos que también incrementan sus búsquedas en esos periodos son los asociados a Halloween. Esto es bastante trivial, pero sería muy interesante por ejemplo para una empresa que tiene aumentos de ventas en ciertos periodos y no tiene tan claro qué produce la estacionalidad.
Por último lo más entretenido: dibujar la correlación! es posible también dibujar una línea y a partir de dicha línea encontrar correlaciones. En este ejemplo dibujé una línea que cae desde el 2004 y el término que está más correlacionado con esta línea es "freehand mx". Adobe mató a Freehand hace un par de años (2007) para potenciar a Illustrator y desde el 2004 que no hay nuevas versiones.
Todo el funcionamiento y como se llegó a esto está explicado en el mismo sitio y para hacerlo más sencillo dibujaron un comic. ¿Qué gana Google con esto? Es una conversación bien larga pero en rigor mantener su ecosistema: mejores búsquedas, mejor contenido, mejor publicidad contextual, más ganancias.
Nota: El número que acompaña al término es el coeficiente de correlación de Pearson. No es mucho lo que se puede decir del valor en si mismo, sólo importa que sea cercano a 1 para hablar de una correlación positiva, o cercano a -1 para que sea negativa. 0 No hay correlación.
Comentarios
Publicar un comentario