¿Es posible predecir cuánto va a cotizar el dólar mañana? ¿Quién va a ganar el mundial? ¿O quién será el próximo presidente? En los últimos años, la irrupción del big data creó una concepción de que “los datos lo pueden con todo”. No obstante, para Walter Sosa Escudero, profesor plenario de la Universidad del San Andrés (UdeSA), todavía quedan algunos desafíos por delante para que la nueva revolución industrial sea realmente un hecho.
“Contrario a lo que la gente cree, big data no son todos los datos. Porque la toma de decisiones, las valuaciones políticas, requiere de comparar escenarios contrafácticos. Tenemos los datos de cómo nos fue con la cuarentena que llevamos a cabo, pero no de cómo hubiese sido si se implementaba otra. Esto, justamente, está detrás de cualquier razonamiento que involucre la toma de decisiones, tanto en el sector público y privado”, inició.
Especializado en econometría y estadística aplicada en cuestiones sociales, Sosa Escudero abrió el quinto capítulo de Inteligencia Artificial, organizado por LA NACION, que fue transmitido por Youtube, LN+ y las redes sociales del diario. Durante el panel “Qué ‘esconden’ los números, para qué sirven y qué hacemos con ellos”, el experto explicó por qué big data tiene una serie de dificultades con “datos importantísimos” para la toma de decisiones.
“El segundo desafío tiene que ver con que big data ni siquiera es mucha información. Son muchos datos, pero que no se traducen en mucha información. ¿Por qué? Porque los datos no tienen ninguna estructura y tienen muchísima dependencia, son muy heterogéneos. Big data no es un fenómeno de más de lo mismo”, remarcó.
Tiempo atrás Xiao-Li Meng, profesor estadístico de Harvard, planteó sobre la paradoja de big data. A pesar de la abundancia de datos provenientes de las redes sociales y sus interacciones, fue difícil predecir la llegada de Donald Trump en la política. Tampoco que el próximo Papa sería argentino.
“Justamente porque esos millones de datos no son una versión aumentada de una encuesta, sino datos fuertemente dependientes. Eso atenta contra los objetivos de forma simple de usar datos para estudiar fenómenos complejos, como el resultado de una elección”, completó.
Incluso un censo, como el que llevó la Argentina este año, pareciera obsoleto en plena época de big data. Pero cuando de estadística social se trata, Sosa Escudero resaltó que hace falta un acuerdo. Para medir el PBI, la pobreza o la población no solo basta con un ejercicio algorítmico, sino que también el estudio sea validado por toda la sociedad. “Dotarlo de confianza”, dijo.
Finalmente, el experto hizo hincapié en que hay ciertos fenómenos que son de una naturaleza esencialmente impredecible. Donde los datos tienen poco qué decir. Incluso escenarios como “cuánto va a estar el dólar” se vuelven difíciles de predecir, porque son situaciones estratégicas y quedan ajenas al comportamiento de los algoritmos. Es más, los pronósticos pueden terminar afectando al comportamiento y hacer, por ejemplo, que el blue suba.
“Big data es un fenómeno de datos nuevos, no son los mismos que teníamos antes, es información de otro tipo. El desafío que tenemos es no mirar los datos de big data como si fuese una versión explotada de los viejos datos, como las encuestas y las planillas de Excel. Son datos distintos, que reclaman inteligencia que haga un uso eficiente, inteligente -valga la redundancia- y responsable de esa lluvia de información. Con esos desafíos posiblemente vayamos a hacerle preguntas a los datos, pero no de manera trivial”, cerró.