Big Data, Medium Data, Thick Data y experiencia humana

¿Por qué hablar de una Thick Data (información densa, etnográfica) cuando parece que la Big Data es la solución a (los) problema de la humanidad en un mundo globalizado?

La Big Data es el nombre que se ha dado a una nueva generación de datos que se incorporan al mundo digital de manera masiva. El volumen de estos datos es inmenso, pero, deben procesarse a velocidades formidables. Ahí empieza el reto de la Big Data y ahí se distingue de los sistemas informáticos habituales que han estado generando, almacenando, analizando y visualizando datos a otras magnitudes y velocidades. Los que hablan de Big Data son las Agencias Nacionales de Seguridad, como la ANS en los US, las grandes corporaciones como Microsoft, Google, eBay, Amazon, Facebook, los bancos y entidades financieras, las grandes ciudades, los grandes proyectos científicos como el del genoma humano, la meteorología o el rastreo del espacio. Se diría que la Big Data es la herramienta que utiliza el mundo globalizado para globalizarse cada vez más.

Pero hay otros que también hablan de Big Data en una escala no (tan) global. Son todos aquellos que generan o acceden nuevos tipos de datos procedentes de la Internet de las Cosas y sus aparatos inteligentes (Smart Technologies) y necesitan procesar la información en tiempo real para dar feedback a los usuarios. Se trata de emprendedores, empresas tecnológicas que, por ejemplo, crean plataformas o apps para móvil, o wearables y todo tipo de sensores que detectan cambios en el estado de las cosas o fenómenos y generan multitud de datos. La naturaleza de esta información no es la misma que la de la Big Data, sin embargo, emplean el término porque se ha popularizado y tiene cierto atractivo comercial. Y, como responde a una necesidad real de conocer al usuario, al consumidor o al ciudadano para tomar decisiones con mayor conocimiento de causa, se ha creado un entorno en el que la Big Data significa más que Data pero menos que la Big Data de las grandes multinacionales. Es decir, se le podría llamar una Medium Data y así habría un poco más de realismo y un poco menos de pretensión. En común con la Big Data tendría el hecho de que no se analiza una muestra de los datos, sino la totalidad, y que se analizan en tiempo real. Otra característica que compartiría la Medium Data, aunque no siempre, sería que fusionan datos de distinta naturaleza (texto, imagen, video, audio). La diferencia la hallaríamos en el volumen de datos que manejan y la complejidad del análisis que hacen de los datos. Pero, un problema común a ambos es el la veracidad de los datos. ¿Sobre qué datos se lleva a cabo el análisis? ¿Qué datos son estos? ¿Son suficientes para garantizar un conocimiento de lo que sucede al otro lado del mundo digital? Los datos cuantitativos proporcionan información sobre determinados fenómenos, por ejemplo, sobre la trazabilidad de la conducta de un usuario dentro de una plataforma que, al cruzar datos, pueden prioporcionar una cierta predictibilidad. Pero, ¿hay alguna manera de conocer mas a pesar de la Big Data y la Medium Data? ¿Se podría se más veraz?

Etnografía y Thick Data

La relación entre la estadística y la etnografía no es de oposición, sino de complementariedad. La estadística proporciona datos numéricos, cuantitativos, sobre distribución de conductas o de declaraciones de una población determinada. La etnografía, en cambio, proporciona información contextual. El trabajo de campo etnográfico es intensivo. Observa sobre el terreno, entrevista a los informantes en profundidad, participa activamente de las actividades de la comunidad para empatizar con sus miembros y comprender su experiencias e interpretaciones y, a veces, los confronta activamente con situaciones y escenarios retadores para entender mejor cómo piensan las personas y qué razones dan a su conducta. La estadística busca explicaciones mientras que la etnografía busca comprender, interpretar y, en definitiva, introducirse en el mundo de los conceptos, significados y experiencias vividas por las personas y que emplean para dar sentido a sus vidas. A este sentido los antropólogos le llaman cultura y, en este sentido, explican los fenómenos sociales utilizando el término cultura; culturas ingenieras, culturas informáticas, tecnoculturas, cultura del trabajo, de la eficiencia, del ocio o cultura de las setas cuando la información que proporcionan tiene que ver con la organización, las relaciones, los objetos y el sentido de esta práctica recolectora. Para conocer y entender las culturas los antropólogos acostumbran a utilizar una de sus herramientas favoritas, la etnografía. ¿Cómo pueden cooperar la estadística, los sistemas complejos y la etnografía?

La difusión de la Internet de las Cosas con su innumerables apps que registran la actividad humana está introduciendo un tipo de conocimiento sobre el cuerpo y la conducta que nunca antes se había tenido a disposición. La geolocalización permite mapear el desplazamiento y la permanencia de los cuerpos en el espacio y el tiempo. Los sensores corporales pueden captar y registrar señales del cuerpo humano de manera continua y registrar sus cambio, incluso los cambios de humor pueden ser monitorizados. Pero ¿Qué se puede hacer con todos estos datos? física social como propone Alex Pentland en su libro Social Physics? ¿Un mundo mejor como proponen Nathan Eagle y Kate Greene en su libro Reality Mining? ¿Incrementar las ventas? ¿Disminuir riesgos? ¿Economizar energía? ¿Recomendar oportunidades o tendencias? ¿Prever escenarios o desenlaces problemáticos? ¿Predecir crisis sanitarias? ¿Tomar decisiones? ¿Ser más eficientes o productivos? ¿Educar, comunicar o socializar mejor? ¿Lograr una política más transparente? En la actualidad abundan las promesas sobre las bondades y posibilidades de la Big Data y sus analíticas de un mundo smart(izado).

Sin embargo, desde el punto de vista de la comprensión de la experiencia humana, a la Big Data y mucho más a la Medium Data, le falta algo. La Big Data y la Medium Data debería estar contrapesadas por una Thick Data, por una información ‘densa’ en el sentido que le dio Clifford Geertz en The Interpretation of Cultures. Una cosa es tener la posibilidad de, por ejemplo, trazar la experiencia humana pero otra es entender relacionar los datos numéricos y las visualizaciones con significados. Los análisis de la Big y la Medium Data deben ser interpretados y, para ayudar a ello, la información numérica debería ser correlacionada con información con rostro y voz humana, con información ‘densa’ (Thick Data) que proporcione otros sentidos a los datos analíticos. Podemos, por ejemplo, monitorizar a un grupo de excursionistas y trazar sus desplazamientos y permanencias en el transcurso de una travesía. ¿Cómo explicamos sus cambios de ritmo? ¿Por qué en un determinado lugar, si seguían una ruta señalizada, cambiaron de dirección? ¿Se perdieron, fueron a ver alguna cosa o fueron a esconder un tesoro? ¿Por qué había zonas por las que transitaban tan lentamente sin que fuera subida o bajada? ¿Acaso estaba enfangado el terreno? ¿Acaso había animales sueltos y tenían que avanzar con precaución? ¿Acaso estaban recogiendo castañas del suelo? ¿Buscaban setas? ¿Insectos? ¿Muestras de tierra? ¿Acaso alguien se había lesionado y demoraba el grupo? ¿O había niños jugando? Estas experiencias cotidianas, contrariamente a lo que se podría pensar, no son infinitas, pero, para conocerlas hay que documentarlas sobre el terreno. Hay que reunir información etnográfica que, por lo menos al principio de los usos de una aplicación de tales características proporcione pistas sobre cómo interpretar los datos analíticos. Una vez los analistas dispongan de una ‘cartera de interpretaciones’, podrán releer la información proporcionada por este tipo de aplicaciones y, dado el caso, sabremos si hay que enviar a un equipo de rescate o encontrarnos con ellos a una determinada hora en el restaurante que hay al lado de un santuario cercano al final del camino. 

Por lo tanto, aquí hay una tarea de antropólogos y tecnoantropólogos por hacer. La Thick Data proporciona a los emprendedores insights acerca de los usos reales de sus aplicaciones, plataformas y aparatos inteligentes. Con lo cual, la Thick Data acaba proporcionando una ‘cartera’ o ‘banco’ de explicaciones que pueden ayudar a los interpretes de las analíticas de la Big y Medium Data a añadir una dimensión significativa a sus analíticas. Por otro lado, y llevando la etnografía un poco más allá de la simple descripción contextual, se pueden recopilar requerimientos específicos que hacen los usuarios de tales tecnologías durante su uso.

Artículos de interés

Burrell, Jenna (2012) The Ethnographer’s Complete Guide to Big Data: Small Data People in a Big Data World (part 1 of 3). En Ethnography Matters. Disponible en http://ethnographymatters.net/blog/2012/05/28/small-data-people-in-a-big-data-world/

Wang, Tricia (2013) Big Data Needs Thick Data. En Ethnography Matters. Disponible en http://ethnographymatters.net/blog/2013/05/13/big-data-needs-thick-data/

Nova, Nicolas (2013): Ethnomining and the combination of qualitative & quantitative data. En Ethnography Matters. Disponible en http://ethnographymatters.net/blog/2013/04/02/april-2013-ethnomining-and-the-combination-of-qualitative-quantitative-data/ 

Madsbjerg, Christian And  Rasmussen, Mikkel B. (2014) The Power of ‘Thick’ Data Businesses need to know how a product or service fits into the emotional lives of their customers. En The Wall Street Journal. Disponible en http://www.wsj.com/articles/SB10001424052702304256404579449254114659882