Big Data vs Small Data

Empecemos con Big Data

A menos que vivas en una cueva seguro has escuchado el término Big Data por lo menos una docena de veces, desde internet, la televisión como algo amenazando nuestras vidas o como el salvador del marketing, o quizá como algo que sólo ocupa a los banqueros o internautas.

Como probablemente puedes deducir del nombre, se trata de datos y muchos, pero, ¿cuántos son necesarios para llamarlos “Big”, cómo se miden, quién los mide, de dónde salen estos datos?. Y es aquí donde empezamos a ver lo sobrevalorado y explotado del término. Big Data habla de millones de datos, sí, millones, en volumen y en puntos de contacto. Piensa en una tabla similar a esta:

ID DE USUARIOPunto de contacto 1Punto de contacto 2Punto de contacto 3Punto de contacto 4
000000001
000000002

Donde cada ID de usuario es cada uno de nosotros, con los identificadores que nos asignan, por ejemplo si es un banco, puede ser tu número de cuenta, si es gmail o el navegador de Google es tu identificador de usuario, o el identificador de usuario del navegador. Algo más similar a esto:

ID DE USUARIOVisitas web deportesVisitas web turismoVisitas web ropa y acc.Compras de viajes Compras de ropaVisitas a cafeterías
000000012625123110
000000021325352510

Obviamente esta es una sobresimplificación, queremos resaltar “SOBRE”, pero es básicamente como funciona, ahora por las visitas a sitios web, compras y lugares que visitaron en X tiempo, podemos deducir (utilizando estereotipos, por favor no nos ataquen es sólo para ejemplificar) que nuestros usuario 01 es probablemente hombre, y usuario 02 es probablemente mujer. 

Big Data es este mismo tipo de suposiciones, pero en una escala MASIVA, millones de columnas y millones de filas. Sólo en México hay más de 60 millones de usuarios de internet. Todos. Registran. Datos.

Evidentemente se vuelve imposible para un humano poder sacar deducciones y poder encontrar correlaciones sólo con ver los números, o al menos increíblemente tardado. Entonces estos millones de datos se analizan con softwares basados en algoritmos (fórmulas matemáticas sistemáticas), para encontrar correlaciones entre los datos, por ejemplo, Google encontró que cuando los usuarios buscan un restaurante desde su celular, 18% visitan el lugar dentro de una hora.

 ¿Significa que todos los usuarios que buscan un restaurante terminan en el restaurante en una hora? No.

Como se indica en el artículo, no, sólo el 18% de las búsquedas, claro que si eres un restaurante muy posiblemente quieras aparecer como opción para ese 18% que representa millones de pesos.

No es difícil adivinar por qué empresas enormes están tan interesadas en Big Data, empresas como Wal-Mart, Amazon, Aeroméxico, Despegar, entre otros que tienen acceso a este volumen y tipo de datos.

Pero ese es el problema, se necesitan millones de datos para generar correlaciones medianamente impactantes, y aún así sigue siendo una correlación. Si no sabes que significa, por ejemplo es decir que si yo soy un vendedor de helados, debo apuntar mis anuncios a sitios de tenis, porque muchos clientes míos usan tenis. Suena absurdo, claro. Pero cuando tenemos correlaciones que estadísticamente destacan de la variación de otros datos podemos encontrar buenas formas de llegar a clientes potenciales.

Sin embargo este fenómeno está sobrevalorado, la gran, gran mayoría de empresas no tienen suficiente abanico de datos como para poderse beneficiar de tecnologías y algoritmos computarizados. Digamos, es para el 1%, si estás leyendo esto, probablemente no eres ese 1%, si es así, contrátanos 😉

Small Data

Figuras como Martin Lindstrom hablan desde la esquina opuesta, el small data como una solución más real, viable y efectiva para muchas empresas, contrario a la big data, aquí no nos enfocamos en encontrar correlaciones, sino causalidades. 

Tanto Big Data como Small Data, usan métodos científicos, o de ciencia de datos para poder extraer e interpretar la información, por ejemplo de Small Data podemos usar datos de Gogole Analytics ( y no, eso no es Big Data a menos que superes millones de hits mensuales), para tomar la decisión de poner o no una máquina de Karaoke en el bar, si vemos que nuestros usuarios buscan seguido videos de letras de canciones en YouTube.

O mejor aún, podemos determinar del todo si un canal nos sirve o no, dependiendo de si está generando ingresos y de acuerdo a nuestro objetivo.

Small Data también va más allá de lo digital, podemos levantar entrevistas cualitativas y transformar los datos en una escala cuantitativa para poder examinar cuál es la mejor aproximación a una oportunidad nueva de negocio, de marketing, del producto, del local, etc. Eso, si se hace con el rigor científico, es Small Data.

Para la gran mayoría de las empresas la solución está en los pequeños datos, no en el ente inalcanzable y sobrevalorado que es Big Data en datos que no podremos ni interpretar correctamente, o no tendremos una muestra estadísticamente significante para producir correlaciones adecuadas entre nuestros clientes.

 ¿Por dónde empezar con Small Data para mi negocio?

De la misma forma, con un poquito de ciencia, en específico, ciencia de datos, como sabemos que México no es exactamente el mejor país en ciencias en la OCDE, aquí va una galleta de memoria:

  1. Observar
  2. Hipotetizar
  3. Experimentar
  4. Validar

De la misma manera, observamos los datos, creamos hipótesis y diseñamos un experimento que me ayuda a encontrar las respuestas planteadas en la hipótesis. 

Por ejemplo, estando en una cadena de comida rápida, después de observar que todos mis usuarios se detienen en la barra del mostrador para apenas decidir la comida que se llevarán, podemos hipotetizar que si creamos tótems con ejemplos apetitosos durante la cadena de gente, podría ayudar a reducir el tiempo de espera, mejorar ticket o introducir nuevos productos durante la fila.

Ahora diseñamos cómo mediremos los nuevos productos mostrados sólo en la fila, en un puñado de restaurantes seleccionados, y de validarse, lo empezamos a repetir en todas las tiendas. Así con el cambio de color en un vestidor, una insta-pared en la tienda, en fin, en muchas otras instancias.

Ves, no es tan complicado como parece, claro que puede llegar a serlo, todo depende de qué tan profundo y la fuente de datos que quieras emplear. Claro esto es una simplificación importante de lo que hace la ciencia de datos, pero igual puede ser tremendamente complejo y calcular tasas de precio variable, según corresponda tu modelo de negocio y la cantidad de datos que generes en determinado tiempo.

Te aconsejamos empezar por tus clientes: 

  1. Mapea el viaje del cliente con tu marca.
  2. Define los puntos de contacto, y enfócate en uno, vamos a mejorar ese único punto de contacto en específico.
  3. Encuentra una forma de medir eficiencia y/o calidad en ese punto de contacto, así como de cada uno de los procesos que se tengan.
  4. Haz una hipótesis, de preferencia con datos cualitativos cuantificados basados en la experiencia de tu personal que tiene contacto con el cliente, y por supuesto, de los clientes mismos.
  5. Haz pruebas, de todo, desde la experiencia, las ventas y la posventa. 

¡Mucho éxito!