¿Big Data Grande?

Ande o no ande … ¡BIG DATA GRANDE!

Dice el refranero español que Ande o no ande, caballo grande. Se emplea este refrán “para encarecer algo por su gran tamaño. Se dice también para ridiculizar a quien hace ostentación de algo, ignorante de que no todo consiste en las mayores dimensiones de lo adquirido o poseído. Critica a los que eligen lo de mayor tamaño sin considerar si es lo mejor” (ver CVC). Si esto siempre ha tenido su reflejo en el mundo de los negocios, con el Big Data adquiere un irónico doble sentido: Ande o no ande, ¡Big Data Grande!

Es evidente y palpable la polarización de opiniones que existe entorno a las tecnologías Big Data: tiene su más fieles adeptos … pero también sus detractores. Personalmente me encuentro entre los adeptos, pero soy consciente de los peligros que entraña (cuestiones éticas sobre algunas aplicaciones aparte) el que se esté abusando del término, siendo muchas veces usado más por los departamentos de marketing que de producción.

Caballo grande

Big Data Grande

En fechas recientes he asistido a diferentes eventos relacionados con Big Data y la llamada Industria 4.0 (no perderse el fabuloso y didáctico artículo de Julio Aliaga al respecto). Precisamente esa marketinización (si se me permite la palabra) del término está alimentando una serie de falacias:

  • El Big Data es para las grandes empresas (para jinetes grandes)
  • El Big Data es caro (caballo caro)
  • No se puede estimar el Retorno de la Inversión (ROI) del Big Data (qué beneficios le voy a sacar a tener un caballo)

Gran parte del problema es que hay empresas que se han subido al carro de la moda del Big Data ofreciendo tecnología, no soluciones a los problemas de sus clientes. Como si fuera un mercado: póngame medio kilo de Hadoop, tres MongoDBs y un par de litros de Cassandra. Mal vamos. Obviamente estoy ironizando, pero me he encontrado casos de empresas que dicen no empezar a usar el Big Data porque no saben por qué tecnología decidirse (sic).

Tecnologías como el Big Data son un medio, no un fin. Lo verdaderamente importante es identificar los problemas que quieres resolver.

Desmitificar que el Big Data no es solo para las grandes empresas, o que es caro, requeriría varios artículos. Pero ya que estamos a vueltas con caballos, sirvan un par de símiles

  • Un jinete pequeño puede, sin ninguna duda, montar un caballo grande. Más aún, cuanto menos pesa el jinete, mayor ventaja competitiva que tiene en una carrera, a igualdad de condiciones entre caballos. Por cierto, los niños son excelentes jinetes. Y, para los más pequeños, un pony es una excelente opción de diversión.
  • Si quieres disfrutar de los caballos, puedes gastarte todo el dinero que quieras, pero hay opciones para todos los gustos y presupuestos. Puedes tener tu propio caballo y cuidar y alimentar al animal. O puedes pagar para que lo tengan en un club de hípica y se encarguen de ello (sin duda una opción más barata). O puedes no tener tu propio caballo pero sí disfrutar de la doma en un club: el Caballo as a Service 🙂

¿Big Data Grande?

Lo que a nadie en su sano juicio se le ocurriría hacer es comprar un caballo y una finca para tenerlo sin haber montado jamás. Salvo para presumir. Presumir de tonto, claro.

Volviendo al terreno del Big Data, no todos los problemas son realmente Big Data, y pueden abordarse con otras tecnologías. Pero, si empezamos por la tecnología, terminaremos creyendo que nuestro problema es Big Data.

Podemos terminar con un pura sangre para dar una vuelta a los niños por el huerto del abuelo. O con un pony para ganar la carrera de Ascot (¡y sin sombrero hortera incluido!)

Lo cual nos lleva a la cuestión del retorno de la inversión. Los grandes proyectos de Big Data requieren de un análisis del ROI muy detallado, en escenarios muchas veces inciertos. Y tal análisis debe acompañar necesariamente al planteamiento del proyecto. Y si el análisis del ROI es complejo, entonces es mejor empezar por un escenario sencillo.

Start small con Big Data

Algunos consejos sencillos para iniciarse en proyectos Big Data:

  • Es recomendable empezar por plantear un problema sencillo, acotado, pero que aporte valor: que optimice un proceso, reduzca un riesgo o unos costes, … No querer resolver todo de golpe. Como suele decirse, hay que ir partido a partido.
  • Olvida inicialmente el proceso de recogida de datos y céntrate en los que ya tengas. Aunque parezca paradójico, la dificultad está en el tratamiento, el análisis de los datos. En el extraer de ellos la información que se busca. La recogida y depurado de datos, siendo una cuestión delicada e importante, puede abordarse más adelante. Y el propio análisis del problema será quien te marque los requisitos de disponibilidad y calidad de los datos.
  • Empieza prototipando, no industrializando. Empieza con una selección de datos, representativa en calidad y cantidad, y analiza el problema. Puedes usar herramientas clásicas de análisis estadístico (incluyendo librerías de algoritmos) para analizar el problema. El llevarlo a un contexto de Big Data, con herramientas y plataformas específicas, puede venir después. Nuevamente, el prototipo te permitirá escalar adecuadamente el problema y fijar sus requisitos.
  • Si no tienes los medios o los conocimientos, contrata a un tercero. E, insisto, que no te vendan tecnología a peso. Busca a alguien que sepa entender tu problema, dimensionarlo adecuadamente y resolverlo.

Conclusiones

Espero haber desmitificado algunas de las falacias que rodean al mundo del Big Data. No es solo para los grandes, ni es (necesariamente) una solución cara. Pero sí requiere una inversión, que estará justificada en base al retorno esperado. Y la mejor manera de eliminar incertidumbres es empezar poco a poco. Sin querer resolver todos los problemas de golpe. Con visión de futuro pero realismo a la vez. Starting small with Big Data.

Y no obsesionarse con la tecnología que irá detrás. La tecnología es el medio, no el fin. Lo realmente importante es que el caballo ande, no que sea grande.

Dicho lo cual cierro una bonita trilogía sobre caballos (caballos  muertos y caballos negros, para ser más precisos). O quizás no. A caballo regalado … ¡Ups!

3s comentarios

¡GRACIAS POR COMENTAR!