Hal Varian, profesor emérito de la Haas School of Business, experto en microeconomía y economía de la información y, desde el año 2002, Chief Economist de Google, dijo hace unos años:
«En diez años, el trabajo más sexy será el de los estadísticos: La capacidad de recoger datos, comprenderlos, procesarlos, extraer su valor, visualizarlos, comunicarlos serán todas habilidades importantes en las próximas décadas. Ahora disponemos de datos gratuitos y omnipresentes. Lo que aún falta es la capacidad de comprender estos datos y extraer su valor«. En un futuro cercano se notará cada vez más la necesidad de un «científico de los datos«, una nueva figura profesional de la sociedad de la información. Un científico que no sólo tendrá que ser capaz de «rebuscar» entre los datos, sino que también deberá contar con competencias en varias disciplinas (derecho, sociología, psicología) y un buenos conocimientos de cultura popular, habilidades comerciales y creatividad.
Esa capacidad de recuperar información de fuentes heterogéneas y correlacionar los datos entre ellos, de hecho, requiere de habilidades de pensamiento lateral, así como de pensamiento lógico. Se trata de un conjunto de competencias y conocimientos que podría ser difícil de encontrar en un solo individuo. Anjul Bhambhri, vicepresidente de Big Data Products para IBM, dijo sobre esta nueva profesión: «Un científico de los datos es una persona curiosa, capaz de observar los datos e identificar tendencias. Es casi como una hombre del Renacimiento, que realmente quiere aprender y lograr un cambio en la organización«.
Estos «hombres del Renacimiento», son figuras clave en las organizaciones de la nueva era. No se trata simplemente de estudiosos que están solos y van por libre, de histriones que basan exclusivamente en la intuición y el talento personal cualquier posible progreso, y tampoco de esclavos de los modelos matemáticos. Son personalidades complejas, perfectamente encajadas en un sistema dilatado, donde pasan cosas y viven personas a las que hay que dirigir en ese mar de información. Los «científicos de los datos» son recolectores y transmisores de inputs, que enriquecen el ambiente de trabajo en el que se insertan. Son profesionales con excepcionales habilidades y conocimientos técnicos, pero que, al mismo tiempo, viven perfectamente integrados en la realidad y el contexto en el que operan y que hacen de la empatía el filtro principal de sus análisis sistémicos. Dominan los números, pero, sobre todo, conocen a los seres humanos.
Desde finales de los años 50 se habla de «Business Intelligence», indicando con esta expresión tanto los procesos, como las herramientas utilizadas para obtener la información necesaria para que una organización pueda planificar una estrategia capaz de incrementar su ventaja competitiva en el mercado. Cuando la información es fiable, exacta y completa, para una empresa es una fuente de valor. Por lo contrario, una información que sea insegura, incompleta, imprecisa o analizada fuera de su contexto puede convertirse en un elemento de inestabilidad, ya que podría dar lugar a una decisión basada en suposiciones incorrectas y, por lo tanto, generar resultados diferentes de los deseados.
La evolución natural de la Business Intelligence es, por tanto, el Big Data Analytics: herramientas, procesos y, sobre todo, la capacidad de analizar, relacionar y contextualizar grandes cantidades de datos heterogéneos entre ellos, ya que sólo una vez que se hayan interconectado, estos datos podrán otorgar una información de inestimable valor. Big Data, en suma, es todo lo que no puede ser tratado y analizado con los paradigmas tradicionales, extraídos de las bases de datos relacionales, debido a que se trata en su mayoría de datos no estructurados y que, por lo general, se conservan a través de una arquitectura distribuida.
En la actualidad, aunque enfrentarse al Big Data represente un desafío para el mundo de las organizaciones, y debido también a la magnitud de la inversión necesaria para implementar una infraestructura tecnológicamente preparada para este nuevo paradigma, los límites principales a la gestión y análisis del Big Data no dependen de la tecnología en sí misma sino, sobre todo, de las altas y multiformes competencias que estas nuevas figuras profesionales deben tener.
De hecho, los avances en la tecnología han proporcionado la oportunidad de desbloquear el «tesoro» escondido y enterrado bajo esta masa de información desordenada. Pero hacen falta sofisticados algoritmos capaces de extraer del Big Data las constantes que se repiten, las correlaciones ocultas que a primera vista pueden escapar. Hacen falta, en otras palabras, profesionales con habilidades a medio camino entre las matemáticas, las de análisis de la inteligencia artificial y con un alto conocimiento del contexto en que se realiza el análisis de datos.
Al principio, las organizaciones participaban en el mundo del Social Media casi por fatalismo, es decir, porque todo el mundo lo hacía y parecía una inversión sin gasto. Por lo tanto no importaba mucho el beneficio que se podía sacar. La segunda ‘ola social’ ha sido la relacional. Los social media estaban vistos por las organizaciones como ‘facilitadores de las relaciones’ con el cliente potencial. Durante los últimos tres años se ha producido un salto ulterior, con una visión del social media más claramente orientada al negocio. Gatorade, Dell, Intel en los EE.UU. han creado unos Social Media command center, mientras que los KPI y los analytic relativos a los social media han sido objeto de numerosas reflexiones y aplicaciones en términos de modelos de valoración.
Por fin, un proceso que había sido hasta el momento lineal, encontraba su realización en una unión entre el aumento constante de disponibilidad de datos procedentes de las interacciones on-line y la capacidad de analizarlos, algo que, sin embargo, por muy rápido que avance no estaba (y sigue sin estar) a la altura del crecimiento exponencial de los datos a analizar.
Las fuentes del Big Data:
A pesar de que la explosión de la información digital sea un episodio bastante reciente, es conveniente tener en cuenta que al enorme volumen del Big Data también contribuyen una variedad de datos e información acumulados en el tiempo, a veces con fines completamente distintos del mero análisis. Las fuentes de origen del Big Data por lo tanto son diferentes, pero reconducibles a algunas principales macro-categorías:
Información people to machine: Se trata, hoy en día, de la fuente de la mayoría de los datos acumulados, originados incluso mucho antes de la formulación del concepto de Big Data. Se trata principalmente (especialmente para la información ya acumulada) de datos transaccionales, es decir, de datos asociados con una transacción (por ejemplo, la compra de un bien o servicio) y que fueron almacenados originalmente sólo para fines de contabilidad y no para propósitos analíticos. Sin embargo, este tipo y cantidad de información ha llamado la atención de las funciones de marketing de las empresas, que fueron las primeras en empezar a pensar en aprovechar estos datos para realizar el perfil de sus clientes y de su comportamiento, con el objetivo de componer una oferta cada vez más alineada a las necesidades del cliente.
Información people to people: Se trata de información que surge de las interacciones humanas, que se producen cada vez más en formato digital a través de las redes sociales. La información que viaja en el medio digital deja una pista, lo que da lugar a las prácticas de «social listening«, o sea, de escucha de las redes sociales. El social listening ha permitido recopilar con mayor fiabilidad un conjunto de información que antes no era posible, o muy difícil, recuperar de forma tradicional, con cuestionarios, entrevistas o focus group. La posibilidad de cruzar e integrar esta información con la acumulada por los sistemas transaccionales mencionados anteriormente, permite a las empresas enriquecer aún más la conciencia del «sentiment» de la audiencia.
Información machine to machine: Se trata de datos recogidos por los sensores y transmitidos a otros dispositivos para diversos fines, como informar al usuario o automatizar ciertos procesos. Muchos objetos de uso común, tales como electrodomésticos, calzado, automóviles, integran en su interior algún sistema para el registro de ciertos eventos y su envío a otros dispositivos. Uno de los ejemplos más representativos es el sensor puesto en el interior de los zapatos deportivos de una famosa compañía del sector que permite enviar a nuestro smartphone toda una serie de información que, debidamente analizada y procesada, permitirá planificar un programa de entrenamiento calibrado en base a las características individuales de cada usuario.
A todo esto hay que añadir todos los datos recogidos y acumulados en formas más tradicionales, básicamente representadas por las base de datos de empresa (los archivos de las organizaciones) y de la pública administración.
¿Qué es el Big Data?
El concepto de Big Data trae consigo una serie de características, todas ellas relacionadas entre sí de diversas maneras, y que se pueden resumir en el paradigma de las tres V: volumen, velocidad, variedad.
Volumen: tal vez sea la característica más inmediata, ya que hablamos siempre de grandes cantidades de datos. Para tener un marco de contexto, podemos pensar que cada minuto en el mundo se envían 100.000 mensajes de Twitter, se ponen 35.000 «Me gusta» en las webs oficiales de las organizaciones, se envían 200 millones de e-mails y se hacen 2.000 check-in en 4square. Todo esto, sumado a las restantes actividades «digitales», da lugar a una asombrosa cantidad de datos que permite, al menos potencialmente, poseer un montón de informaciones que a su vez se pueden cruzar entre ellas. Es evidente que los ‘martketeers’ son los profesionales más atraídos por el potencial de este flujo de datos, pero también la política.
Velocidad: se refiere al Big Data bajo diferentes puntos de vista. En primer lugar, la velocidad con la que se generan los datos, en segundo lugar, la velocidad con la que las nuevas tecnologías permiten acceder a estos datos (aunque con arquitecturas distribuidas y estructuras de datos complejas) que a veces roza el acceso en tiempo real. La velocidad de acceso a los datos y a la información conduce a una mejora en la velocidad del proceso de toma de decisiones, uno de los elementos más críticos para mantener un alto nivel de competitividad en la actual situación del mercado. Consideremos, por ejemplo, la ‘monitorización’ del ‘sentiment’ de la opinión pública: una empresa podrá adoptar en un lapso muy breve las medidas correctivas o preventivas para reducir o prevenir un episodio de crisis.
Variedad: como ya se ha señalado, los datos por la mayoría no están estructurados y por lo tanto no se pueden abordar con las técnicas tradicionales de las bases de datos relacionales. En otras palabras, los datos ya no pueden ser colocados en tablas, porque se encuentran en forma no estructurada (correo electrónico, imágenes, audio, vídeo). Los algoritmos más avanzados tienen la capacidad de analizar datos no estructurados procedentes de diversas fuentes, con una precisión media de 93% – 97%.
Además de estas tres fundamentales, existen otras ‘V’, que determinan la importancia del Big Data. Entre ellas, la viralidad, es decir la capacidad de un dato de expandirse de manera rápida y a larga distancia y la variabilidad, o sea le relevancia del contexto. De hecho, el valor de un dato no se encuentra sólo en sí mismo, sino que está estrechamente relacionado con el contexto en el que se produce.
Finalmente, todas estas características se pueden resumir con una sola «V»: el Valor. De hecho, es la capacidad de entender y gestionar adecuadamente todos estos aspectos del Big Data que permite extraer su valor.
Conclusiones
• El mercado que gira en torno al Big Data está en fuerte crecimiento y expansión. 5 mil millones son los teléfonos inteligentes utilizados en 2010. 30 mil millones los contenidos compartidos en Facebook cada mes.
• Los datos han asumido cada vez más importancia en el desarrollo de los negocios y en las organizaciones. Su uso es cada vez más relevante y clave en los escenarios de evolución de las empresas.
• El Big Data crea valor de muchas maneras diferentes, cuando se usa correctamente y se comprende. En concreto:
- o El Big Data permite una mayor transparencia y una mejor utilización de la información. Si los datos llegaran a ser transparentes y al alcance de todos se beneficiarían muchos sectores (por ejemplo, el sector público).
o Los datos son fundamentales para mejorar el rendimiento y comprender mejor el contexto en que se mueven las organizaciones.
o Los datos nos ayudan a entender mejor a nuestros clientes y a nuestro público. A través de los datos podemos anticipar las necesidades y escuchar de una manera más activa las demandas de los consumidores, convirtiendo la escucha en estrategias de acción concretas. El Big Data también es útil para la segmentación.
o Automatizar el proceso de toma de decisiones y hacerlo más simple. Con el uso de algoritmos que pueden facilitar el análisis del contexto, es posible facilitar en gran medida los procesos de ‘decision making’ y de ‘problem solving’ dentro de las organizaciones.
o Proporcionar nuevas ideas para los procesos de innovación participada.
Pero este es un viaje que acaba de comenzar. Actualmente, a la mayoría de las empresas no les interesa realmente hacer actividad de Big Data, les interesa aprovechar las redes sociales para llegar a las personas a las que quieren llegar. Les interesa aprovechar el tamaño Big Data normalmente representado por Facebook o Linkedin y utilizar los mecanismos de advertising que estas realidades son ahora capaces de expresar. En resumen, las empresas utilizan el social media con la misma lógica con la que hoy en día se usan los recursos de Google. Al revés, aprovechar las redes sociales como fuente de datos, a fin de desarrollar una propia estrategia de marketing, sigue siendo sobre todo teoría, impulsada principalmente por el hecho de que ya existen los requisitos tecnológicos para poner esa teoría en práctica.
Sin embargo, este es también el momento en que, para una pequeña vanguardia de grandes empresas visionarias, la medición comienza a convertirse en estrategia y el monitoring se hace parte integrante de la forma de pensar de la sociedad. Se empieza a otorgar mayor importancia al análisis de las redes que surgen de las conversaciones, a sus implicaciones de carácter ‘netnografico’ y, en general, a las potencialidades que el Big Data ofrece en la observación y predicción del comportamiento de los usuarios.
El Social Media Intelligence puede, finalmente, convertirse en un productor de sentido. Un sentido que parte de los datos y de las relaciones creadas por el Social Media y que va hacia las estrategias corporativas para influenciarlas.
Para llegar a esto nos hacen falta ‘Científicos de los datos’, que puedan aportar sus capacidades al proceso de innovación de las organizaciones.Las empresas hoy más que nunca necesitan de innovación y de creatividad. En 1946, el ingeniero y científico ruso Genrich Altshuller se dio cuenta de que la evolución de los sistemas tecnológicos no es un proceso al azar, sino que se rige por leyes objetivas. Sobre la base de estas intuiciones, comenzó un estudio en profundidad que pretendía extrapolar los caminos lógicos que habían permitido la creación de las soluciones más ingeniosas e innovadoras. Trabajando en el Departamento de patentes de la Marina Militar rusa, Altshuller tuvo la oportunidad de analizar el resultado final de la creatividad de innumerables inventores: la patente. A partir del análisis estadístico de las patentes más innovadoras, pudo iniciar un trabajo de sistematización y estructuración, que sentaba las bases de una metodología para la solución de los problemas tecnológicos. La idea era extraer conocimiento utilizable de forma genérica (es decir, independientemente del sector de origen) desde una valiosa base de datos de información tecnológica. Un Big Data de la innovación.
Uno de los principales logros obtenidos por Altshuller fue el de haber racionalizado los resultados de los análisis estadísticos en un método coherente que, como tal, podía ser enseñado. Los Leonardo Da Vinci seguirán siendo únicos y probablemente irrepetibles, pero con un método estructurado, también un grupo de personas con valores normales de creatividad podrá generar ideas altamente innovadoras. Si a todo esto asociamos la posibilidad de aprovechar y descifrar una cantidad nunca vista antes de datos, podremos vislumbrar claramente el futuro de las organizaciones.
Por Catalina Pons Y Andrés Raya