En muchas ocasiones, el término Big Data es empleado genéricamente para referirse a la recolección y análisis a gran escala de grandes cantidades de datos. Sin embargo, en SAS contemplamos la definición de este concepto más allá del procesamiento de datos masivos y lo consideramos relativo al contexto y situación de negocio sobre el que se esté manejando el término. En este sentido prácticamente cualquier empresa puede tener retos de Big Data cuando intentan generar Valor de su información y se ven rebasados por el Volumen, Velocidad y/o Variedad de sus datos.
Tomando como ejemplo la información generada en redes sociales, actualmente todas las empresas pueden acceder de forma gratuita a grandes cantidades de información tanto propia como de su competencia, sin embargo el verdadero reto es cómo obtener información valiosa de estos datos considerando que se generan a alta velocidad, son datos no estructurados (textos libres) y por lo tanto se requieren de capacidades analíticas particulares para poder analizar el contexto y sentimiento de los comentarios.
Lo mismo sucede con la información que reciben las empresas de sistemas transaccionales en tiempo real, en este contexto, es un reto el aplicar analítica conforme la información se va moviendo ya que se requieren algoritmos optimizados que ofrezcan tiempos de respuesta inmediatos.
Encontramos asimismo que muchas empresas tienen información almacenada que no ha sido explotada hacia el negocio y que termina por generar un costo en lugar de un ingreso.
En este sentido podemos decir en un Proyecto de Big Data las empresas deben enfocarse en las 4 “V”s: Volumen, Variedad, Velocidad y Valor.
Volumen: La visión estratégica en cuanto a cómo se deben manejar los volúmenes de información, no debe ir encaminada hacia obtener y analizar la mayor cantidad posible de datos, sino a contar con los volúmenes adecuados que permitan extraer conocimiento ya sea de forma integral o segmentada por el departamento en donde esa información se requiera, tan acotada como sea necesaria. En este sentido los volúmenes de datos recomendados en los análisis son dictados por el tipo de estrategia de negocio a implementar. No necesariamente, más es mejor.
Velocidad: Es importante considerar los tiempos internos para la toma de decisiones y para la ejecución de acciones al evaluar los tiempos en los que los datos deben ser analizados. En este sentido, la visión estratégica no debe ir enfocada a analizar todos los datos transaccionales en tiempo real, sino a realizar un análisis previo para identificar cuáles son los eventos que en realidad deben ser analizados en tiempo real y que en combinación con información previamente recopilada aportan un mayor valor al negocio. No es útil analizar todo en tiempo real sin filtrar los triggers relevantes y sin considerar el lag entre el análisis y la ejecución de acciones.
Variedad: Los datos recolectados pueden ser estructurados o no estructurados con formatos y perfiles complejos. Cada tipo de datos requiere de un acceso, transformación y análisis particular para poder extraerles valor. Previa su explotación es importante definir las estrategias de negocio en la que cada tipo de dato aportará y asegurarse que se cuentan con los mecanismos adecuados de análisis, intentando crear un roadmap de madurez en el que cada vez se puedan ir incorporando estructuradas más complejas siempre que estas aporten al negocio.
Valor: El punto más importante para afrontar los retos asociados con el Volumen, Variedad y Velocidad de los datos es que éstos son valiosos únicamente si son analizados y si se puede mostrar el impacto que su análisis genera en los objetivos estratégicos de las empresas. De no ser así, las estrategias de acceso y recolección e información pueden llegar a representar costos operativos.
Para que una compañía logre cubrir de manera efectiva los retos del Big Data, se debe partir de una definición específica de los objetivos de negocio que se pretenden alcanzar mediante la explotación de la información y se debe hacer un análisis para definir los volúmenes y variedad de datos necesarios así como la velocidad con las que se deben realizar los análisis para que la toma de decisiones sea oportuna y relevante.
Desde el punto de vista tecnológico dependiendo de dichos componentes de volumen, variedad, velocidad y valor es necesario contar con plataformas analíticas y de gestión de datos integradas que cubran con las necesidades de seguridad, acceso, preparación, integración, análisis y monitoreo de cada proyecto de Big Data.
A partir de la definición de las estrategias de negocio y las plataformas tecnológicas, las compañías tienen además la responsabilidad de asegurarse que cuentan con los perfiles adecuados para el análisis de información y de establecer procesos internos confiables y repetibles que permitan retroalimentar los procesos de toma de decisión.