Estamos ante la era del Big Data y las modernas soluciones que existen actualmente en el mercado hacen cada vez más fácil manejar los grandes volúmenes de información. Sin embargo, vale la pena preguntarnos, ¿son necesarios tantos datos? En otras palabras, si su solución de analítica puede organizarlos, consolidarlos y salir invicta dentro este entorno de Big Data, ¿eso significa que estas nuevas herramientas de información pueden lograrlo con cualquier fuente de datos? La respuesta es un no rotundo.
Steve Mellgren, arquitecto de soluciones de SAS, piensa que gracias a que existen estas herramientas capaces de todo, hay una tentación natural por soltar los datos a estas herramientas y esperar a ver qué sale. No obstante, para obtener el valor real, es necesario hacer algo más que simplemente dejar sus datos en manos de un software y esperar a que salga un informe automático.
Por ejemplo, aspectos como la calidad, el diseño y la estructura de un reporte deberían importarle y esto no es sólo responsabilidad de la solución con la que usted cuente. La preparación de los datos es parte fundamental y por eso Mellgren propone algunos pasos que deben ser considerados como punto de partida para sacar el mayor provecho de su información antes de visualizarla en un informe.
- No use columnas innecesarias. Aveces usted conserva los datos de determinada manera, sólo porque vienen de la fuente original así. Analice muy bien sus datos para entender cuáles le aportarán valor y cuáles no.
- Reduzca la distancia entre un campo y otro. Aveces las casillas quedan largas debido a que se ajustan a la longitud del dato más grande. Analice qué puede hacer con estas cifras y sí es necesario mostrarlas completas.
- Iguale el conjunto de datos para poder combinar filas. La dispersión de sus datos puede afectar negativamente el rendimiento y aumentar el tamaño de los datos cuando son escasos. Haga que sus datos estén al mismo nivel.
- Trasponga datos desde filas a columnas. Algunas soluciones no sólo le ayudan a visualizar e informarse sobre los valores, sino que integran un análisis muy sofisticado tal como la previsión, los árboles de decisión y las correlaciones. Ubicando estos datos en columnas permite un análisis más sofisticado.
- Reduzca la “cardinalidad” si es posible. Como la alta cardinalidad puede disminuir el rendimiento, es buena idea revisar cuáles datos tienen alta cardinalidad pero no la requieren y reducirla al mínimo.
El poder, la velocidad y la agilidad de soluciones como SAS Visual Analytics le ofrecen la capacidad de visualizar y explorar grandes cantidades de datos. Si bien la preparación de los datos no parece necesaria en todos los casos, implementándola siempre, usted incrementará la calidad y reducirá el tamaño de sus datos. Por último, no utilice estos pasos como un checklist, sino como un punto de partida para ayudarle a manejar sus datos. Si le pareció útil este post, no se quede con él, compártalo y ayude a los demás en su viaje por la visualización de datos.
2 Comments
Pingback: Payday loans
Excelente visión de manejo de la Big Data, sin embargo el proceso de manejo de grandes cantidades de datos traspasa el esfuerzo a la máquina. Lo anterior está perfecto, pero siento que se está trabando el pensamiento estratégico que te lleva a el por qué se hacen las cosas. Creo que el Big Data, debe ser utilizado con responsabilidad puesto que no tendrá las respuestas de tus preguntas si ni siquiera sabes que desconoces.
Big Data es lo que se viene, pero no dejemos de tener presente que hoy ya podemos hacer un Pre-Big Data en nuestras mentes para sacar el mejor provecho a esta nueva tecnología.
Agradezco el punto de vista y el respeto a las diferentes visiones que se presentan.
Un abrazo.