Antes que el data management existiera como lo conocemos actualmente, la información generada en las empresas era depositada y centralizada en un solo lugar, el denominado enterprise data warehouse (EDW).
Los EDW´s han sido de gran utilidad sobre todo para datos estructurados, transaccional e internally generated. Sin embargo, el big data se ha convertido en la razón principal para generar otro repositorio de información, el data lake.
Data lake es una poderosa fuente de almacenamiento que se alimenta de información nativa sin importar su origen, ya sea semiestructurada o no estructurada, no transaccional, un evento conducido o bien generada de forma externa.
Sin embargo, la centralización de información antes de la era del data management actual, presentaba algunas importantes ventajas, la principal su ubicación, ya que era solamente un lugar en el que las empresas deberían invertir para almacenar su información y al que podían acudir cuando esta era requerida.
Claramente, este enfoque estaba basado en el supuesto que los usuarios se encontrarían dentro de un mismo centro de gestión de información, en donde podrían recabarse los datos, no obstante, actualmente el escenario es distinto, los usuarios tienen una gran cantidad de fuentes alternativas de datos, tanto dentro como fuera de la empresa. Aspecto que vuelve obsoleta la concentración de información desde un solo punto físico.
¿Cómo manejar los datos para impulsar su gobernabilidad y calidad?
Gracias a este nuevo reto de movilidad de información que las empresas enfrentan diariamente,
hoy en día la alternativa es mover los datos a un concentrador de administración (no físico) para que estos puedan procesarse de forma ideal, lo cual implica crear servicios periféricos donde los datos puedan alojarse, por ejemplo, en la nube, base de datos, memoria, etc.
Dicho aspecto planteaba en el pasado grandes preocupaciones sobre los sitios que eran creados para albergar la data, pero a lo largo de la última década, la industria de software de data management o gestión de datos ha cambiado este paradigma y ofrece un modelo de entrega y despliegue orientado a servicios desde múltiples puntos de acceso no limitados a un espacio físico determinado.
De esta forma, cuando los datos se albergan en diversos repositorios antes de ser administrados se encuentran disponibles para los usuarios en el mismo punto en donde fueron colocados, situación que mejora tanto la usabilidad de la data como la eliminación de la sobrecarga de capacitación sobre cómo usar nuevas aplicaciones e interfaces hacia el equipo operativo.
A su vez, esta nueva forma de data management evita posibles desconexiones entre los datos generados de origen y los que finalmente llegaban a su destino final para ser analizados, de esta forma puede asegurarse la gobernabilidad y calidad de los mismos, a mayor centralización, no dependiente de un punto físico, mayor rentabilidad en la gestión de información.