Monitorowanie jakości danych - krok 1.

0

Niezbędnym elementem wszystkich inicjatyw związanych z przetwarzaniem i analizowaniem danych jest zaufanie do danych, które w znacznej mierze uzależnione jest od ich jakości. Czy można określić jakość danych bez mechanizmów jej monitorowania? Platforma do definiowania i monitorowania jakości danych jest niezbędna praktycznie w każdej organizacji – a szczególnie tej opartej na danych (ang. data-driven organization). Zdefiniowanie, zarządzanie, wdrożenie wskaźników i mechanizmów monitorowania jakości danych jest niezbędne przed rozpoczęciem programu poprawy jakości danych. Śmiało można powiedzieć, że powinno występować również przed każdą inicjatywą związaną z podejmowaniem decyzji w oparciu o dane.

Rozwiązania SAS Data Management wspierają kompleksowo nie tylko procesy związane z integracją danych, ale również procesy monitorowania i poprawy jakości danych. Dojrzała metodyka SAS do monitorowania jakości danych mówi o 6 krokach, które należy przejść w celu wdrożenia takiego środowiska.

monitorowanie jakości danych
Rysunek 1. Metodyka monitorowania jakości danych

Krok 1. Tworzenie definicji

W celu podejścia do zagadnienia jakości danych trzeba na samym początku odpowiedzieć sobie na pytanie: do czego będą mi potrzebne dane? To właśnie realna potrzeba, czyli odpowiedź na nasze pytanie, będzie określała miejsce startu inicjatywy. Nie trzeba zaczynać od razu od wskaźników dla wszystkich systemów i dla wszystkich danych. Możemy zacząć od jednej inicjatywy biznesowej i na jej bazie określić, jakie dane będą mi potrzebne i jak one powinny wyglądać. W tym procesie warto zdefiniować:

  • właściciela biznesowego – czyli osobę (lub osoby), której dane będą potrzebne do realizacji celów biznesowych;
  • eksperta danych – czyli osobę (lub osoby), która pomoże zlokalizować odpowiednie systemy do realizacji celów właściciela biznesowego oraz będzie go wspierać w procesie tworzenia definicji.

Kiedy mamy określony jasny cel projektu i wiemy, jakie dane będą nam potrzebne oraz gdzie je wykorzystać, musimy je zdefiniować i udokumentować. Tutaj przydać się może narzędzie SAS Business Data Network.

monitorowanie jakości danych
Rysunek 2. Aplikacja SAS Business Data Network

SAS Business Data Network pozwoli nam na zdefiniowanie pojęć biznesowych i złączenie ich ze sobą relacjami. W naszym przypadku mogą to być opisy i definicje wskaźników oraz wymiarów jakości danych (np. spójność, poprawność, dokładność, dostępność, itd.), opisy systemów wraz z właścicielami danych oraz typy pól, a także ich definicja i sposoby weryfikacji. Samo narzędzie zapewnia nam, poza jednym punktem wprowadzania informacji, również mechanizmy ich kontroli oraz wersjonowania i monitorowania. Tworzenie, kasowanie czy modyfikacja pojęć w narzędziu opierać się może o stworzony przez użytkowników obieg spraw (ang. workflow). Użytkownicy mają możliwość podglądu stanu samego repozytorium w danym punkcie czasu, gdyż wprowadzone zmiany podlegają wersjonowaniu. Wszelkie zmiany mogą być automatycznie przesyłane do subskrybentów i wyświetlane im również po zalogowaniu w aplikacji www.

Kolejnym przydatnym elementem jest mechanizm połączenia świata biznesowego ze światem technicznym. W momencie kiedy użytkownicy w kolejnych krokach zaczną implementować reguły monitorowania czy poprawy jakości danych, w SAS Business Data Network będzie możliwość podłączenia technicznych procesów do konkretnych pojęć biznesowych. Dzięki temu użytkownicy będą mogli przeprowadzić kompleksową analizę, zarówno wychodząc od reguły biznesowej, jak i od konkretnego systemu. Startując od reguły monitorowania jakości danych, będzie można dowiedzieć się, jakie procesy, gdzie i przez kogo stworzone implementują daną regułę. Rozpoczynając natomiast analizę od systemu, możemy uzyskać informacje, jakie reguły są w nim zaimplementowane, jakie procesy wykorzystują dany system oraz np. jakie raporty zostały stworzone w oparciu o jego dane.

Dzięki zastosowaniu narzędzia takiej klasy jak SAS Business Data Network po wypracowaniu i wpisaniu niezbędnych informacji będzie można swobodnie przejść do kolejnych kroków, takich jak profilowanie czy implementacja reguł. Użytkownicy biorący udział w inicjatywie będą posiadali wszystkie niezbędne dane w jednym miejscu oraz będą one dla nich dostępne w przeglądarce internetowej z dowolnego miejsca w organizacji.

Share

About Author

Łukasz Leszewski

Certified Business Intelligence Professional, Business Analytics. He graduated Faculty of Production Engineering at the Warsaw University of Technology. He has been working at SAS Institute for more than 12 years as an Architect, Project Manager and Consultant. During his work, he had the opportunity to work on many projects in many different sectors like telecommunications, insurance, retail, banking and public. He has extensive experience in the area of data integration and data quality.

Leave A Reply

Back to Top