Niezbędnym elementem wszystkich inicjatyw związanych z przetwarzaniem i analizowaniem danych jest zaufanie do danych, które w znacznej mierze uzależnione jest od ich jakości. Czy można określić jakość danych bez mechanizmów jej monitorowania? Platforma do definiowania i monitorowania jakości danych jest niezbędna praktycznie w każdej organizacji – a szczególnie tej opartej na danych (ang. data-driven organization). Zdefiniowanie, zarządzanie, wdrożenie wskaźników i mechanizmów monitorowania jakości danych jest niezbędne przed rozpoczęciem programu poprawy jakości danych. Śmiało można powiedzieć, że powinno występować również przed każdą inicjatywą związaną z podejmowaniem decyzji w oparciu o dane.
Rozwiązania SAS Data Management wspierają kompleksowo nie tylko procesy związane z integracją danych, ale również procesy monitorowania i poprawy jakości danych. Dojrzała metodyka SAS do monitorowania jakości danych mówi o 6 krokach, które należy przejść w celu wdrożenia takiego środowiska.
Rysunek 1. Metodyka monitorowania jakości danych
Krok 1. Tworzenie definicji
W celu podejścia do zagadnienia jakości danych trzeba na samym początku odpowiedzieć sobie na pytanie: do czego będą mi potrzebne dane? To właśnie realna potrzeba, czyli odpowiedź na nasze pytanie, będzie określała miejsce startu inicjatywy. Nie trzeba zaczynać od razu od wskaźników dla wszystkich systemów i dla wszystkich danych. Możemy zacząć od jednej inicjatywy biznesowej i na jej bazie określić, jakie dane będą mi potrzebne i jak one powinny wyglądać. W tym procesie warto zdefiniować:
- właściciela biznesowego – czyli osobę (lub osoby), której dane będą potrzebne do realizacji celów biznesowych;
- eksperta danych – czyli osobę (lub osoby), która pomoże zlokalizować odpowiednie systemy do realizacji celów właściciela biznesowego oraz będzie go wspierać w procesie tworzenia definicji.
Kiedy mamy określony jasny cel projektu i wiemy, jakie dane będą nam potrzebne oraz gdzie je wykorzystać, musimy je zdefiniować i udokumentować. Tutaj przydać się może narzędzie SAS Business Data Network.
Rysunek 2. Aplikacja SAS Business Data Network
SAS Business Data Network pozwoli nam na zdefiniowanie pojęć biznesowych i złączenie ich ze sobą relacjami. W naszym przypadku mogą to być opisy i definicje wskaźników oraz wymiarów jakości danych (np. spójność, poprawność, dokładność, dostępność, itd.), opisy systemów wraz z właścicielami danych oraz typy pól, a także ich definicja i sposoby weryfikacji. Samo narzędzie zapewnia nam, poza jednym punktem wprowadzania informacji, również mechanizmy ich kontroli oraz wersjonowania i monitorowania. Tworzenie, kasowanie czy modyfikacja pojęć w narzędziu opierać się może o stworzony przez użytkowników obieg spraw (ang. workflow). Użytkownicy mają możliwość podglądu stanu samego repozytorium w danym punkcie czasu, gdyż wprowadzone zmiany podlegają wersjonowaniu. Wszelkie zmiany mogą być automatycznie przesyłane do subskrybentów i wyświetlane im również po zalogowaniu w aplikacji www.
Kolejnym przydatnym elementem jest mechanizm połączenia świata biznesowego ze światem technicznym. W momencie kiedy użytkownicy w kolejnych krokach zaczną implementować reguły monitorowania czy poprawy jakości danych, w SAS Business Data Network będzie możliwość podłączenia technicznych procesów do konkretnych pojęć biznesowych. Dzięki temu użytkownicy będą mogli przeprowadzić kompleksową analizę, zarówno wychodząc od reguły biznesowej, jak i od konkretnego systemu. Startując od reguły monitorowania jakości danych, będzie można dowiedzieć się, jakie procesy, gdzie i przez kogo stworzone implementują daną regułę. Rozpoczynając natomiast analizę od systemu, możemy uzyskać informacje, jakie reguły są w nim zaimplementowane, jakie procesy wykorzystują dany system oraz np. jakie raporty zostały stworzone w oparciu o jego dane.
Dzięki zastosowaniu narzędzia takiej klasy jak SAS Business Data Network po wypracowaniu i wpisaniu niezbędnych informacji będzie można swobodnie przejść do kolejnych kroków, takich jak profilowanie czy implementacja reguł. Użytkownicy biorący udział w inicjatywie będą posiadali wszystkie niezbędne dane w jednym miejscu oraz będą one dla nich dostępne w przeglądarce internetowej z dowolnego miejsca w organizacji.