Dane w przedsiębiorstwie mają coraz większe znaczenie i coraz większą wartość. Wzrasta potrzeba dbania o ich jakość i bezpieczeństwo. Wyzwaniem staje się umiejętność czerpania z danych możliwie największych korzyści biznesowych. W tych obszarach szczególną rolę odgrywają rozwiązania klasy Data Management.
Rozwiązanie klasy Data Management, które jest w stanie zaadresować potrzeby całej organizacji, musi posiadać co najmniej cztery zasadnicze cechy.
Po pierwsze, powinno umożliwiać dostęp szerokiego spektrum systemów przechowujących dane w różnych technologiach, czy to będą relacyjne bazy danych w dowolnej technologii, systemy wspierające zarządzanie przedsiębiorstwem (ERP), Hadoop, serwisy webowe, czy strumień danych. System Data Management powinien umieć pobrać dane z jednego miejsca i umieścić je w innym.
Po drugie, powinno udostępniać narzędzia, które zapewnią użytkownikom kontrolę i poprawę jakości danych, umożliwią właściwe połączenie danych z różnych źródeł oraz ich profilowanie pod potrzeby konkretnego biznesowego projektu.
Po trzecie, powinno zapewnić przejrzyste zarządzanie dostępem do danych, w zgodzie z procedurami wymaganymi przez organizację i w zgodności z obowiązującym prawem.
I po czwarte, powinno umożliwić delegacje procedur wymienionych w punkcie dwa i trzy do lokalizacji, w których znajdują się dane, bez konieczności przemieszczania ich z jednej lokalizacji do innej.
Rys.1. System Data Management klasy Enterprise
To oznacza możliwość kontroli jakości, łączenia i profilowania danych bezpośrednio w źródle, czyli w bazach danych czy systemach przechowujących nieustrukturalizowane dane, jak Hadoop. Wysiłki zmierzają więc do tego, aby:
systemy klasy Data Management i systemy wykorzystujące dane bezpośrednio w biznesie wykorzystywały ten sam język komunikacji – prosty i zrozumiały w użyciu dla użytkownika biznesowego,
umożliwiały łączenie danych zlokalizowanych w przedsiębiorstwie z danymi z chmury czy danymi w ruchu, jak to ma miejsce w przypadku IoT, a także:
umożliwiały prosty wybór lokalizacji, gdzie połączone dane mają być przetworzone do celów biznesowych, czyli na przykład czy powinny być analizowane w spoczynku, w dedykowanych aplikacjach biznesowych, czy też raczej jakiś fragment istotnych dla procesu danych powinien na bieżąco zasilać strumień danych operacyjnych, aby umożliwić adekwatne decyzje w czasie rzeczywistym, zwłaszcza w czasach rosnącej roli IoT.
Pozostawienie takich decyzji w rękach użytkowników biznesowych, a przynajmniej demokratyzacja i zrównanie w dostępie do informacji użytkowników biznesowych i IT ma w dzisiejszych czasach kluczowe znaczenie.
Najważniejsze trendy w dziedzinie Data Management
Samodzielny dostęp i przetwarzanie danych.
Zarządzanie i przetwarzanie danych w chmurze.
Spójna, firmowa polityka ochrony danych.
Metody kognitywne w zarządzaniu danymi.
Rosnąca różnorodność i ruchliwość danych.
Spójrzmy na najważniejsze trendy, które zdominowały obszar Data Management. Idea, która zyskała najliczniejszych i najgłośniejszych orędowników, to self‑service. Użytkownicy (obecni i aspirujący, którzy w przeszłości nie mieli dostępu do tej klasy systemów z powodów technicznych) chcą uzyskać większą niezależność od swoich bardziej zaawansowanych kolegów. W tym samym tonie wypowiadają się menedżerowie: większa swoboda w przygotowaniu i wykorzystaniu danych przez nietechnicznych użytkowników to oczywiste zwiększenie efektywności i produktywności.
Drugim istotnym głosem w dyskusji na temat przyszłości rozwiązań Data Management jest zarządzanie danymi w chmurze. Jest wiele rozwiązań dedykowanych, które w pełni adresują potrzeby użytkowników Microsoft Azure czy Amazon Web Services, ale w przypadku, gdy dane znajdują się w wielu lokalizacjach, a użytkownik chciałby zastosować rozwiązanie hybrydowe i w świadomy sposób decydować, czy przenosi wszystkie dane do chmury, aby zastosować procedury Data Quality, czy realizuje te procedury w miejscach, gdzie dane są składowane, to wciąż obszar, który nie został do końca zaadresowany.
W obliczu nowych regulacji europejskich (RODO – Rozporządzenie o Ochronie Danych Osobowych – data wejścia w życie 1 lipca 2018), gwarantujących klientom dostęp do informacji, które ich bezpośrednio dotyczą, przygotowanie i zapewnienie jasnego, klarownego przekazu – „czy i w jaki sposób moje dane są zabezpieczone, kto i w jaki sposób ma do nich dostęp, w jaki sposób są powiązane z danymi przechowywanymi w innych zbiorach” – ma fundamentalne znaczenie nie tylko z punktu widzenia przestrzegania prawa, ale jest istotne dla utrzymania partnerskich i transparentnych relacji z klientami.
Coraz większa popularność sztucznej inteligencji i systemów kognitywnych wzbudza falę pytań i oczekiwań, w jakim stopniu rozwiązania klasy Data Management są w stanie zaadaptować nowe technologie i wesprzeć użytkowników w zarządzaniu danymi, na przykład poprzez proaktywną weryfikację jakości i spójności dostępnych zbiorów danych oraz sugestie co do najbardziej efektywnych kroków poprawiających kompletność i użyteczność biznesową dostępnych zbiorów.
I w końcu rosnąca różnorodność i ruchliwość danych. Jest to o tyle ważna, że przy rosnącej liczbie źródeł danych, ich różnorodności i tempie w jakim napływają, organizacje nie mogą sobie pozwolić na proste zwiększenie zatrudnienia, nie tylko ze względów kosztowych, ale z powodu niedoboru odpowiednich specjalistów na rynku. Dlatego potrzebne są nowe technologie Data Management, zwiększające efektywność zarządzania zróżnicowanymi danymi i to nie tylko w formie dodatkowych, niszowych funkcjonalności, ale jako podstawowe cechy funkcjonalne głównego nurtu. Z badań IDC wynika, że do 2020 roku aż 70% firm zamierza w istotny sposób rozszerzyć zakres wykorzystywanych danych ze szczególnym uwzględnieniem nietradycyjnych technologii, takich jak Hadoop, bazy danych typu noSQL czy dane w ruchu, w strumieniu.
Ten tekst jest częścią projektu How to do IT. To twój sprawdzony przewodnik po cyfrowej transformacji i technologiach dla biznesu. Zapisz się na newsletter projektu!