Data Governance s Microsoft Purview nasazovala v CETINu Adastra
Od pilotní implementace až po reálný byznys dopad
systémů v IT prostředí společnosti
tabulek automaticky katalogizovaných v Microsoft Purview
Výzva
Zavést data governance v prostředí s vysokou mírou legacy bez paralyzující složitosti
Cílem CETINu nebylo vytvořit teoretický model data governance napříč celou firmou. Takový přístup by znamenal víceletý program s nejistou přidanou hodnotou. Klíčovou výzvou bylo:
- získat přehled o datech, která CETIN skutečně používá pro reporting a rozhodování,
- sjednotit význam klíčových byznysových pojmů,
- zvýšit transparentnost datových toků bez masivní manuální dokumentace,
- ověřit, že data governance je v takto komplexním prostředí realizovatelná a dlouhodobě udržitelná.
Řešení
Microsoft Purview jako řízený pilot data governance
Po vyhodnocení dostupných možností zvolil CETIN nástroj Microsoft Purview, který by se stal základem pro data governance s možností dalšího rozšiřování. Rozhodujícími faktory byly poměr ceny a funkčnosti a přímá návaznost na Azure, kde běží datový sklad.
Adastra nasadila Microsoft Purview jako řízený pilot v BI doméně a integrovala ho do stávající IT infrastruktury CETINu v souladu s bezpečnostními a provozními standardy společnosti.
V rámci MVP (Minimal Viable Product) jsme nastavili automatizované skeny klíčových cloudových i on-prem datových zdrojů napojených na datový sklad. Purview dnes automaticky katalogizuje přibližně 8 000 tabulek včetně jejich struktury a vazeb na analytickou vrstvu.
Součástí řešení byla i metodická podpora BI týmu, který se naučil systematicky dokumentovat Power BI reporty a spravovat je jako datové produky (Data Products) určené k dlouhodobému používání.
Business Glossary a datoví stewardi: Jednotný jazyk pro data napříč BI
Zásadním přínosem řešení je sjednocení významu dat. CETIN zapojil vybrané doménové experty do role datových stewardů, kteří v Microsoft Purview vytvořili Business Glossary pro své oblasti.
Výsledkem je jednotná definice klíčových pojmů jako jsou služby, objednávky nebo KPI, které byly dříve interpretovány rozdílně. Tím se odstranily opakované nejasnosti při vyhodnocování výsledků a reporting získal pevný významový základ.
Data lineage: Transparentní původ dat bez plošného mapování celé firmy
CETIN se záměrně vyhnul plošnému mapování všech datových toků napříč organizací. Zaměřil se na kritické domény a klíčové reporty.
Pro podporované datové zdroje poskytuje Microsoft Purview column-level data lineage, která může ukazovat, odkud data pocházejí, jakými transformacemi procházejí a jak se promítají do výsledných reportů. Bohužel technologie Azure Synapse není v CETINu používána způsobem, ze kterého Purview informace o data lineage dokáže získávat. Proto Adastra v rámci dostupných projektových kapacit připravila alespoň prototyp načítání lineage z metadat definice DWH transformací.
Výsledky
Funkční data governance s reálným dopadem
Díky nasazení Microsoft Purview má CETIN:
- funkční základ data governance integrovaný do svého IT prostředí
- automatizovaný datový katalog bez nutnosti rozsáhlé ruční dokumentace
- sjednocený výklad klíčových byznysových pojmů prostřednictvím Business Glossary
- přehled o původu a transformacích dat pro klíčové BI reporty
- BI tým schopný spravovat reporty jako datové produkty (Data Products) a podporovat self-service vyhledávání dat pro business
Microsoft Purview se v CETINu stal praktickým nástrojem pro každodenní práci s daty, nikoli dalším izolovaným systémem. Vytvořil pevný základ pro další rozšiřování data governance a pro ambici společnosti posunout rozhodování více směrem k datům.






