Metamodel enterprise datamodel
Inleiding
In dit document wordt een framework beschreven voor de modellen binnen de data architectuur van een provincie. Daarmee benoemt en ordent het alle type data modellen. Dit zorgt ervoor dat data en definities van data tussen afdelingen, tussen provincies en tussen overheden beter uitwisselbaar en analyseerbaar worden. Hierdoor wordt data beter inzetbaar voor beleidsvorming en monitoring, wat uiteindelijk leidt tot een beter en effectiever provinciaal beleid voor onze inwoners.
Volgens goede data management principes en ook NORA (IMP001) is het belangrijk dat als we binnen de overheid met data werken, we de data ook modelleren in gegevensmodellen. Bij een ongestructureerde aanpak zullen deze modellen op zich staan en geen samenhangend geheel vormen. Daarom is het van belang datamodellen binnen een organisatie in een verband met elkaar te zien, waarbij de entiteiten en definities tussen de modellen zo goed mogelijk gestandaardiseerd (NAP08) en hergebruikt (IMP021) kunnen worden. Dit bevordert de interoperabiliteit van oplossingen en het principe om data en proces te scheiden (IMP030).
Voor de provincies zijn er twee belangrijke raamwerken rondom modellering. De eerste is het Metamodel Informatie Modellering van Geonovum, welke een aanbevolen standaard is. Dit metamodel bevat een hiërarchie en definities voor verschillende typen data modellen en hoe deze samenhangen.
Het tweede is het DAMA DMBOK framework en dan primair de best practices uit de kennisgebieden data architectuur en modellering. Binnen het raamwerk data governance van het IPO is namelijk gekozen aan te sluiten op dama dmbok als bron voor best practices voor de implementatie van data management.
Het interprovinciale EDM is een interprovinciaal enterprise datamodel raamwerk op basis van zowel het DAMA-DMBOK raamwerk als de MIM standaard om op te nemen in de PETRA. Hiermee zorgen we onder andere voor een goede positionering van bedrijfsobjectmodellen, conceptuele en logische modellen ten opzichte van elkaar. Binnen en tussen de provincies kan het raamwerk gebruikt worden om de data modellen logisch met elkaar in verband te brengen, zodat er een samenhangend geheel ontstaat van data modellen. En daarbij sluiten we aan op zowel de open standaard als de gekozen best practice.
Het uiteindelijke doel van een interprovinciale EDM raamwerk is dat dit het uitwisselen van data en informatiemodellen vereenvoudigt en daarmee hergebruik binnen, tussen en buiten provincies maximaliseert en data daardoor optimaal gaat bijdragen aan de provinciale beleidsvorming.
Aanpak
De volgende bronnen zijn gebruikt:
- IDA Interprovinciale Data Governance Raamwerk
- DAMA DMBOK 2e editie (hoofdstukken data architectuur en data modellering)
- Het Metamodel Informatiemodellering (MIM)
We nemen de definities van de verschillende soorten data modellen uit MIM en DAMA en brengen deze bij elkaar tot één logisch geheel. Hieruit ontstaat een hiërarchie van de verschillende typen data modellen en de relatie die zij met elkaar hebben.
Soorten data modellen
De verschillende beschikbare (architectuur)raamwerken en standaarden voor het ontwikkelen van een data architectuur hanteren in grote lijnen de volgende niveaus:
Conceptueel niveau
Op conceptueel niveau gaat het om een zo getrouw mogelijke en systeem onafhankelijke beschrijving van de werkelijkheid die wordt beschouwd (het wat). De informatiemodellen die worden opgesteld zijn voor gebruik door mensen, zodat de vakinhoudelijke specialisten (‘de business’) en de ICT-specialisten (informatievoorziening) elkaar (gaan) begrijpen. Binnen het conceptuele niveau worden (vaak) verschillende detailniveau ’s gehanteerd; organisatie breed (enterprise) en de onderverdeling in domeinen. De benodigde architectuurproducten worden opgesteld door de architectuurfunctie rollen die acteren binnen de enterprise- en domein architectuur niveaus verantwoordelijk voor het plannen en vormgeven van architectuur (doel en transitie) binnen de organisatie.
Logisch niveau
Op logische niveau wordt de vertaalslag gemaakt hoe de op conceptueel niveau geïdentificeerde concepten gebruikt worden binnen systemen (digitale registraties), systemen onderling (uitwisseling) en interactie tussen systemen en hun gebruikers. De overgang van conceptueel naar logisch niveau is die naar systeemontwerp maar is nog steeds implementatie onafhankelijk. Een logisch informatiemodel is specifiek voor een koppelvlak of keten of een bepaalde toepassing (met bijbehorende implementatie, database en interfaces). Echter de informatiemodellen op logisch niveau beschrijven nog niet de implementatie binnen de systemen en worden opgesteld voor ICT-interoperabiliteit en met name gebruikt door ontwerpers, ontwikkelaars en beheerders van ICT-voorzieningen. De benodigde architectuurproducten worden opgesteld door de architectuurfunctie rollen die acteren binnen het project architectuur (solution) niveau.
Fysiek niveau
Op fysiek niveau wordt de structuur en eigenschappen van de technologie gespecificeerd waarin de informatie wordt vastgelegd of uitgewisseld. Deze specificaties worden opgesteld voor ‘machines’, te gebruiken door softwareontwikkelaars.
Met bovenstaande niveau’s en het DAMA-DMBOK raamwerk als uitgangspunt is tot het volgende enterprise data model (model topologie) gekomen.
Opmerkingen:
Met deze niveaus onderscheiden we mate van detail tussen de modellen. Daarnaast is het ook mogelijk om mate van abstractie te onderscheiden. In dit geval zitten alle modellen op het niveau M1 uit het OMG-MOF model. Dit betekent dat het modellen zijn die concepten uit de realiteit beschrijven, wat het niveau is waar modelleurs binnen provincies normaliter op zullen werken
EDM Metadatamodel
Toelichting
- Er is een expliciet ophangpunt voor een organisatie breed bedrijfsobjectenmodel gecreëerd. Een organisatie breed bedrijfsobjectenmodel is binnen het DAMA-DMBOK raamwerk niet gedefinieerd. In het DAMA-DMBOK raamwerk wordt als eerste modelleringsniveau de opdeling in domeinen (subject area’s) gehanteerd, entiteiten komen pas aan de orde in de geïdentificeerde domeinen. Een organisatie breed bedrijfsobjectmodel is een waardevol artefact (architectuurproduct) om bedrijfsgegevens organisatie breed in hun context te zetten zodat er een gemeenschappelijk begrip ontstaat.
- Er is gekozen om systeemafhankelijkheid als belangrijke onderscheidende factor tussen het conceptuele- en logisch niveau te hanteren. Volgens bovenstaande niveau indeling valt het DAMA-DMBOK Logical Model binnen het conceptuele niveau. Dit is vanuit naamgeving perspectief verwarrend en is er voor gekozen om binnen het conceptuele niveau de term conceptueel informatie model te hanteren. Deze komt overeen met het DAMA-DMBOK Logical Model.
- Het Canoniek gegevens model wordt gebruikt om binnen een domein tussen systemen berichten uit te wisselen en is daarom binnen het domein gelijk.
- Binnen de data architectuur kunnen domeinen vanuit twee verschillende perspectieven (invalshoeken) worden geïdentificeerd:
Inhoudelijke data domeinen
Inhoudelijke data domeinen kunnen worden gezien als expertise/kennis gebieden (b.v. natuur of landbouw) los van de uit te voeren bedrijfsprocessen. De provinciale kerntaken geven een goede indicatie welke kennis en expertise nodig is voor de uitvoering van deze kerntaken en daarmee een logische eerste aanzet tot de identificatie van de verschillende inhoudelijke data domeinen.
Bedrijf data domeinen
Bedrijf data domeinen worden op basis van het PETRA bedrijfsfunctiemodel geïdentificeerd en zijn daarmee sterk proces gerelateerd en onderdeel van de business architectuur. Bedrijf data domeinen worden niet gedefinieerd vanuit de data architectuur, maar vanuit uit de business architectuur. Data architectuur geeft daarna invulling aan data en data entiteiten binnen het bedrijf datadomein.
Beide domein categorieën kunnen naast elkaar bestaan waarbij bedrijf data domeinen één of meerdere inhoudelijke data domeinen kunnen bestrijken wat betekent dat de bedrijfsfuncties en -processen gebruik maken van de gegevens uit verschillende inhoudelijke data domeinen. De bedrijf data domeinen kunnen worden gezien als verticale domeinen en de inhoudelijke data domeinen als horizontale domeinen waarmee uitdrukking gegeven kan worden hoe de data uit een inhoudelijk data domein zich horizontaal beweegt door de verschillende bedrijfsdomeinen (overeenkomstig met value chain diagrammen).
Voor de provincies is het belangrijk rekening te houden met:
- Het PETRA bedrijfsfunctiemodel en de daaraan gekoppelde bedrijf data domeinen.
- De kerntaken van de provincie en de daaraan gekoppelde inhoudelijke data domeinen.
De meeste projecten zullen te maken hebben met minimaal één bedrijf data domein en waarschijnlijk ook één of meerdere inhoudelijke data domeinen vanuit de kerntaken.
De uitwerking van de inhoudelijke data domeinen is een volgende stap bij de uitwerking van de interprovinciale data architectuur.
Binnen het DAMA-DMBOK raamwerk wordt het begrip subject area (Nederlands: domein) gehanteerd en geen expliciet onderscheid gemaakt tussen data- en business domeinen. Dit laatste uit zich door het ontbreken van aan expliciete definitie voor subject area, wel wordt een handreiking gegeven (zie pagina 107) waarop je subject area’s kan identificeren (DAM-DMBOK: discriminator principles):
- Budgettering structuur, b.v. bestaande portfolio’s (funding)
- Data governance structuur of gegevens eigenaarschap (organisational)
- Bedrijfsprocesmodel (business value chains)
- Business capabilities (enterprise architecture based)
Daarnaast kan het principe van maximale cohesie (samenhang) binnen het domein en minimale koppeling tussen domeinen worden gehanteerd.
Informatiemodellen en hun toepassingsniveaus
In onderstaande tabel zijn de verschillende informatiemodellen met daarbij de verschillende toepassingsniveaus en de verantwoordelijke rol.
Scope | Niveau | Model | Omschrijving | Mapt op | Responsible |
---|---|---|---|---|---|
Interprovinciaal | Conceptueel | Model van domeinen | Opdeling in domeinen en beschrijvingen van de domeinen. | DAMA-DMBOK: Enterprise Data Model | Enterprise Architectuur |
Interprovinciaal | Conceptueel | Model van domeinen en bedrijfsobjecten | Identificatie van de belangrijkste organisatie brede entiteiten en hun definities, toegewezen aan domeinen. | DAMA-DMBOK: Enterprise Data Model | Enterprise Architectuur |
Interprovinciaal of binnen één provincie | Conceptueel | Model van begrippen | Gegevenswoordenboek (business glossary) met begrippen, definities en eventueel onderliggende relaties. Levert definities aan conceptuele modellen. | DAMA-DMBOK: Business Glossary. MIM: Model van Begrippen. |
Data Governance |
Binnen één provincie | Conceptueel | Domein bedrijfsobject model | Belangrijke entiteiten en hun relaties binnen een domein. Definities komen uit model van begrippen. | DAMA-DMBOK: EDM Subject Area Model en Conceptueel Data Model | Domein Architect |
Projectdomein | Conceptueel | Conceptueel informatie model | Belangrijke entiteiten voor het project. Entiteiten, relaties en definities worden hergebruikt uit het domein bedrijfsobjectmodel en het model van begrippen. Attributen worden toegevoegd Entiteiten kunnen ook uit externe of overlappende domeinen worden hergebruikt (provinciaal / interprovinciaal / landelijk / Europees) |
DAMA-DMBOK: Logical Model MIM: Conceptueel Informatie model |
Business data modelleur / business data architect / business data analist |
Projectdomein | Logisch | Logisch informatie model | Toevoegen systeemafhankelijke zaken met betrekking tot digitale registraties en gegevensuitwisseling. Model blijft onafhankelijk van specifieke technologische oplossingen. | DAMA-DMBOK: Logical Data Model MIM: Logisch Informatie Model |
Data anlisten |
Projectdomein | Fysiek | Fysiek gegevens model | Data model voor fysieke opslag in systemen of communicatie tussen systemen. | DAMA-DMBOK: Physical data model MIM: Fysiek gegevens model |
Developers |
Provinciaal data domein | Fysiek | Canoniek gegevens model | Een specifiek fysiek gegevensmodel voor communicatie tussen systemen. Het is zo opgesteld dat het generiek bruikbaar is tussen vele systemen. | DAMA-DMBOK: Canonical data model | Developers / analisten |
Om uitwisselbaarheid van informatiemodellen en daarmee hergebruik te maximaliseren is naast het hanteren van dezelfde informatietopologie het ook van belang dezelfde modelleer methode te gebruiken voor de verschillenden (informatie) modellen.
Model | Modelleertaal | Opmerkingen |
---|---|---|
Bedrijfsobjectmodel | Archimate | Volgens PETRA kennismodel |
Model van begrippen | SKOS | Volgens voorstel Nederlandse standaard voor het beschrijven van begrippen |
Domeinmodel | Archimate | Volgens PETRA kennismodel |
Domein bedrijfsobjectmodel | Archimate | Volgens PETRA kennismodel Eenvoudige subset van Archimate elementen kiezen |
Conceptueel informatiemodel | UML / Linked Data | Volgens MIM standaard |
Logisch informatiemodel | UML / Linked Data | Volgens MIM standaard |
Fysiek datamodel | Afhankelijk van de opslag-technologie | |
Canoniek gegevens model | UML / Linked Data |
Voor het modelleren van het conceptuele- en logisch informatiemodel is gekozen om de MIM standaard te gebruiken. De MIM standaard wordt beheerd door Geonovum en staat op de lijst van aanbevolen open standaarden van Forum Standaardisatie