GEGEVENSMANAGEMENT DEEL III
Brilbeer in de dierentuin van Wenen, de enige beer die van nature in Zuid Amerika voorkomt. Leeft op grote hoogte in vochtige bossen.
- Op een gegeven moment is Telecom ‘content’ gaan leveren. En de doelstelling ‘leveren van content’ wordt ondersteund door de doelstelling “leveren van telecommunicatie’ en is dus “hoger”.
- Telecom was altijd al een bedrijf, maar onderdeel van de overheid. Er was daarmee steeds een doelstelling “maken van winst”. Voor de verzelfstandiging was dat aspect voor het bedrijf zelf niet van het hoogste belang. De winst ging naar de staat en die bepaalde hoeveel ruimte er op de rijksbegroting was voor het investeren in Telecom. Daarna is het gewicht van deze doelstelling sterk toegenomen, en dat was ook de bedoeling; Telecom moest zijn investeringen zelf gaan financieren, teneinde aan de de behoefte van de markt te gaan voldoen. Toen Telecom als onderdeel van KPN, naar de beurs ging werd dat gewicht nog veel groter.
Om het een en ander toe te lichten een globaal plaatje als introductie tot de methode van de Modellencyclus. Later gaan we er uitgebreider op in.
Als eerste een paar uitgangspunten:
Gegevens worden gezien als een neerslag van feiten.
Deze feiten zijn het onderwerp van een Universe of Discourse; dat wil zeggen een aantal betrokkenen spreekt met dezelfde doelstelling over een bepaald onderwerp, en onderkent daarom deze feiten in dat onderwerp.
- Het eerste is het Objectmodel waarmee geregistreerd wordt waarover de feiten gaan.
- In het Semantisch-model wordt vastgelegd wat we over die feiten willen weten
- Het Logisch datamodel legt vast hoe we datgene wat we over die feiten willen weten gaan registeren.
- Het Fysieke datamodel legt dat wat we gaan registreren vast in een database notatie, hierbij kunnen om implementatie redenen nog bepaalde data worden toegevoegd.
Bij gegevensmanagement houden we ons vooral bezig met de eerste drie aspecten. Het Fysieke datamodel ontstaat in het project in samenwerking met de databaseadministrator; een functionaris van de automatiseringsafdeling.
Een essentiële stap die we niet over het hoofd mogen zien is dat het steeds over een type gaat. Bijvoorbeeld bij het maken van het objectmodel nemen we feiten over objecten waar. Vervolgens onderkennen we, gestuurd door de doelstellingen, typen. En we registreren de objecttypen! De stap van object naar objecttype gebeurt doordat de taal ons daartoe dwingt; we hebben geen woord voor “dat beestje met veren daar”, maar we hebben het over die vogel. Ook in de andere modellen hebben we het steeds over typen, of over een exemplaar van een type.
Voor het Semantisch-model gaan we uit van objecttypen; die daarmee entiteittypen worden en onderzoeken wij welke beweringen
<HIERO>
In de buitenste ring staan de FEITEN. Die buitenste ring staat voor wat ik in het voorafgaande wel Het Universe Of Discourse heb genoemd. Daar bevinden zich mensen die betrokken zijn bij het onderwerp waarvoor we een model gaan maken, die gestuurd door gemeenschappelijke doelstellingen een zakelijke discussie voeren over dat onderwerp.
Een simpel voorbeeld NATUURLIJK-PERSOON.
We volgen de discussie en constateren dat het woord ‘natuurlijk-persoon’ gebruiken, wellicht te onderscheid van een ‘rechtspersoon’; en dat ze daar kennelijk gewoon een ‘mens’ mee bedoelen. We hebben dan voor het Objectmodel: Een NATUURLIJK-PERSOON is een mens
(Dit is een zogenaamde terminale definitie; voor een gegevensmodel van een supermarkt is ‘is een mens’ voldoende. Maar als je bezig zou zijn met evolutie van de mens uit zijn voorouders dan kom je daar niet mee weg, en moet je bijvoorbeeld besluiten tot ‘is een Homo erectus’ , of ‘een Homo sapiens’ )
Vervolgens beluisteren wat ze over die natuurlijke personen zeggen: {nogmaals het is een heel simpel voorbeeld}. Ze hebben over de geboortedag en ede geboortedatum van natuurlijke personen. Dergelijke uitspraken zijn beweringen, en horen thuis in het Semantisch-model:
NATUURLIJK-PERSOON is geboren op LOCATIE.
NATUURLIJK-PERSOON is geboren op DATUM.
(Beweringen zijn logische expressies aansluitend bij natuurlijke taal. Beweringen moeten falsifieerbaar zijn; ze moeten ook onwaar kunnen zijn)
Hiermee hebben we de betekenis uit dit voorbeeld te pakken. In de volgende twee modellen gaat het om de vorm en de representatie. In het semantisch model hebben we drie types NATUURLIJK-PERSOON, LOCATIE en DATUM. In het logisch datamodel ligt de vraag voor hoe gaan we de individuele voorkomens van deze types; de tokens, vormgeven?
Dit gebeurt met zogenaamde aanduidingstypen, waarmee voor voor bepaalde toepassingen de ‘grammatica’ van de tokens wordt gegeven.
DATUM: (eejjmmdd)
Voor de beide andere aanduidingstypen bestaat een NEN-norm. Een standaard vaak gerelateerd aan een internationale standaard:
NATUURLIJK-PERSOONSNAAM; NEN 1888 Algemene Persoonsgegevens.
LOCATIE: ADRES-NEN5825.
In de beide NEN-normen staat precies beschreven hoe Algmenene Persoonsgegevens en Adressen opgebouwd mogen zijn. Dergelijke normen staan in het BedrijfsGegevensModel, zie hieronder, en een gegevensmodel voor een bepaalde toepassing zal gewoonlijk een keuze uit die normen gemaakt worden. Binnen die normen is het vaak mogelijk te kiezen voor een volledige en een korte variant. (Postcode huisnummer voor adres bijvoorbeeld).
In het logisch datamodel voor een bepaalde toepassing wordt ook nog de redundantie teruggebracht door door het model in een normaalvorm te gieten.
In het fysiek datamodel wordt de opslag door de opslag met technische middelen geoptimaliseerd.
De beide laatste punten: normaalvorm en technisch optimaliseren spele geen rol in het BGM.
BedrijfsGegevensModel (BGM)
Het bleek al gauw dat we bezig waren met de vierde poging om bij Telecom tot een succesvol gegevensmanagement te komen, en dat de verwachting was dat we toch wel binnen een jaar met een aanzet tot een BedrijfsGegevensModel moesten komen. Zo een (BGM) wordt gemaakt volgens dezelfde methode als een ‘gewoon’ gegevensmodel voor een bepaalde toepassing, maar het dient een ander doel, en daarom liggen de accenten bij het modelleren anders.
Een ‘gewoon’ gegevensmodel is bedoeld om te leiden tot een database voor een bepaalde toepassing. Het BGM dient om de samenhang tussen de gegevens van het primaire proces van het bedrijf expliciet te maken. En daarmee richting aan de informatisering van dat primaire proces te geven. De gegevens uit zo een ‘gewoon’ datamodel worden beoordeeld of ze vooral van lokaal belang zijn voor de onderhavige toepassing; of dat ze een duidelijke rol spelen in een primair bedrijfsproces. In het laatste geval komen ze in aanmerking om opgenomen te worden in het BGM.
Er zijn in totaal 5 versies van een BGM uitgebracht: de eerste is van 1988, en de laatste is van 1994. De eerste uitgave telde 75 pagina’s, de laatste 287.
<HIERO>
In het BGM houden we ons vooral bezig met:
- Het Objectmodel: Hier vind je de definitie van de belangrijkste zaken (objecttypen) uit de voornaamste bedrijfsprocessen. Er is een sterke samenhang tussen de definities. Ze staan gegroepeerd in werkgebieden zoals personen, producten & middelen, infrastructuur, … .
- Het Semantisch Model. Hierover vinden we in het BGM het belangrijkste wat we over de bovengenoemde zaken als we ermee geconfronteerd worden zouden willen weten. Zoals wat ze belangwekkend maakt en waaraan we ze zouden kunnen herkennen.
- Het Logisch Gegevensmodel valt buiten het BGM. Maar bij het maken van een logisch model worden veel aanduidings-typen geïntroduceerd. Bijvoorbeeld AANTAL, ADRES, DATUM, PERSOONSNAAM. Deze aanduidings-typen lenen zich goed voor standaardisatie binnen het bedrijf, maar ook nationaal en zelfs internationaal. Daarom zijn deze wel binnen het BGM opgenomen met eventueel een standaard.
- Een Fysiek datamodel speelt geen rol in het BGM.
————————————
Werkwijze
Comments
Post a Comment