GEGEVENSMANAGEMENT DEEL III

Brilbeer in de dierentuin van Wenen, de enige beer die van nature in Zuid Amerika voorkomt. Leeft op grote hoogte in vochtige bossen.

GEGEVENSMANAGEMENT DEEL III Beta 05

De Communicatiebehoefte van een Bedrijf/Organisatie

De hele informatie-problematiek van een bedrijf of instelling kun je uitdrukken met drie vragen:

1: Wat voor zakelijke informatie wisselen mensen in en rond het bedrijf met elkaar uit?

Alles wat rond een bedrijf gebeurt is het gevolg van afspraken tussen mensen. Ook als een computer van het bedrijf constateert dat een voorraad onder een bepaalde limiet is gekomen, en een signaal stuurt naar de computer van de leverancier om bij te bestellen, dan is dat het gevolg van een contract tussen beide partijen. (Als mechanisme is dit geen uitvinding uit het informatietijdperk, het waterleidingbedrijf doet dit al 175 jaar met een voor dit doel uitstekend signaleringssysteem: de waterleidingdruk)

2: Hoe realiseer je de acties waartoe een bedrijf zich daarbij verplicht.

Het gaat daarbij om welke “zaken van waarde” (geld, goederen, diensten) worden overgedragen aan een partij buiten het bedrijf.

Alle informatie die je daarbij naar derden stuurt valt onder (1). De informatie rond alle activiteiten die je intern voor die overdracht opstart valt ook onder (1). Het overdragen zelf heeft echter een juridisch en financieel aspect, en daar ligt de grens tussen (1) en (2).

Het maakt in het geheel niet uit of je bij bepaalde activiteiten computers of andere machines inschakelt. Het inschakelen van een computer is, in laatste instantie, ook het communiceren met een mens.

Indien die machine van iemand anders is, bijvoorbeeld een ATM (Automatic Transaction Machine: flappentap), dan heb je met die andere partij een afspraak hierover gemaakt. Gebruik maken van die machine is een uitvloeisel van die afspraak. De bediening van die machine is ook communicatie: via de ontwerper van het interface, en de exploitant die verantwoordelijk is voor het apparaat.

3: Wat voor middelen gebruik je om (1) en (2) te faciliteren.

De zakelijke informatie-uitwisseling en datgene wat je intern moet communiceren om de acties waartoe je je verplicht te realiseren vormt de communicatiebehoefte. De communicatiestructuur is het geheel aan middelen dat je gebruikt om de communicatie te faciliteren.

Als je alleen naar de effectiviteit en niet naar de efficiëntie kijkt, dan kun je (1) en (2) realiseren zonder informatiesystemen. Als iedereen naar iedereen brieven stuurt, en voor de acties die je moet realiseren ook pakjes bezorgd worden, of medewerkers op pad worden gestuurd om ergens activiteiten te gaan verrichten, dan kun je een effective oplossing voor (1) en (2) hebben. Dan verzorgt de Post de communicatiestructuur.

Een klant schrijft naar het bedrijf wat hij wil. De directeur geeft deze brief aan de accountmanager die schrijft brieven naar de magazijnmeester en de chef monteur en zo voorts. Ooit deden we het zo, hoewel we natuurlijk vooral veel zaken mondeling regelden.

Terwille van de efficiëntie verzin je iets beters; dit gaat te langzaam en is te duur. Je verzint bijvoorbeeld een aanvraagformulier voor de klant. Dat kan de accountmanager aan de klant sturen, en het ingevulde exemplaar aan magazijnmeester en chef monteur.

De prijs die je hiervoor betaalt is dat je de communicatie rond (1) en (2) in een keurslijf wringt. Je dwingt de klant de vrije tekst uit een brief om te zetten in rubrieken op een formulier; het worden gestructureerde gegevens.

Daarnaast ga je om tijd te winnen de formulieren niet per post, maar als fax of E-mail versturen. We onderscheiden daarmee twee soorten middelen:

3A: Logische middelen, zoals de onderkende rubrieken op formulieren om de communicatie te structureren, en

3B: Technische middelen: zoals een fax, E-mail. En ook databases, daarmee kun je tijd overbruggen, en ook een historie opbouwen.

Als je de communicatie ook nog regelt door databases met elkaar te verbinden; dan lijkt het geheel al veel op een Integraal Systeem zoals Telecom in 1980 voor ogen stond.

Het onderscheid tussen 3A en 3B is van essentieel omdat de logische middelen structuur geven aan hetgeen gecommuniceerd wordt. Terwijl de technische middelen los van de inhoud staan: een fax heeft geen boodschap aan de boodschap. Beide middelen gebruik je ter wille van de efficiëntie. Ze gaan vaak samen, maar hun effect is heel verschillend.

{Collega Chris bij GM had een achtergrond in de electrotechniek. Hij noemde met elkaar verbonden systemen waarbij 3B goed geregeld was, maar 3A niet, galvanisch verbonden. Er kunnen wel degelijk bytes tussen beide systemen uitgewisseld worden; wat ze er mee moeten is een andere vraag}

Met het doen structureren van de boodschap open je een venster op de inhoud van die boodschap. Je gaat bij een boodschap bijvoorbeeld onderscheid maken tussen delen waarin respectievelijk afzender, geadresseerde, en de feitelijke mededeling staan. En je zet de geadresseerde op de voorkant van een enveloppe, de afzender in een hoek op de achterzijde, en de mededeling op een vel papier in de enveloppe. Als je die structuurelementen onderkent kun je ze ook toepassen in een taal die je in het geheel niet kent.

De toegevoegde waarde van de structuur voor de betekenis, is voor de menselijke lezer die de gebruikte taal kent gering, en zal hem vaak ontgaan.

Voor de automatische verwerking is de structuur het begin van alles.

De taak van Gegevensmanagement

Gegevensmanagement beoogt structuren te creëren zodat de zender en de ontvanger van een boodschap daarin dezelfde betekenis zullen onderkennen.

Dit doen we meestal niet zozeer met rubrieken, maar met gestructureerd Nederlands. In Gm deel II, staat een beknopte introductie tot die methode. In dit deel III volgt meer.

De prijs die je met een communicatiestructuur betaalt vergeleken met een informele informatievoorziening is onherroepelijk een verlies aan flexibiliteit. Vandaar dat we proberen die structuur af te leiden van de doelstellingen van het bedrijf; want die veranderen niet snel.

{In de 45 jaar dat ik Telecom min of meer gevolgd heb; springen er voor mij slechts twee grote veranderingen in de doelstellingen uit:

Op een gegeven moment is Telecom ‘content’ gaan leveren. En de doelstelling ‘leveren van content’ wordt ondersteund door de doelstelling “leveren van telecommunicatie’ en is dus “hoger”.
Telecom was altijd al een bedrijf, maar onderdeel van de overheid. Er was daarmee steeds een doelstelling “maken van winst”. Voor de verzelfstandiging was dat aspect voor het bedrijf zelf niet van het hoogste belang. De winst ging naar de staat en die bepaalde hoeveel ruimte er op de rijksbegroting was voor het investeren in Telecom. Daarna is het gewicht van deze doelstelling sterk toegenomen, en dat was ook de bedoeling; Telecom moest zijn investeringen zelf gaan financieren, teneinde aan de de behoefte van de markt te gaan voldoen. Toen Telecom als onderdeel van KPN, naar de beurs ging werd dat gewicht nog veel groter.

Er is natuurlijk ondertussen heel veel gewijzigd, bijvoorbeeld in de techniek door de opkomst van Internet. Toch zijn er systemen die het heel lang hebben volgehouden.

Hun gegevens zullen tot het laatst toe bruikbaar zijn geweest. De systemen zijn vooral vervangen omdat ze technisch verouderd waren, en niemand er meer geld in wilde steken.}

< waar komt de methode vandaan >

De Modellencyclus voor het maken van een Gegevensmodel

Om het een en ander toe te lichten een globaal plaatje als introductie tot de methode van de Modellencyclus. Later gaan we er uitgebreider op in.

Als eerste een paar uitgangspunten:

Gegevens worden gezien als een neerslag van feiten.

Deze feiten zijn het onderwerp van een Universe of Discourse; dat wil zeggen een aantal betrokkenen spreekt met dezelfde doelstelling over een bepaald onderwerp, en onderkent daarom deze feiten in dat onderwerp.

Het eerste is het Objectmodel waarmee geregistreerd wordt waarover de feiten gaan.
In het Semantisch-model wordt vastgelegd wat we over die feiten willen weten
Het Logisch datamodel legt vast hoe we datgene wat we over die feiten willen weten gaan registeren.
Het Fysieke datamodel legt dat wat we gaan registreren vast in een database notatie, hierbij kunnen om implementatie redenen nog bepaalde data worden toegevoegd.

Bij gegevensmanagement houden we ons vooral bezig met de eerste drie aspecten. Het Fysieke datamodel ontstaat in het project in samenwerking met de databaseadministrator; een functionaris van de automatiseringsafdeling.

Een essentiële stap die we niet over het hoofd mogen zien is dat het steeds over een type gaat. Bijvoorbeeld bij het maken van het objectmodel nemen we feiten over objecten waar. Vervolgens onderkennen we, gestuurd door de doelstellingen, typen. En we registreren de objecttypen! De stap van object naar objecttype gebeurt doordat de taal ons daartoe dwingt; we hebben geen woord voor “dat beestje met veren daar”, maar we hebben het over die vogel. Ook in de andere modellen hebben we het steeds over typen, of over een exemplaar van een type.

Voor het Semantisch-model gaan we uit van objecttypen; die daarmee entiteittypen worden en onderzoeken wij welke beweringen

<HIERO>

In de buitenste ring staan de FEITEN. Die buitenste ring staat voor wat ik in het voorafgaande wel Het Universe Of Discourse heb genoemd. Daar bevinden zich mensen die betrokken zijn bij het onderwerp waarvoor we een model gaan maken, die gestuurd door gemeenschappelijke doelstellingen een zakelijke discussie voeren over dat onderwerp.

Een simpel voorbeeld NATUURLIJK-PERSOON.

We volgen de discussie en constateren dat het woord ‘natuurlijk-persoon’ gebruiken, wellicht te onderscheid van een ‘rechtspersoon’; en dat ze daar kennelijk gewoon een ‘mens’ mee bedoelen. We hebben dan voor het Objectmodel: Een NATUURLIJK-PERSOON is een mens

(Dit is een zogenaamde terminale definitie; voor een gegevensmodel van een supermarkt is ‘is een mens’ voldoende. Maar als je bezig zou zijn met evolutie van de mens uit zijn voorouders dan kom je daar niet mee weg, en moet je bijvoorbeeld besluiten tot ‘is een Homo erectus’ , of ‘een Homo sapiens’ )

Vervolgens beluisteren wat ze over die natuurlijke personen zeggen: {nogmaals het is een heel simpel voorbeeld}. Ze hebben over de geboortedag en ede geboortedatum van natuurlijke personen. Dergelijke uitspraken zijn beweringen, en horen thuis in het Semantisch-model:

NATUURLIJK-PERSOON is geboren op LOCATIE.

NATUURLIJK-PERSOON is geboren op DATUM.

(Beweringen zijn logische expressies aansluitend bij natuurlijke taal. Beweringen moeten falsifieerbaar zijn; ze moeten ook onwaar kunnen zijn)

Hiermee hebben we de betekenis uit dit voorbeeld te pakken. In de volgende twee modellen gaat het om de vorm en de representatie. In het semantisch model hebben we drie types NATUURLIJK-PERSOON, LOCATIE en DATUM. In het logisch datamodel ligt de vraag voor hoe gaan we de individuele voorkomens van deze types; de tokens, vormgeven?

Dit gebeurt met zogenaamde aanduidingstypen, waarmee voor voor bepaalde toepassingen de ‘grammatica’ van de tokens wordt gegeven.

DATUM: (eejjmmdd)

Voor de beide andere aanduidingstypen bestaat een NEN-norm. Een standaard vaak gerelateerd aan een internationale standaard:

NATUURLIJK-PERSOONSNAAM; NEN 1888 Algemene Persoonsgegevens.

LOCATIE: ADRES-NEN5825.

In de beide NEN-normen staat precies beschreven hoe Algmenene Persoonsgegevens en Adressen opgebouwd mogen zijn. Dergelijke normen staan in het BedrijfsGegevensModel, zie hieronder, en een gegevensmodel voor een bepaalde toepassing zal gewoonlijk een keuze uit die normen gemaakt worden. Binnen die normen is het vaak mogelijk te kiezen voor een volledige en een korte variant. (Postcode huisnummer voor adres bijvoorbeeld).

In het logisch datamodel voor een bepaalde toepassing wordt ook nog de redundantie teruggebracht door door het model in een normaalvorm te gieten.

In het fysiek datamodel wordt de opslag door de opslag met technische middelen geoptimaliseerd.

De beide laatste punten: normaalvorm en technisch optimaliseren spele geen rol in het BGM.

BedrijfsGegevensModel (BGM)

Het bleek al gauw dat we bezig waren met de vierde poging om bij Telecom tot een succesvol gegevensmanagement te komen, en dat de verwachting was dat we toch wel binnen een jaar met een aanzet tot een BedrijfsGegevensModel moesten komen. Zo een (BGM) wordt gemaakt volgens dezelfde methode als een ‘gewoon’ gegevensmodel voor een bepaalde toepassing, maar het dient een ander doel, en daarom liggen de accenten bij het modelleren anders.

Een ‘gewoon’ gegevensmodel is bedoeld om te leiden tot een database voor een bepaalde toepassing. Het BGM dient om de samenhang tussen de gegevens van het primaire proces van het bedrijf expliciet te maken. En daarmee richting aan de informatisering van dat primaire proces te geven. De gegevens uit zo een ‘gewoon’ datamodel worden beoordeeld of ze vooral van lokaal belang zijn voor de onderhavige toepassing; of dat ze een duidelijke rol spelen in een primair bedrijfsproces. In het laatste geval komen ze in aanmerking om opgenomen te worden in het BGM.

Er zijn in totaal 5 versies van een BGM uitgebracht: de eerste is van 1988, en de laatste is van 1994. De eerste uitgave telde 75 pagina’s, de laatste 287.

<HIERO>

In het BGM houden we ons vooral bezig met:

Het Objectmodel: Hier vind je de definitie van de belangrijkste zaken (objecttypen) uit de voornaamste bedrijfsprocessen. Er is een sterke samenhang tussen de definities. Ze staan gegroepeerd in werkgebieden zoals personen, producten & middelen, infrastructuur, … .
Het Semantisch Model. Hierover vinden we in het BGM het belangrijkste wat we over de bovengenoemde zaken als we ermee geconfronteerd worden zouden willen weten. Zoals wat ze belangwekkend maakt en waaraan we ze zouden kunnen herkennen.
Het Logisch Gegevensmodel valt buiten het BGM. Maar bij het maken van een logisch model worden veel aanduidings-typen geïntroduceerd. Bijvoorbeeld AANTAL, ADRES, DATUM, PERSOONSNAAM. Deze aanduidings-typen lenen zich goed voor standaardisatie binnen het bedrijf, maar ook nationaal en zelfs internationaal. Daarom zijn deze wel binnen het BGM opgenomen met eventueel een standaard.
Een Fysiek datamodel speelt geen rol in het BGM.

————————————

Werkwijze

Search This Blog

Memoires van Programmeur en Zeiler, Gerard Kok

GEGEVENSMANAGEMENT DEEL III

Comments

Post a Comment

Popular posts from this blog

EEN INTEGRAAL SYSTEEM Deel II

Een Liefde aan het Begin en ook aan het Eind

GegevensMangement