GEGEVENSMANAGEMENT DEEL III

Brilbeer in de dierentuin van Wenen, de enige beer die van nature in Zuid Amerika voorkomt. Leeft vooral in vochtige bossen op de Andes.

GEGEVENSMANAGEMENT DEEL III Beta 09

De Communicatiebehoefte van een Bedrijf/Organisatie

De hele informatie-problematiek van een bedrijf of instelling kun je uitdrukken met drie vragen:

1: Wat voor zakelijke informatie wisselen mensen in en rond het bedrijf met elkaar uit?

Alles wat rond een bedrijf gebeurt is het gevolg van afspraken tussen mensen. Ook als een computer van het bedrijf constateert dat een voorraad onder een bepaalde limiet is gekomen, en een signaal stuurt naar de computer van de leverancier om bij te bestellen, dan is dat het gevolg van een contract tussen beide partijen. (Als mechanisme is dit geen uitvinding uit het informatietijdperk, het waterleidingbedrijf doet dit al 175 jaar met een voor dit doel uitstekend signaleringssysteem: de waterleidingdruk)

2: Hoe realiseer je de acties waartoe een bedrijf zich daarbij verplicht.

Het gaat daarbij om welke “zaken van waarde” (geld, goederen, diensten) worden overgedragen aan een partij buiten het bedrijf.

Alle informatie die je daarbij naar derden stuurt valt onder (1). De informatie rond alle activiteiten die je intern voor die overdracht opstart valt ook onder (1). Het overdragen zelf heeft echter een juridisch en financieel aspect, en daarom ligt de grens tussen (1) en (2).

Het maakt in het geheel niet uit of je bij bepaalde activiteiten computers of andere machines inschakelt. Het inschakelen van een computer is, in laatste instantie, ook het communiceren met een mens.

Indien die machine van iemand anders is, bijvoorbeeld een ATM (Automatic Transaction Machine: flappentap), dan heb je met die andere partij een afspraak hierover gemaakt. Gebruik maken van die machine is een uitvloeisel van die afspraak. De bediening van die machine is ook communicatie: via de ontwerper van het interface, en de exploitant die verantwoordelijk is voor het apparaat.

3: Wat voor middelen gebruik je om (1) en (2) te faciliteren.

De zakelijke informatie-uitwisseling en datgene wat je intern moet communiceren om de acties waartoe je je verplicht te realiseren vormt de communicatiebehoefte. De communicatiestructuur is het geheel aan middelen dat je gebruikt om de communicatie te faciliteren.

Als je alleen naar de effectiviteit en niet naar de efficiëntie kijkt, dan kun je (1) en (2) realiseren zonder informatiesystemen. Als iedereen naar iedereen brieven stuurt, en voor de acties die je moet realiseren ook pakjes bezorgd worden, of medewerkers op pad worden gestuurd om ergens activiteiten te gaan verrichten, dan kun je een effective oplossing voor (1) en (2) hebben. Dan verzorgt de Post de communicatiestructuur.

Een klant schrijft naar het bedrijf wat hij wenst. De directeur geeft deze brief aan de accountmanager die schrijft brieven naar de magazijnmeester en de chef monteur en zo voorts. Ooit deden we het zo, hoewel we natuurlijk vooral veel zaken mondeling regelden.

Terwille van de efficiëntie verzin je iets beters; dit gaat te langzaam en is te duur. Je verzint bijvoorbeeld een aanvraagformulier voor de klant. Dat kan de accountmanager aan de klant sturen, en het ingevulde exemplaar aan magazijnmeester en chef monteur.

De prijs die je hiervoor betaalt is dat je de communicatie rond (1) en (2) in een keurslijf wringt. Je dwingt de klant de vrije tekst uit een brief om te zetten in rubrieken op een formulier; het worden gestructureerde gegevens.

Daarnaast ga je om tijd te winnen de formulieren niet per post, maar als fax of E-mail versturen. We onderscheiden daarmee twee soorten middelen:

3A: Logische middelen, zoals de onderkende rubrieken op formulieren om de communicatie te structureren, en

3B: Technische middelen: zoals een fax, E-mail. En ook databases, daarmee kun je tijd overbruggen, en ook een historie opbouwen. De rubrieken op de formulieren, worden gerealiseerd als de schermen van on-line transacties op de database.

Als je de communicatie ook nog regelt door databases met elkaar te verbinden; dan lijkt het geheel al veel op een Integraal Systeem zoals Telecom in 1980 voor ogen stond.

Het onderscheid tussen 3A en 3B is essentieel omdat de logische middelen structuur geven aan hetgeen gecommuniceerd wordt. Terwijl de technische middelen los van de inhoud staan: een fax heeft geen boodschap aan de boodschap. Beide middelen gebruik je ter wille van de efficiëntie. Ze gaan vaak samen, maar hun effect is heel verschillend.

{Collega Chris bij GM had een achtergrond in de electrotechniek. Hij noemde met elkaar verbonden systemen waarbij 3B goed geregeld was, maar 3A niet, galvanisch verbonden. Er kunnen wel degelijk bytes tussen beide systemen uitgewisseld worden; wat ze er mee moeten is een andere vraag}

Met het doen structureren van de boodschap open je een venster op de inhoud van die boodschap. Je gaat bij een boodschap bijvoorbeeld onderscheid maken tussen delen waarin respectievelijk afzender, geadresseerde, en de feitelijke mededeling staan. En je zet de geadresseerde op de voorkant van een enveloppe, de afzender in een hoek op de achterzijde, en de mededeling op een vel papier in de enveloppe. Als je die structuurelementen onderkent kun je ze ook toepassen in een taal die je in het geheel niet kent. En dus kan een computer het ook.

De toegevoegde waarde van de structuur voor de betekenis, is voor de menselijke lezer die de gebruikte taal kent gering, en zal hem vaak ontgaan.

Voor de automatische verwerking is de structuur het begin van alles.

De taak van Gegevensmanagement

Gegevensmanagement beoogt structuren te creëren zodat de zender en de ontvanger van een boodschap over iets wat in het bedrijf gaande is, daarin dezelfde betekenis zullen onderkennen.

Dit doen we meestal niet zozeer met rubrieken, maar met gestructureerd Nederlands. In Gm deel II, staat een beknopte introductie tot die methode. In dit Gm deel III bouw ik daar op voort.

De prijs die je met een communicatiestructuur betaalt vergeleken met een informele informatievoorziening is onherroepelijk een verlies aan flexibiliteit. Vandaar dat we proberen die structuur af te leiden van de doelstellingen van het bedrijf; want die veranderen niet snel en dus hoef je niet vaak te wijzigen.

{In de 45 jaar dat ik Telecom min of meer gevolgd heb; springen er voor mij slechts twee grote veranderingen in de doelstellingen uit:

Op een gegeven moment is Telecom ‘content’ gaan leveren. En de nieuwe doelstelling ‘leveren van content’ wordt ondersteund door de doelstelling ‘leveren van telecommunicatie’ en is daarmee hoger.
Telecom was altijd al een bedrijf, maar onderdeel van de overheid. Er was daarmee steeds een doelstelling “maken van winst”. Vòòr de verzelfstandiging was dat aspect voor het bedrijf zelf, niet van het hoogste belang. De winst ging naar de staat en die bepaalde hoeveel ruimte er op de rijksbegroting was voor het investeren in Telecom. Daarna is het gewicht van deze doelstelling sterk toegenomen, en dat was ook de bedoeling; Telecom moest zijn investeringen zelf uit de opbrengsten gaan financieren, en tegelijk aan de de behoefte van de markt gaan voldoen. Toen Telecom als onderdeel van KPN, naar de beurs ging werd dat gewicht nog veel groter.

Er is natuurlijk ondertussen heel veel gewijzigd, bijvoorbeeld in de techniek door de opkomst van Internet. Toch zijn er systemen die het heel lang hebben volgehouden.

Hun gegevens zullen tot het laatst toe bruikbaar zijn geweest. De systemen zijn vooral vervangen omdat ze technisch verouderd waren, en niemand er meer geld in wilde steken.}

De Modellencyclus voor het maken van een Gegevensmodel

Hoewel de basis van deze methode de verzamelingenleer en de formele logica is, gebeurt de vormgeving ervan met een gestructureerde versie van een natuurlijke taal; Nederlands in ons geval.

De basis daarvan is gelegd in INFOMOD een taal en methode voor het specificeren van een informatiemodel van Philips. En in NIAM, Nijssens Informatie Analyse Methode van G.M.Nijssen. Hieraan is ook de naam van J.J.V.R Wintraecken verbonden. De betrokkenen bij beide methoden verwijzen naar elkaar.

Ik maakte kennis met een verder doorontwikkelde methode, die inmiddels de Modellencyclus werd genoemd, en gegeven werd door Wim van der Sanden van het bedrijf Brainforce, een onderdeel van Volmac. Die verdere ontwikkeling was vooral gedaan door Van der Sanden, en J.J.van Griethuysen.

Op een gegeven moment is een deel van de bemensing van Brainforce, weggegaan bij Volmac, en een eigen bedrijf begonnen onder de naam Panfox. Zij gaven cursussen in Informatiearchitectuur, en in dat kader ook wel in gegevensmanagement.

Het grote voordeel van het gebruik van gestructureerd Nederlands is, dat het laagdrempelig is, terwijl je door zorgvuldig te structureren, en het maken van figuren, de dubbelzinnigheid van natuurlijke talen kunt vermijden.

Ik heb ook wel in internationaal verband gegevensmodellen in het Engels gemaakt, dat gaat natuurlijk net zo goed als in het Nederlands; wel hadden we er altijd en native speaker, bij nodig. Ook al spreek je als IT-er, redelijk Engels; in het kiezen van de juiste woorden voor een definitie maak je af en toe fouten die tot een onbegrijpelijk resultaat kunnen leiden.

Wat ik hieronder beschrijf is een versie van de Modellencyclus, die in het gebruik binnen Telecom weer verder ontwikkeld is.

Om het een en ander toe te lichten een globaal plaatje als introductie tot die methode. Daarna volgt een uitgewerkt voorbeeld.

Gegevens worden gezien als een neerslag van feiten.

In de buitenste ring staan de FEITEN. Die buitenste ring symboliseert wat ik in het voorafgaande het Universe Of Discourse heb genoemd. Dat is de professionele discussie tussen betrokkenen, gestuurd door gemeenschappelijke doelstellingen, over dat onderwerp. De feiten zijn de neerslag van die discussie

LINKS BOVEN staat het Objectmodel waarmee geregistreerd wordt waarover de feiten gaan.
RECHTS BOVEN in het Semantisch-model wordt vastgelegd wat we over die feiten willen weten
RECHTS ONDER: het Logisch datamodel legt vast hoe we datgene wat we over die feiten willen weten gaan registeren.
LINKS ONDER: het Fysieke datamodel legt dat wat we gaan registreren vast in een database notatie, hierbij kunnen om implementatie redenen nog bepaalde data worden toegevoegd.

Bij gegevensmanagement houden we ons vooral bezig met de eerste drie aspecten. Het Fysieke datamodel ontstaat in het project in samenwerking met de databaseadministrator; een functionaris van de automatiseringsafdeling.

Een essentiële stap die is dat het steeds over een type gaat. Bijvoorbeeld bij het maken van het objectmodel nemen we feiten over objecten waar. Vervolgens onderkennen we, gestuurd door de doelstellingen, typen. En we registreren de objecttypen! De stap van object naar objecttype gebeurt ‘vanzelf’ doordat de taal ons daartoe dwingt; we hebben geen woord voor “dat beestje met veren daar”, maar we hebben het over die vogel. Ook in de andere modellen hebben we het steeds over typen, of over een exemplaar van een type. (Voor exemplaren van een type, wordt wel de term ‘token’ gebruikt)

Voorbeeld: Gegevensmodel van een Bibliotheek

Het primaire doel van een bibliotheek is het uitlenen van boeken. Het primaire doel van de registratie is dus het registreren daarvan. Het reserveren van boeken, en het inschrijven van nieuwe boeken en klanten zijn subdoelen.

Er lopen in zo een typisch registratieve situatie eigenlijk twee processen parellel: Het primaire bedrijfsproces, het uitlenen van boeken aan klanten, en als afspiegeling daarvan een secundair registratief proces het maken van aantekeningen over dat uitlenen.

Beide processen lopen nagenoeg synchroon omdat er anders informatie over het primaire proces verloren gaat die geregistreerd had moeten worden.

In termen van “waarnemingen”, vinden in het registratieve proces waarnemingen plaats van het primaire proces; de bibliothecaris neem daarin ook zijn eigen handelingen en beslissingen waar.

In het domein vinden we:

Als concrete zaken: KLANTEN, BOEKEN en AUTEURS.
Als gebeurtenissen: UITLENING en RESERVERING.
Er is één concept: omdat er van een boek meerdere exemplaren kunnen zijn hebben we naast BOEK ook SOORT-BOEK nodig.

Objectmodel

KLANT: Een PERSOON die gerechtigd is bij de bibliotheek BOEKEN te lenen.
BOEK: Een aantal pagina’s op papier die , al dan niet in een band zijn samengevoegd en waarop een geschrift over enig onderwerp is vastgelegd. (opmerking: hier is duidelijk het boek in fysieke zin bedoeld. Dit zijn de objecten die je uitleent. Vaak voorzien van een automatisch leesbare identificerende code, om efficient uit te kunnen lenen)
SOORT-BOEK: Een verzameling BOEKEN, die omdat ze allen dezelfde inhoud hebben, voor de KLANT bij het uitlenen verwisselbaar zijn.
AUTEUR: Een NATUURLIJK-PERSOON die één of meer boeken geschreven heeft.
UITLENING: Een tijdelijke overdracht van een BOEK aan een KLANT
RESERVERING: De kennisgeving van een KLANT dat hij zo spoedig mogelijk een UITLENING wil van een exemplaar van een SOORT-BOEK.
NATUURLIJK-PERSOON: een mens
NIET-NATUURLIJK-PERSOON: een rechtspersoon of een ander samenwerkingsverband dat voor de bibliotheek als klant acceptabel is.
PERSOON: Een generalisatie van een natuurlijk- en een niet-natuurlijk-persoon.

Objectmodel bibliotheek

Voor het tekenen van het objectmodel maken we gebruik van Venn-diagrammen. Dit is een tekentechniek om verzamelingen en de relaties daartussen in het platte vlak voor te stellen.

Een verzameling wordt voorgesteld door een gesloten kromme, gewoonlijk een cirkel. De punten binnen de cirkel staan voor de elementen van de verzameling, de punten erbuiten behoren niet tot de verzameling. Overlappende verzamelingen worden voorgesteld door cirkels met een overlap.

Wij hebben het over objecttypen, dat zijn verzamelingen van objecten, en we kunnen die dus goed voorstellen met Venn-diagrammen. Wij gebruiken daarvoor afgeronde rechthoeken.

Zie in het model PERSOON. Er wordt wat ruimte vrijgehouden voor de naam, maar in principe vullen de natuurlijk en de niet-natuurlijke-persoon de hele verzameling.

In PERSOON zie je nog drie liggende afgeronde vierkanten: voor uitgeverij, klant en auteur. Dit zijn drie objecttypen die we in dit verband rollen noemen.

Of een persoon natuurlijk of niet-natuurlijk wordt bepaald door zijn aard. En is daarmee onveranderbaar.

Een rol zit niet in de aard van het object; het is iets wat die persoon bij gelegenheid speelt.

Een Reservering is een samenstelling van drie objecttypen: de reservering zelf, soort-boek en klant. We noemen dit wel een aggregatie.

Een uitlening is ook een aggregatie. De gestippelde pijl van soort-boek naar boek, geeft natuurlijk aan dat boek een element is van soort-boek.

Semantisch-model

Hierin wordt vastgelegd wat we over de objecten uit het objectmodel willen weten. Dat kan alleen maar als je de objecten individueel kent. Dergelijke geïdentificeerde objecten hebben daarmee de status van entiteit verkregen. Of simpel weg; ze komen in de database.

Omdat het in de modellencyclus altijd over typen gaat; hebben we het dus over entiteittypen.

Dit lijken precies dezelfde zaken als de objecttypen; althans ze hebben dezelfde naam en definitie, waarom is er een verschil: tussen een objecttype het gelijknamige entiteittype BOEK? Het antwoord luidt: er zijn bijvoorbeeld héél erg veel meer objecten BOEK dan entiteiten BOEK.

Semantisch-model van de biblotheek

Hier onder staat een opsomming van entiteittypen met hun beweringtypen. Door substitutie van entiteiten voor hun type daarin ontstaan beweringen.

KLANT:

KLANT wordt aangeduid met naam PERSOONSNAAM
KLANT is geboren op datum DATUM
KLANT is geregistreerd onder KLANTNUMMER
KLANT woont op ADRES

BOEK

BOEK wordt geïdentificeerd met magnetische code BOEK-CODE
BOEK is exemplaar van SOORT-BOEK

SOORT-BOEK

SOORT-BOEK wordt geïdentificeerd met nummer ISBN-NUMMER
SOORT-BOEK is geschreven door AUTEUR
SOORT-BOEK wordt aangeduid met TITEL

UITLENING

UITLENING is gedaan aan KLANT
UITLENING betreft boek BOEK
UITLENING is gedaan op datum DATUM

RESERVERING

RESERVERING is gemaakt voor KLANT
RESERVERING betreft soort-boek SOORT-BOEK
RESERVERING is gemaakt op datum DATUM

Logisch datamodel

Hiermee hebben we de semantiek uit dit voorbeeld te pakken. In de volgende twee modellen gaat het om de vorm en de representatie. In het semantisch model hebben we drie types NATUURLIJK-PERSOON, LOCATIE en DATUM. In het logisch datamodel ligt de vraag voor hoe gaan we de individuele voorkomens van deze types; de tokens, vormgeven?

Dit gebeurt met zogenaamde aanduidingstypen, waarmee voor voor bepaalde toepassingen de ‘grammatica’ van de tokens wordt gegeven.

Om met de simpelste te beginnen: DATUM: (eejjmmdd)

Voor de beide andere aanduidingstypen bestaat een NEN-norm. Een standaard vaak gerelateerd aan een internationale standaard:

NATUURLIJK-PERSOONSNAAM; NEN 1888 Algemene Persoonsgegevens.

LOCATIE: ADRES-NEN5825.

In de beide NEN-normen staat precies beschreven hoe Algmenene Persoonsgegevens en Adressen opgebouwd mogen zijn. Dergelijke normen staan in het BedrijfsGegevensModel, zie hieronder, en een gegevensmodel voor een bepaalde toepassing zal gewoonlijk een keuze uit die normen gemaakt worden. Binnen die normen is het vaak mogelijk te kiezen voor een volledige en een korte variant. (postcode huisnummer voor adres bijvoorbeeld).

In het logisch datamodel voor een bepaalde toepassing wordt ook nog de redundantie teruggebracht door door het model in een normaalvorm te gieten.

In het fysiek datamodel wordt de opslag door de opslag met technische middelen geoptimaliseerd.

Search This Blog

Memoires van Programmeur en Zeiler, Gerard Kok

GEGEVENSMANAGEMENT DEEL III

Comments

Post a Comment

Popular posts from this blog

EEN INTEGRAAL SYSTEEM Deel II

Een Liefde aan het Begin en ook aan het Eind

GegevensMangement