Metadata DCAT

Dit document beschrijft een applicatieprofiel, in dit geval Metadata DCAT. Dit applicatieprofiel beantwoordt de vraag over hoe het corresponderende domeinmodel in de praktijk kan toegepast worden. Daarbij worden de beperkingen (kardinaliteit, codelijsten) toegelicht en de overeenkomstige (RDF) termen opgelijst.

Samenvatting

Het applicatieprofiel metadata voor services is een applicatieprofiel gebaseerd op DCAT. Dit applicatieprofiel richt zich op het verzamelen van informatie over de services die door een overheid beschikbaar gesteld worden. Deze services omvatten publiek toegankelijke als afgeschermd diensten, ontwikkeld in en voor eender technisch perspectief. Het samenbrengen van al deze informatie in een catalogus laat toe om de vindbaarheid van deze services te verhogen.

Status van dit document

Dit applicatieprofiel heeft status Kandidaat Standaard en werd uitgegeven op 2020-12-14.

Informatie over het gevolgde proces en de beslissingen om tot deze specificatie te komen zijn beschikbaar in het standaardenregister.

Licentie

Deze specificatie van Informatie Vlaanderen is gepubliceerd onder de "Modellicentie Gratis Hergebruik - v1.0".

Conformiteit

Een applicatieprofiel is een specificatie voor gegevensuitwisseling dat bijkomende beperkingen introduceert voor het toepassen van vocabularia. Dergelijke bijkomende beperkingen kunnen de volgende elementen bevatten:

  • verfijning van de terminologie (klassen en eigenschappen) consistent met de semantiek uit de betreffende specificaties met een welbepaald gebruik als doel;
  • externe terminologie (klassen en eigenschappen) gebruikt voor nieuwe/extra termen die niet in de bestaande vocabularia voorkomen.

Om conform te zijn met dit applicatieprofiel, geldt voor een implementatie dat ze:

  • MOET conform zijn aan de verplichtingen van DCAT.
  • MOET Voor elke klasse steeds de eigenschappen bevatten die als minimum kardinaliteit 1 hebben.
  • MAG NIET meer dan 1 instantie bevatten van eigenschappen die 1 als maximum kardinaliteit hebben.
  • MAG terminologie (klassen en eigenschappen) gebruiken op een manier die consistent is met haar semantiek (definitie, gebruik, domein en bereik).
  • MAG uitgebreid worden met klassen en eigenschappen van andere datamodellen (vocabularia) die niet overlappen met terminologie vermeld in dit document of in DCAT, DCAT-AP.
  • PAST maximaal de algemene en specifieke gebruiksadviezen toe.

Algemene gebruikadviezen

  • Zorg voor stabiele identificatoren voor datasets en dataservices, en waar mogelijk ook voor alle andere vermelde entiteiten.
  • Gebruik enkel absolute URLs. Dan is blijft onder alle verwerkingsoperaties van de catalogus de URL identiek en is er geen kwaliteitsverlies voor de gebruiker.
  • Voor temporele informatie wordt verwacht dat de tijdszone wordt meegegeven.
  • Indien gekozen wordt om de geografische beschrijving als een geometrie mee te geven, dan wordt best gekozen voor een beschrijving met expliciete vermelding van het gebruikte Coordinaten Referentie Systeem (CRS).
  • Beschrijvende informatie zoals titels en beschrijvingen zijn taalafhankelijk. Voorzie voor elke taal slechts één waarde.

Informatieveiligheid

Een semantische specificatie richt zich in de eerste plaats op het maken van afspraken rond de betekenis van termen. Dit is bij uitstek het doel van een vocabularium. Applicatieprofielen zijn gericht op afspraken in een brede gebruikscontext. Daardoor omvatten zijn meer en specifieke beperkingen die het gebruik ten goede komen.

Een van de aspecten voor het gebruik van de specificatie is informatieveiligheid. Het merendeel van de bezorgdheden i.v.m. informatieveiligheid hebben geen directe invloed op een applicatieprofiel. Ze zijn dikwijls van technische aard die buiten de semantische afspraken vallen zoals het encrypteren van datastromen. Bij voorkeur worden deze twee werelden zoveel mogelijk gescheiden en enkel samengevoegd in een implementatie.

Echter sommige afspraken zijn beïnvloedbaar door informatieveiligheid. Voorbeelden hiervan zijn het al dan niet verplichten van een eigenschap of de range van een eigenschap (een identificator versus een string). Het is aan de opstellers van de specificatie om de juiste balans te vinden.

Voor metadata voor services is een belangrijke gebruikscontext het aggregeren van catalogi komende van verschillende organisaties. Het doel is om deze aggregatie als geheel ter beschikking te stellen van het publiek. Omdat entiteiten van de ene catalogus kunnen verwijzen naar entiteiten van andere catalogi, is het zo goed als onmogelijk om een verschillende informatieveiligheidspolitiek te voeren per ter aggregeren catalogus. Daarom wordt dit niet opgenomen als onderdeel van de specificatie. Indien dit gewenst is, dan zal dit een implementatieafspraak worden.

Omdat de basis van de usecase het publiekelijk delen van informatie is, wordt aangenomen dat de informatiestructuur zoals die in de specificatie opgenomen is ook in die vorm kan gedeeld worden. Informatie waarvan kennis is genomen dat die omwille van een of andere reden niet publiek kan gemaakt worden, zal dus niet verplicht worden. Dikwijls zal die informatie via een andere eigenschap, via een toegangspagina, te vinden zijn voor de gebruiker van de geaggregeerde catalogus.

Service beschrijving en de payload beschrijving

Indien een data service beschrijft dan is er meestal ook de noodzaak om informatie te geven over de data die ontsloten wordt via de dataservice. Om dit onderscheid eenduidig vast te leggen wordt de volgende ontwerpbeslissing gevolgd. Eigenschappen die rechtstreeks te maken hebben met de dataservice zijn eigenschappen van de dataservice. Eigenschappen die slaan op de ontsloten data zijn eigenschappen van de verbonden aangeboden dataset (of datasets). Bijvoorbeeld de eigenschap taal voor een data service slaat op de taal die gevolgd wordt in de fysieke payload structuren van de service. Dit kan b.v. engels zijn. Echter indien men wil aangeven dat de informatie ontsloten wordt slechts beschikbaar is in het Nederlands, dan wordt dat aan gegeven als waarde voor de taal eigenschap van de aangeboden dataset.

Onderscheid distributie en data service.

In een dagdagelijks gesprek over datasets en hun onsluitingsvormen wordt de term distributie gebruikt in een brede zin. Een distributie is daarin de aanduiding van eender welke vorm van ontsluiting. DCAT heeft ervoor gekozen om een service als een onafhankelijke entiteit op te nemen. Hierdoor ontstaat een spanningsveld tussen de dagdagelijkse terminologie en de formele terminologie van DCAT. Echter zelfs op basis van de definities in DCAT kan men geen precies afgelijnd onderscheid maken tussen een Distributie en een DataService.

Om de catalogus beheerders in Vlaanderen een uniformere aanpak te geven, wordt het volgende afgesproken. Een distributie zal voornamelijk gebruikt worden om een afgerond geheel van data aan te duiden. Iets dat downloadbaar is als een file. Een dataset is een abstracte entiteit (een naam voor een geheel aan data); een distributie van de dataset is een concrete vorm die de afnemer van de dataset lokaal kan gebruiken zzonder enige andere systeemtoegang. Een distributie zal dus niet bestaan zonder een dataset.

Alle andere vormen zullen als een dataservice beschreven worden. Een dataservice heeft dikwijls een hoge mate van onafhankelijkheid van een distributie (effectieve data) van een dataset; het kan zelfs niet gevonden zijn aan 'e'en dataset. Of het biedt een slimme toegang tot de data (b.v. via een query interface).

Overzicht

In dit document wordt correct gebruik van de volgende entiteiten toegelicht:
| Agent | Catalogus | Catalogus Record | Catalogus Resource | Data Service | Dataset | Distributie |

In dit document worden de volgende datatypes toegelicht:
| Contactinfo |

Entiteiten

Agent

Beschrijving
Iemand die of iets dat kan handelen of een effect kan teweeg brengen.
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: naam.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
naam TaalString 1..n De naam van de agent Omwille van de meertaligheid kunnen er meerdere waarden zijn. De gewenste interpretatie van de cardinaliteit is: per taal slechts 1 waarde.

Catalogus

Beschrijving
Een beheerde verzameling van informatie over resources.
Gebruik
[See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Class:Catalog]
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: beschrijving, contactinformatie, heeft DataService, heeft Dataset, identificator, licentie, record, titel, uitgever.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
beschrijving TaalString 0..1 een bondige omschrijving van de catalogus [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_description]
contactinformatie Contactinfo 0..n De contactinformatie via men in contact kan treden met de verantwoordelijken van de catalogus [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_contact_point]
heeft DataService Data Service 0..* geregistreerde DataServices in de catalogus
heeft Dataset Dataset 0..* geregistreerde dataset in de catalogus
identificator Identificator 1..n een identificator voor de catalogus [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_identifier]
licentie LicentieDocument 0..1 de licentie voor de catalogus
record Catalogus Record 0..* provenance informatie over de registratie van een catalogsResource in de catalogus [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:catalog_catalog_record]
titel TaalString 0..1 de naam voor de catalogus [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_title]
uitgever Agent 0..1 de uitgever van een catalogus [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_publisher]

Catalogus Record

Beschrijving
Een record in een catalogus dat de registratie van een catalogus resource beschrijft.
Gebruik
[See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Class:Catalog_Record]
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: aanmaakdatum, hoofdonderwerp, identificator, titel.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
aanmaakdatum DateTime 0..1 Het moment waarop de registratie van de catalogusResource voor de eerste keer gebeurde in de catalogus [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:record_listing_date]
hoofdonderwerp Catalogus Resource 0..1 de geregistreerde catalogusResource [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:record_primary_topic]
identificator Identificator 1 een identificator van het catalogusrecord [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_identifier]
titel TaalString 0..1 de naam van het registratie van de catalogusresource [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:record_title]

Catalogus Resource

Beschrijving
Een resource gepubliceerd of beheerd door 1 agent.
Gebruik
[See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Class:Resource]
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: uitgever.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
uitgever Agent 0..1 De uitgever van de catalogusResource [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_publisher]

Data Service

Beschrijving
Een verzameling van operaties die ofwel toegang tot één of meer datasets voorzien ofwel een dataverwerkingsdoel hebben.
Gebruik
[See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Class:Data_Service]
Subklasse van
Catalogus Resource
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: authenticatie, beschrijving, biedt informatie aan over, contactinformatie, dienstverleningskwaliteit, doelpopulatie, endpointbeschrijving, endpointURL, gebruiksbepaling, gebruiksstatus, identificator, landingspagina, ontwikkelingsstatus, titel, trefwoord, versie, wettelijke beperkingen.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
authenticatie URI 0..1 landingspagina met informatie over authenticatie Deze eigenschap capteert een onderdeel van de beschrijvende informatie over de service beschreven in de landingspagina. Enkel te gebruiken indien men kan verwijzen naar een sectie of een aparte pagina waar deze specifieke informatie beschikbaar is.
beschrijving TaalString 0..1 Een bondige omschrijving van de dataService [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_description]
biedt informatie aan over Dataset 0..* data die aangeboden wordt door de datasService [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:data_service_serves_dataset]
contactinformatie Contactinfo 1 De contactinformatie via men in contact kan treden met de verantwoordelijken van de dataservice. [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_contact_point]
dienstverleningskwaliteit URI 0..1 landingspagina met informatie over kwaliteit van de dienstverlening Deze eigenschap capteert een onderdeel van de beschrijvende informatie over de service beschreven in de landingspagina. Enkel te gebruiken indien men kan verwijzen naar een sectie of een aparte pagina waar deze specifieke informatie beschikbaar is.
doelpopulatie URI 0..1 landingspagina met informatie over de doelpopulatie Deze eigenschap capteert een onderdeel van de beschrijvende informatie over de service beschreven in de landingspagina. Enkel te gebruiken indien men kan verwijzen naar een sectie of een aparte pagina waar deze specifieke informatie beschikbaar is.
endpointbeschrijving URI 1 Een beschrijving van de diensten die beschikbaar zijn via de end-points, met inbegrip van hun werking, parameters, enz. [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:data_service_endpoint_description]
endpointURL URI 0..1 De rootlocatie of het primaire eindpunt van de dienst (een web-resolvable URI) [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:data_service_endpoint_url]
gebruiksbepaling URI 0..1 landingspagina met informatie over de genomen voorwaarden om de service te mogen gebruiken.
gebruiksstatus Code 0..1 huidige toestand van gebruiksmogelijkheden
identificator Identificator 1..n Een unieke identificator van de dataService [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_identifier]
landingspagina URI 0..1 Algemene pagina met vaak beschrijvende tekst [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_landing_page]
ontwikkelingsstatus Code 0..1 huidige toestand van de ontwikkelingsstatus
titel TaalString 1 naam voor de dataService. [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:record_title]
trefwoord TaalString 0..1 Een trefwoord of tag die de resource beschrijft [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_keyword]
versie String 0..1 unieke aanduiding van de gedeployde service toestand gegeven door de endpointbeheerder [See <a href="https://joinup.ec.europa.eu/collection/semantic-interoperability-community-semic/solution/dcat-application-profile-data-portals-europe/release/201-0">dcat-ap</a>] Voor de meeste usecases is het voldoende om de major version te delen.
wettelijke beperkingen URI 0..1 landingspagina met informatie over de wettelijke beperkingen i.v.m. dataService Deze eigenschap capteert een onderdeel van de beschrijvende informatie over de service beschreven in de landingspagina. Enkel te gebruiken indien men kan verwijzen naar een sectie of een aparte pagina waar deze specifieke informatie beschikbaar is.

Dataset

Beschrijving
Een door 1 agent beheerde of gepubliceerde verzameling van data toegankelijk in één of meerdere voorstellingen.
Gebruik
[See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Class:Dataset]
Subklasse van
Catalogus Resource
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: beschrijving, contactinformatie, distributie, identificator, landingspagina, thema, titel, toegankelijkheid.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
beschrijving TaalString 0..1 Een bondige omschrijving van de dataset. [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_description]
contactinformatie ContactInfo 0..1 De contactinformatie via men in contact kan treden met de verantwoordelijken van de dataset [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_contact_point]
distributie Distributie 0..* een distributie van de de dataset. [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:dataset_distribution]
identificator Identificator 1..n Een unieke identificator van de dataset [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_identifier]
landingspagina URI 0..1 Een webpagina waar via een browser informatie kan gevonden worden over de dataset. [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_landing_page]
thema Code 0..n Het thema waartoe de dataset behoort [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_theme]
titel TaalString 0..1 De naam van de dataset [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:record_title]
toegankelijkheid Code 0..1 De toegankelijkheidscategorie van de dataset. Link

Distributie

Beschrijving
Een specifieke voorstelling van een dataset, gekenmerkt door een een of meerdere eigenschappen zoals taal, format, temporele en ruimtelijke dekking, granulariteit, ...
Gebruik
[See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Class:Distribution]
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: downloadURL, identificator, licentie, titel, toegangsURL, wordt aangeboden door.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
downloadURL URI 0..1 De URL waar de data gedownload kan worden. De URL start het downloaden van de distributie.
identificator Identificator 1..n Een unieke identificator van de distributie [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_identifier]
licentie LicentieDocument 0..1 de licentie van de distributie [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:resource_license]
titel TaalString 0..1 naam van de distributie [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:record_title]
toegangsURL URI 0..1 De URL waar de data kan gevonden worden. Deze url kan zowel verwijzen naar een beschrijvende pagina over hoe toegang tot de data kan verkregen worden als naar een directe link waarmee het downloaden van de distributie gestart kan worden. In het tweede geval wordt ook de eigenschap downloadURL bijkomend ingevuld.
wordt aangeboden door Data Service 0..* de dataservice die deze distributie aanbiedt [See https://www.w3.org/TR/2020/REC-vocab-dcat-2-20200204/#Property:distribution_access_service]

Datatypes

Contactinfo

Beschrijving
Een beschrijving van contact informatie.
Eigenschappen
Voor dit datatype zijn de volgende eigenschappen gedefinieerd: e-mail.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
e-mail URI 1 Het e-mail adres waarmee je contact kan opnemen. Een e-mail adres in de vorm van een mailto URI volgens de standaard https://tools.ietf.org/html/rfc6068 .

JSON-LD context

(niet normatief)

Een herbruikbare JSON-LD context definitie voor dit applicatieprofiel is terug te vinden op: /doc/applicatieprofiel/metadata-dcat/kandidaatstandaard/2020-12-14/context/metadata-voor-services-ap.jsonld

SHACL template

(niet normatief)

Een herbruikbare SHACL template definitie voor dit applicatieprofiel is terug te vinden op: /doc/applicatieprofiel/metadata-dcat/kandidaatstandaard/2020-12-14/shacl/metadata-voor-services-ap-SHACL.ttl