Moissonnage DCAT
DCAT
DCAT est une ontologie RDF pour décrire des jeux de données.
L’Europe a publié son extension de DCAT, appelée DCAT-AP.
Spécificités techniques
Ce moissonneur attend l’URL d’un catalogue DCAT (dcat:Catalog
).
Plusieurs formats sont supportés et découvrables à travers la négociation de contenu :
RDF XML
JSON-LD
Turtle
N3
NT
Trig
La pagination est supportée via l’ontologie Hydra (ainsi que l’ancienne version)
Correspondance des champs du modèle
Par souci de lisibilité, les namespaces suivants sont déclarés :
dcat
⇨http://www.w3.org/ns/dcat#
dct
⇨http://purl.org/dc/terms/
foaf
⇨http://xmlns.com/foaf/0.1/
hydra
⇨http://www.w3.org/ns/hydra/core#
rdfs
⇨http://www.w3.org/2000/01/rdf-schema#
scv
⇨http://purl.org/NET/scovo#
skos
⇨http://www.w3.org/2004/02/skos/core#
vcard
⇨http://www.w3.org/2006/vcard/ns#
xsd
⇨http://www.w3.org/2001/XMLSchema#
freq
⇨http://purl.org/cld/freq/
Jeu de données
La notion équivalente au jeu de données sur data.gouv.fr (Dataset
) est un noeud de type dcat:Dataset
en RDF.
data.gouv.fr | RDF | Notes | |
---|---|---|---|
Titre | title |
dct:title |
|
Acronyme | acronym |
skos:altLabel |
|
Description | description |
dct:description |
Éventuellement HTML transformé en Markdown |
Mots-clés | tags |
dcat:keyword + dcat:theme |
Les RdfResource ne sont pas supportées pour le champ dcat:theme |
Licence | license |
dct:license et dct:right depuis dcat:distributions |
Détection des licences |
Couverture spatiale | spatial |
❌ | |
Couverture temporelle | temporal_coverage |
dct:temporal |
Séparé par / dans le cas de dates de début et de fin, ex: 2011-01-01/2011-12-31 |
Fréquence de mise à jour | frequency |
dct:accrualPeriodicity |
Dublin Core Frequency ou un équivalent au plus proche des Fréquences Européennes |
Extras
Certaines propriétés sont conservées dans les attributs clés-valeurs extras
par soucis de traçabilité :
data.gouv.fr extras |
RDF | Notes | |
---|---|---|---|
Identifiant distant | harvest:remote_id |
dct:identifier |
Conservé aussi sous dct:identifier |
URI | uri |
ID du noeud | URIRef |
Ressource
La notion équivalente à la ressource sur data.gouv.fr (Resource
) est un noeud de type dcat:Distribution
en RDF.
data.gouv.fr | RDF | Notes | |
---|---|---|---|
Titre | title |
dct:title |
Propriété facultative, un nom est généré sinon |
Description | description |
dct:description |
Éventuellement HTML transformé en Markdown |
URL | url |
dcat:downloadURL et dcat:accessURL |
Priorité à dcat:downloadURL |
Taille | filesize |
dcat:bytesSize |
|
Type MIME | mime |
dcat:mediaType |
|
Format | format |
dct:format |
|
Somme de contrôle | checksum |
spdx:checksum (spdx:algorithm + spdx:checksumValue ) |
|
Date de mise à jour | modified |
dct:modified |
|
Date de publication | published |
dct:issued |
Extras
Certaines propriétés sont conservées dans les attributs clés-valeurs extras
par souci de traçabilité :
data.gouv.fr Resource.extras |
RDF | Notes | |
---|---|---|---|
Identifiant distant | dct:identifier |
dct:identifier |
|
URI | uri |
dct:identifier |
Si dct:identifier est un URIRef |
Logiciels supportés
La plupart des logiciels exposant du DCAT (v1 à date) devraient être compatibles a minima avec le moissonneur DCAT de data.gouv.fr. Ci-dessous quelques exemples de logiciels supportés.
Geonetwork
Si vous avez une instance de Geonetwork, vous pouvez probablement publier sur data.gouv.fr.
En effet, il existe un endpoint DCAT alternatif au endpoint CSW habituellement utilisé comme documenté sur la doc Geonetwork officielle.
Ainsi https://geosas.fr/geonetwork/srv/fre/csw deviendra https://geosas.fr/geonetwork/srv/fre/rdf.search par exemple.
Contribuer
Ce moissonneur fait partie du coeur de udata
, son code est disponible sur github. Vous pouvez donc soumettre des améliorations ou signaler des anomalies.