Choisissez les fonctionnalités expérimentales que vous souhaitez essayer

Ce document est extrait du site web EUR-Lex

Réutiliser le contenu d'EUR-Lex

Aide

Vous pouvez réutiliser gratuitement les données d'EUR-Lex, mais elles sont soumises à des conditions relatives aux droits d'auteur.

Il existe différentes manières de rechercher et d'extraire des données pour les réutiliser.

Service web

Si vous êtes un utilisateur enregistré, vous pouvez effectuer une recherche directe sur EUR-Lex au moyen du service web. Les options de recherche sont semblables à celles de la recherche en mode expert. Les données sont fournies au format XML. En savoir plus: utilisation du service web.

Téléchargement en masse

Data dump

Le service Data dump vous permet actuellement de télécharger en masse tous les actes juridiques (secteur 3 CELEX) en vigueur par langue.

Vous avez besoin d’un compte EU Login pour accéder à ce service.

datadump.publications.europa.eu

data.europa.eu

Sur «data.europa.eu», le portail officiel des données européennes, vous pouvez télécharger une liste des Journaux officiels (séries L et C) publiés par année (à partir de 2004) et par langue. Cette liste est disponible au format csv et comporte un lien vers chaque Journal officiel au format XML Formex.

data.europa.eu

Accès direct à la base de données

Pour traiter des données de manière plus sophistiquée, vous pouvez demander:

  1. Des notifications par flux RSS de la base de données, qui vous avertiront de chaque modification. Ces flux peuvent transmettre un très grand nombre de notifications (plusieurs millions par jour).
  2. Un accès direct à votre sélection de contenus et de métadonnées de la base de données, par l'intermédiaire de l'interface REST.

Dépôt de données

Les informations figurant sur EUR-Lex sont extraites du dépôt commun des métadonnées et des contenus («Cellar»). Ce dépôt est fondé sur les technologies sémantiques, un cadre de plusieurs normes.

Les données qui s’y trouvent ne se limitent pas aux documents et informations juridiques publiés sur EUR-Lex: elles comprennent également d’autres publications de l’UE (livres, brochures, etc.). Les données stockées dans Cellar sont directement accessibles par l’intermédiaire du point de terminaison SPARQL et de l’API RESTful.

Le point de terminaison SPARQL permet d'effectuer des recherches dans toutes les métadonnées disponibles dans Cellar, y compris les relations entre les différentes entités. L’API RESTful permet d'extraire des jeux de métadonnées spécifiques (souvent appelés «notices») et de télécharger les fichiers relatifs au contenu des documents. Différents formats (PDF, HTML, Formex, etc.) sont disponibles dans les deux cas.

Vous pouvez obtenir plus d’informations et consulter le manuel de l'utilisateur le plus récent, qui contient des informations sur Cellar et son API RESTful, sur le site web de Cellar. Vous pouvez effectuer des recherches dans les métadonnées disponibles dans Cellar au moyen du point de terminaison SPARQL.

Modèle de données

La structure des données de Cellar est définie dans le modèle de données commun (CDM), qui repose sur des technologies sémantiques telles que le schéma RDF et OWL. Les versions actuelles et antérieures du CDM sont disponibles sur le site EU Vocabularies.

Outre la définition de l’ontologie, le site EU Vocabularies contient également des définitions pour les vocabulaires contrôlés, les taxinomies et les thésaurus utilisés par Cellar.

Le site EU Vocabularies fournit en particulier les différentes tables d’autorité utilisées dans les valeurs des métadonnées pour désigner des entités ou concepts spécifiques tels que «personne morale», «traité», «pays» ou «langue».

Formats des documents

Les documents disponibles dans Cellar et sur EUR-Lex sont fournis dans différents formats standard, suivant leur disponibilité: PDF, HTML, XHTML, etc.

Une grande partie des documents disponibles dans Cellar et sur EUR-Lex, notamment ceux publiés au Journal officiel, sont également disponibles dans le format XML spécifique «Formex». Pour plus d’informations sur ce format, consultez le site web Formex.

Récupérer des documents EUR-Lex dans des formats structurés lisibles par machine

EUR-Lex propose plusieurs méthodes d’extraction permettant de récupérer le contenu des documents disponibles sur le site web dans des formats structurés lisibles par machine. Pour en savoir plus sur ces méthodes, consultez le document Récupération dans des formats lisibles par machine.

Pour de grands volumes de données, utilisez un des services de téléchargement de données en masse: l’accès direct à l’API de CELLAR ou Data dump.


Lien utile

Legal Analysis Methodology (LAM)

Cette publication présente le savoir-faire de l’Office des publications dans le domaine du catalogage des actes juridiques de l’UE publiés au Journal officiel et sur EUR-Lex. Elle décrit la signification et l’utilisation des éléments de métadonnées attribués à ces actes.