Genius Geomatics

Terrestre

OpenDataSoft
Blog Geomod, Terrestre

Les Open Data et les SIG

Qu’est-ce que les Open Data ? Pour résumer succinctement, « les Open Data sont des données qui sont accessibles, réutilisables et redistribuables librement par tout le monde ». Ces données peuvent provenir de diverses sources publiques comme privées : des gouvernements, des collectivités, des villes, des entreprises, des ONG, des communautés, etc.

Des définitions plus complètes sont disponibles sur internet, notamment sur le site opendefinition.org.

Les licences

Logos Licences Open Data

Une licence définit quels droits et/ou obligations sont octroyés lors de l’utilisation des données. Ce qu’on a le droit de faire avec pour résumer.

Il existe plusieurs types de licences dans le domaine des Open Data. Et même si elles ont toutes pour but de faciliter l’accès et la redistribution des données, elles peuvent différer l’une de l’autre par les obligations ou libertés accordées. On peut citer les plus connues comme Creative Commons (CC) qui est plus destinée à du contenu créatif, Open Data Commons Public Domain Dedication and Licence (PDDL) et Open Data Commons Open Database License (ODbL) destinées à des bases de données.

Il y a aussi des licences qui sont créées par les gouvernements eux-mêmes qui mettent à disposition des données. Comme par exemple le Royaume-Uni qui a créé la licence Open Government Licence (OGL), l’Allemagne avec les licences DL-DE et même l’Europe avec la licence EUPL. Une liste de ces licences peut être consultée sur le site www.europeandataportal.eu.

La France a créé sa « licence ouverte » (LO) avec le projet Etalab que beaucoup de villes ont adoptée. Avec cette licence, il est possible de reproduire, modifier, redistribuer et même exploiter les données à des fins commerciales à condition de mentionner la source de l’information et la date de dernière mise à jour.

Chaque licence a donc son propre fonctionnement au niveau de l’utilisation et de la redistribution. Il est donc important pour l’utilisateur de se renseigner sur la (les) licence(s) associée(s) aux données qu’il récupère et utilise. Ces licences sont la plupart du temps disponibles et mises en avant sur les plateformes Open Data.

Provenance et contenu

Les Open Data sont présentes dans beaucoup de domaines : la culture, l’éducation, les transports, les sciences, l’environnement, l’économie, la cartographie et bien d’autres. Et le phénomène Big Data ne fait qu’augmenter la quantité de données et leurs types. Ce qui fait que l’on trouve toutes sortes de données : des statistiques, des rapports, des images, des géométries, etc. Elles peuvent toutes avoir leur utilité, car même si un type de données peut sembler ne pas être pertinent seul, sa valeur peut être très importante une fois combiné à d’autres données. Et c’est là la force des données ouvertes.

Dans les domaines des SIG (Système d’Information Géographique) et de la cartographie, les données proviennent la plupart du temps d’entités publiques. Le gouvernement français propose des données via sa plateforme. Mais de plus en plus de régions, d’agglomérations ou de villes mettent à disposition via leurs propres plateformes bon nombre de données également. Ces données cartographiques peuvent notamment contenir les données terrains (levés lidar, MNT, courbes de niveau), les bâtiments en 2D ou 3D, les tracés des routes et voies ferrées, les occupations du sol, les fonds de plan, les images satellite. Ces données constituent des ressources riches et de qualité pour construire des modèles numériques utilisables par la suite dans les logiciels de modélisation.

Les formats des Open Data en cartographie

Pour assurer une compatibilité la plus large possible entre tous les utilisateurs, les données sont la plupart du temps dans des formats exploitables qui permettent d’importer et d’exporter ces données. Et pour cela, il y a les fichiers ou les services web.

En cartographie, les formats que l’on trouve le plus souvent pour les Open Data sont :

  • le format CSV qui peut être utilisé ensuite en jointure de table dans un SIG.
  • les formats KML, GeoJSON, SHP qui peuvent être utilisés en particuliers pour des données vecteur.
  • les formats GeoTIFF et ASC pour les données raster ou maillées.

D’autres formats existent mais sont moins répandus comme le GML ou le CityGML pour la 3D, le XML, le GPKG. Toutefois, ils tendent à s’imposer petit-à-petit et pourraient devenir de futurs standards.

Mais il n’est pas toujours intéressant de télécharger les données pour diverses raisons : le fichier est trop important en taille, les données contenues sont trop souvent mises à jour, la quantité de données à afficher est trop grande, etc. Dans ces cas-là, les données sont alors mises à disposition par un service web ou une API sur lesquels il est possible de se connecter afin d’avoir accès à la donnée. En service web, il y a notamment les Web Map Service (WMS) et Web Feature Service (WFS), tous deux des standards de l’OGC. Ces services permettent d’obtenir des cartes géoréférencées sous forme d’images pour le WMS ou des données géographiques géoréférencées pour le WFS.

Où trouver des Open Data?

Aujourd’hui, on peut trouver ces données relativement facilement sur internet. Depuis quelques années, c’est une volonté de partager les données à des fins d’information, de connaissance, mais aussi de transparence.

Le gouvernement français dispose de ses plateformes data.gouv.fr ou encore geo.data.gouv.fr. On peut y trouver les plans du cadastre, des statistiques sur l’énergie ou la population, le tracé des routes, l’emplacement des musées, et bien d’autres.

Les villes de France possèdent également leur propre service mettant à disposition les données concernant les villes et leurs agglomérations. C’est le cas de Paris, Lyon, Strasbourg par exemple.

Les régions ont aussi leurs plateformes comme le Grand Paris,  PIGMA pour la Nouvelle-Aquitaine, ou la région Provence Alpes Côte d’Azur.

Un autre site clé pour la France, c’est OpenData France qui est une association ayant pour but de « regrouper et soutenir les collectivités engagées activement dans une démarche d’ouverture des données publiques et de favoriser toutes les démarches entreprises par ces collectivités, dans le but de la promotion de l’Open Data. » On y trouve notamment la liste des membres de cette association et en particuliers les collectivités avec le lien vers leurs plateformes Open Data.

Il y a aussi des services incontournables comme Open Street Map qui s’appuie sur une communauté de personnes de tous domaines pour enrichir le projet. A noter que la plupart des contributeurs importants sont les gouvernements eux-mêmes.

L’étranger n’est pas en reste concernant les plateformes Open Data et nous pouvons citer quelques villes comme Genève, Bruxelles, New York, ou encore l’Europe et les Etats-Unis.

Evidemment, il est difficile de s’y retrouver parmi toutes les possibilités d’accès. Heureusement, il existe des sites qui regroupent tous les portails disponibles dans le monde. C’est le cas par exemple de OpenDataSoft où on peut parcourir une carte du monde et trouver un portail.

OpenDataSoft

vigiExpo-intro
Blog Geomod, Terrestre

VigiExpo, coupler des mesures smartphone avec de la modélisation

VigiExpo est un projet financé par l’ANSES dans le cadre du Programme national de recherche Environnement-Santé Travail

Réalisé en collaboration par le Centre Scientifique et Technique du Bâtiment (CSTB), le laboratoire XLIM (CNRS UMR 72522) et Geomod.

L’objectif du projet VigiExpo est le développement d’un outil de monitoring de l’exposition des populations aux champs électromagnétiques radiofréquences issus des antennes des réseaux de téléphonie mobile. Il s’agit d’estimer les niveaux d’exposition en tout point d’une zone géographique donnée.

La modélisation numérique des niveaux d’exposition permet une analyse de l’exposition à grande échelle et en tout lieu, ce qui est complémentaire des campagnes de mesures in situ qui sont toujours localisées temporellement et spatialement.

vigiExpo-schema-fr

 

L’une des difficultés majeures pour la production de cartes d’exposition est l’accès aux caractéristiques précises des émetteurs et antennes des stations de base : position, puissance émise, diagramme de rayonnement. Des informations sont accessibles dans le domaine public, notamment sur le site internet et la base de données https://www.cartoradio.fr, géré par l’agence nationale des fréquences. Ces informations sont très partielles et l’ensemble des paramètres nécessaires à une modélisation numérique ne sont pas présents dans les données disponibles.

Il s’agit dans le projet VigiExpo d’enrichir les données accessibles sur les caractéristiques des émetteurs, avec des informations géoréférencées de niveaux de puissance reçue par un ou plusieurs Smartphones dédiés. L’utilisation simultanée et complémentaire des données issues des Smartphones et d’un outil de modélisation numérique permet par optimisation et traitement statistique de remonter aux caractéristiques réelles et complètes des antennes, et de fournir une cartographie dynamique de l’exposition des personnes dans une zone géographique donnée.

vigiExpo-parcours

Parcours simultané avec deux Smartphones différents – comparaison des données GPS (à gauche) et niveau de puissance reçue d’un émetteur UMTS (à droite). Visualisation dans Google Earth.

Principe

Le principe de l’outil de monitoring du projet VigiExpo développé repose sur une application Android développée par le CSTB (VigiPhone), associée au logiciel de modélisation numérique de la propagation des champs électromagnétiques (MithraREM) et à un algorithme d’optimisation pour remonter aux caractéristiques précises des émetteurs. L’application VigiPhone collecte des relevés de niveaux de puissance reçue géoréférencées sur un Smartphone. Par la mise en réseau de ces données et l’algorithme d’optimisation adapté il est possible d’enrichir la modélisation numérique et ainsi de construire des cartographies dynamiques de l’exposition des personnes à l’échelle d’un quartier ou d’une ville.

vigiexpo- mithrarem

Modèle numérique dans MithraREM (à gauche) – application VigiPhone (à droite)

Un algorithme de type génétique a été développé afin d’identifier les paramètres caractéristiques des émetteurs, avec comme objectif que les niveaux de champ électrique modélisés en tout point à partir des émetteurs soient le plus cohérents possible avec les informations géoréférencées collectées au niveau des Smartphones. Nous utilisons conjointement des indicateurs de liaison (de type corrélation de Pearson, Spearman) et des indicateurs d’erreur, afin de trouver l’extremum (minimum/maximum) global dans un large espace de solutions exploré par l’algorithme (bases de données de diagrammes d’antenne, tilts, positions, puissances émises). Les fonctions de mutation et de croisement spécifiques à cet algorithme ont été conçues et validées de manière à assurer une bonne reproductibilité des résultats (convergence systématique vers les paramètres réels et une solution physique).

vigiexpo-algogenetique

Positions obtenues par optimisation à gauche, comparaison mesure/simulation à droite