Les mégadonnées et la manipulation des données ouvertes
- Comprendre la variété des usages des mégadonnées (big data).
- Identifier les contraintes liées à la manipulation des données ouvertes.
- Comprendre pourquoi la manipulation des données ouvertes crée de l’information.
- Les mégadonnées (en anglais big data) sont des données en nombre et en taille très importantes.
- Les données ouvertes (en anglais open data) sont des données accessibles à tous. Ces données sont publiques.
- Les traitements des mégadonnées grâce aux données ouvertes sont nombreux et variés.
Le nouvel enjeu des organisations est d’exploiter une masse de données considérable afin de créer de l’information pertinente pour le pilotage, l’analyse et la valorisation de leur activité.
Les données ouvertes et les mégadonnées sont donc indispensables pour transformer ces informations en ressources.
La mise à disposition des mégadonnées favorise le partage de connaissances et la mise en ligne d’informations pour le grand public, mais cela favorise aussi les travaux de recherche et la mise en commun d’avancées technologiques.
Le champ d’action des mégadonnées est très large. Partout où un grand nombre de données est nécessaire, un traitement informatique est pertinent.
Voici quelques domaines d’application.
- Dans le domaine scientifique,
les mégadonnées permettent par
exemple de décoder le génome humain
grâce aux séquenceurs d’ADN,
ou de réaliser des simulations
climatiques.
Exemple
Le premier génome humain a mis 10 ans à être décodé, cela prend désormais une semaine. - Dans le domaine de la vente, le nombre
croissant de données exploitées permet de
dresser des profils de consommation de plus en plus
précis afin de maximiser le potentiel de
vente.
Exemple
Le géant américain de la grande distribution Walmart enregistre plus d’un million de transactions clients par heure.
On peut trouver des données ouvertes dans les mégadonnées, elles bénéficient donc du même traitement informatique.
Les applications des mégadonnées grâce aux données ouvertes sont conséquentes et ne cessent de croitre. Seule la main d’œuvre qualifiée pour les traiter ralentit le rythme de mise à disposition auprès du grand public des données ouvertes.
Les utilisateurs de transports publics utilisent quotidiennement, sans le savoir, les données ouvertes en consultant la ponctualité de leurs trains. La ponctualité des TER en région Centre Val-de-Loire est visible sur le site suivant : https://data.centrevaldeloire.fr/pages/ponctualite-ter-exintercites/
L’exploitation des données ouvertes couvre un large spectre de sujets. Les plus importantes sont les données gouvernementales avec les statistiques de l’INSEE, les données des finances publiques par les Impôts ou les données foncières et cadastrales.
Si les données constituent la matière première de tout traitement informatique, il faut pouvoir les conserver de manière à assurer leur sécurité et leur confidentialité.
Le traitement des données ouvertes représente ainsi un enjeu économique, environnemental et sociétal.
La multiplication des usages du web et la croissance exponentielle des données à traiter nécessitent un besoin en infrastructures informatiques pour pouvoir stocker ces données de façon sécurisée : ces infrastructures sont appelées data centers.
Les data centers utilisent beaucoup d’énergie électrique car ils dégagent énormément de chaleur et doivent être refroidis pour éviter toute panne. Cette constante augmentation de la consommation électrique contribue à accroitre l’émission de gaz à effet de serre.
En 2018, les ordinateurs, réseaux et data centers ont consommé près de 10 % de l’électricité mondiale (d’après un rapport du CNRS intitulé Numérique : le grand gâchis énergétique, 16 mai 2018).
Les conséquences sociétales du traitement des données ouvertes sont nombreuses : surabondance d’informations multipliant les risques et possibilité de surveillance des individus grâce à la géolocalisation.
Le RGPD (Règlement Général sur la Protection des Données) a ainsi renforcé la protection des données personnelles dans la communauté européenne. Ce règlement s’applique à toutes les organisations (entreprises, administrations et associations) qui collectent et traitent des données numériques.
La valeur économique des données ouvertes et de leur traitement n’est pas simple à estimer. McKinsey, une agence américaine de conseil auprès des organisations, l’a fait en 2013 et a conclu que la valeur économique des données ouvertes s’inscrit dans une fourchette allant de 3,2 à 5,4 milliards de dollars.
À titre d’exemple, le PIB de la France est de 2,775 milliards de dollars.
L’enjeu économique pour les états est donc de permettre, en ouvrant les données publiques, de développer de nouvelles activités qui généreront des bénéfices économiques.
La jeunesse des données ouvertes ne permet actuellement pas de donner des exemples probants de valeur économique dégagée grâce à elles, mais le futur nous apportera certainement des exemples de réussite économique liés au traitement des données ouvertes.

Fiches de cours les plus recherchées
Découvrir le reste du programme


Des profs en ligne
- 6 j/7 de 17 h à 20 h
- Par chat, audio, vidéo
- Sur les matières principales

Des ressources riches
- Fiches, vidéos de cours
- Exercices & corrigés
- Modules de révisions Bac et Brevet

Des outils ludiques
- Coach virtuel
- Quiz interactifs
- Planning de révision

Des tableaux de bord
- Suivi de la progression
- Score d’assiduité
- Un compte Parent