Les mégadonnées et la manipulation des données ouvertes - Maxicours

Les mégadonnées et la manipulation des données ouvertes

Objectifs
  • Comprendre la variété des usages des mégadonnées (big data).
  • Identifier les contraintes liées à la manipulation des données ouvertes.
  • Comprendre pourquoi la manipulation des données ouvertes crée de l’information.
Points clés
  • Les mégadonnées (en anglais big data) sont des données en nombre et en taille très importantes.
  • Les données ouvertes (en anglais open data) sont des données accessibles à tous. Ces données sont publiques.
  • Les traitements des mégadonnées grâce aux données ouvertes sont nombreux et variés.

Le nouvel enjeu des organisations est d’exploiter une masse de données considérable afin de créer de l’information pertinente pour le pilotage, l’analyse et la valorisation de leur activité.

Les données ouvertes et les mégadonnées sont donc indispensables pour transformer ces informations en ressources.

1. Le traitement des données ouvertes par les mégadonnées
a. Champs d’application des mégadonnées
Les mégadonnées (en anglais big data) sont des données en nombre et en taille trop importantes pour être analysées, traitées et exploitées par une activité humaine.

La mise à disposition des mégadonnées favorise le partage de connaissances et la mise en ligne d’informations pour le grand public, mais cela favorise aussi les travaux de recherche et la mise en commun d’avancées technologiques.

Le champ d’action des mégadonnées est très large. Partout où un grand nombre de données est nécessaire, un traitement informatique est pertinent.

Voici quelques domaines d’application.

  • Dans le domaine scientifique, les mégadonnées permettent par exemple de décoder le génome humain grâce aux séquenceurs d’ADN, ou de réaliser des simulations climatiques.
    Exemple
    Le premier génome humain a mis 10 ans à être décodé, cela prend désormais une semaine.
  • Dans le domaine de la vente, le nombre croissant de données exploitées permet de dresser des profils de consommation de plus en plus précis afin de maximiser le potentiel de vente.
    Exemple
    Le géant américain de la grande distribution Walmart enregistre plus d’un million de transactions clients par heure.
b. Le traitement des données ouvertes
Les données ouvertes (en anglais open data) sont des données accessibles à tous. Ces données sont publiques.

On peut trouver des données ouvertes dans les mégadonnées, elles bénéficient donc du même traitement informatique.

Les applications des mégadonnées grâce aux données ouvertes sont conséquentes et ne cessent de croitre. Seule la main d’œuvre qualifiée pour les traiter ralentit le rythme de mise à disposition auprès du grand public des données ouvertes.

Exemple de mise à disposition de données ouvertes
Les utilisateurs de transports publics utilisent quotidiennement, sans le savoir, les données ouvertes en consultant la ponctualité de leurs trains. La ponctualité des TER en région Centre Val-de-Loire est visible sur le site suivant : https://data.centrevaldeloire.fr/pages/ponctualite-ter-exintercites/
Exemple de traitement des données ouvertes
L’exploitation des données ouvertes couvre un large spectre de sujets. Les plus importantes sont les données gouvernementales avec les statistiques de l’INSEE, les données des finances publiques par les Impôts ou les données foncières et cadastrales.
2. Les enjeux et les risques du traitement des données ouvertes

Si les données constituent la matière première de tout traitement informatique, il faut pouvoir les conserver de manière à assurer leur sécurité et leur confidentialité.

Le traitement des données ouvertes représente ainsi un enjeu économique, environnemental et sociétal.

a. Un enjeu environnemental

La multiplication des usages du web et la croissance exponentielle des données à traiter nécessitent un besoin en infrastructures informatiques pour pouvoir stocker ces données de façon sécurisée : ces infrastructures sont appelées data centers.

Un data center est un endroit physique qui possède un réseau de ressources de calcul et de stockage, ce qui permet la mise à disposition d’applications logicielles et de données partagées en interne ou via internet.

Les data centers utilisent beaucoup d’énergie électrique car ils dégagent énormément de chaleur et doivent être refroidis pour éviter toute panne. Cette constante augmentation de la consommation électrique contribue à accroitre l’émission de gaz à effet de serre.

Exemple
En 2018, les ordinateurs, réseaux et data centers ont consommé près de 10 % de l’électricité mondiale (d’après un rapport du CNRS intitulé Numérique : le grand gâchis énergétique, 16 mai 2018).
b. Un enjeu sociétal

Les conséquences sociétales du traitement des données ouvertes sont nombreuses : surabondance d’informations multipliant les risques et possibilité de surveillance des individus grâce à la géolocalisation.

Le RGPD (Règlement Général sur la Protection des Données) a ainsi renforcé la protection des données personnelles dans la communauté européenne. Ce règlement s’applique à toutes les organisations (entreprises, administrations et associations) qui collectent et traitent des données numériques.

c. Un enjeu économique

La valeur économique des données ouvertes et de leur traitement n’est pas simple à estimer. McKinsey, une agence américaine de conseil auprès des organisations, l’a fait en 2013 et a conclu que la valeur économique des données ouvertes s’inscrit dans une fourchette allant de 3,2 à 5,4 milliards de dollars.

À titre d’exemple, le PIB de la France est de 2,775 milliards de dollars.

L’enjeu économique pour les états est donc de permettre, en ouvrant les données publiques, de développer de nouvelles activités qui généreront des bénéfices économiques.

La jeunesse des données ouvertes ne permet actuellement pas de donner des exemples probants de valeur économique dégagée grâce à elles, mais le futur nous apportera certainement des exemples de réussite économique liés au traitement des données ouvertes.

Vous avez déjà mis une note à ce cours.

Découvrez les autres cours offerts par Maxicours !

Découvrez Maxicours

Comment as-tu trouvé ce cours ?

Évalue ce cours !

 

quote blanc icon

Découvrez Maxicours

Exerce toi en t’abonnant

Fiches de cours les plus recherchées

Gestion et systèmes d'information

Les mégadonnées, les données ouvertes

Gestion et systèmes d'information

L'impact du numérique sur l'organisation

Gestion et systèmes d'information

Les tableaux de bord

Gestion et systèmes d'information

La prévention et la gestion des risques externes

Gestion et systèmes d'information

La prévention et la gestion des risques internes

Gestion et systèmes d'information

Les différents types d'organisations

Gestion et systèmes d'information

Les compétences

Gestion et systèmes d'information

L'émotion et la perception

Découvrir le reste du programme

Des profs en ligne

  • 6j/7 de 17 h à 20 h
  • Par chat, audio, vidéo
  • Sur les matières principales

Des ressources riches

  • Fiches, vidéos de cours
  • Exercices & corrigés
  • Modules de révisions Bac et Brevet

Des outils ludiques

  • Coach virtuel
  • Quiz interactifs
  • Planning de révision

Des tableaux de bord

  • Suivi de la progression
  • Score d’assiduité
  • Un compte Parent