Lycée   >   Premiere techno   >   Gestion et systèmes d'information   >   Les mégadonnées et la manipulation des données ouvertes

Les mégadonnées et la manipulation des données ouvertes

  • Fiche de cours
  • Quiz
  • Profs en ligne
Objectifs
  • Comprendre la variété des usages des mégadonnées (big data).
  • Identifier les contraintes liées à la manipulation des données ouvertes.
  • Comprendre pourquoi la manipulation des données ouvertes crée de l’information.
Points clés
  • Les mégadonnées (en anglais big data) sont des données en nombre et en taille très importantes.
  • Les données ouvertes (en anglais open data) sont des données accessibles à tous. Ces données sont publiques.
  • Les traitements des mégadonnées grâce aux données ouvertes sont nombreux et variés.

Le nouvel enjeu des organisations est d’exploiter une masse de données considérable afin de créer de l’information pertinente pour le pilotage, l’analyse et la valorisation de leur activité.

Les données ouvertes et les mégadonnées sont donc indispensables pour transformer ces informations en ressources.

1. Le traitement des données ouvertes par les mégadonnées
a. Champs d’application des mégadonnées
Les mégadonnées (en anglais big data) sont des données en nombre et en taille trop importantes pour être analysées, traitées et exploitées par une activité humaine.

La mise à disposition des mégadonnées favorise le partage de connaissances et la mise en ligne d’informations pour le grand public, mais cela favorise aussi les travaux de recherche et la mise en commun d’avancées technologiques.

Le champ d’action des mégadonnées est très large. Partout où un grand nombre de données est nécessaire, un traitement informatique est pertinent.

Voici quelques domaines d’application.

  • Dans le domaine scientifique, les mégadonnées permettent par exemple de décoder le génome humain grâce aux séquenceurs d’ADN, ou de réaliser des simulations climatiques.
    Exemple
    Le premier génome humain a mis 10 ans à être décodé, cela prend désormais une semaine.
  • Dans le domaine de la vente, le nombre croissant de données exploitées permet de dresser des profils de consommation de plus en plus précis afin de maximiser le potentiel de vente.
    Exemple
    Le géant américain de la grande distribution Walmart enregistre plus d’un million de transactions clients par heure.
b. Le traitement des données ouvertes
Les données ouvertes (en anglais open data) sont des données accessibles à tous. Ces données sont publiques.

On peut trouver des données ouvertes dans les mégadonnées, elles bénéficient donc du même traitement informatique.

Les applications des mégadonnées grâce aux données ouvertes sont conséquentes et ne cessent de croitre. Seule la main d’œuvre qualifiée pour les traiter ralentit le rythme de mise à disposition auprès du grand public des données ouvertes.

Exemple de mise à disposition de données ouvertes
Les utilisateurs de transports publics utilisent quotidiennement, sans le savoir, les données ouvertes en consultant la ponctualité de leurs trains. La ponctualité des TER en région Centre Val-de-Loire est visible sur le site suivant : https://data.centrevaldeloire.fr/pages/ponctualite-ter-exintercites/
Exemple de traitement des données ouvertes
L’exploitation des données ouvertes couvre un large spectre de sujets. Les plus importantes sont les données gouvernementales avec les statistiques de l’INSEE, les données des finances publiques par les Impôts ou les données foncières et cadastrales.
2. Les enjeux et les risques du traitement des données ouvertes

Si les données constituent la matière première de tout traitement informatique, il faut pouvoir les conserver de manière à assurer leur sécurité et leur confidentialité.

Le traitement des données ouvertes représente ainsi un enjeu économique, environnemental et sociétal.

a. Un enjeu environnemental

La multiplication des usages du web et la croissance exponentielle des données à traiter nécessitent un besoin en infrastructures informatiques pour pouvoir stocker ces données de façon sécurisée : ces infrastructures sont appelées data centers.

Un data center est un endroit physique qui possède un réseau de ressources de calcul et de stockage, ce qui permet la mise à disposition d’applications logicielles et de données partagées en interne ou via internet.

Les data centers utilisent beaucoup d’énergie électrique car ils dégagent énormément de chaleur et doivent être refroidis pour éviter toute panne. Cette constante augmentation de la consommation électrique contribue à accroitre l’émission de gaz à effet de serre.

Exemple
En 2018, les ordinateurs, réseaux et data centers ont consommé près de 10 % de l’électricité mondiale (d’après un rapport du CNRS intitulé Numérique : le grand gâchis énergétique, 16 mai 2018).
b. Un enjeu sociétal

Les conséquences sociétales du traitement des données ouvertes sont nombreuses : surabondance d’informations multipliant les risques et possibilité de surveillance des individus grâce à la géolocalisation.

Le RGPD (Règlement Général sur la Protection des Données) a ainsi renforcé la protection des données personnelles dans la communauté européenne. Ce règlement s’applique à toutes les organisations (entreprises, administrations et associations) qui collectent et traitent des données numériques.

c. Un enjeu économique

La valeur économique des données ouvertes et de leur traitement n’est pas simple à estimer. McKinsey, une agence américaine de conseil auprès des organisations, l’a fait en 2013 et a conclu que la valeur économique des données ouvertes s’inscrit dans une fourchette allant de 3,2 à 5,4 milliards de dollars.

À titre d’exemple, le PIB de la France est de 2,775 milliards de dollars.

L’enjeu économique pour les états est donc de permettre, en ouvrant les données publiques, de développer de nouvelles activités qui généreront des bénéfices économiques.

La jeunesse des données ouvertes ne permet actuellement pas de donner des exemples probants de valeur économique dégagée grâce à elles, mais le futur nous apportera certainement des exemples de réussite économique liés au traitement des données ouvertes.

Comment as-tu trouvé ce cours ?

Évalue ce cours !

 

Question 1/5

La médiane de 6 notes est 13. Cela signifie que :

Question 2/5

On a obtenu la série statistique suivante :

Combien vaut la médiane ?

Question 3/5

On a obtenu la série ci-dessous :

Quelle est la médiane de cette série ?

Question 4/5

On a relevé les tailles en cm des élèves d’une classe :

 

Parmi les propositions suivantes, laquelle est vraie ?

Question 5/5

Les notes en français de deux classes littéraires sont données dans le tableau suivant :

Quelle est la note médiane ?

Vous avez obtenu75%de bonnes réponses !

Recevez l'intégralité des bonnes réponses ainsi que les rappels de cours associés :

Votre adresse e-mail sera exclusivement utilisée pour vous envoyer notre newsletter. Vous pourrez vous désinscrire à tout moment, à travers le lien de désinscription présent dans chaque newsletter. Pour en savoir plus sur la gestion de vos données personnelles et pour exercer vos droits, vous pouvez consulter notre charte.

Une erreur s'est produite, veuillez ré-essayer

Consultez votre boite email, vous y trouverez vos résultats de quiz!

Découvrez le soutien scolaire en ligne avec myMaxicours

Le service propose une plateforme de contenus interactifs, ludiques et variés pour les élèves du CP à la Terminale. Nous proposons des univers adaptés aux tranches d'âge afin de favoriser la concentration, encourager et motiver quel que soit le niveau. Nous souhaitons que chacun se sente bien pour apprendre et progresser en toute sérénité ! 

Fiches de cours les plus recherchées

Gestion et systèmes d'information

Les mégadonnées, les données ouvertes

Gestion et systèmes d'information

La diversité des usages dans le numérique dans l'organisation du travail

Gestion et systèmes d'information

L'impact du numérique sur le partage de l'information d'une organisation

Gestion et systèmes d'information

L'impact du numérique sur l'organisation

Gestion et systèmes d'information

Les tableaux de bord

Gestion et systèmes d'information

La prévention et la gestion des risques externes

Gestion et systèmes d'information

La prévention et la gestion des risques internes

Gestion et systèmes d'information

Les différents types d'organisations

Gestion et systèmes d'information

Les compétences

Gestion et systèmes d'information

L'émotion et la perception