Les caractéristiques des données structurées - Maxicours

Les caractéristiques des données structurées

Objectifs
  • Définir une donnée personnelle.
  • Distinguer la valeur d’une donnée de son descripteur.
  • Identifier les différents descripteurs d’une donnée.
Points clés
  • Une donnée (data en anglais) est une valeur attribuée à une entité pour la décrire. Il peut s’agir d’un objet, d’une personne, d’un événement, etc.
  • Une donnée personnelle est une donnée qui identifie directement ou indirectement une personne physique.
  • En France, les données personnelles sont protégées par la CNIL.
  • On représente des données ayant des descripteurs identiques sous forme de tables appelées collections.
  • Les bases de données sont un regroupement de collections reliées entres elles.
  • Les données sont structurées lorsqu’elles sont classées sous la forme de tables.
1. Qu'est-ce qu'une donnée ?
a. La donnée
Une donnée (data en anglais) est une valeur attribuée à une entité pour la décrire. Cette entité peut être un objet, une personne, un événement, etc.
Une donnée personnelle est une donnée qui identifie directement ou indirectement une personne physique.

Une donnée peut être élémentaire ou complexe.

  • Une donnée élémentaire représente une caractéristique de base (un nom, un numéro, etc.). Cette donnée est caractérisée par un descripteur qui permet de donner le format dans lequel cette donnée est représentée.
  • Une donnée complexe est constituée de plusieurs données élémentaires.
Exemple
On prend le cas d’une adresse postale. Il s’agit d’une donnée complexe constituée de 8 données élémentaires.

L’adresse postale : une donnée complexe

Les données élémentaires sont les suivantes.
  1. La civilité, dont le descripteur est une chaine de 4 caractères maximum (de valeur « M. » ou « Mme »).
  2. Le prénom, dont le descripteur est une chaine de 32 caractères maximum.
  3. Le nom, dont le descripteur est une chaine de 32 caractères maximum.
  4. Le numéro de rue, dont le descripteur est une chaine de 10 caractères maximum (par exemple « 125 bis »).
  5. Le type de voie, dont le descripteur est une chaine de 16 caractères maximum (par exemple « Rue », « Avenue », « impasse », etc.).
  6. Le nom de la voie, dont le descripteur est une chaine de 48 caractères maximum.
  7. Le code postal, dont le descripteur est un nombre entier.
  8. La ville, dont le descripteur est une chaine de 32 caractères maximum.
b. La protection des données personnelles

Les données personnelles sont protégées dans tous les états membres de l’Union Européenne par une loi Informatique et libertés.

En France, l’autorité compétente est la Commission Nationale de l’Informatique et des Libertés (CNIL). Elle est chargée de veiller à la protection de l’identité humaine, des droits de l’homme, de la vie privée et des libertés individuelles.

c. Le cycle de vie d'une donnée

Les données constituent la matière première de toute activité numérique.

Ces données ne sont cependant pas permanentes et possèdent un cycle de vie bien défini.

  1. Collecte
    Il faut commencer par recueillir les données.
  2. Traitement et Partage
    Étant donné la grande quantité de données, il est indispensable de les traiter et de les partager aux différents acteurs afin de préparer leur analyse.
  3. Analyse
    L’analyse permet de donner du sens aux données afin de mettre en place des actions. À l’issue de cette phase, on parle d’informations.
  4. Sauvegarde
    Il est nécessaire de sauvegarder les données pour pouvoir les restaurer à l’identique en cas de panne ou de perte d’un support de stockage.
  5. Archivage
    Les données doivent être conservées uniquement pour la durée nécessaire à l’opération pour laquelle elles ont été recueillies et traitées.
  6. Destruction
    Les données sont détruites lorsqu’elles deviennent obsolètes.

Cycle de vie d’une donnée
2. La structuration des données
a. La collection

Les données utilisées pour une application donnée sont souvent très nombreuses. Il est donc nécessaire de les organiser pour pouvoir les utiliser de manière efficace.

Lorsque des données partagent les mêmes descripteurs, on les rassemble dans une collection.

On les présente souvent sous forme de tables dont les colonnes représentent les descripteurs et les lignes représentent les données. La valeur de cette donnée se lit ainsi à l’intersection de la ligne et de la colonne.

Exemple
On donne ci-dessous une table qui représente un extrait de la collection des bandes dessinées d’une bibliothèque.
Série Titre de l’album Dessinateur Éditeur Année de parution
Tintin Tintin au Tibet Hergé Casterman 1959
Astérix le Gaulois La serpe d’or Uderzo Dargaud 1962
Lefranc La grande menace Martin Le Lombard 1954
Blake et Mortimer La marque jaune Jacobs Le Lombard 1956
Lorsque l’on peut classer les données sous la forme de tables, on parle de données structurées.
b. La base de données

Lorsque l’on regroupe des collections de données reliées entre elles, on parle de base de données.

Une base de données est représentée dans un format spécifique qui fait apparaitre les collections (sous forme de tables) et les liens entre ces collections (appelées relations).

Exemple
On donne ci-dessous le modèle d’une base de données utilisée par un jeu sur smartphone, où l’on distingue les 3 collections : joueurs, parties et scores.

Repères historiques

Voici quelques repères historiques dans le domaine des données structurées.

  • 1930 : Utilisation des cartes perforées comme premier support de stockage de données.
  • 1956 : Invention du disque dur avec une capacité de 5 Mo (mégaoctet).
  • 1979 : Création du premier tableur VisiCalc qui permet de visualiser des données sous forme de tableaux.
  • 1982 : Commercialisation du CD-ROM qui permet d’étendre le stockage à 700 Mo.
  • 1995 : Invention du DVD qui permet d’étendre encore l’espace de stockage à 4,7 Go (1 Go (gigaoctet) = 1024 Mo).
  • 1997 : Le terme Big Data apparait pour désigner de gros ensembles de données de natures variées, toujours en constante évolution.
  • 1999 : Invention de la clé USB, ce qui permet le transport des données dans sa poche.
  • 2009 : Création du terme Open Data qui caractérise le libre accès des données sous l’impulsion du président américain Barack Obama.
  • 2016 : La capacité des nouveaux disques durs SSD atteint 17 To (1 To (téraoctet) = 1024 Go).

Vous avez déjà mis une note à ce cours.

Découvrez les autres cours offerts par Maxicours !

Découvrez Maxicours

Comment as-tu trouvé ce cours ?

Évalue ce cours !

 

quote blanc icon

Découvrez Maxicours

Exerce toi en t’abonnant

Des profs en ligne

  • 6 j/7 de 17 h à 20 h
  • Par chat, audio, vidéo
  • Sur les matières principales

Des ressources riches

  • Fiches, vidéos de cours
  • Exercices & corrigés
  • Modules de révisions Bac et Brevet

Des outils ludiques

  • Coach virtuel
  • Quiz interactifs
  • Planning de révision

Des tableaux de bord

  • Suivi de la progression
  • Score d’assiduité
  • Un compte Parent

Inscrivez-vous à notre newsletter !

Votre adresse e-mail sera exclusivement utilisée pour vous envoyer notre newsletter. Vous pourrez vous désinscrire à tout moment, à travers le lien de désinscription présent dans chaque newsletter. Conformément à la Loi Informatique et Libertés n°78-17 du 6 janvier 1978 modifiée, au RGPD n°2016/679 et à la Loi pour une République numérique du 7 octobre 2016, vous disposez du droit d’accès, de rectification, de limitation, d’opposition, de suppression, du droit à la portabilité de vos données, de transmettre des directives sur leur sort en cas de décès. Vous pouvez exercer ces droits en adressant un mail à : contact-donnees@sejer.fr. Vous avez la possibilité de former une réclamation auprès de l’autorité compétente. En savoir plus sur notre politique de confidentialité