Utiliser un fichier texte tabulé, notion de CSV
- Fiche de cours
- Quiz
- Profs en ligne
- Videos
- Application mobile
Objectif
Comprendre la notion de données, la notion de fichier texte tabulé et donc du format CSV.
Points clés
- Une donnée structurée comprend un descripteur qui permet d’interpréter la donnée.
- Un format très utilisé pour les données structurées est celui de fichier texte tabulé, dont le format le plus utilisé est le CSV.
1. La notion de données structurées
Les données sont des ensembles de symboles (mots,
nombres, images, sons, etc.) qui peuvent
représenter le monde réel (objets,
événements, personnes, etc.).
Elles peuvent être quantitatives (âge, poids, etc.) ou qualitatives (noms, numéro de sécurité sociale, etc.).
Elles peuvent être quantitatives (âge, poids, etc.) ou qualitatives (noms, numéro de sécurité sociale, etc.).
Exemple
Voici une donnée : 1 74 01 84 125 098 32. Elle représente un numéro de sécurité sociale.
Voici une donnée : 1 74 01 84 125 098 32. Elle représente un numéro de sécurité sociale.
Remarque
Une donnée devient une information que lorsqu’elle est interprétée dans son contexte.
Une donnée devient une information que lorsqu’elle est interprétée dans son contexte.
Pour qu’une donnée soit structurée, il faut qu’elle soit décrite par un descripteur (ou attribut) compréhensible par ceux qui veulent l’interpréter pour la transformer en information.
Un descripteur va indiquer à l’utilisateur
la signification des données.
Exemple
1 74 01 84 125 098 32 devient une donnée structurée en ajoutant le descripteur suivant :
1 74 01 84 125 098 32 devient une donnée structurée en ajoutant le descripteur suivant :
- sexe 1 pour H et 2 pour F (ici : 1),
- 2 derniers chiffres de l’année de naissance (ici : 74),
- numéro du mois de naissance (ici : 01),
- département de naissance (ici : 84),
- code de la commune de naissance sur 3 chiffres (ici : 125),
- ordre de naissance sur 3 chiffres (ici : 098),
- clé de vérification sur 2 chiffres (ici : 32).
Remarque
Toutes ces données sont regroupées dans des tables, on crée alors des collections qui alimentent des bases de données.
Toutes ces données sont regroupées dans des tables, on crée alors des collections qui alimentent des bases de données.
2. Texte tabulé et format CSV
Un fichier au format texte tabulé est un fichier
texte dans lequel les données sont
représentées sous forme de tableau.
Il existe différents formats : CSV, JSON, XML, etc.
Le plus utilisé est le CSV, l’un des plus récents est le JSON (JavaScript Object Notation).
Le format CSV (Comma-Separated Values) permet de
représenter des données tabulaires sous la
forme de valeurs séparées par des virgules.
Remarque
Pour créer un fichier CSV, on peut utiliser un traitement de texte, un bloc-notes, etc. Il faudra juste choisir l’extension « .csv » à l’enregistrement.
Pour ouvrir un fichier CSV, il faudra préciser l’encodage choisi (UTF-8 en général) et le délimiteur (point-virgule, virgule).
Pour créer un fichier CSV, on peut utiliser un traitement de texte, un bloc-notes, etc. Il faudra juste choisir l’extension « .csv » à l’enregistrement.
Pour ouvrir un fichier CSV, il faudra préciser l’encodage choisi (UTF-8 en général) et le délimiteur (point-virgule, virgule).
Exemple
Voici le fichier chien.csv ouvert avec Bloc-notes et Tableur.
La première ligne du fichier donne le
descripteur :
« nom, poids, âge »,
ce qui permet d’interpréter les
données structurées.
Attention, il faut utiliser l’écriture anglosaxonne des décimaux, c’est-à-dire remplacer la virgule qui sépare la partie entière de la partie décimale par un point.
Voici le fichier chien.csv ouvert avec Bloc-notes et Tableur.
Bloc-notes | Tableur |
|
|
Attention, il faut utiliser l’écriture anglosaxonne des décimaux, c’est-à-dire remplacer la virgule qui sépare la partie entière de la partie décimale par un point.
Remarque
Le tableur Excel ne lit correctement que les fichiers CSV où le séparateur est un point-virgule.
Le tableur Excel ne lit correctement que les fichiers CSV où le séparateur est un point-virgule.
Vous avez obtenu75%de bonnes réponses !