Lycée   >   Premiere   >   NSI   >   Rechercher et supprimer des doublons d'un fichier CSV

Rechercher et supprimer des doublons d'un fichier CSV

  • Fiche de cours
  • Quiz
  • Profs en ligne
Objectifs

Rechercher et supprimer des éléments d’un tableau, en particulier les doublons.

Point clé

Les tableurs permettent de repérer les valeurs identiques des cellules, mais on utilise Python pour repérer et supprimer les lignes doublons d’un fichier CSV imposant.

Pour bien comprendre
  • L’indexation d’un tableau
  • L’utilisation de la bibliothèque CSV de Python pour lire un fichier CSV
  • L’utilisation de if … not in …
1. La notion de cellules doublons avec un tableur

La recherche de cellules doublons dans un tableur se fait aisément, il faut juste appliquer les étapes suivantes.

Méthode
  1. Sélectionner l’ensemble des valeurs du tableau.
  2. Dans « Accueil », choisir « Mise en forme conditionnelle ».
  3. Choisir « Règles de mise en surbrillance des cellules ».
  4. Choisir « Valeurs en double ».
Le but est de supprimer les lignes en double !
Exemple

Mise en surbrillance des doublons sous Excel
Remarque
C’est très efficace pour les fichiers CSV qui comportent un nombre de lignes pas trop grand.
2. La suppression des lignes doublons en utilisant Python

Pour supprimer les lignes doublons avec Python, on utilise la bibliothèque CSV et on ouvre le fichier CSV.

Les lignes de code suivantes permettent d’obtenir un tableau.

Remarque
« donnee » est un itérable, c’est-à-dire qu’il s’agit d’un objet dont on peut parcourir les valeurs.
Ainsi donnee[i] retourne la i-ème ligne du tableau.

Pour rechercher des doublons et les supprimer, il va donc falloir parcourir l’ensemble des lignes de ce tableau et les stocker dans une table vide tant qu’elles sont uniques.

table[] Création de la variable table
for elem in donnee: Parcours des lignes du tableau
   if elem not in table:
      table.append(elem)
Si la ligne n’est pas déjà présente,
on l’ajoute à la table
print(table) On affiche la table sans aucun doublon

Comment as-tu trouvé ce cours ?

Évalue ce cours !

 

Question 1/5

La médiane de 6 notes est 13. Cela signifie que :

Question 2/5

On a obtenu la série statistique suivante :

Combien vaut la médiane ?

Question 3/5

On a obtenu la série ci-dessous :

Quelle est la médiane de cette série ?

Question 4/5

On a relevé les tailles en cm des élèves d’une classe :

 

Parmi les propositions suivantes, laquelle est vraie ?

Question 5/5

Les notes en français de deux classes littéraires sont données dans le tableau suivant :

Quelle est la note médiane ?

Vous avez obtenu75%de bonnes réponses !

Recevez l'intégralité des bonnes réponses ainsi que les rappels de cours associés :

Votre adresse e-mail sera exclusivement utilisée pour vous envoyer notre newsletter. Vous pourrez vous désinscrire à tout moment, à travers le lien de désinscription présent dans chaque newsletter. Pour en savoir plus sur la gestion de vos données personnelles et pour exercer vos droits, vous pouvez consulter notre charte.

Une erreur s'est produite, veuillez ré-essayer

Consultez votre boite email, vous y trouverez vos résultats de quiz!

Découvrez le soutien scolaire en ligne avec myMaxicours

Le service propose une plateforme de contenus interactifs, ludiques et variés pour les élèves du CP à la Terminale. Nous proposons des univers adaptés aux tranches d'âge afin de favoriser la concentration, encourager et motiver quel que soit le niveau. Nous souhaitons que chacun se sente bien pour apprendre et progresser en toute sérénité ! 

Fiches de cours les plus recherchées

NSI

Rechercher un élément d'un fichier CSV par la logique propositionnelle

NSI

Trier une table en utilisant une bibliothèque Python

NSI

Fusionner des tables avec Python

NSI

Interagir avec une page HTML : éléments graphiques

NSI

Interagir avec une page HTML : événements

NSI

Interagir avec une page HTML : boutons cliquables

NSI

Comprendre les requêtes HTTP et la réponse serveur

NSI

Comprendre la notion de cookie

NSI

Comprendre l'intérêt du protocole HTTPS

NSI

Comprendre le fonctionnement d'un formulaire