Lycée   >   Premiere   >   NSI   >   Représenter un texte en utilisant différents encodages

Représenter un texte en utilisant différents encodages

  • Fiche de cours
  • Quiz
  • Profs en ligne
Objectif

Comprendre la représentation d’un texte en machine.

Point clé

Pour représenter un texte, on utilise différents encodages : l’ASCII qui est plus ancien et limité, et l’Unicode qui permet d’encoder pratiquement tous les glyphes.

Pour bien comprendre
  • Codage sur 8 bits ou plus
  • Conversion binaire/décimal
1. Codage ASCII

Les caractères sont des symboles alphanumériques : majuscules, minuscules, chiffres, ponctuation, caractères spéciaux, etc. À chaque caractère correspond un nombre en binaire.

En 1960, on normalise l’écriture avec l’ASCII de base (American Standard Code for Information Interchange), prononcé « aski ». À chaque caractère est associé un binaire sur 7 bits. Il y a donc 27 = 128 caractères numérotés de 010 à 12710 et codés en binaire de 00000002 à 11111112.


Table ASCII
Exemple
P en ASCII : 10100002. En effet, les 3 premiers bits sont donnés par le numéro de colonne associé à P, c’est-à-dire 101, puis les quatre autres bits sont donnés par le numéro de la ligne, ici 0000.
Le code ASCII de P en décimal vaut 8010.

Remarque
Le code ASCII utilisant 7 bits, il faudra souvent rajouter à gauche un huitième bit égal à 0 pour pouvoir écrire le caractère sur 1 octet (8 bits). Pour ajouter les accents, on utilise le 8e bit dans l’ASCII étendu.
Un glyphe est une représentation graphique d'un signe typographique, autrement dit d'un caractère ou d'un accent.
2. Codage Unicode

Beaucoup de langues n’utilisent pas l’alphabet latin, ce qui cause beaucoup de problèmes (par exemple les glyphes des alphabets russes ou arabes). Une nouvelle norme a donc été créée en 1991 : l’Unicode.

Le but est de rassembler tous les caractères existants, la table Unicode contient donc près de 150 000 caractères. Le codage de cette table est multiple.

Le codage le plus utilisé est l’UTF-8 qui fonctionne sur le principe suivant.

Principe du codage UTF-8

  • Les caractères « classiques » sont codés sur 1 octet.
  • Les caractères moins classiques, plus rares, sont codés sur un nombre variable d’octets (2, 3 ou 4).
Propriété
Les 128 premiers caractères de la table UTF-8 sont compatibles avec le codage ASCII. Les caractères simples Unicode codés avec UTF-8 ont exactement le même code que les mêmes caractères en ASCII.
Remarque : il existe un encodage UTF-16 et UTF-32.
À retenir
Il est important, quand on veut décoder un texte, de savoir quel est le codage utilisé, sinon le message risque d’être incompréhensible.

Comment as-tu trouvé ce cours ?

Évalue ce cours !

 

Question 1/5

La médiane de 6 notes est 13. Cela signifie que :

Question 2/5

On a obtenu la série statistique suivante :

Combien vaut la médiane ?

Question 3/5

On a obtenu la série ci-dessous :

Quelle est la médiane de cette série ?

Question 4/5

On a relevé les tailles en cm des élèves d’une classe :

 

Parmi les propositions suivantes, laquelle est vraie ?

Question 5/5

Les notes en français de deux classes littéraires sont données dans le tableau suivant :

Quelle est la note médiane ?

Vous avez obtenu75%de bonnes réponses !

Recevez l'intégralité des bonnes réponses ainsi que les rappels de cours associés :

Votre adresse e-mail sera exclusivement utilisée pour vous envoyer notre newsletter. Vous pourrez vous désinscrire à tout moment, à travers le lien de désinscription présent dans chaque newsletter. Pour en savoir plus sur la gestion de vos données personnelles et pour exercer vos droits, vous pouvez consulter notre charte.

Une erreur s'est produite, veuillez ré-essayer

Consultez votre boite email, vous y trouverez vos résultats de quiz!

Découvrez le soutien scolaire en ligne avec myMaxicours

Le service propose une plateforme de contenus interactifs, ludiques et variés pour les élèves du CP à la Terminale. Nous proposons des univers adaptés aux tranches d'âge afin de favoriser la concentration, encourager et motiver quel que soit le niveau. Nous souhaitons que chacun se sente bien pour apprendre et progresser en toute sérénité ! 

Fiches de cours les plus recherchées

NSI

Définir une liste et un p-uplet

NSI

Utiliser des p-uplets nommés

NSI

Construire et utiliser un tableau indexé

NSI

Construire et utiliser un tableau en compréhension

NSI

Utiliser des tableaux de tableaux pour représenter des matrices

NSI

Transformer les éléments d'un tableau

NSI

Définir un dictionnaire

NSI

Utiliser les clés et valeurs

NSI

Utiliser un fichier texte tabulé, notion de CSV

NSI

Utiliser un fichier CSV