C - Données structurées
Tables de données
Pour exploiter efficacement un ensemble d'informations, on les organise souvent sous la forme d'un tableau que l'on appelle une table de données. Cette présentation structurée permet de retrouver rapidement une valeur et d'effectuer des traitements automatisés.
La première ligne de cette table contient des descripteurs (parfois appelés champs ou attributs). Chaque descripteur précise la nature des informations qui figurent dans la colonne correspondante.
Chaque ligne suivante de la table correspond à un objet. Un objet est donc un élément de la table, caractérisé par l'ensemble des valeurs qu'il prend pour chaque descripteur.
L'ensemble des objets qui partagent exactement les mêmes descripteurs constitue une collection. On dit alors que les données sont structurées, car elles obéissent à une organisation régulière et prévisible.
Formats et représentations des données
Pour que ces données ne disparaissent pas à la fermeture du logiciel, on les enregistre dans des fichiers sur un support de stockage. À l'intérieur d'un fichier, les informations sont rangées selon une organisation précise qui facilite leur lecture et leur modification par un programme.
La manière dont les données sont organisées dans un fichier détermine son format. On peut classer les formats en deux grandes catégories selon la façon dont l'information y est représentée.
Formats texte : Ces formats ne contiennent que des caractères alphanumériques et peuvent être ouverts avec un simple éditeur comme Notepad++ ou le Bloc-Notes. L'utilisateur peut donc lire et modifier directement le contenu.
Exemples courants : CSV, JSON, XML...
Formats binaires :Ces formats stockent l'information sous une forme directement exploitable par la machine, mais illisible pour un humain sans logiciel spécifique. Ils sont principalement utilisés par les tableurs pour conserver, en plus des données, des formules et des mises en forme.
Exemples : ODS (LibreOffice Calc), XLSX (Microsoft Excel)...
Un format de données est qualifié d'ouvert (ou libre) lorsque sa spécification a été rendue publique par son créateur et qu'aucune restriction légale n'en limite l'utilisation par des logiciels tiers.
Syntaxe : Format CSV
Le .CSV (Comma Separated Values) est le format texte le plus simple pour représenter une table. Chaque ligne du fichier correspond à un objet, et les valeurs des descripteurs sont séparées par un caractère dédié, généralement une virgule ou un point-virgule (en France, on privilégie le point-virgule car la virgule sert de séparateur décimal).
Nom,Departement,Population
Amiens,80,133625
Beauvais,60,56677
Saint-Quentin,02,52958
Compiègne,60,40394
Creil,60,36106
Soissons,02,28705
Laon,02,24021
Abbeville,80,22595
Nogent-sur-Oise,60,21382
Syntaxe : Format JSON
Le .JSON (JavaScript Object Notation) est un format texte inspiré de la syntaxe des objets du langage JavaScript. Il permet de décrire des structures plus complexes que le simple tableau, en associant à chaque descripteur sa valeur entre accolades.
{"Nom": "Amiens",
"Departement": 80,
"Habitants": 136449,
},
{"Ville": "Beauvais",
"Departement": 60,
"Habitants": 55550,
}
Syntaxe : Format XML
Le .XML (eXtensible Markup Language) est un format de balisage extensible. Les données y sont encadrées par des balises ouvrantes et fermantes qui en précisent la signification. Il est très utilisé pour les échanges automatisés entre systèmes d'information.
<ville>
<nom>Amiens</nom>
<dep>80</dep>
<pop>136449</pop>
</ville>
<ville>
<nom>Beauvais</nom>
<dep>60</dep>
<pop>55550</pop>
</ville>
Bases de données
Une base de données est un ensemble structuré de tables qui sont reliées entre elles par l'intermédiaire de descripteurs communs. Cette organisation permet d'éviter de répéter inutilement les mêmes informations dans plusieurs endroits (on parle de redondance) et facilite le croisement des données pour obtenir de nouvelles informations.
Pour interroger une base de données, on utilise des requêtes exprimées dans un langage dédié. Le logiciel qui gère ces opérations est appelé un Système de Gestion de Bases de Données (SGBD).
Exemple concret : imaginons une bibliothèque musicale. Plutôt que de saisir à chaque fois le nom de l'interprète pour chacun de ses morceaux, on crée une table Morceaux et une table Interprètes. On les relie ensuite par un identifiant commun, ce qui évite les répétitions et les risques d'erreur de saisie.


