A - HTML

HTML signifie « HyperText Markup Language ». C’est un langage qui permet de composer des pages Web de manière structurée et organisée. On parle de langage de balisage et non de langage de programmation, car le rôle principal du HTML n’est pas de créer des programmes ou des calculs, mais plutôt de d'encadrer les différents éléments présents dans une page, tels que les images, les titres, les paragraphes ou les listes. Chaque élément est entouré de balises, qui servent à définir son rôle et à lui donner un sens précis dans la structure de la page.

SyntaxeQuelques balises HTML

Voici quelques exemples de balises HTML fréquemment utilisées pour structurer et mettre en forme le contenu d’une page web :

  • <h1>, ..., <h6> : ces balises définissent les niveaux de titre et de sous-titres, du plus important (<h1>) au moins important (<h6>). Elles permettent d’organiser le texte et de faciliter la lecture.

  • <p> : cette balise sert à créer un paragraphe. Elle sépare le texte en blocs distincts pour améliorer la présentation et la clarté du contenu.

  • <b> : le texte placé entre ces balises apparaît en gras, ce qui permet de mettre en avant certains mots ou expressions importantes.

  • <i> : le texte placé entre ces balises apparaît en italique, utile pour souligner ou distinguer certains termes, comme des titres d’œuvres ou des mots étrangers.

  • <ul> : cette balise crée une liste à puces, utilisée pour énumérer des éléments sans ordre particulier.

  • <li> : chaque élément d’une liste, qu’elle soit à puces (<ul>) ou numérotée (<ol>), est placé entre ces balises.

  • <a href="dest"> : cette balise crée un lien hypertexte vers une autre page web. L’adresse URL de la page cible est indiquée dans l’attribut href.

  • <img src="photo.jpg"> : cette balise permet d’afficher une image stockée à l’adresse URL indiquée dans l’attribut src. Elle est utilisée pour insérer des illustrations ou des photos dans une page web.

ExempleExemple de code HTML

Exemple de code HTML

RemarquePython et les URL

requests est un module Python qui permet d’utiliser le protocole HTTP, c’est-à-dire le protocole utilisé pour communiquer avec des sites web. Grâce à ce module, il est possible d’envoyer des requêtes à des serveurs web et de récupérer leurs réponses directement dans un programme Python. Le programme suivant montre un exemple concret : il permet d’extraire le code source d’une page web en utilisant simplement son URL. Cette fonctionnalité est très utile pour analyser le contenu d’une page, automatiser la collecte de données ou créer des applications web.

Extraire le code source HTML d'un site internet

Attention : Le code ci-dessus ne retournera rien sur d'autres pages que celle de cet exemple car les éditeurs Python en ligne n'autorisent pas l'utilisation du module requests pour des questions de sécurité. Pour utiliser ce code Python avec d'autres sites, on peut utiliser un éditeur local, comme EduPython ou Thonny.