J’ai écrit mon propre OS en 2006. En 2026, tu devrais écrire ton propre LLM

April 11, 2026

De MINIX aux LLMs : pourquoi les gens en cybersécurité doivent comprendre ce qu’ils défendent

En 2006, je compilais mon propre noyau Linux. Je lisais Operating Systems: Design and Implementation de Tanenbaum et Woodhull, la 3e édition, celle qui venait avec le code source complet de MINIX 3 sur CD-ROM. J’écrivais mon propre système d’exploitation. Je faisais de la recherche sur les vulnérabilités, j’étudiais les shellcodes, je désassemblais des binaires pour comprendre exactement ce qui se passait entre le processeur et la mémoire quand un buffer overflow permettait d’exécuter du code arbitraire.

À cette époque, si tu travaillais en sécurité informatique, c’était un passage obligé. Tu ne pouvais pas prétendre défendre des systèmes que tu ne comprenais pas. Personne ne prenait au sérieux un analyste qui n’avait jamais regardé ce qui se passait au-delà de l’interface graphique. Tanenbaum t’apprenait comment un OS orchestrait ses processus, sa mémoire et ses interruptions. Erickson, avec Hacking: The Art of Exploitation, t’apprenait comment exploiter ces mêmes mécanismes en assembleur x86. Le Shellcoder’s Handbook de Chris Anley et son équipe t’emmenait encore plus loin : stack overflows, heap overflows, format strings, shellcoding sur Linux, Windows, Solaris et SPARC.

La logique était simple : pour sécuriser quelque chose, il faut d’abord savoir comment ça fonctionne, puis comment ça casse.


2026 : les LLMs sont le nouveau système d’exploitation

Vingt ans plus tard, les Large Language Models occupent une place dans nos infrastructures qui rivalise avec celle qu’occupaient les systèmes d’exploitation en 2006. Depuis 2023, les LLMs sont partout. Pas seulement dans les laboratoires de recherche : dans les entreprises, dans les flux de travail quotidiens, dans les produits que nos clients utilisent. Certaines personnes organisent littéralement toute leur vie autour de ces systèmes (gestion de tâches, rédaction, recherche, prise de décisions). On parle de « Life OS » pour décrire cette dépendance croissante.

Et pourtant, la majorité des professionnels en sécurité informatique ne savent pas comment un LLM fonctionne. Pas au niveau superficiel (ça, tout le monde a vu un diagramme de transformer dans une présentation PowerPoint). Je parle du niveau fondamental. Comment un tokenizer découpe le texte en sous-mots. Comment les embeddings projettent ces tokens dans un espace vectoriel de haute dimension. Comment le mécanisme d’attention (le cœur de l’architecture transformer) calcule les relations entre chaque token et tous les autres dans une séquence. Comment la fonction softmax transforme des scores bruts en distributions de probabilité. Comment le pré-entraînement sur des milliards de tokens crée des représentations internes du langage, et comment le fine-tuning et le RLHF alignent ces représentations sur des comportements spécifiques.

C’est exactement le même angle mort qu’en 2006, transposé à une nouvelle couche de la stack technologique.


Les deux ressources que tout professionnel en cybersécurité devrait connaître

Sebastian Raschka, Build a Large Language Model (From Scratch) (Manning, 2024)

Le livre s’inspire du principe attribué à Richard Feynman : « Je ne comprends rien de ce que je ne peux pas construire. » Raschka, chercheur en ingénierie LLM avec plus d’une décennie d’expérience en IA, guide le lecteur à travers la construction complète d’un LLM de style GPT, étape par étape. Sans s’appuyer sur des bibliothèques LLM existantes, on code un modèle de base, on le transforme en classificateur de texte, puis en chatbot capable de suivre des instructions conversationnelles.

La table des matières couvre les fondamentaux des LLMs, le traitement des données textuelles, le codage des mécanismes d’attention, l’implémentation d’un modèle GPT depuis zéro, le pré-entraînement sur des données non étiquetées, le fine-tuning pour la classification et le fine-tuning pour suivre des instructions. Le livre inclut même une annexe sur le fine-tuning efficace en paramètres avec LoRA.

Ce qui rend ce livre particulièrement pertinent pour la cybersécurité : quand tu as codé toi-même chaque composante (le tokenizer, les couches d’attention, la boucle d’entraînement), tu comprends intuitivement où se trouvent les surfaces d’attaque. Les prompt injections ne sont plus des curiosités abstraites; elles deviennent des conséquences logiques de l’architecture. Le data poisoning devient compréhensible quand tu as toi-même préparé un dataset d’entraînement. Le model extraction prend sens quand tu as toi-même chargé et inspecté des poids pré-entraînés.

Andrej Karpathy, nanochat (GitHub, 2025)

Si le livre de Raschka est le Tanenbaum des LLMs, nanochat est le MINIX. nanochat est le harness expérimental le plus simple pour entraîner des LLMs, conçu pour tourner sur un seul nœud GPU, avec un code minimal et hackable couvrant toutes les étapes majeures : tokenisation, pré-entraînement, fine-tuning, évaluation, inférence et interface web de chat.

La promesse est spectaculaire : on peut entraîner son propre LLM de niveau GPT-2 (un modèle qui coûtait environ 43 000 $ USD à entraîner en 2019) pour seulement 73 $ USD (environ 3 heures sur un nœud de 8 GPU H100). Et ensuite, on peut lui parler via une interface web à la ChatGPT.

Le projet est configuré avec un seul paramètre de complexité : --depth, le nombre de couches dans le transformer. Tous les autres hyperparamètres (largeur du transformer, nombre de têtes d’attention, taux d’apprentissage, horizon d’entraînement) sont calculés automatiquement de manière optimale. Pour les professionnels en sécurité, c’est idéal : le code est lisible, minimal, et chaque composante est exposée. Pas de frameworks gigantesques qui obscurcissent la logique. Un seul fichier cohérent qu’on peut lire, modifier et comprendre.

Le code est sur GitHub: https://github.com/karpathy/nanochat


Le parallèle n’est pas une métaphore

En 2006, Tanenbaum te donnait MINIX pour que tu puisses voir le code d’un vrai OS, le compiler, le modifier et observer les conséquences. En 2025, Raschka et Karpathy offrent exactement la même chose pour les LLMs.

En 2006, The Shellcoder’s Handbook et Hacking: The Art of Exploitation t’apprenaient comment les systèmes que tu défendais pouvaient être subvertis au niveau le plus bas. Aujourd’hui, comprendre comment les tokens traversent les couches d’attention, comment les poids encodent des biais, comment le fine-tuning peut être manipulé : c’est l’équivalent exact de comprendre comment un buffer overflow détourne le pointeur d’instruction.

Si tu es en cybersécurité en 2026 et que tu ne comprends pas comment un transformer fonctionne, tu es dans la même position que quelqu’un qui défendait des serveurs en 2006 sans avoir jamais ouvert un désassembleur. Les outils ont changé. L’exigence fondamentale, elle, n’a pas changé du tout : comprends ce que tu défends, ou quelqu’un d’autre le fera à ta place (et pas dans ton intérêt).

Lis Raschka. Clone nanochat. Entraîne un modèle. Regarde ce qui se passe à l’intérieur. C’est comme ça qu’on faisait en 2006. C’est comme ça qu’on devrait encore faire aujourd’hui.

Image placeholder

Leave a Reply

Discover more from Pier-Luc Charbonneau

Subscribe now to keep reading and get access to the full archive.

Continue reading