1. C'est quoi l'open source ? La Big Picture pour démarrer
Définition simple
L'open source, c'est un logiciel dont le code source est public : n'importe qui peut le lire, le modifier, le redistribuer — gratuitement et légalement, dans le respect d'une licence.
Mais open source ≠ gratuit. C'est avant tout un modèle de collaboration ouvert, opposé au logiciel propriétaire dont le code est caché (closed source).
Les 4 libertés fondamentales (FSF)
Définies par Richard Stallman et la Free Software Foundation, elles sont la base philosophique du libre :
Pour tout usage, sans restriction.
Lire le code, comprendre, adapter.
Partager des copies.
Modifier et publier les versions modifiées.
Free Software (FSF) et Open Source (OSI) recouvrent en pratique les mêmes logiciels, mais avec des accents différents : philosophique pour la FSF, pragmatique pour l'OSI.
Open source vs Free software vs Source-available
| Catégorie | Code visible | Modifiable | Redistribuable | Usage commercial |
|---|---|---|---|---|
| Open source (OSI) | Oui | Oui | Oui | Oui |
| Free software (FSF) | Oui | Oui | Oui | Oui |
| Source-available | Oui | Limité | Limité | Souvent restreint |
| Propriétaire | Non | Non | Non | Selon licence achetée |
BUSL (Business Source License) ou SSPL (MongoDB) sont parfois présentées comme "open source" mais ne le sont pas au sens OSI. C'est le piège du source-available.2. Histoire & Timeline du libre De Berkeley aux LLM ouverts
50 ans en 12 dates clés
1969 — UNIX naît aux Bell Labs
Ken Thompson et Dennis Ritchie créent UNIX, distribué avec son code source aux universités. Première forme moderne de logiciel libre, même si le terme n'existe pas encore.
1983 — Le projet GNU
Richard Stallman lance le projet GNU (GNU's Not Unix) pour créer un système d'exploitation entièrement libre. Il fonde la Free Software Foundation en 1985.
1989 — La licence GPL v1
Première version de la GNU General Public License, qui invente le copyleft : un code libre qui le reste à perpétuité.
1991 — Linus Torvalds publie Linux
Étudiant finlandais, il poste sur Usenet : "I'm doing a (free) operating system, just a hobby, won't be big and professional like gnu". L'histoire décidera autrement.
1995 — Apache HTTP Server
Le serveur web qui propulsera la majorité d'Internet. La Apache Software Foundation est créée en 1999.
1998 — Naissance du terme "Open Source"
Eric Raymond, Bruce Perens et d'autres fondent l'Open Source Initiative (OSI) pour rendre le libre acceptable en entreprise. Netscape libère Mozilla la même année.
2004 — Ubuntu & Firefox
Canonical lance Ubuntu, distribution Linux grand public. Firefox 1.0 sort la même année et casse le monopole d'Internet Explorer.
2008 — GitHub
Plateforme qui démocratise la collaboration sur du code open source. Aujourd'hui, +100 millions de développeurs y travaillent.
2014 — Kubernetes
Google libère l'orchestrateur de conteneurs qui devient le standard du cloud moderne. La Cloud Native Computing Foundation est créée en 2015.
2018 — Microsoft rachète GitHub (7,5 Md$)
Symbole d'un basculement : l'ennemi historique du libre devient un de ses plus gros contributeurs (VS Code, TypeScript, .NET Core).
2023 — Llama 2 ouvre l'IA
Meta publie Llama 2 en poids ouverts. Premier LLM sérieux librement réutilisable, qui amorce la révolution IA libre.
2025-2026 — L'explosion de l'IA open source
DeepSeek-V3, Qwen 3, Mistral Large 3, Llama 4, Kimi K2, GLM 4.5… Les modèles ouverts rattrapent (et parfois dépassent) les modèles fermés. Voir section 5.
3. Les licences Le cœur juridique du libre
Permissive vs Copyleft — La distinction fondamentale
Permissive (MIT, BSD, Apache)
- Faites ce que vous voulez, même du propriétaire
- Obligation : conserver la mention de copyright
- Compatibles entre elles & avec presque tout
- Privilégiées par les entreprises
Copyleft (GPL, AGPL, MPL)
- Si vous redistribuez, vous devez rester sous la même licence
- "Viral" : oblige les dérivés à rester libres
- Garantit que le libre reste libre
- Plus contraignante en contexte commercial
Le top 7 des licences à connaître Indispensable
| Licence | Type | Usage commercial | Code modifié doit être publié ? | Exemples |
|---|---|---|---|---|
| MIT | Permissive | Oui | Non | React, Node.js, Vue, Rails |
| Apache 2.0 | Permissive | Oui | Non | Kubernetes, Android, Llama |
| BSD-2 / BSD-3 | Permissive | Oui | Non | FreeBSD, Nginx |
| GPL v3 | Copyleft fort | Oui (avec conditions) | Oui (si redistribution) | GIMP, Bash, GCC |
| LGPL v3 | Copyleft faible | Oui | Modifications du LIB seulement | glibc, FFmpeg (parts) |
| AGPL v3 | Copyleft réseau | Oui (avec conditions) | Oui, même en SaaS | MongoDB (jusqu'à 2018), Mastodon |
| MPL 2.0 | Copyleft fichier | Oui | Sur les fichiers MPL uniquement | Firefox, LibreOffice |
Les licences "presque open source" — Attention au piège
Depuis 2018, plusieurs éditeurs ont quitté les licences OSI pour se protéger des hyperscalers (AWS, Azure, GCP) :
- SSPL (MongoDB, Elastic) : oblige à libérer toute l'infra du SaaS qui l'utilise. Non reconnue OSI.
- BUSL (HashiCorp Terraform, Sentry) : non commerciale 4 ans, puis bascule en Apache. Source-available.
- Elastic License v2 : interdit la revente en SaaS. Non OSI.
- Commons Clause : ajout à une licence pour interdire la revente.
Comment choisir une licence pour votre projet
- Vous voulez le maximum d'adoption ? → MIT ou Apache 2.0
- Vous voulez protéger les contributions et garder l'esprit libre ? → GPL v3
- Vous publiez un service web et voulez que les forks SaaS partagent ? → AGPL v3
- Vous publiez une bibliothèque (lib) utilisable dans du proprio ? → LGPL ou MPL
- Vous déposez des brevets ? → Apache 2.0 (clause brevets explicite)
Outils utiles : choosealicense.com (par GitHub), tldrlegal.com.
4. État des lieux 2026 Les chiffres et les acteurs qui comptent
L'open source en chiffres
contiennent de l'OSS
(Synopsys OSSRA 2024)
sur GitHub
vient de paquets OSS
de l'OSS pour l'économie
(Harvard, 2024)
Les fondations qui structurent l'écosystème
| Fondation | Créée | Domaines | Projets phares |
|---|---|---|---|
| Linux Foundation | 2000 | OS, cloud, automotive, IA | Linux, Kubernetes (CNCF), Node.js, OpenTofu, PyTorch |
| Apache Software Foundation | 1999 | Web, big data, messaging | HTTP Server, Kafka, Spark, Airflow, Cassandra |
| Eclipse Foundation | 2004 | IDE, Java EE (Jakarta), IoT | Eclipse IDE, Jakarta EE, Theia |
| Free Software Foundation | 1985 | Outils GNU, militantisme | GCC, GNU Coreutils, Emacs |
| Mozilla Foundation | 2003 | Web ouvert | Firefox, Rust (initialement), MDN |
| OpenJS Foundation | 2019 | JavaScript | Node.js, Electron, ESLint, Webpack |
| Python Software Foundation | 2001 | Python & PyPI | CPython, PyPI |
Les hyperscalers et l'open source — Amour-haine
Les géants tech sont à la fois les plus gros contributeurs et les plus gros consommateurs de l'OSS :
- Microsoft : VS Code, TypeScript, .NET Core, Playwright, propriétaire de GitHub et npm
- Google : Kubernetes, Go, Angular, TensorFlow, Chromium, Android (AOSP)
- Meta : React, PyTorch, Llama, Cassandra (origine), GraphQL, Yarn
- Amazon : OpenSearch, Bottlerocket, Firecracker, AWS SDKs
- Apple : Swift, WebKit, LLVM (origine du compilateur Clang)
5. Le tournant IA open source 2025-2026 Le rattrapage qui change tout
Ce qui s'est passé en 18 mois CRUCIAL
Fin 2023, l'IA performante était quasi-monopolisée par les API fermées (OpenAI GPT-4, Anthropic Claude, Google Gemini). En avril 2026, l'écart est marginal sur la plupart des benchmarks entre modèles ouverts et fermés.
Trois bascules majeures :
- Décembre 2024 : DeepSeek-V3 (671B paramètres MoE) atteint GPT-4o pour 1/40ème du coût d'entraînement.
- 2025 : Qwen (Alibaba), Llama 4 (Meta), Mistral Large 3, Kimi K2 (Moonshot), GLM 4.5 (Zhipu), Reka Flash 3 déferlent. Tous publiés en poids ouverts.
- Début 2026 : les premiers reasoning models open source (DeepSeek R2, QwQ-Max) rivalisent avec o3 et Claude 3.7 sur les benchmarks de raisonnement.
Les LLMs ouverts à connaître en 2026
| Modèle | Éditeur | Licence | Forces |
|---|---|---|---|
| Llama 4 | Meta | Llama Community License* | Écosystème massif, multimodal, multi-tailles |
| DeepSeek-V3 / R2 | DeepSeek (CN) | MIT (poids) | Raisonnement, math, code, très économique |
| Qwen 3 | Alibaba | Apache 2.0 (la plupart) | Multilingue (zh/en), très polyvalent |
| Mistral Large 3 | Mistral AI (FR) | Apache 2.0 (variantes) | Européen, latence faible, très compétitif |
| Kimi K2 | Moonshot AI | Modified MIT | Long context (200k+), agents |
| GLM 4.5 | Zhipu AI | MIT | Bilingue, raisonnement |
| Gemma 3 | Gemma License* | Petits formats efficaces (2B-27B) | |
| Phi-4 | Microsoft | MIT | Petit (14B) mais très performant |
* Licences "open weights" non OSI : libres pour la plupart des usages mais avec restrictions (clause d'usage acceptable, seuil utilisateurs, etc.).
Open weights vs Open source — La nuance qui compte
La plupart des "LLMs open source" diffusent uniquement les poids du modèle (les milliards de paramètres entraînés), pas les données d'entraînement ni le code complet. C'est de l'open weights, pas du vrai open source.
| Niveau d'ouverture | Code | Poids | Données | Méthode | Exemples |
|---|---|---|---|---|---|
| Fermé (closed) | Non | Non | Non | Non | GPT-5, Claude 4, Gemini 2.5 |
| Open weights | Partiel | Oui | Non | Partiel | Llama 4, Gemma 3, Mistral |
| Open source (au sens OSI/OSAID) | Oui | Oui | Oui ou recettes | Oui | OLMo (AI2), Pythia, Mistral 7B v0.1 |
Stack IA open source en 2026 — L'essentiel
Inférence locale / serveur
- Ollama — Le plus simple pour faire tourner un LLM en local
- llama.cpp — Inférence C++ ultra-optimisée (CPU/GPU)
- vLLM — Serveur d'inférence haute performance pour la prod
- Text Generation Inference (HF) — Stack Hugging Face
Frameworks & orchestration
- LangChain / LangGraph — Orchestration agents
- LlamaIndex — RAG, indexation, query
- Haystack — Pipeline NLP/RAG (Apache 2.0)
- Transformers (HF) — Le standard de l'écosystème
Bases vectorielles
- Qdrant — Rust, Apache 2.0, très perf
- Weaviate — BSD-3, hybrid search
- Chroma — Apache 2.0, simple à démarrer
- pgvector — Extension PostgreSQL
UI & Frontends
- Open WebUI — Le "ChatGPT" local pour Ollama
- LibreChat — Multi-providers (OpenAI, Anthropic, locaux)
- Jan — App desktop offline-first (AGPL)
- Continue.dev — Copilote IDE open source
Pourquoi c'est un tournant stratégique
- Souveraineté numérique : faire tourner un LLM on-premise / dans son cloud européen, sans envoyer de données chez OpenAI ou Anthropic.
- Contrôle des coûts : au-delà d'un certain volume, l'open source devient drastiquement moins cher que les API.
- Spécialisation : fine-tuning sur ses données métier — impossible avec une API fermée.
- Audit & sécurité : vérifier comment le modèle se comporte, supprimer les biais, contrôler les fuites.
- Conformité (RGPD, AI Act) : beaucoup plus simple avec un modèle qui tourne sur infrastructure maîtrisée.
6. Stack open source de référence Les briques utilisées partout
OS & runtimes
- Linux (kernel) — GPL v2 — 96% des serveurs publics, 100% des supercalculateurs du Top500.
- Distributions : Ubuntu / Debian, RHEL / Rocky / AlmaLinux, Alpine (léger, conteneurs).
- FreeBSD / OpenBSD — BSD — alternatives historiques très sécurisées.
Web & serveurs
- Nginx — BSD-2 — reverse proxy / serveur web le plus utilisé.
- Apache HTTP Server — Apache 2.0 — historique, toujours partout (LAMP).
- Caddy — Apache 2.0 — HTTPS automatique, configuration moderne.
- HAProxy — GPL v2 — load balancer haute performance.
- Traefik — MIT — reverse proxy cloud-native.
Bases de données
- PostgreSQL — PostgreSQL License (proche BSD) — le SGBD relationnel de référence.
- MariaDB — GPL v2 — fork communautaire de MySQL.
- SQLite — Domaine public — embarqué partout (mobiles, navigateurs).
- Redis — passe en SSPL/RSALv2 en 2024 ⇒ fork Valkey (BSD-3) par la Linux Foundation.
- Apache Cassandra — Apache 2.0 — NoSQL décentralisé haute volumétrie.
Conteneurs & cloud-native (CNCF)
- Docker (engine + Containerd) — Apache 2.0.
- Podman — Apache 2.0 — alternative rootless à Docker.
- Kubernetes — Apache 2.0 — orchestrateur standard.
- Helm — Apache 2.0 — package manager pour K8s.
- Prometheus / Grafana / Loki — observabilité (Apache 2.0 / AGPL).
- OpenTelemetry — Apache 2.0 — standard de télémétrie.
- OpenTofu — MPL 2.0 — fork de Terraform.
Langages & runtimes phares
| Langage | Licence | Domaine |
|---|---|---|
| Python | PSF (BSD-like) | IA, scripting, web, data |
| Node.js | MIT | Web, outillage frontend |
| Go | BSD-3 | Cloud-native, CLI, backend |
| Rust | MIT / Apache 2.0 | Système, perf, sécurité |
| PHP | PHP License | Web (WordPress, Symfony, Laravel) |
| OpenJDK (Java) | GPL v2 + Classpath | Backend entreprise |
7. Boîte à outils du développeur libre Le quotidien open source
IDE & éditeurs
- VS Code (MIT, build Microsoft propriétaire) / VSCodium (build 100% libre)
- Zed — Apache/AGPL — éditeur Rust ultra-rapide, collaboratif
- Neovim — Apache 2.0 — vim modernisé et extensible
- Helix — MPL 2.0 — éditeur modal en Rust, batteries included
- JetBrains Fleet / IntelliJ Community — Apache 2.0 (éditions communautaires)
Versioning & collaboration
- Git — GPL v2 — le standard absolu, créé par Linus Torvalds en 2005.
- GitHub (propriétaire, Microsoft) / GitLab CE (MIT) / Gitea (MIT) / Forgejo (GPL v3, fork Gitea)
- Codeberg — instance Forgejo associative, alternative européenne à GitHub.
Sécurité & supply chain
- OWASP Dependency-Check / Trivy / Grype — scan de vulnérabilités (CVE).
- Syft — génération de SBOM (Software Bill of Materials).
- Sigstore / Cosign — signature et vérification d'artefacts.
- OSV.dev — base de données de vulnérabilités open source par Google.
- Renovate / Dependabot — mises à jour automatiques de dépendances.
Bureautique & création libres
- LibreOffice — MPL 2.0 — bureautique complète.
- GIMP — GPL v3 — alternative à Photoshop.
- Inkscape — GPL v3 — vectoriel (alternative à Illustrator).
- Krita — GPL v3 — peinture numérique.
- Blender — GPL v2 — 3D, devenu standard en VFX.
- Audacity / Ardour — audio.
- Kdenlive / OpenShot — montage vidéo.
8. Modèles économiques de l'open source Comment ça vit, comment ça se finance
Les principaux modèles
| Modèle | Principe | Exemples |
|---|---|---|
| Open Core | Coeur libre + features avancées payantes | GitLab, Sentry, Mattermost |
| SaaS hébergé | Le code est libre, le service hébergé est payant | WordPress.com, Discourse, Plausible |
| Support & consulting | Logiciel libre, services pros payés | Red Hat (IBM), Canonical, SUSE |
| Dual licensing | GPL pour le libre + licence commerciale pour le fermé | MySQL (Oracle), Qt |
| Sponsoring & donations | Mainteneurs financés par utilisateurs / entreprises | Sindre Sorhus, Vue.js (Evan You), Tea |
| Fondation neutre | Multiples entreprises financent une gouvernance partagée | Linux Foundation, CNCF, Apache |
| Bounties / Crowdfunding | Paiement à la feature, au bug fix | Bountysource, Open Collective, GitHub Sponsors |
Le problème du maintainer burnout
Beaucoup de briques critiques (OpenSSL, log4j, core-js, curl…) reposent sur quelques mainteneurs bénévoles. C'est le syndrome "random guy in Nebraska" du célèbre xkcd 2347.
Cas emblématiques :
- Heartbleed (2014) — OpenSSL maintenu par 1 personne à temps plein avant la crise.
- Log4Shell (2021) — faille critique sur log4j, projet sous-financé.
- core-js (2023) — utilisé par 70% du web, mainteneur unique en burnout.
- XZ Utils (2024) — mainteneur ultra-isolé, cible parfaite d'attaque sociale.
9. Communauté & contribution Comment participer concrètement
Mythe vs réalité
Mythe : "il faut être un dev senior pour contribuer à un grand projet OSS".
Réalité : 80% des contributions utiles ne sont pas du code : doc, traduction, signalement de bug, tri des issues, design, animation de communauté.
Comment commencer concrètement Newbie OK
- Identifiez un projet que vous utilisez déjà. C'est 10x plus motivant que de chercher "un projet pour contribuer".
- Lisez le
CONTRIBUTING.mdet leCODE_OF_CONDUCT.md. C'est la règle du jeu. - Cherchez les issues étiquetées
good first issue,help wanted,documentation. - Annoncez votre intention sur l'issue avant de coder. Évite le travail en double.
- Faites un fork, une branche, une PR. Patience : la review peut prendre des semaines sur un gros projet.
- Répondez aux feedbacks. 90% des PRs requièrent au moins une itération.
Anatomie d'un bon repo open source
README.md— pitch + quick start + lien docLICENSE— obligatoire, choisi explicitementCONTRIBUTING.md— comment contribuerCODE_OF_CONDUCT.md— règles de comportement (souvent Contributor Covenant)SECURITY.md— comment signaler une faille (responsible disclosure)CHANGELOG.md— historique des versions (Keep a Changelog + SemVer).github/ISSUE_TEMPLATE/— templates d'issues- CI/CD verte (tests automatisés sur chaque PR)
10. Pièges, risques et bonnes pratiques L'OSS responsable en entreprise
Les 7 pièges classiques
- Mauvaise lecture de licence. Inclure du code GPL dans un produit fermé : risque juridique majeur.
- Dépendances abandonnées. Une lib non maintenue depuis 2 ans est une dette de sécurité.
- Vulnérabilités transitoives. Vous dépendez de A qui dépend de B qui dépend de C compromis.
- Typosquatting / dependency confusion.
react-domvsreact-doom— un faux paquet malveillant. - Secrets dans Git. Une clé API pushée par erreur reste pour toujours dans l'historique.
- "Free as in beer" mindset. Pomper sans jamais contribuer ni sponsoriser : non viable à l'échelle de l'industrie.
- Forks sauvages. Modifier une lib en interne sans réintégrer upstream : maintenance éternelle à vos frais.
10 bonnes pratiques pour une OSS responsable en entreprise
- Tenir une SBOM à jour (norme SPDX ou CycloneDX).
- Scanner les vulnérabilités en CI (Trivy, Grype, Snyk).
- Mettre en place un OSPO (Open Source Program Office) si vous êtes une grande boite.
- Cartographier les licences de toutes vos dépendances (FOSSA, ScanCode, license-checker).
- Privilégier les paquets activement maintenus (>1 mainteneur, commits récents).
- Verrouiller les versions (lockfiles) et signer les artefacts.
- Sponsoriser les briques critiques que vous utilisez (GitHub Sponsors, OpenCollective).
- Contribuer en retour (même modestement : doc, bug reports).
- Préférer les builds reproductibles.
- Anticiper le EU Cyber Resilience Act et l'AI Act.
Cadres réglementaires à connaître
- EU Cyber Resilience Act (CRA) — 2024, applicable dès 2027 : oblige les éditeurs de logiciels (même OSS commercialisé) à assurer sécurité et patches. Exemption pour OSS non-commercial.
- EU AI Act — 2024 : niveaux de risque pour les systèmes IA, exemptions pour les modèles "open source" sous conditions.
- NIS2 — obligations cyber pour secteurs critiques (s'applique aux logiciels open source utilisés).
- Executive Order 14028 (USA) — SBOM obligatoire pour fournisseurs du gouvernement fédéral.
11. Roadmap d'apprentissage De curieux à contributeur
Mois 1-2 — Les fondations Débutant
- Installer une distribution Linux (Ubuntu / Mint / Fedora) en dual-boot ou VM.
- Apprendre les bases du shell (
bash) :cd,ls,grep, pipes, redirections. - Comprendre Git : commit, branch, merge, rebase, pull request.
- Lire les 4 libertés FSF + définition OSI + 3 licences (MIT, GPL, Apache).
Mois 3-4 — Première contribution Intermédiaire
- Faire un fork d'un projet que vous utilisez. Réparer un bug ou améliorer la doc.
- Comprendre les conventions de commit (Conventional Commits) et SemVer.
- S'abonner à des newsletters : Console, Hacker News, LWN.net, Open Source Watch.
- Suivre 5 mainteneurs sur GitHub. Lire leurs PRs.
Mois 5-6 — Aller plus loin Avancé
- Publier votre propre paquet (npm, PyPI, crates.io) avec licence claire et CI.
- Contribuer à un projet de fondation (CNCF, Apache, Linux Foundation).
- Faire tourner un LLM open source en local (Ollama + Open WebUI) — comprendre quantization, GGUF.
- Se former sur SBOM, signature d'artefacts, supply chain security.
Ressources référence
- opensource.guide — les guides officiels GitHub (FR dispo).
- choosealicense.com — pour choisir vite.
- OSI — Open Source Definition
- LWN.net — référence des news kernel et OSS.
- Hugging Face — le GitHub de l'IA ouverte.
- Awesome lists — index communautaires par thème.