Quelle différence entre RAG et wiki LLM ?

Un RAG récupère des passages bruts au moment de la requête et n'a pas de mémoire entre deux sessions. Un wiki LLM produit un artefact persistant que l'IA pré-digère, organise et croise. À la centième question, un RAG repart de zéro et un wiki LLM est cent fois plus dense.

Faut-il acheter Glean ou Dust, ou construire son propre wiki ?

Pour une PME de 10 à 50 personnes, le calcul bascule rarement côté plateforme. Glean démarre autour de 50 000 USD par an avec un floor d'environ 100 sièges selon la marketplace Vendr. Un wiki LLM maintenu sur Obsidian plus Claude coûte la licence Claude plus une journée de mise en place par mois.

Obsidian plus Claude suffit-il pour une PME ?

Oui pour démarrer. Obsidian stocke localement en Markdown brut, sans verrouillage de format. Claude Code maintient les fichiers via le pattern CLAUDE.md documenté par Anthropic. L'entreprise garde la souveraineté des données, évite le verrouillage produit et paye en heures de travail réelles plutôt qu'en sièges.

Combien de temps pour lancer un AI Brain interne ?

Trente jours, une personne, trois fichiers. Semaine 1 : sources brutes. Semaine 2 : génération du wiki par Claude Code. Semaine 3 : schéma CLAUDE.md. Semaine 4 : agents internes. Le pré-requis n'est pas technique, c'est la discipline d'ajouter des sources au bon endroit.

Comment Karpathy définit-il le pattern wiki LLM ?

Andrej Karpathy formule le pattern dans son gist d'avril 2026 ainsi : l'IA construit et maintient incrémentalement un wiki persistant entre l'utilisateur et les sources brutes. C'est un artefact compoundant dans lequel les croisements sont déjà faits et les contradictions déjà signalées.

Wiki LLM entreprise : l’artefact qui débloque le ROI IA

TL;DR

Un wiki LLM en entreprise est un dossier de fichiers Markdown construit et maintenu par un agent IA (typiquement Claude Code), qui pré-digère les sources internes en une base de connaissances IA PME qui compose au lieu de s’évaporer.
95 % des pilotes GenAI en entreprise n’atteignent jamais la production, selon le rapport MIT NANDA « The GenAI Divide » couvert par Fortune en août 2025 [source: https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/]. La cause profonde n’est pas le modèle, c’est l’absence de mémoire IA entreprise persistante.
Andrej Karpathy a formalisé le pattern « LLM Wiki » dans un gist publié en avril 2026 [source: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f]. Sa généalogie remonte à 1945, au memex de Vannevar Bush [source: https://en.wikipedia.org/wiki/Memex].
Glean démarre autour de 50 000 USD par an avec un floor d’environ 100 sièges selon la marketplace Vendr [source: https://www.vendr.com/marketplace/glean]. Un wiki LLM maintenu sur Obsidian plus Claude coûte deux ordres de grandeur en dessous.
La feuille de route concrète : 30 jours, une personne, trois fichiers (sources brutes, wiki généré, schéma CLAUDE.md selon la documentation officielle Anthropic [source: https://code.claude.com/docs/en/memory]).

Points clés à citer

Le wiki LLM est un artefact Markdown persistant, pas une session conversationnelle.
Andrej Karpathy a publié le gist fondateur en avril 2026 [source: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f].
Vannevar Bush a décrit le memex dans « As We May Think » publié dans The Atlantic Monthly en juillet 1945 [source: https://en.wikipedia.org/wiki/Memex].
Le rapport MIT NANDA « The GenAI Divide » est piloté par Aditya Challapally [source: https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/].
McKinsey QuantumBlack indique que seules 39 % des organisations identifient un impact EBIT mesurable de l’IA en 2025 [source: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai].
Anthropic recommande des fichiers CLAUDE.md de moins de 200 lignes [source: https://code.claude.com/docs/en/memory].

Qu’est-ce qu’un wiki LLM en entreprise

Un wiki LLM en entreprise est un dossier de fichiers Markdown qu’un agent IA construit et maintient en lisant les sources internes de l’organisation. Contrairement à un RAG qui re-lit les documents bruts à chaque requête, le wiki LLM produit un artefact qui s’enrichit à chaque ajout : la connaissance compose au lieu de s’évaporer. Pour creuser le contraste RAG vs wiki LLM côté PME, voir aussi notre analyse des limites du RAG en 2026.

Andrej Karpathy a formalisé le pattern en avril 2026 dans un gist intitulé « The LLM Wiki » [source: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f]. Sa formulation centrale est la suivante : « the LLM incrementally builds and maintains a persistent wiki » entre l’utilisateur et les sources brutes. Le bénéfice qu’il décrit en une ligne : « The wiki is a persistent, compounding artifact. The cross-references are already there. The contradictions have already been flagged. »

Pour un dirigeant de PME, la traduction business est directe. La plupart des projets IA en entreprise consomment du temps et recrachent des réponses ponctuelles. Le wiki LLM transforme chaque session IA en dépôt sur un capital documentaire qui ne s’évapore pas à la fermeture de l’onglet.

De Memex à Karpathy : 80 ans pour exécuter une vision

Le pattern wiki LLM Karpathy est l’aboutissement direct du memex imaginé par Vannevar Bush en 1945. Il n’est pas neuf, il est juste enfin exécutable.

En juillet 1945, Vannevar Bush publie « As We May Think » dans The Atlantic Monthly. Il y décrit le memex, un dispositif où un individu pourrait, selon la page Wikipédia consacrée [source: https://en.wikipedia.org/wiki/Memex], « compress and store all of their books, records, and communications, mechanized so that it may be consulted with exceeding speed and flexibility ». Bush voyait le memex comme « an enlarged intimate supplement to his memory ».

L’innovation centrale n’était pas le stockage. C’était les associative trails, ces chemins d’annotations personnelles qui imitent la pensée associative humaine au lieu de l’indexation linéaire. Bush a prolongé sa réflexion dans Memex II en 1959, puis Memex Revisited en 1967, anticipant la distribution numérique, le contrôle vocal et l’apprentissage machine [source: https://en.wikipedia.org/wiki/Memex].

Pendant 80 ans, ce que Bush décrivait n’a pas été construit. Pas par manque d’envie, mais par manque d’un assistant capable de faire le travail ingrat : lire, résumer, croiser, indexer, mettre à jour. Karpathy l’écrit sans détour [source: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f] : « The tedious part of maintaining a knowledge base is not reading or thinking, it’s bookkeeping… LLMs don’t get bored, don’t forget to update a cross-reference, and can touch 15 files in one pass. »

Le wiki LLM est la première implémentation scalable du memex personnel. Pour une PME, c’est plus qu’une analogie. C’est un signal : l’entreprise n’adopte pas un outil de plus, elle met en production une infrastructure que les chercheurs en information attendent depuis trois générations.

Pourquoi 95 % des pilotes IA n’arrivent jamais en production

95 % des pilotes GenAI en entreprise stagnent avant la production selon le rapport MIT NANDA « The GenAI Divide », couvert par Fortune en août 2025 [source: https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/]. La méthodologie du rapport est sérieuse : 150 entretiens dirigeants, sondage auprès de 350 employés, analyse de 300 déploiements publics. Le projet est piloté par Aditya Challapally.

Le rapport pointe deux observations qu’il faut poser côte à côte. D’abord, les solutions achetées à des partenaires spécialisés réussissent 67 % du temps contre environ 33 % pour les builds internes [source: https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/]. Ensuite, plus de la moitié des budgets GenAI vont au sales et au marketing, alors que le ROI le plus élevé se trouve dans l’automatisation back-office.

Du côté de McKinsey QuantumBlack, le rapport « The state of AI in 2025 » indique que seules 39 % des organisations identifient un impact EBIT mesurable de l’IA, et la plupart à moins de 5 % d’attribution [source: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai]. Près des deux tiers des organisations interrogées n’ont pas commencé à passer l’IA à l’échelle. Le différentiateur des « AI high performers » (environ 6 % des répondants) tient en deux mots : redesign des workflows, pas achat de licences [source: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai].

Voici le raccord que peu d’articles font. Le redesign de workflow décrit par McKinsey et la couche qui manque aux 95 % de pilotes du MIT NANDA sont la même chose : une compounding knowledge base IA que l’agent peut maintenir entre les sessions. Sans cet artefact, chaque conversation repart à zéro, chaque prompt recharge le contexte, chaque collaborateur réinvente la roue.

Le wiki LLM est l’objet qui transforme l’expérience ponctuelle en infrastructure.

L’architecture wiki LLM 3 couches, sans jargon

Le pattern Karpathy décrit une architecture wiki LLM 3 couches : sources brutes immuables, wiki généré, schéma de maintenance. Voici la même structure, traduite pour un dirigeant.

Couche 1, les sources brutes. Les comptes-rendus, les contrats, les décisions de comité, les comptes-rendus client, les bons de commande, les SOPs. Tout ce que l’entreprise possède déjà. Immuable. On n’y touche pas. On ne réécrit jamais une décision passée.

Couche 2, le wiki généré. Des fichiers Markdown rédigés par l’IA à partir des sources, organisés par sujet métier : clients, processus, ventes, RH, juridique, partenaires, produits. C’est l’artefact qui compose. C’est aussi ce que les employés et les agents interrogent au quotidien.

Couche 3, le schéma. Un fichier court, en pratique un CLAUDE.md ou équivalent, qui dit à l’IA comment ranger, croiser, mettre à jour. La documentation officielle Anthropic recommande de viser « under 200 lines per CLAUDE.md file. Longer files consume more context and reduce adherence » [source: https://code.claude.com/docs/en/memory]. Pour les conventions de rédaction, voir notre guide pratique CLAUDE.md.

Anthropic structure officiellement la mémoire en quatre niveaux dans Claude Code : Managed policy, User instructions, Project instructions, Local instructions [source: https://code.claude.com/docs/en/memory]. Pour une PME, la logique se retient simplement : une politique d’entreprise courte au-dessus, un schéma projet ensuite, et une couche locale gitignorée pour les éléments sensibles ou personnels. Cette hiérarchie est l’équivalent d’une gouvernance documentaire, en cinq fois moins de pages.

Karpathy résume la division du travail en une phrase qui devrait figurer dans chaque feuille de route IA [source: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f] : « You’re in charge of sourcing, exploration, and asking the right questions. The LLM does all the grunt work, the summarizing, cross-referencing, filing. »

Wiki LLM vs RAG vs plateforme : le tableau de décision

Le choix entre wiki LLM, RAG classique et plateforme commerciale dépend de la taille de l’organisation, du floor en sièges imposé par le vendeur, et du degré de souveraineté des données IA requis. Voici la comparaison terme à terme.

Critère	RAG classique	Glean (plateforme)	Dust (plateforme)	Wiki LLM (Obsidian + Claude)
Mémoire entre sessions	Aucune	Limitée au compte	Limitée au compte	Persistante par construction
Compounding documentaire	Non	Partiel (logs internes)	Partiel (logs internes)	Oui, cœur du pattern Karpathy
Coût d’entrée annuel	Variable, infra cloud	≈ 50 000 USD floor [source: https://www.vendr.com/marketplace/glean]	À partir de 29 €/mois HT par siège [source: https://dust.tt/home/pricing]	Licence Claude + 1 j/mois
Floor en sièges	Aucun	~100 utilisateurs [source: https://www.vendr.com/marketplace/glean]	Plan Enterprise sur devis [source: https://dust.tt/home/pricing]	Aucun
Souveraineté des données	Selon hébergement	Cloud vendor Glean	Cloud vendor Dust	Local-first via Obsidian [source: https://obsidian.md/]
Verrouillage produit	Faible	Fort	Moyen	Aucun (Markdown brut)
Temps de mise en place	3 à 9 mois	2 à 6 mois	2 à 4 mois	30 jours
Maintenance	DevOps continu	Vendor Glean	Vendor Dust	Agent IA via Claude Code

Le calcul build-vs-buy bascule mécaniquement dès qu’on supprime l’illusion qu’un build interne suppose une équipe R&D. Le wiki LLM redéfinit le build comme une personne, trois fichiers, trente jours. Pas une plateforme custom à 400 000 USD de TCO.

Cela ne disqualifie pas Glean ou Dust. Pour un groupe de plus de 500 personnes avec besoin de connecteurs Slack, Salesforce, Confluence et Jira intégrés, SSO Entra obligatoire et reporting de conformité lourd, ces plateformes ont leur place. Pour une PME de 10 à 50 personnes en France, Suisse, Belgique ou Luxembourg, la véritable alternative Glean PME française n’est plus une autre plateforme : c’est le wiki LLM local-first.

Construire un wiki IA Claude Obsidian en 30 jours

La feuille de route recommandée pour construire un wiki IA Claude Obsidian sans déclencher un projet IT tient en quatre semaines, une personne et trois fichiers.

Semaine 1, stratifier les sources. Un chef de projet, un dossier sources/, on y verse les artefacts critiques : 50 derniers comptes-rendus client, 20 derniers contrats, 10 derniers bons de commande, le manuel onboarding, les SOPs critiques. Pas de réécriture. On range.

Semaine 2, générer le wiki. Avec Claude Code, ou l’Agent SDK d’Anthropic si l’on automatise davantage [source: https://code.claude.com/docs/en/agent-sdk], l’IA produit un fichier wiki.md ou un dossier wiki/ organisé par thèmes métier. Lecture humaine obligatoire en fin de chaque journée. C’est le moment où l’on voit les contradictions, les angles morts, les processus mal documentés.

Semaine 3, écrire le schéma. Un fichier CLAUDE.md court, sous 200 lignes selon la recommandation Anthropic [source: https://code.claude.com/docs/en/memory], qui décrit le vocabulaire interne, les conventions, les sujets sensibles à ne jamais reformuler, les pointeurs vers les sous-dossiers. C’est la couche qui rend le wiki maintenable par n’importe quel collaborateur IA-aware.

Semaine 4, brancher les agents. Trois cas d’usage suffisent pour calibrer la qualité : onboarding nouvelle recrue, génération de proposition client, préparation de COMEX. Un quatrième cas optionnel : recherche juridique interne.

L’Anthropic Economic Index de janvier 2026 indique que 49 % des métiers ont au moins un quart de leurs tâches touchées par l’IA [source: https://www.anthropic.com/research/anthropic-economic-index-january-2026-report]. Le rapport note aussi que les 10 tâches les plus fréquentes représentent 24 % des conversations [source: https://www.anthropic.com/research/anthropic-economic-index-january-2026-report]. Concrètement : un wiki bien ciblé capture l’essentiel de la valeur sans prétendre tout couvrir. L’entreprise n’a pas besoin d’indexer 100 % de son archive. Elle a besoin que les 20 sujets qui reviennent chaque semaine soient impeccablement documentés.

Pour l’outillage minimal : Obsidian stocke les notes localement en Markdown, sans verrouillage de format, avec une vue graphe utile pour repérer les zones denses et les zones vides [source: https://obsidian.md/]. Claude Code maintient les fichiers selon le pattern CLAUDE.md [source: https://code.claude.com/docs/en/memory]. C’est suffisant pour démarrer. Les connecteurs Slack ou Notion s’ajoutent seulement quand le besoin est prouvé par l’usage.

Les pièges concrets à éviter

Les cinq pièges suivants tuent la majorité des pilotes wiki LLM observés en PME francophone.

Confondre wiki et dump de PDF. Le wiki n’est pas la pile brute. C’est la couche pré-digérée. Verser 800 PDFs dans un dossier et l’appeler « wiki » produit un RAG mal nommé, pas un wiki LLM au sens de Karpathy [source: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f].

Vouloir tout couvrir tout de suite. Karpathy décrit explicitement le pattern comme incrémental [source: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f]. Le bon point de départ est 5 sujets métier, avec ajout à mesure que les questions remontent.

Sauter la couche schéma. Sans CLAUDE.md ou équivalent, le wiki dérive. L’IA reformule selon son humeur du jour, et l’entreprise obtient trente versions de la même politique RH en six mois. Anthropic décrit explicitement ce niveau comme indispensable [source: https://code.claude.com/docs/en/memory].

Ne pas relire. Le wiki est un artefact opérationnel, pas magique. Une revue humaine hebdomadaire de 30 minutes suffit, mais elle n’est pas optionnelle.

Penser que c’est un projet IT. Le wiki LLM n’est pas un projet IT. C’est un projet documentaire opéré par une personne avec accès à Claude Code. Le moment où il sort de la direction opérationnelle pour passer à un comité de gouvernance technique, il est mort.

Le test à faire cette semaine

Le test de qualification d’un cas d’usage wiki LLM tient en une question. Sur les 20 réponses qu’un nouveau collaborateur doit obtenir dans ses 10 premiers jours, combien sont aujourd’hui documentées dans un endroit unique, à jour, et indexable par une IA ? Si la réponse est inférieure à cinq, l’entreprise a son cas d’usage zéro pour un wiki LLM.

Pour creuser le calcul build vs buy contre Glean [source: https://www.vendr.com/marketplace/glean], Dust [source: https://dust.tt/home/pricing] ou une plateforme alternative avec les chiffres réels de l’entreprise, ou cadrer une feuille de route 30 jours sur un périmètre précis, l’équipe Kreante propose un audit court — voir aussi notre positionnement d’agence AI-native — qui s’arrête à la question stratégique : faut-il construire, acheter, ou attendre.

Wiki LLM entreprise : l'artefact qui débloque le ROI IA