Jusqu’ici, lancer un agent IA sur ta machine, c’était souvent la galère. Variables d’environnement à configurer, fichiers de config à créer, dépendances à installer… Bref, un parcours du combattant qui décourageait pas mal de monde.
Eh bien, c’est terminé. ✅
Ollama vient de sortir ollama launch, une nouvelle commande qui change absolument tout. Une seule ligne dans ton terminal, et boom : ton agent IA préféré est opérationnel. Claude Code, Codex, Clawdbot, OpenCode… Tous accessibles en quelques secondes, sans te prendre la tête.
J’ai testé cette fonctionnalité dès sa sortie, et franchement, c’est bluffant de simplicité. Dans ce guide, je vais te montrer exactement comment ça marche, quel agent choisir selon tes besoins, et comment en tirer le maximum. C’est parti ! 🦙
🚀 Guide Interactif Pas à Pas
Suis les 5 étapes pour installer et lancer ton premier agent IA avec Ollama
Installer Ollama
La première étape, c’est d’installer Ollama sur ta machine. Choisis la commande selon ton système d’exploitation :
brew install ollama
curl -fsSL https://ollama.com/install.sh | sh
Une fois installé, vérifie ta version :
ollama --version # Tu dois voir v0.15 ou plus récent
Télécharger un modèle
Avant de lancer un agent, il te faut un modèle IA. Deux options selon ta configuration :
# Le plus recommandé pour le coding ollama pull glm-4.7-flash
# Si tu n'as pas de GPU puissant ollama pull glm-4.7:cloud
Lancer ton premier agent
C’est le moment magique ! Une seule commande et ton agent est prêt. Essayons avec Claude Code :
ollama launch claude
Un wizard interactif s’ouvre. Sélectionne ton modèle avec les flèches et appuie sur Entrée :
╭──────────────────────────────────────╮
│ Select a model │
│ > glm-4.7-flash [local] │
│ qwen3-coder [local] │
│ glm-4.7:cloud │
│ │
│ ↑/↓ navigate, Enter to select │
╰──────────────────────────────────────╯
Choisir le bon agent
Plusieurs agents sont disponibles. Voici un comparatif pour t’aider à choisir :
| Agent | Commande | Idéal pour |
|---|---|---|
| Claude Code | ollama launch claude |
Coding agentique avancé |
| Codex | ollama launch codex |
Écosystème OpenAI |
| OpenCode | ollama launch opencode |
100% open-source |
| Droid | ollama launch droid |
Automatisation mobile |
| Clawdbot | ollama launch clawdbot |
Assistant personnel |
Local ou Cloud ?
Dernière étape : choisir entre exécution locale ou cloud selon tes besoins.
| Critère | Local | Cloud |
|---|---|---|
| Confidentialité | ✅ Données chez toi | ⚠️ Via serveurs Ollama |
| Coût | 💰 GPU initial | 💸 Pay-as-you-go |
| Performance | 🔄 Selon ton GPU | ✅ Toujours optimal |
| Offline | ✅ Sans internet | ❌ Connexion requise |
Félicitations ! 🎉
Tu as toutes les clés pour lancer tes agents IA avec Ollama. Une commande, zéro config !
# Installer brew install ollama # Télécharger un modèle ollama pull glm-4.7-flash # Lancer un agent ollama launch claude
Ollama Launch : C’est quoi exactement ? 🤔
Le problème que ça résout
Si tu as déjà essayé de faire tourner Claude Code ou un autre agent de coding en local, tu connais la chanson :
- Installer Node.js (la bonne version, évidemment)
- Configurer des variables d’environnement (
ANTHROPIC_API_KEY,OPENAI_API_KEY…) - Créer des fichiers de configuration JSON
- Gérer les dépendances qui s’entrechoquent
- Prier pour que tout fonctionne du premier coup (spoiler : ça n’arrive jamais)
Bref, avant même de coder, tu passes des heures en setup. C’est frustrant, et ça décourage beaucoup de gens qui voudraient simplement tester ces outils.
La solution : un wizard tout-en-un
Ollama launch résout ce problème de manière élégante. La commande :
- Détecte automatiquement les modèles disponibles sur ta machine
- Te propose de choisir celui que tu veux utiliser
- Configure tout en arrière-plan
- Lance l’agent directement
Zéro variable d’environnement à définir. Zéro fichier de config à créer. Tu tapes une commande, tu suis le wizard interactif, et c’est parti.
Si tu débutes dans le domaine, je t’invite d’abord à consulter notre guide sur les agents IA pour bien comprendre les concepts de base avant de te lancer.
Les agents supportés
Voici la liste des agents que tu peux lancer avec ollama launch :
| Agent | Commande | Description |
|---|---|---|
| Claude Code | ollama launch claude | L’agent de coding d’Anthropic, référence du marché |
| Codex | ollama launch codex | L’agent d’OpenAI pour le développement |
| OpenCode | ollama launch opencode | Alternative open-source prometteuse |
| Droid | ollama launch droid | Automatisation d’appareils mobiles |
| Clawdbot | ollama launch clawdbot | Assistant IA personnel complet |
💡 Bon à savoir : Cette liste va s’allonger avec le temps. Ollama ajoute régulièrement de nouvelles intégrations.
Prérequis : Ce dont tu as besoin ⚙️
Ollama v0.15 ou plus récent
La commande ollama launch a été introduite dans la version 0.15, sortie le 23 janvier 2026. Si tu as une version antérieure, il faudra mettre à jour.
Pour vérifier ta version :
bash
ollama --version
Configuration matérielle
C’est LA question que tout le monde se pose : « Est-ce que ma machine peut faire tourner ça ? »
Option 1 : En local (sur ta machine)
Pour faire tourner les modèles localement, tu auras besoin d’une carte graphique avec suffisamment de VRAM :
| Modèle | VRAM requise | Contexte |
|---|---|---|
glm-4.7-flash | ~23 GB | 64k tokens |
qwen3-coder | ~16 GB | 32k tokens |
gpt-oss:20b | ~12 GB | 32k tokens |
Concrètement, ça veut dire une RTX 3090, RTX 4090, ou une carte pro type A100. Pas donné, je sais.
Option 2 : Via le cloud Ollama
Bonne nouvelle : si tu n’as pas le GPU qu’il faut, Ollama propose un service cloud avec :
- Un free tier généreux
- Des sessions de coding étendues (5 heures)
- Accès aux modèles les plus puissants
Tu peux utiliser les modèles cloud en ajoutant :cloud au nom :
bash
ollama pull glm-4.7:cloud
Je détaille la comparaison local vs cloud plus bas dans l’article. 👇
Installation et premier lancement 🛠️
3.1 Installer ou mettre à jour Ollama
Sur macOS :
bash
brew install ollama
# ou pour mettre à jour
brew upgrade ollama
Tu peux aussi télécharger directement depuis ollama.com/download.
Sur Linux :
bash
curl -fsSL https://ollama.com/install.sh | sh
Sur Windows :
Télécharge l’installateur depuis le site officiel. L’installation est classique, next-next-finish.
3.2 Télécharger un modèle
Avant de lancer un agent, tu dois avoir au moins un modèle disponible. Voici les recommandés pour le coding :
Pour du local (si tu as le GPU) :
bash
# Le plus recommandé pour le coding
ollama pull glm-4.7-flash
# Alternative plus légère
ollama pull qwen3-coder
Pour du cloud (sans GPU puissant) :
bash
# Modèle cloud avec contexte complet
ollama pull glm-4.7:cloud
# Ou le monstre de 480B paramètres
ollama pull qwen3-coder:480b-cloud
⏳ Le téléchargement peut prendre un moment selon ta connexion (les modèles locaux font plusieurs Go).
3.3 Lancer ton premier agent
Maintenant, le moment magique. Pour lancer Claude Code par exemple :
bash
ollama launch claude
Le wizard interactif s’ouvre :
╭──────────────────────────────────────────────────╮
│ Select a model │
│ > glm-4.7-flash [local] │
│ qwen3-coder [local] │
│ glm-4.7:cloud │
│ │
│ ↑/↓ to navigate, Enter to select │
╰──────────────────────────────────────────────────╯
Tu sélectionnes ton modèle, tu appuies sur Entrée, et Claude Code se lance directement. C’est tout. Vraiment.
Pas de clé API à rentrer, pas de config à toucher. Ollama gère tout en arrière-plan.
Guide par agent : Quel outil choisir ? 🎯
Maintenant que tu sais comment lancer un agent, la question c’est : lequel choisir ? Voici un tour d’horizon pour t’aider à décider.
4.1 Claude Code : Le roi du coding agentique 👑
bash
ollama launch claude
Claude Code, c’est l’agent de coding développé par Anthropic. Il est devenu LA référence pour le « vibe coding » — tu décris ce que tu veux en langage naturel, et l’IA génère le code.
Ce qu’il sait faire :
- Lire et modifier des fichiers dans ton projet
- Exécuter des commandes terminal
- Corriger des bugs automatiquement
- Gérer des conflits de merge
- Refactorer du code existant
Idéal pour : Les développeurs qui veulent un copilote puissant pour coder plus vite.
Le truc en plus : Grâce à Ollama, tu peux maintenant faire tourner Claude Code avec des modèles open-source locaux, sans envoyer ton code sur les serveurs d’Anthropic. Une vraie révolution pour la confidentialité.
4.2 Codex : L’alternative OpenAI
bash
ollama launch codex
Codex, c’est l’agent de coding côté OpenAI. Si tu es déjà dans l’écosystème OpenAI (ChatGPT, API GPT-4…), tu seras en terrain connu.
Idéal pour : Ceux qui préfèrent l’approche OpenAI ou qui ont déjà des crédits API chez eux.
4.3 OpenCode : L’option 100% open-source
bash
ollama launch opencode
OpenCode est une alternative entièrement open-source aux agents propriétaires. Si tu es du genre à vouloir contrôler tout ton stack et éviter les dépendances aux GAFAM, c’est fait pour toi.
Idéal pour : Les puristes de l’open-source, les environnements air-gapped, les entreprises avec des contraintes de compliance.
4.4 Droid : L’automatisation mobile
bash
ollama launch droid
Droid, c’est un peu différent. C’est un agent spécialisé dans l’automatisation d’appareils mobiles. Tu peux lui donner des instructions en langage naturel pour contrôler ton téléphone Android.
Ce qu’il sait faire :
- Naviguer dans des apps
- Remplir des formulaires
- Automatiser des tâches répétitives
- Faire des captures d’écran intelligentes
Idéal pour : Le testing mobile, l’automatisation de workflows sur smartphone, le scraping d’apps.
Si tu cherches d’autres solutions pour automatiser des workflows, jette un œil à notre article sur l’agent N8N qui propose une approche no-code très intéressante.
4.5 Clawdbot : L’assistant personnel ultime 🦞
bash
ollama launch clawdbot
Clawdbot, c’est mon coup de cœur. Ce n’est pas juste un agent de coding — c’est un assistant IA personnel complet qui vit sur ta machine et peut interagir avec toi via WhatsApp, Telegram, Discord…
Ce qu’il sait faire :
- Gérer tes emails et ton calendrier
- T’envoyer des briefings matinaux proactifs
- Contrôler ta domotique
- Automatiser des tâches système
- Se souvenir de tes préférences
J’ai écrit un guide complet sur Clawdbot si tu veux approfondir. C’est vraiment le projet qui fait le plus de buzz en ce moment dans la communauté IA.
Idéal pour : Ceux qui veulent un vrai « Jarvis » personnel, pas juste un chatbot.
Local ou Cloud : Comment choisir ? ☁️💻
C’est LA grande question. Ollama te permet de faire tourner les modèles en local ou via leur cloud. Voici comment choisir.
Tableau comparatif
| Critère | Local | Cloud |
|---|---|---|
| Confidentialité | ✅ Données sur ta machine | ⚠️ Données transitent par Ollama |
| Coût | 💰 Investissement GPU initial | 💸 Pay-as-you-go (free tier dispo) |
| Performance | 🔄 Dépend de ton hardware | ✅ Modèles puissants garantis |
| Contexte | ⚠️ Limité par ta VRAM | ✅ Contexte complet (128k+) |
| Offline | ✅ Fonctionne sans internet | ❌ Connexion requise |
| Setup | 🔧 Plus technique | ✅ Plug & play |
Quand choisir le local ?
- Tu travailles sur du code sensible/propriétaire
- Tu as besoin de fonctionner offline
- Tu as déjà un GPU puissant (RTX 4090, A100…)
- Tu veux zéro dépendance à un service tiers
Quand choisir le cloud ?
- Tu n’as pas de GPU dédié (laptop, Mac Intel…)
- Tu veux accéder aux modèles les plus puissants (480B paramètres)
- Tu as besoin d’un contexte large pour de gros projets
- Tu veux tester rapidement sans investir
Le pricing Ollama Cloud
Ollama propose un modèle freemium assez généreux :
- Free tier : Suffisant pour tester et des usages légers
- Sessions étendues : 5 heures de coding continu
- Modèles premium : Accès aux versions les plus puissantes
Pour les détails à jour, check ollama.com/pricing.
💡 Mon conseil : Commence par le cloud pour tester, puis investis dans du local si tu accroches et que tu as des besoins de confidentialité.
Aller plus loin : Configuration avancée 🔧
Augmenter la taille du contexte
Par défaut, Ollama utilise un contexte de 2k tokens. Pour le coding, c’est trop court. Les agents fonctionnent mieux avec au moins 64k tokens.
Pour augmenter :
bash
# Créer un Modelfile personnalisé
echo "FROM glm-4.7-flash
PARAMETER num_ctx 64000" > Modelfile
# Créer le modèle custom
ollama create glm-4.7-flash-64k -f Modelfile
Ou modifie directement dans les settings Ollama si tu utilises l’app desktop.
Configurer sans lancer
Tu veux juste configurer un agent pour plus tard, sans le lancer immédiatement ? Utilise le flag --config :
bash
ollama launch opencode --config
Ça va créer tous les fichiers de config nécessaires sans démarrer l’agent.
Combiner plusieurs agents
Rien ne t’empêche d’avoir plusieurs agents configurés et de switcher selon tes besoins :
- Claude Code pour le coding pur
- Clawdbot pour l’automatisation personnelle
- Droid pour les tests mobile
Chaque ollama launch est indépendant.
Ollama Launch : Un vrai game changer 🏆
Ollama launch représente exactement ce dont l’écosystème IA avait besoin : une simplification radicale de l’accès aux agents IA.
Avant : Des heures de configuration, des tutoriels de 47 étapes, des erreurs cryptiques.
Maintenant : Une commande, un wizard, et c’est parti.
Ce qui me plaît particulièrement, c’est la flexibilité. Tu peux commencer en cloud gratuitement, puis migrer en local quand tu es prêt. Tu peux tester différents agents sans te prendre la tête. Tu peux même faire tourner des modèles open-source avec des outils propriétaires comme Claude Code.
Si tu hésites encore, mon conseil : lance-toi. Installe Ollama, tape ollama launch claude, et vois par toi-même. En 5 minutes, tu auras un agent de coding fonctionnel.
Et si tu veux aller plus loin dans l’univers des agents IA, n’hésite pas à explorer notre comparateur d’agents IA pour trouver l’outil qui correspond le mieux à tes besoins.
Ressources utiles
- 🦙 Ollama : ollama.com
- 📚 Documentation : docs.ollama.com
- 💬 Discord Ollama : discord.gg/ollama
- 💻 GitHub : github.com/ollama/ollama
- 📖 Blog officiel : ollama.com/blog/launch
FAQ ❓
Ollama launch est-il gratuit ? Oui, la commande ollama launch est totalement gratuite. Si tu fais tourner les modèles en local, il n’y a aucun coût récurrent. Pour le cloud, il y a un free tier généreux, puis des options payantes pour plus d’usage.
Quelle carte graphique pour ollama launch en local ? Pour les modèles recommandés comme glm-4.7-flash, il te faut environ 23 GB de VRAM. Ça correspond à une RTX 3090, RTX 4090, ou des cartes pro comme les A100. Pour des modèles plus légers, une RTX 3080 (10 GB) peut suffire avec un contexte réduit.
Peut-on utiliser ollama launch sans GPU ? Oui, en utilisant les modèles cloud (:cloud). Tu n’as besoin d’aucun GPU — tout tourne sur les serveurs d’Ollama. C’est la solution idéale pour les laptops ou les Mac sans GPU dédié.
Quelle différence entre ollama launch et une installation manuelle ? ollama launch automatise toute la configuration : détection des modèles, création des fichiers de config, gestion des variables d’environnement. Une installation manuelle te demanderait de faire tout ça à la main, ce qui prend du temps et peut générer des erreurs.
Les modèles locaux sont-ils aussi performants que les modèles cloud ? Ça dépend. Les modèles cloud comme qwen3-coder:480b-cloud ont 480 milliards de paramètres — impossible à faire tourner en local. Mais pour des tâches courantes, un bon modèle local comme glm-4.7-flash fait très bien le job, avec l’avantage de la confidentialité.
Puis-je utiliser mes propres clés API avec ollama launch ? Oui, mais ce n’est pas nécessaire. L’intérêt d’ollama launch est justement de ne PAS avoir besoin de clés API — Ollama gère l’authentification. Si tu veux utiliser tes propres clés (par exemple pour Claude via Anthropic directement), tu peux toujours faire une configuration manuelle classique.

Tu as testé ollama launch ? Dis-moi en commentaire quel agent tu utilises et pour quoi faire ! 👇