Jusqu’ici, lancer un agent IA sur ta machine, c’était souvent la galère. Variables d’environnement à configurer, fichiers de config à créer, dépendances à installer… Bref, un parcours du combattant qui décourageait pas mal de monde.

Eh bien, c’est terminé. ✅

Ollama vient de sortir ollama launch, une nouvelle commande qui change absolument tout. Une seule ligne dans ton terminal, et boom : ton agent IA préféré est opérationnel. Claude Code, Codex, Clawdbot, OpenCode… Tous accessibles en quelques secondes, sans te prendre la tête.

J’ai testé cette fonctionnalité dès sa sortie, et franchement, c’est bluffant de simplicité. Dans ce guide, je vais te montrer exactement comment ça marche, quel agent choisir selon tes besoins, et comment en tirer le maximum. C’est parti ! 🦙

🚀 Guide Interactif Pas à Pas

Suis les 5 étapes pour installer et lancer ton premier agent IA avec Ollama

Étape 1 sur 5 20%
1

Installer Ollama

La première étape, c’est d’installer Ollama sur ta machine. Choisis la commande selon ton système d’exploitation :

macOS
brew install ollama
Linux
curl -fsSL https://ollama.com/install.sh | sh
💡 Astuce
Sur Windows, télécharge l’installateur depuis ollama.com/download. L’installation se fait en quelques clics.

Une fois installé, vérifie ta version :

Terminal
ollama --version
# Tu dois voir v0.15 ou plus récent
2

Télécharger un modèle

Avant de lancer un agent, il te faut un modèle IA. Deux options selon ta configuration :

💻
Local
GPU puissant (~23 GB VRAM)
☁️
Cloud
Sans GPU, free tier dispo
Option Local
# Le plus recommandé pour le coding
ollama pull glm-4.7-flash
Option Cloud
# Si tu n'as pas de GPU puissant
ollama pull glm-4.7:cloud
⏳ Patience
Le téléchargement peut prendre plusieurs minutes. Les modèles locaux pèsent plusieurs Go.
3

Lancer ton premier agent

C’est le moment magique ! Une seule commande et ton agent est prêt. Essayons avec Claude Code :

Terminal
ollama launch claude

Un wizard interactif s’ouvre. Sélectionne ton modèle avec les flèches et appuie sur Entrée :

Résultat
╭──────────────────────────────────────╮
│  Select a model                      │
│  > glm-4.7-flash [local]            │
│    qwen3-coder [local]               │
│    glm-4.7:cloud                     │
│                                      │
│  ↑/↓ navigate, Enter to select       │
╰──────────────────────────────────────╯
🎉 C’est tout !
Pas de clé API, pas de fichier config. Ollama gère tout. Tu peux coder !
4

Choisir le bon agent

Plusieurs agents sont disponibles. Voici un comparatif pour t’aider à choisir :

Agent Commande Idéal pour
Claude Code ollama launch claude Coding agentique avancé
Codex ollama launch codex Écosystème OpenAI
OpenCode ollama launch opencode 100% open-source
Droid ollama launch droid Automatisation mobile
Clawdbot ollama launch clawdbot Assistant personnel
🦞 Conseil
Claude Code pour le coding pur, Clawdbot pour un assistant personnel complet qui va au-delà du code.
5

Local ou Cloud ?

Dernière étape : choisir entre exécution locale ou cloud selon tes besoins.

Critère Local Cloud
Confidentialité ✅ Données chez toi ⚠️ Via serveurs Ollama
Coût 💰 GPU initial 💸 Pay-as-you-go
Performance 🔄 Selon ton GPU ✅ Toujours optimal
Offline ✅ Sans internet ❌ Connexion requise
💡 En résumé
Cloud pour tester rapidement ou sans GPU. Local pour la confidentialité et l’autonomie.

Félicitations ! 🎉

Tu as toutes les clés pour lancer tes agents IA avec Ollama. Une commande, zéro config !

Récap des commandes
# Installer
brew install ollama

# Télécharger un modèle
ollama pull glm-4.7-flash

# Lancer un agent
ollama launch claude

Ollama Launch : C’est quoi exactement ? 🤔

Le problème que ça résout

Si tu as déjà essayé de faire tourner Claude Code ou un autre agent de coding en local, tu connais la chanson :

  • Installer Node.js (la bonne version, évidemment)
  • Configurer des variables d’environnement (ANTHROPIC_API_KEY, OPENAI_API_KEY…)
  • Créer des fichiers de configuration JSON
  • Gérer les dépendances qui s’entrechoquent
  • Prier pour que tout fonctionne du premier coup (spoiler : ça n’arrive jamais)

Bref, avant même de coder, tu passes des heures en setup. C’est frustrant, et ça décourage beaucoup de gens qui voudraient simplement tester ces outils.

La solution : un wizard tout-en-un

Ollama launch résout ce problème de manière élégante. La commande :

  1. Détecte automatiquement les modèles disponibles sur ta machine
  2. Te propose de choisir celui que tu veux utiliser
  3. Configure tout en arrière-plan
  4. Lance l’agent directement

Zéro variable d’environnement à définir. Zéro fichier de config à créer. Tu tapes une commande, tu suis le wizard interactif, et c’est parti.

Si tu débutes dans le domaine, je t’invite d’abord à consulter notre guide sur les agents IA pour bien comprendre les concepts de base avant de te lancer.

Les agents supportés

Voici la liste des agents que tu peux lancer avec ollama launch :

AgentCommandeDescription
Claude Codeollama launch claudeL’agent de coding d’Anthropic, référence du marché
Codexollama launch codexL’agent d’OpenAI pour le développement
OpenCodeollama launch opencodeAlternative open-source prometteuse
Droidollama launch droidAutomatisation d’appareils mobiles
Clawdbotollama launch clawdbotAssistant IA personnel complet

💡 Bon à savoir : Cette liste va s’allonger avec le temps. Ollama ajoute régulièrement de nouvelles intégrations.


Prérequis : Ce dont tu as besoin ⚙️

Ollama v0.15 ou plus récent

La commande ollama launch a été introduite dans la version 0.15, sortie le 23 janvier 2026. Si tu as une version antérieure, il faudra mettre à jour.

Pour vérifier ta version :

bash

ollama --version

Configuration matérielle

C’est LA question que tout le monde se pose : « Est-ce que ma machine peut faire tourner ça ? »

Option 1 : En local (sur ta machine)

Pour faire tourner les modèles localement, tu auras besoin d’une carte graphique avec suffisamment de VRAM :

ModèleVRAM requiseContexte
glm-4.7-flash~23 GB64k tokens
qwen3-coder~16 GB32k tokens
gpt-oss:20b~12 GB32k tokens

Concrètement, ça veut dire une RTX 3090, RTX 4090, ou une carte pro type A100. Pas donné, je sais.

Option 2 : Via le cloud Ollama

Bonne nouvelle : si tu n’as pas le GPU qu’il faut, Ollama propose un service cloud avec :

  • Un free tier généreux
  • Des sessions de coding étendues (5 heures)
  • Accès aux modèles les plus puissants

Tu peux utiliser les modèles cloud en ajoutant :cloud au nom :

bash

ollama pull glm-4.7:cloud

Je détaille la comparaison local vs cloud plus bas dans l’article. 👇

Installation et premier lancement 🛠️

3.1 Installer ou mettre à jour Ollama

Sur macOS :

bash

brew install ollama
# ou pour mettre à jour
brew upgrade ollama

Tu peux aussi télécharger directement depuis ollama.com/download.

Sur Linux :

bash

curl -fsSL https://ollama.com/install.sh | sh

Sur Windows :

Télécharge l’installateur depuis le site officiel. L’installation est classique, next-next-finish.

3.2 Télécharger un modèle

Avant de lancer un agent, tu dois avoir au moins un modèle disponible. Voici les recommandés pour le coding :

Pour du local (si tu as le GPU) :

bash

# Le plus recommandé pour le coding
ollama pull glm-4.7-flash

# Alternative plus légère
ollama pull qwen3-coder

Pour du cloud (sans GPU puissant) :

bash

# Modèle cloud avec contexte complet
ollama pull glm-4.7:cloud

# Ou le monstre de 480B paramètres
ollama pull qwen3-coder:480b-cloud

⏳ Le téléchargement peut prendre un moment selon ta connexion (les modèles locaux font plusieurs Go).

3.3 Lancer ton premier agent

Maintenant, le moment magique. Pour lancer Claude Code par exemple :

bash

ollama launch claude

Le wizard interactif s’ouvre :

╭──────────────────────────────────────────────────╮
│  Select a model                                  │
│  > glm-4.7-flash [local]                        │
│    qwen3-coder [local]                          │
│    glm-4.7:cloud                                │
│                                                  │
│  ↑/↓ to navigate, Enter to select               │
╰──────────────────────────────────────────────────╯

Tu sélectionnes ton modèle, tu appuies sur Entrée, et Claude Code se lance directement. C’est tout. Vraiment.

Pas de clé API à rentrer, pas de config à toucher. Ollama gère tout en arrière-plan.

Guide par agent : Quel outil choisir ? 🎯

Maintenant que tu sais comment lancer un agent, la question c’est : lequel choisir ? Voici un tour d’horizon pour t’aider à décider.

4.1 Claude Code : Le roi du coding agentique 👑

bash

ollama launch claude

Claude Code, c’est l’agent de coding développé par Anthropic. Il est devenu LA référence pour le « vibe coding » — tu décris ce que tu veux en langage naturel, et l’IA génère le code.

Ce qu’il sait faire :

  • Lire et modifier des fichiers dans ton projet
  • Exécuter des commandes terminal
  • Corriger des bugs automatiquement
  • Gérer des conflits de merge
  • Refactorer du code existant

Idéal pour : Les développeurs qui veulent un copilote puissant pour coder plus vite.

Le truc en plus : Grâce à Ollama, tu peux maintenant faire tourner Claude Code avec des modèles open-source locaux, sans envoyer ton code sur les serveurs d’Anthropic. Une vraie révolution pour la confidentialité.

4.2 Codex : L’alternative OpenAI

bash

ollama launch codex

Codex, c’est l’agent de coding côté OpenAI. Si tu es déjà dans l’écosystème OpenAI (ChatGPT, API GPT-4…), tu seras en terrain connu.

Idéal pour : Ceux qui préfèrent l’approche OpenAI ou qui ont déjà des crédits API chez eux.

4.3 OpenCode : L’option 100% open-source

bash

ollama launch opencode

OpenCode est une alternative entièrement open-source aux agents propriétaires. Si tu es du genre à vouloir contrôler tout ton stack et éviter les dépendances aux GAFAM, c’est fait pour toi.

Idéal pour : Les puristes de l’open-source, les environnements air-gapped, les entreprises avec des contraintes de compliance.

4.4 Droid : L’automatisation mobile

bash

ollama launch droid

Droid, c’est un peu différent. C’est un agent spécialisé dans l’automatisation d’appareils mobiles. Tu peux lui donner des instructions en langage naturel pour contrôler ton téléphone Android.

Ce qu’il sait faire :

  • Naviguer dans des apps
  • Remplir des formulaires
  • Automatiser des tâches répétitives
  • Faire des captures d’écran intelligentes

Idéal pour : Le testing mobile, l’automatisation de workflows sur smartphone, le scraping d’apps.

Si tu cherches d’autres solutions pour automatiser des workflows, jette un œil à notre article sur l’agent N8N qui propose une approche no-code très intéressante.

4.5 Clawdbot : L’assistant personnel ultime 🦞

bash

ollama launch clawdbot

Clawdbot, c’est mon coup de cœur. Ce n’est pas juste un agent de coding — c’est un assistant IA personnel complet qui vit sur ta machine et peut interagir avec toi via WhatsApp, Telegram, Discord…

Ce qu’il sait faire :

  • Gérer tes emails et ton calendrier
  • T’envoyer des briefings matinaux proactifs
  • Contrôler ta domotique
  • Automatiser des tâches système
  • Se souvenir de tes préférences

J’ai écrit un guide complet sur Clawdbot si tu veux approfondir. C’est vraiment le projet qui fait le plus de buzz en ce moment dans la communauté IA.

Idéal pour : Ceux qui veulent un vrai « Jarvis » personnel, pas juste un chatbot.

Local ou Cloud : Comment choisir ? ☁️💻

C’est LA grande question. Ollama te permet de faire tourner les modèles en local ou via leur cloud. Voici comment choisir.

Tableau comparatif

CritèreLocalCloud
Confidentialité✅ Données sur ta machine⚠️ Données transitent par Ollama
Coût💰 Investissement GPU initial💸 Pay-as-you-go (free tier dispo)
Performance🔄 Dépend de ton hardware✅ Modèles puissants garantis
Contexte⚠️ Limité par ta VRAM✅ Contexte complet (128k+)
Offline✅ Fonctionne sans internet❌ Connexion requise
Setup🔧 Plus technique✅ Plug & play

Quand choisir le local ?

  • Tu travailles sur du code sensible/propriétaire
  • Tu as besoin de fonctionner offline
  • Tu as déjà un GPU puissant (RTX 4090, A100…)
  • Tu veux zéro dépendance à un service tiers

Quand choisir le cloud ?

  • Tu n’as pas de GPU dédié (laptop, Mac Intel…)
  • Tu veux accéder aux modèles les plus puissants (480B paramètres)
  • Tu as besoin d’un contexte large pour de gros projets
  • Tu veux tester rapidement sans investir

Le pricing Ollama Cloud

Ollama propose un modèle freemium assez généreux :

  • Free tier : Suffisant pour tester et des usages légers
  • Sessions étendues : 5 heures de coding continu
  • Modèles premium : Accès aux versions les plus puissantes

Pour les détails à jour, check ollama.com/pricing.

💡 Mon conseil : Commence par le cloud pour tester, puis investis dans du local si tu accroches et que tu as des besoins de confidentialité.

Aller plus loin : Configuration avancée 🔧

Augmenter la taille du contexte

Par défaut, Ollama utilise un contexte de 2k tokens. Pour le coding, c’est trop court. Les agents fonctionnent mieux avec au moins 64k tokens.

Pour augmenter :

bash

# Créer un Modelfile personnalisé
echo "FROM glm-4.7-flash
PARAMETER num_ctx 64000" > Modelfile

# Créer le modèle custom
ollama create glm-4.7-flash-64k -f Modelfile

Ou modifie directement dans les settings Ollama si tu utilises l’app desktop.

Configurer sans lancer

Tu veux juste configurer un agent pour plus tard, sans le lancer immédiatement ? Utilise le flag --config :

bash

ollama launch opencode --config

Ça va créer tous les fichiers de config nécessaires sans démarrer l’agent.

Combiner plusieurs agents

Rien ne t’empêche d’avoir plusieurs agents configurés et de switcher selon tes besoins :

  • Claude Code pour le coding pur
  • Clawdbot pour l’automatisation personnelle
  • Droid pour les tests mobile

Chaque ollama launch est indépendant.

Ollama Launch : Un vrai game changer 🏆

Ollama launch représente exactement ce dont l’écosystème IA avait besoin : une simplification radicale de l’accès aux agents IA.

Avant : Des heures de configuration, des tutoriels de 47 étapes, des erreurs cryptiques.

Maintenant : Une commande, un wizard, et c’est parti.

Ce qui me plaît particulièrement, c’est la flexibilité. Tu peux commencer en cloud gratuitement, puis migrer en local quand tu es prêt. Tu peux tester différents agents sans te prendre la tête. Tu peux même faire tourner des modèles open-source avec des outils propriétaires comme Claude Code.

Si tu hésites encore, mon conseil : lance-toi. Installe Ollama, tape ollama launch claude, et vois par toi-même. En 5 minutes, tu auras un agent de coding fonctionnel.

Et si tu veux aller plus loin dans l’univers des agents IA, n’hésite pas à explorer notre comparateur d’agents IA pour trouver l’outil qui correspond le mieux à tes besoins.

Ressources utiles

FAQ ❓

Ollama launch est-il gratuit ? Oui, la commande ollama launch est totalement gratuite. Si tu fais tourner les modèles en local, il n’y a aucun coût récurrent. Pour le cloud, il y a un free tier généreux, puis des options payantes pour plus d’usage.

Quelle carte graphique pour ollama launch en local ? Pour les modèles recommandés comme glm-4.7-flash, il te faut environ 23 GB de VRAM. Ça correspond à une RTX 3090, RTX 4090, ou des cartes pro comme les A100. Pour des modèles plus légers, une RTX 3080 (10 GB) peut suffire avec un contexte réduit.

Peut-on utiliser ollama launch sans GPU ? Oui, en utilisant les modèles cloud (:cloud). Tu n’as besoin d’aucun GPU — tout tourne sur les serveurs d’Ollama. C’est la solution idéale pour les laptops ou les Mac sans GPU dédié.

Quelle différence entre ollama launch et une installation manuelle ? ollama launch automatise toute la configuration : détection des modèles, création des fichiers de config, gestion des variables d’environnement. Une installation manuelle te demanderait de faire tout ça à la main, ce qui prend du temps et peut générer des erreurs.

Les modèles locaux sont-ils aussi performants que les modèles cloud ? Ça dépend. Les modèles cloud comme qwen3-coder:480b-cloud ont 480 milliards de paramètres — impossible à faire tourner en local. Mais pour des tâches courantes, un bon modèle local comme glm-4.7-flash fait très bien le job, avec l’avantage de la confidentialité.

Puis-je utiliser mes propres clés API avec ollama launch ? Oui, mais ce n’est pas nécessaire. L’intérêt d’ollama launch est justement de ne PAS avoir besoin de clés API — Ollama gère l’authentification. Si tu veux utiliser tes propres clés (par exemple pour Claude via Anthropic directement), tu peux toujours faire une configuration manuelle classique.

auteur lucas lagent ia


Tu as testé ollama launch ? Dis-moi en commentaire quel agent tu utilises et pour quoi faire ! 👇

Publications similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *