Vision
La fonctionnalité Vision vous permet d'envoyer des images en même temps que vos messages textuels aux modèles IA capables de vision. Le modèle peut analyser, décrire et répondre aux questions sur les images que vous fournissez.
Fournisseurs Pris en Charge
Tous les modèles ne supportent pas la vision. Les fournisseurs et modèles suivants peuvent traiter des images :
| Fournisseur | Modèles de Vision |
|---|---|
| Anthropic | Claude Sonnet 4, Claude Opus 4, Claude Haiku 3.5 et autres modèles Claude 3+ |
| OpenAI | GPT-4o, GPT-4o mini, GPT-4 Turbo, o1, o3 |
| xAI | Grok 2 Vision |
| Google Gemini | Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.0 Flash |
| OpenRouter | Tout modèle capable de vision disponible via OpenRouter |
Le registre de modèles indique quels modèles supportent la vision via l'étiquette de capacité "vision". Si un modèle ne supporte pas la vision, l'image sera ignorée ou causera une erreur.
Comment Envoyer des Images
Il y a trois façons d'attacher une image à votre message :
1. Coller depuis le Presse-papiers (Ctrl+V / Cmd+V)
Copiez une image depuis n'importe quelle source (outil de capture d'écran, navigateur web, éditeur d'images) et collez-la directement dans la zone de saisie du message. L'image est détectée automatiquement et apparaît comme un aperçu miniature.
2. Bouton de Téléchargement
Cliquez sur le bouton avec l'icône d'appareil photo à côté du bouton Envoyer. Un sélecteur de fichiers s'ouvre où vous pouvez sélectionner une image depuis votre appareil.
3. Glisser-déposer
Faites glisser un fichier image depuis votre gestionnaire de fichiers et déposez-le sur la zone de saisie du message.
Aperçu de l'Image
Une fois qu'une image est attachée, un aperçu miniature apparaît au-dessus de la zone de saisie. Vous pouvez :
- Voir quelle image est en attente d'envoi
- Cliquer sur le bouton X pour retirer l'image avant l'envoi
- Taper votre message texte en même temps que l'image
Vous pouvez attacher une image et l'envoyer sans texte. Collez ou téléchargez simplement l'image et appuyez sur Entrée. Le modèle analysera l'image et décrira ce qu'il voit.
Envoyer le Message
Quand vous cliquez sur Envoyer (ou appuyez sur Entrée), votre texte et l'image attachée sont envoyés ensemble comme un seul message. L'image est encodée comme une URL de données base64 et incluse dans la requête API.
Après l'envoi, l'aperçu de l'image est effacé automatiquement. Le message utilisateur dans l'historique de chat affiche votre texte (les données de l'image sont stockées dans le message en interne mais affichées comme texte dans la vue de chat).
Formats d'Image Pris en Charge
Les formats d'image suivants sont pris en charge :
- JPEG (.jpg, .jpeg)
- PNG (.png)
- GIF (.gif)
- WebP (.webp)
Les images volumineuses augmentent les coûts API car elles consomment plus de jetons. La plupart des fournisseurs ont des limites de taille d'image. Les images sont envoyées sous forme de données encodées en base64, donc une image de 1 Mo ajoute environ 1,3 Mo à la charge utile de la requête. Envisagez de redimensionner les très grandes images avant de les envoyer.
Formatage Spécifique au Fournisseur
La plateforme formate automatiquement les données d'image selon les exigences de l'API de chaque fournisseur :
- Anthropic utilise le format de bloc de contenu
imageavecsource.type: "base64"et le type MIME de l'image - OpenAI, xAI, OpenRouter, Gemini utilisent le format de bloc de contenu
image_urlavec une URL de données
Vous n'avez pas besoin de gérer cela -- c'est automatique en fonction du fournisseur sélectionné.
Images Multiples
Vous pouvez envoyer une image par message. Pour discuter de plusieurs images, envoyez-les dans des messages séparés. Le modèle conserve le contexte des messages précédents, vous pouvez donc dire "comparez cette image à celle que j'ai envoyée précédemment."
Activer/Désactiver la Vision
La vision est activée par défaut. Vous pouvez la basculer dans Paramètres > Capacités. Quand elle est désactivée, le bouton de téléchargement d'image et la gestion du collage sont désactivés.
Cas d'Usage
- Analyse de capture d'écran -- collez une capture d'écran et demandez "Quelle erreur est affichée ici ?"
- Lecture de documents -- photographiez un document et demandez au modèle d'extraire le texte ou de résumer
- Revue de code -- partagez une capture d'écran de code et demandez des améliorations
- Retour sur design -- téléchargez une maquette et obtenez des suggestions de design
- Problèmes de mathématiques -- photographiez un problème de mathématiques et demandez une solution
- Visualisation de données -- partagez un graphique et demandez une interprétation