Vision

La fonctionnalité Vision vous permet d'envoyer des images en même temps que vos messages textuels aux modèles IA capables de vision. Le modèle peut analyser, décrire et répondre aux questions sur les images que vous fournissez.

Fournisseurs Pris en Charge

Tous les modèles ne supportent pas la vision. Les fournisseurs et modèles suivants peuvent traiter des images :

Fournisseur	Modèles de Vision
Anthropic	Claude Sonnet 4, Claude Opus 4, Claude Haiku 3.5 et autres modèles Claude 3+
OpenAI	GPT-4o, GPT-4o mini, GPT-4 Turbo, o1, o3
xAI	Grok 2 Vision
Google Gemini	Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.0 Flash
OpenRouter	Tout modèle capable de vision disponible via OpenRouter

info

Le registre de modèles indique quels modèles supportent la vision via l'étiquette de capacité "vision". Si un modèle ne supporte pas la vision, l'image sera ignorée ou causera une erreur.

Comment Envoyer des Images

Il y a trois façons d'attacher une image à votre message :

1. Coller depuis le Presse-papiers (Ctrl+V / Cmd+V)

Copiez une image depuis n'importe quelle source (outil de capture d'écran, navigateur web, éditeur d'images) et collez-la directement dans la zone de saisie du message. L'image est détectée automatiquement et apparaît comme un aperçu miniature.

2. Bouton de Téléchargement

Cliquez sur le bouton avec l'icône d'appareil photo à côté du bouton Envoyer. Un sélecteur de fichiers s'ouvre où vous pouvez sélectionner une image depuis votre appareil.

3. Glisser-déposer

Faites glisser un fichier image depuis votre gestionnaire de fichiers et déposez-le sur la zone de saisie du message.

Aperçu de l'Image

Une fois qu'une image est attachée, un aperçu miniature apparaît au-dessus de la zone de saisie. Vous pouvez :

Voir quelle image est en attente d'envoi
Cliquer sur le bouton X pour retirer l'image avant l'envoi
Taper votre message texte en même temps que l'image

astuce

Vous pouvez attacher une image et l'envoyer sans texte. Collez ou téléchargez simplement l'image et appuyez sur Entrée. Le modèle analysera l'image et décrira ce qu'il voit.

Envoyer le Message

Quand vous cliquez sur Envoyer (ou appuyez sur Entrée), votre texte et l'image attachée sont envoyés ensemble comme un seul message. L'image est encodée comme une URL de données base64 et incluse dans la requête API.

Après l'envoi, l'aperçu de l'image est effacé automatiquement. Le message utilisateur dans l'historique de chat affiche votre texte (les données de l'image sont stockées dans le message en interne mais affichées comme texte dans la vue de chat).

Formats d'Image Pris en Charge

Les formats d'image suivants sont pris en charge :

JPEG (.jpg, .jpeg)
PNG (.png)
GIF (.gif)
WebP (.webp)

avertissement

Les images volumineuses augmentent les coûts API car elles consomment plus de jetons. La plupart des fournisseurs ont des limites de taille d'image. Les images sont envoyées sous forme de données encodées en base64, donc une image de 1 Mo ajoute environ 1,3 Mo à la charge utile de la requête. Envisagez de redimensionner les très grandes images avant de les envoyer.

Formatage Spécifique au Fournisseur

La plateforme formate automatiquement les données d'image selon les exigences de l'API de chaque fournisseur :

Anthropic utilise le format de bloc de contenu image avec source.type: "base64" et le type MIME de l'image
OpenAI, xAI, OpenRouter, Gemini utilisent le format de bloc de contenu image_url avec une URL de données

Vous n'avez pas besoin de gérer cela -- c'est automatique en fonction du fournisseur sélectionné.

Images Multiples

Vous pouvez envoyer une image par message. Pour discuter de plusieurs images, envoyez-les dans des messages séparés. Le modèle conserve le contexte des messages précédents, vous pouvez donc dire "comparez cette image à celle que j'ai envoyée précédemment."

Activer/Désactiver la Vision

La vision est activée par défaut. Vous pouvez la basculer dans Paramètres > Capacités. Quand elle est désactivée, le bouton de téléchargement d'image et la gestion du collage sont désactivés.

Cas d'Usage

Analyse de capture d'écran -- collez une capture d'écran et demandez "Quelle erreur est affichée ici ?"
Lecture de documents -- photographiez un document et demandez au modèle d'extraire le texte ou de résumer
Revue de code -- partagez une capture d'écran de code et demandez des améliorations
Retour sur design -- téléchargez une maquette et obtenez des suggestions de design
Problèmes de mathématiques -- photographiez un problème de mathématiques et demandez une solution
Visualisation de données -- partagez un graphique et demandez une interprétation

Fournisseurs Pris en Charge​

Comment Envoyer des Images​

1. Coller depuis le Presse-papiers (Ctrl+V / Cmd+V)​

2. Bouton de Téléchargement​

3. Glisser-déposer​

Aperçu de l'Image​

Envoyer le Message​

Formats d'Image Pris en Charge​

Formatage Spécifique au Fournisseur​

Images Multiples​

Activer/Désactiver la Vision​

Cas d'Usage​