Visão
O recurso Visão permite enviar imagens junto com suas mensagens de texto para modelos de IA com capacidade de visão. O modelo pode analisar, descrever e responder perguntas sobre as imagens que você fornecer.
Provedores Suportados
Nem todos os modelos suportam visão. Os seguintes provedores e modelos podem processar imagens:
| Provedor | Modelos de Visão |
|---|---|
| Anthropic | Claude Sonnet 4, Claude Opus 4, Claude Haiku 3.5 e outros modelos Claude 3+ |
| OpenAI | GPT-4o, GPT-4o mini, GPT-4 Turbo, o1, o3 |
| xAI | Grok 2 Vision |
| Google Gemini | Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.0 Flash |
| OpenRouter | Qualquer modelo com capacidade de visão disponível através do OpenRouter |
O registro de modelos indica quais modelos suportam visão via tag de capacidade "vision". Se um modelo não suporta visão, a imagem será ignorada ou causará um erro.
Como Enviar Imagens
Há três maneiras de anexar uma imagem à sua mensagem:
1. Colar da Área de Transferência (Ctrl+V / Cmd+V)
Copie uma imagem de qualquer fonte (ferramenta de captura, navegador web, editor de imagens) e cole diretamente na área de entrada de mensagem. A imagem é detectada automaticamente e aparece como prévia em miniatura.
2. Botão de Upload
Clique no botão de ícone de câmera ao lado do botão Enviar. Um seletor de arquivos abre onde você pode selecionar uma imagem do seu dispositivo.
3. Arrastar e Soltar
Arraste um arquivo de imagem do seu gerenciador de arquivos e solte na área de entrada de mensagem.
Prévia de Imagem
Uma vez que uma imagem é anexada, uma prévia em miniatura aparece acima da área de entrada. Você pode:
- Ver qual imagem está na fila para envio
- Clicar no botão X para remover a imagem antes de enviar
- Digitar sua mensagem de texto junto com a imagem
Você pode anexar uma imagem e enviá-la sem texto. Apenas cole ou carregue a imagem e pressione Enter. O modelo analisará a imagem e descreverá o que vê.
Enviando a Mensagem
Quando você clica Enviar (ou pressiona Enter), tanto seu texto quanto a imagem anexada são enviados juntos como uma única mensagem. A imagem é codificada como URL de dados base64 e incluída na solicitação de API.
Após enviar, a prévia de imagem é limpa automaticamente. A mensagem de usuário no histórico de chat mostra seu texto (os dados da imagem são armazenados na mensagem internamente, mas exibidos como texto na visualização de chat).
Suporte a Formato de Imagem
Os seguintes formatos de imagem são suportados:
- JPEG (.jpg, .jpeg)
- PNG (.png)
- GIF (.gif)
- WebP (.webp)
Imagens grandes aumentam custos de API porque consomem mais tokens. A maioria dos provedores tem limites de tamanho de imagem. Imagens são enviadas como dados codificados em base64, então uma imagem de 1 MB adiciona aproximadamente 1.3 MB ao payload da solicitação. Considere redimensionar imagens muito grandes antes de enviar.
Formatação Específica do Provedor
A plataforma formata automaticamente dados de imagem de acordo com os requisitos de API de cada provedor:
- Anthropic usa o formato de bloco de conteúdo
imagecomsource.type: "base64"e o tipo MIME da imagem - OpenAI, xAI, OpenRouter, Gemini usam o formato de bloco de conteúdo
image_urlcom uma URL de dados
Você não precisa lidar com isso -- é automático baseado no provedor selecionado.
Múltiplas Imagens
Você pode enviar uma imagem por mensagem. Para discutir múltiplas imagens, envie-as em mensagens separadas. O modelo retém contexto de mensagens anteriores, então você pode dizer "compare esta imagem com a que enviei anteriormente."
Habilitar/Desabilitar Visão
Visão está habilitada por padrão. Você pode alternar em Configurações > Recursos. Quando desabilitado, o botão de upload de imagem e tratamento de colagem são desativados.
Casos de Uso
- Análise de captura de tela -- cole uma captura e pergunte "Que erro é mostrado aqui?"
- Leitura de documentos -- fotografe um documento e peça ao modelo para extrair texto ou resumir
- Revisão de código -- compartilhe uma captura de código e peça melhorias
- Feedback de design -- carregue um mockup e obtenha sugestões de design
- Problemas de matemática -- fotografe um problema de matemática e peça uma solução
- Visualização de dados -- compartilhe um gráfico e peça interpretação