Pular para o conteúdo principal

Visão

O recurso Visão permite enviar imagens junto com suas mensagens de texto para modelos de IA com capacidade de visão. O modelo pode analisar, descrever e responder perguntas sobre as imagens que você fornecer.

Provedores Suportados

Nem todos os modelos suportam visão. Os seguintes provedores e modelos podem processar imagens:

ProvedorModelos de Visão
AnthropicClaude Sonnet 4, Claude Opus 4, Claude Haiku 3.5 e outros modelos Claude 3+
OpenAIGPT-4o, GPT-4o mini, GPT-4 Turbo, o1, o3
xAIGrok 2 Vision
Google GeminiGemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.0 Flash
OpenRouterQualquer modelo com capacidade de visão disponível através do OpenRouter
informação

O registro de modelos indica quais modelos suportam visão via tag de capacidade "vision". Se um modelo não suporta visão, a imagem será ignorada ou causará um erro.

Como Enviar Imagens

Há três maneiras de anexar uma imagem à sua mensagem:

1. Colar da Área de Transferência (Ctrl+V / Cmd+V)

Copie uma imagem de qualquer fonte (ferramenta de captura, navegador web, editor de imagens) e cole diretamente na área de entrada de mensagem. A imagem é detectada automaticamente e aparece como prévia em miniatura.

2. Botão de Upload

Clique no botão de ícone de câmera ao lado do botão Enviar. Um seletor de arquivos abre onde você pode selecionar uma imagem do seu dispositivo.

3. Arrastar e Soltar

Arraste um arquivo de imagem do seu gerenciador de arquivos e solte na área de entrada de mensagem.

Prévia de Imagem

Uma vez que uma imagem é anexada, uma prévia em miniatura aparece acima da área de entrada. Você pode:

  • Ver qual imagem está na fila para envio
  • Clicar no botão X para remover a imagem antes de enviar
  • Digitar sua mensagem de texto junto com a imagem
dica

Você pode anexar uma imagem e enviá-la sem texto. Apenas cole ou carregue a imagem e pressione Enter. O modelo analisará a imagem e descreverá o que vê.

Enviando a Mensagem

Quando você clica Enviar (ou pressiona Enter), tanto seu texto quanto a imagem anexada são enviados juntos como uma única mensagem. A imagem é codificada como URL de dados base64 e incluída na solicitação de API.

Após enviar, a prévia de imagem é limpa automaticamente. A mensagem de usuário no histórico de chat mostra seu texto (os dados da imagem são armazenados na mensagem internamente, mas exibidos como texto na visualização de chat).

Suporte a Formato de Imagem

Os seguintes formatos de imagem são suportados:

  • JPEG (.jpg, .jpeg)
  • PNG (.png)
  • GIF (.gif)
  • WebP (.webp)
aviso

Imagens grandes aumentam custos de API porque consomem mais tokens. A maioria dos provedores tem limites de tamanho de imagem. Imagens são enviadas como dados codificados em base64, então uma imagem de 1 MB adiciona aproximadamente 1.3 MB ao payload da solicitação. Considere redimensionar imagens muito grandes antes de enviar.

Formatação Específica do Provedor

A plataforma formata automaticamente dados de imagem de acordo com os requisitos de API de cada provedor:

  • Anthropic usa o formato de bloco de conteúdo image com source.type: "base64" e o tipo MIME da imagem
  • OpenAI, xAI, OpenRouter, Gemini usam o formato de bloco de conteúdo image_url com uma URL de dados

Você não precisa lidar com isso -- é automático baseado no provedor selecionado.

Múltiplas Imagens

Você pode enviar uma imagem por mensagem. Para discutir múltiplas imagens, envie-as em mensagens separadas. O modelo retém contexto de mensagens anteriores, então você pode dizer "compare esta imagem com a que enviei anteriormente."

Habilitar/Desabilitar Visão

Visão está habilitada por padrão. Você pode alternar em Configurações > Recursos. Quando desabilitado, o botão de upload de imagem e tratamento de colagem são desativados.

Casos de Uso

  • Análise de captura de tela -- cole uma captura e pergunte "Que erro é mostrado aqui?"
  • Leitura de documentos -- fotografe um documento e peça ao modelo para extrair texto ou resumir
  • Revisão de código -- compartilhe uma captura de código e peça melhorias
  • Feedback de design -- carregue um mockup e obtenha sugestões de design
  • Problemas de matemática -- fotografe um problema de matemática e peça uma solução
  • Visualização de dados -- compartilhe um gráfico e peça interpretação