图像生成
AISCouncil 可以使用 AI 图像生成模型从文本描述生成图像。描述您想要的内容,模型会直接在您的聊天中创建图像。
支持的提供商
| 提供商 | 模型 | 说明 |
|---|---|---|
| OpenAI | DALL-E 3 | 高质量,1024x1024,修订提示词 |
| xAI | Grok 2 Image | 快速生成,返回 URL 或 base64 |
| OpenRouter | 多种 | 访问多个图像生成模型 |
信息
您需要为您想使用的提供商提供 API 密钥。图像生成是付费功能 —— 免费额度模型不包括图像生成。
工作原理
平台自动从您的消息文本中检测图像生成请求。您可以通过两种方式触发图像生成:
1. 自然语言(自动检测)
只需以一种暗示图像创建的方式描述您想要的内容:
- "生成一张山日落的图片"
- "创建一张未来城市的图片"
- "画一只戴礼帽的猫"
平台会在您消息的开头查找"生成图片"、"创建图片"或"画"等短语。
2. /image 命令(显式触发)
使用 /image 命令后跟您的描述:
/image 春天樱花盛开的宁静日式庭院
这是触发图像生成最可靠的方式,特别是对于可能不会被自动检测到的提示词。
触发模式
以下模式在消息开头触发图像生成:
| 模式 | 示例 |
|---|---|
/image ... | /image 黎明时的山景 |
generate image of ... | generate an image of a robot |
create image of ... | create an image of a cozy cabin |
draw ... | draw a dragon flying over a castle |
提示
如果您的消息没有被检测为图像请求,请在前面加上 /image 以确保触发图像生成。
生成的图像
当图像成功生成时:
- 图像内联显示在聊天中,嵌入在助手的响应中
- 如果提供商返回了修订后的提示词(DALL-E 3 会这样做),它会显示在图像上方,以便您可以看到模型如何解释您的请求
- 图像存储在聊天历史中,重新加载对话时会出现
下载图像
右键点击(或移动端长按)生成的图像并选择"图像另存为..."下载到您的设备。生成的图像是标准的网络图像(PNG 或 JPEG),可以像任何其他图像一样保存。
有效提示词的技巧
- 具体: "一只在秋叶中玩耍的金毛幼犬,温暖的阳光,浅景深"比"一只狗"产生更好的结果
- 指定风格: 添加艺术风格描述符,如"油画"、"水彩"、"照片级逼真"、"3D 渲染"、"像素艺术"
- 包含构图细节: 提及光线、角度、情绪和背景
- 描述您想要的,而不是您不想要的: 正面描述比"不要 X"或"没有 Y"效果更好
- 使用修订后的提示词: DALL-E 3 显示其修订后的解释 —— 用它来了解如何编写更好的提示词
提供商对比
| 功能 | DALL-E 3 (OpenAI) | Grok 2 Image (xAI) |
|---|---|---|
| 分辨率 | 1024x1024 | 可变 |
| 修订后的提示词 | 是(显示在图像上方) | 否 |
| 速度 | 约 10-15 秒 | 约 5-10 秒 |
| 图像中的文字 | 良好 | 可变 |
| 照片级逼真 | 优秀 | 良好 |
| API 密钥 | 需要 OpenAI 密钥 | 需要 xAI 密钥 |
错误处理
如果图像生成失败,聊天中会显示错误消息。常见问题:
- 无 API 密钥: 在配置面板中为您选择的提供商设置 API 密钥
- 不支持的提供商: 切换到 OpenAI、xAI 或 OpenRouter —— 并非所有提供商都支持图像生成
- 内容政策: 提供商因内容政策违规拒绝了提示词
- 速率限制: 稍等片刻再试
注意
图像生成仅在您的机器人活动提供商支持时可用(OpenAI、xAI 或 OpenRouter)。如果您使用 Anthropic、Gemini 或 Ollama,图像生成命令将无法工作。