FuhuAPI
  1. Gemini
FuhuAPI
  • 快速开始
    • 快速开始
    • 入门必看
    • FuhuAPI 公告
  • API 参考
    • 报错状态码说明
    • OpenAI 格式
      • Chat Completions
      • Response
      • gpt-4o-image生图
      • 图像
      • 图像编辑(gpt-image-1)
      • Embeddings
      • 获取模型列表
      • response id获取结果
      • Hunyuan3D
    • Anthropic 格式
      • Anthropic Claude
    • Gemini
      • 调用 gemini-3-pro-image 指南
      • Gemini生图
        POST
      • Gemini 文本对话
        POST
    • Midjourney 图像生成
      • 快速教学-完整流程一遍过
      • 任务查询
        • 分页查询
        • 指定ID获取任务
      • 提交Imagine任务
      • 提交视频任务
      • 提交编辑任务
      • 提交Action任务
      • 提交Blend任务
      • 提交Describe任务
      • 提交Modal
    • 图像生成
      • Replicate(image)
        • 创建任务-通用
        • 查询任务
        • 创建任务
      • 豆包生图
        • seededit-image-generation
        • seededit-Image Editing
    • 音乐生成
      • Suno
        • 设置 suno 版本
        • Suno API 场景应用指南
        • 生成歌词
        • 生成音乐
        • 上传音乐
        • 歌曲拼接
        • 全轨声曲分离
        • 单轨声曲分离
        • 新建 Persona
        • 拓展 style tags
        • 查询单个任务
        • 生成 mp4 mv 视频
        • 获取 wav 格式文件
        • Timing:歌词、音频时间线
        • 批量查询任务
        • 获取 midi
    • 视频生成
      • sora-2
        • 官方格式
          • 创建视频
          • 混编视频
          • 检索视频
          • 删除视频
          • 下载视频
        • 逆向
          • 逆向异步格式
            • sora逆向异步
            • sora逆向查回
          • sora-2视频逆向格式
      • veo3
        • 逆向异步格式
          • veo3逆向异步
          • veo3逆向查回
        • veo3-chat格式
      • kling (video)
        • Callback协议
        • 扩图
        • 生成图像
        • 文生视频
        • 图生视频
        • 视频延长
        • 虚拟试穿
        • 对口型
        • 视频特效
        • 查询任务(单个)
      • runway(video)
        • 官方格式
          • 从图像生成视频
          • 获取任务详细信息
        • 逆向格式
          • generate(文本)
          • generate(参考图片)
          • video2video 视频转视频 风格重绘
          • Act-one 表情迁移
          • feed-获取任务
      • MiniMax 海螺(video)
        • 官方文档
        • 视频生成
        • 查询任务
        • 文件下载
      • luma (video)
        • 官方API格式
          • 生成视频
          • 单个查询任务
    • 音频
      • 文本转音频
      • 音频转文本
      • 创建翻译
  • 代码示例
    • 代码示例
  • 集成指南
    • 最佳实践
      • Gemini CLI 接入说明
      • Claude code 接入说明
      • FuhuAPI 账户余额查询API 使用说明
      • 使用 FuhuAPI 和 OpenAI 官方 API 的重试逻辑说明文档
      • Midjorney调用最佳实践
      • Runway调用最佳实践
    • 应用集成指南
  • 定价计费
    • 关于价格
    • 关于分组
  • 帮助中心
    • 帮助中心
    • 接口稳定性
    • 常见误区
    • 使用困惑
    • 隐私政策
    • 服务条款
  • 数据模型
    • 示例数据模型
    • Sample Schemas
      • Pet
      • Category
      • Tag
    • Schemas
      • 双人特效
      • ChatCompletionRequest
      • 单人特效
      • RequestMessage
      • VideoGenerationRequest
      • ChatCompletionResponse
      • TextGenerateRequest
      • ResponseChoice
      • ImageGenerateRequest
      • ResponseMessage
      • VideoGenerateRequest
      • Usage
      • BaseResponse
      • TextToImageRequest
      • VideoGenerationResponse
      • GenerateResponse
      • EditImageRequest
      • ErrorResponse
      • BlendImagesRequest
      • UpscaleRequest
      • DescribeImageRequest
      • ImageGenerationResponse
      • ImageDescriptionResponse
      • ErrorResponse
  1. Gemini

Gemini生图

POST
https://api.fuhuapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent

Gemini原生格式生图#

调用 gemini-2.5-flash-image 指南
详细参数及用法建议参考
Gemini 官方文档

🍌 Flash 2.5 Image 更新#

a. 灵活的宽高比#

现已支持设置多种宽高比(可参考代码示例中的控制图像尺寸),轻松适配不同终端的内容创作。默认所有分辨率生成的图片都消耗 1290 个 token。
支持的宽高比包括:1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9。
参考文中提供的例子:
Google AI Dev: Image Generation Aspect Ratios
Google Cloud: Vertex AI Image Generation
GitHub: Generative AI Getting Started Notebook

b. 模型名字更新#

所有新功能都将在新的 model ID:gemini-2.5-flash-image 上提供。之前的 gemini-2.5-flash-image-preview 将会下线。
需在 2025 年 10 月 31 日 前完成迁移。

c. 强制图片输出#

针对之前经常不输出图片的问题,现在 API 请求里面的 "responseModalities" 可以只设置 ["IMAGE"],这样就避免了只输出文本没有图片的情况。

请求参数

Header 参数

Body 参数application/json

示例

返回响应

🟢200成功
application/json
Body

请求示例请求示例
Shell
JavaScript
Java
Swift
cURL
curl --location --request POST 'https://api.fuhuapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "'\''Maintain the character features in the image to generate a new portrait photo: a woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Her right hand gently touches a large kite with a blue background, decorated with pink fish motifs and a pair of large eyes. The background is the interior of an old wooden building, dimly lit and cozy. The painting style is realistic, focusing on the textural details of the clothing patterns, floral headdresses, and wooden buildings"
                }
            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'
响应示例响应示例
{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": "这里是模型返回的文本内容"
          }
        ]
      },
      "finishReason": "STOP",
      "index": 0,
      "safetyRatings": [
        "CATEGORY_HARM_TYPE_SEXUALLY_EXPLICIT: NEGLIGIBLE"
      ]
    }
  ],
  "promptFeedback": {
    "safetyRatings": [
      "CATEGORY_HARM_TYPE_SEXUALLY_EXPLICIT: NEGLIGIBLE"
    ]
  },
  "usageMetadata": {
    "promptTokenCount": 15,
    "candidatesTokenCount": 120,
    "totalTokenCount": 135,
    "thoughtsTokenCount": 0,
    "promptTokensDetails": null
  }
}
上一页
调用 gemini-3-pro-image 指南
下一页
Gemini 文本对话
Built with