轻松编辑图像:Gemini 2.0 Flash Experimental Plugin现已可用于ComfyUI

CN
ComfyUI.org
2025-03-17 11:26:56

谷歌最新推出的多模态模型 Gemini 2.0 Flash Experimental 在图像生成和编辑方面展现了强大的能力,尤其是在保持主体一致性的图像编辑上,实现了“一键生图,一句话改图”的便捷操作。 无论是修图、扩图还是生成效果图,Gemini 2.0 都能轻松应对。现在,ComfyUI 用户也可以通过插件将其集成到工作流程中,享受高效便捷的图像编辑体验!

m8czd5yoxpy21y8ekb00000.jpg

Gemini 2.0 的核心优势

  • 高效生成:生成图片效率更快,尤其是在保持主体一致性的图像编辑上表现出色。

  • 简单易用:无需复杂插件辅助,只需上传原图并描述需求,即可一键修图。

  • 多功能支持:支持修图、扩图、去水印、打光等多种图像编辑功能。


ComfyUI 插件集成

插件地址ComfyUI-Gemini-API

插件功能

  • 基本图像编辑:支持上传图片并描述需求,快速生成编辑后的图像。

  • 一致性保持:在修改图像时,能够很好地保持主体一致性。

  • 简单操作:无需复杂设置,小白用户也能轻松上手。

插件限制

  • 不支持连续对话功能。

  • 图像尺寸需为 1024x1024,否则返回的图像尺寸可能与设置不符。


效果展示

  1. 改变头发颜色
    只需描述需求,Gemini 2.0 即可快速修改人物头发颜色,同时保持主体一致性。

  2. 让人物飞起来
    生成效果自然,主体一致性表现优秀。

  3. 扩图功能
    支持上下左右扩图,或指定方向扩图。

  4. 生成服装模型
    上传衣服图片,一键生成服装模型。

  5. 产品效果图
    上传产品图片,生成高质量产品效果图。

  6. 去除水印
    轻松去除图片中的水印。

  7. 打光效果
    为图片中的人物添加打光效果。


安装与使用教程

1. 安装插件

  1. 打开 ComfyUI 管理器,搜索插件 ComfyUI-Gemini-API

  2. 点击安装并重启 ComfyUI。

2. 获取 API Key

  1. 访问谷歌 API Key 申请地址:Google AI Studio API Key

  2. 登录后,点击“创建 API 密钥”并复制生成的密钥。

3. 配置插件

  1. 在 ComfyUI 中加载 Gemini 2.0 节点。

  2. 将复制的 API Key 粘贴到节点中。

  3. 上传图片并描述需求,即可生成编辑后的图像。


常见问题与解决方案

  1. 图像尺寸问题

    • 如果图像尺寸不是 1024x1024,返回的图像尺寸可能与设置不符。

    • 解决方案:使用插件 ComfyUI-Teeth 运行 Python 脚本,通过正则表达式获取原始图像尺寸并进行缩放修复。

  2. API 连接问题

    • 如果无法正常使用,尝试切换网络节点或检查 API Key 是否正确。


总结

Gemini 2.0 Flash Experimental 在图像编辑方面展现了强大的能力,尤其是在保持主体一致性上的表现令人印象深刻。ComfyUI 插件的集成进一步降低了使用门槛,让用户能够轻松享受 AI 驱动的图像编辑体验。虽然插件功能目前还比较简单,但已经能够满足大部分基础需求,未来还有很大的优化空间。

立即尝试 Gemini 2.0 和 ComfyUI 插件,开启您的 AI 图像编辑之旅! 🎨✨


官方体验地址Gemini 2.0 Flash Experimental
插件地址ComfyUI-Gemini-API