ComfyUI-Gemini:Gemini 1.5 Pro在ComfyUI中的全面集成
ComfyUI-Gemini,在 ComfyUI 中使用 Gemini 1.5 Pro 进行高级对话管理和多模态交互,体验前所未有的智能对话与数据处理能力。
直达下载
回到上一页
clickgpt_line.png_noView
介绍

Gemini 1.5 Pro 已成功集成到 ComfyUI 中,这意味着用户现在不仅可以使用该模型生成提示词、描述图像,还能享受与其深入交流的乐趣。自2024年5月2日起,Gemini API 将开始收费,用户需在官方网站申请API密钥以继续使用服务。

github_ai_tool_comfyui_gemini_1

主要功能

  1. 高级对话管理:支持系统指令设置,允许用户精细控制对话流程,实现更加智能的交互体验。
  2. 多模态交互能力:集成文本、图像以及文件读取功能,支持多种媒体类型的输入,包括视频和音频,上限为20GB。
  3. 扩展的输入限制:支持的输入token数量达到1048576,为用户提供了极大的灵活性。
  4. 严格的速率限制:每分钟最多两次请求,每日最多1000次,确保服务的稳定与高效。

新增功能

github_ai_tool_comfyui_gemini_2

  • 文件上传支持:现支持单个文件上传,包括图片、文本文件、PDF和音频文件,未来将扩展到多文件上传。
  • 全面的训练和测试流程:提供了从预处理到自动打标,再到训练和测试的一条龙服务,特别适用于LoRa设备的数据处理。

使用方式

用户需要首先在 Gemini API 官网 申请自己的 API 密钥。Gemini 1.5 Pro的使用分为隐式和显式两种API Key方式,推荐使用隐式API Key以增强安全性。用户也可以选择显式输入API Key,但需要注意不要将包含密钥的工作流共享。

安装指南

推荐通过 ComfyUI Manager 进行安装,也可以手动安装。手动安装步骤如下:

  1. 克隆存储库到本地。
  2. 进入项目目录,安装必要的依赖。
  3. 重启 ComfyUI 以应用安装。
编程学习
编程学习 免费领取编程学习资料 进编程学习交流群
订阅号
视频号
公众号 关注公众号,回复关键字python领取大厂最新面试题
×
编程学习
免费领取编程学习资料 进编程学习交流群