首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Hermes 接入 Image2 后生图直接起飞了

Hermes 接入 Image2 后生图直接起飞了

作者头像
用户3325124
发布2026-06-18 13:17:31
发布2026-06-18 13:17:31
100
举报

最近参加线下活动需要各种素材,所以一直在折腾 Hermes 的生图能力。

之前单独用 image_generate 做图的时候,就能明显感觉到 OpenAI 新一代 Image2 在中文海报、UI 截图、信息图这块比以前强了不少。后来看到 Hermes 可以直接通过 Codex 授权接入 gpt-image-2,就顺手把这套能力和 Baoyu Skills 结合了一下。

结果发现,这个组合简直是生图王炸。

现在我不管是公众号配图、PPT 素材,还是对外宣传物料,基本都走这套流程了。效果好,关键是省事。

以前是人写 Prompt,再去生图。现在是把内容丢给 Hermes,让 Baoyu Skills 先拆结构、写 Prompt,再调用 Image2 出图。

整个过程,你几乎不用管 Prompt 怎么写。

先说怎么让 Hermes 用上 Image2

配置很简单,三步搞定。

第一步,升级 Hermes,

代码语言:javascript
复制
hermes update

第二步,进工具配置,

代码语言:javascript
复制
hermes tools

依次选 Reconfigure an existing tool's provider or API key

然后选 Image Generation

接着选 OpenAI (Codex auth) [free]

这三种任意选择就行

第三步,重启网关,

代码语言:javascript
复制
hermes gateway restart

前提是你之前已经通过 OpenAI Codex 做过登录鉴权。如果已经登录过,就不需要单独配置 OpenAI API Key,Hermes 的 image_generate 工具会走 Codex auth 调用 Image2。

配置完之后,你可以随便让 Hermes 生成一张图,看看返回的元信息。

我之前实测的时候,返回过这样的信息,

代码语言:javascript
复制
{
  "provider": "openai-codex",
  "model": "gpt-image-2-medium",
  "aspect_ratio": "portrait",
  "size": "1024x1536",
  "quality": "medium"
}

也就是说,在当前 Hermes 环境里,生图工具实际走的是 gpt-image-2-medium

不是理论上支持,是真的在用 Image2。

第一种玩法,直接用 image_generate 做配图

最简单的方式,就是直接让 Hermes 调用内置的 image_generate 工具。

比如我之前做过一个"GPT 额度重置"的科幻海报,把参考图主题色改成爱马仕橙。

需求很简单,

代码语言:javascript
复制
image-2 重新生成这个图,改下主题颜色,爱马仕橙

当时 Prompt 里重点写了这些约束,

  • 竖版 9:16 科幻宣传海报
  • 中央是原创奥特曼风格银红超级英雄
  • 背景是未来 HUD 仪表盘、额度表格界面
  • 原本蓝绿科技风改成爱马仕橙
  • 主色使用 Hermès orange,大约 #F37021
  • 搭配深黑、暖金、白色、金属银
  • 所有进度条、发光边框、仪表盘高亮都用橙色和金色霓虹
  • 避免绿色蓝色主调
  • 中文大标题尽量清晰可读

指定文案包括,

代码语言:javascript
复制
4月28日 13:30
GPT额度重置!
奥特曼,又满了,继续冲
100%
5h 100% | Weekly 100%

生成出来的图,直接就能用。

如果只是做公众号首图、宣传海报、朋友圈配图,直接用 Hermes 的 image_generate 就足够了。关键是把主体、画面结构、配色、中文文案、负面约束写清楚。

第二种玩法,Baoyu Skills 自动生成信息图

这个才是真正的王炸。

Baoyu Skills 里有个工具叫 baoyu-infographic,专门用来把文章、课程、PPT 素材结构化成专业视觉 Prompt,然后调用 Image2 出图。

我之前试过一个案例,把一份 35 页的 PPT 课程稿,直接生成成公众号信息图。

素材是这样的,

代码语言:javascript
复制
# AI 工具站的 7 个方向

## A01. 工具导航站
聚合展示,按分类、标签、场景索引 AI 工具...

## D04. 工具评测站
深度测评,对比横评,避坑指南...

## E05. 工具教程站
从入门到进阶,手把手教学...

一共 7 个模块,每个模块下面有 3-5 条要点。

我直接把这份素材丢给 Hermes,

代码语言:javascript
复制
用 baoyu-infographic 把这份课程稿生成信息图

Baoyu Skills 会自动做这几件事,

  1. 分析素材结构,提取核心要点
  2. 设计信息图布局,7 个模块怎么排
  3. 生成详细的视觉 Prompt,包括配色、字体、图标、排版
  4. 调用 Image2 生成图片

整个过程你不用管 Prompt 怎么写,Baoyu Skills 全自动处理。

生成出来的图是这样的,

  • 竖版 9:16 比例,适合公众号发布
  • 7 个模块分成上下两部分,A01-D04 一张,E05-G07 一张
  • 每个模块有独立的图标、标题、要点列表
  • 配色是深蓝渐变背景,搭配白色文字和橙色高亮
  • 中文文字清晰可读,没有乱码

我当时看到生成结果的时候,第一反应是,这尼玛也太省事了。

以前做这种信息图,要么自己在 Figma 里画,要么手动写一大堆 Prompt 调参数。现在直接把素材丢进去,等几十秒就出来了。

而且 Baoyu Skills 生成的 Prompt 非常专业,会自动处理这些细节,

  • 中文文字的可读性优化
  • 信息层级的视觉区分
  • 配色方案的协调性
  • 图标和装饰元素的风格统一

这些都是手动写 Prompt 很难兼顾的。

第三种玩法,拆分生成 + 二次优化

有时候一张信息图内容太多,Image2 生成出来的图会有些细节不够清晰。

这时候可以用 Baoyu Skills 的拆分功能。

还是刚才那个 AI 工具站的案例,Baoyu Skills 会自动把 7 个模块拆成两张图,

  • 第一张,A01-D04,前 4 个模块
  • 第二张,E05-G07,后 3 个模块

每张图的 Prompt 都是独立生成的,会根据内容调整布局和排版。

拆分后的图,细节更清晰,文字更容易读。

而且 Baoyu Skills 还会自动生成每张图的 Prompt 文件,保存在输出目录里。如果你对某张图不满意,可以直接拿 Prompt 去微调,不用从头写。

这个功能在做长图、知识卡片、教程图的时候特别有用。

实际用下来的感受

现在这套流程在我的工作里基本是标配了。

公众号配图,直接用 image_generate 生成首图和配图。

PPT 素材,用 Baoyu Skills 把大纲生成信息图,再导入 PPT。

对外宣传物料,比如朋友圈海报、活动宣传图,也是这套流程。

效果好,关键是省事。

以前做一张信息图,从构思到设计到调参数,怎么也得半小时起步。现在把素材丢进去,几十秒就出来了。

而且 Baoyu Skills 生成的图,专业度比我自己手动写 Prompt 高多了。配色、排版、图标、文字层级,这些细节都处理得很到位。

当然也不是说完全不用管,有时候生成出来的图还是需要微调。比如中文文字偶尔会有点糊,或者某个模块的排版不够紧凑。

但整体来说,这套流程已经把生图的效率提升了一个量级。

如果你也在用 Hermes,强烈建议试试这个组合。

Hermes 负责统一调度工具,Image2 负责最终出图,Baoyu Skills 负责把内容结构化成专业视觉 Prompt。

三个工具配合起来,生图直接起飞。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~

谢谢你看我的文章,我们,下次再见。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 俊哥AI出海 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档