最近参加线下活动需要各种素材,所以一直在折腾 Hermes 的生图能力。
之前单独用 image_generate 做图的时候,就能明显感觉到 OpenAI 新一代 Image2 在中文海报、UI 截图、信息图这块比以前强了不少。后来看到 Hermes 可以直接通过 Codex 授权接入 gpt-image-2,就顺手把这套能力和 Baoyu Skills 结合了一下。
结果发现,这个组合简直是生图王炸。

现在我不管是公众号配图、PPT 素材,还是对外宣传物料,基本都走这套流程了。效果好,关键是省事。
以前是人写 Prompt,再去生图。现在是把内容丢给 Hermes,让 Baoyu Skills 先拆结构、写 Prompt,再调用 Image2 出图。
整个过程,你几乎不用管 Prompt 怎么写。

先说怎么让 Hermes 用上 Image2
配置很简单,三步搞定。
第一步,升级 Hermes,
hermes update
第二步,进工具配置,
hermes tools
依次选 Reconfigure an existing tool's provider or API key

然后选 Image Generation

接着选 OpenAI (Codex auth) [free]

这三种任意选择就行

第三步,重启网关,
hermes gateway restart
前提是你之前已经通过 OpenAI Codex 做过登录鉴权。如果已经登录过,就不需要单独配置 OpenAI API Key,Hermes 的 image_generate 工具会走 Codex auth 调用 Image2。
配置完之后,你可以随便让 Hermes 生成一张图,看看返回的元信息。
我之前实测的时候,返回过这样的信息,
{
"provider": "openai-codex",
"model": "gpt-image-2-medium",
"aspect_ratio": "portrait",
"size": "1024x1536",
"quality": "medium"
}
也就是说,在当前 Hermes 环境里,生图工具实际走的是 gpt-image-2-medium。
不是理论上支持,是真的在用 Image2。
第一种玩法,直接用 image_generate 做配图
最简单的方式,就是直接让 Hermes 调用内置的 image_generate 工具。
比如我之前做过一个"GPT 额度重置"的科幻海报,把参考图主题色改成爱马仕橙。
需求很简单,
image-2 重新生成这个图,改下主题颜色,爱马仕橙
当时 Prompt 里重点写了这些约束,
#F37021指定文案包括,
4月28日 13:30
GPT额度重置!
奥特曼,又满了,继续冲
100%
5h 100% | Weekly 100%
生成出来的图,直接就能用。

如果只是做公众号首图、宣传海报、朋友圈配图,直接用 Hermes 的 image_generate 就足够了。关键是把主体、画面结构、配色、中文文案、负面约束写清楚。
第二种玩法,Baoyu Skills 自动生成信息图
这个才是真正的王炸。
Baoyu Skills 里有个工具叫 baoyu-infographic,专门用来把文章、课程、PPT 素材结构化成专业视觉 Prompt,然后调用 Image2 出图。
我之前试过一个案例,把一份 35 页的 PPT 课程稿,直接生成成公众号信息图。
素材是这样的,
# AI 工具站的 7 个方向
## A01. 工具导航站
聚合展示,按分类、标签、场景索引 AI 工具...
## D04. 工具评测站
深度测评,对比横评,避坑指南...
## E05. 工具教程站
从入门到进阶,手把手教学...
一共 7 个模块,每个模块下面有 3-5 条要点。
我直接把这份素材丢给 Hermes,
用 baoyu-infographic 把这份课程稿生成信息图
Baoyu Skills 会自动做这几件事,
整个过程你不用管 Prompt 怎么写,Baoyu Skills 全自动处理。
生成出来的图是这样的,
我当时看到生成结果的时候,第一反应是,这尼玛也太省事了。
以前做这种信息图,要么自己在 Figma 里画,要么手动写一大堆 Prompt 调参数。现在直接把素材丢进去,等几十秒就出来了。
而且 Baoyu Skills 生成的 Prompt 非常专业,会自动处理这些细节,
这些都是手动写 Prompt 很难兼顾的。

第三种玩法,拆分生成 + 二次优化
有时候一张信息图内容太多,Image2 生成出来的图会有些细节不够清晰。
这时候可以用 Baoyu Skills 的拆分功能。
还是刚才那个 AI 工具站的案例,Baoyu Skills 会自动把 7 个模块拆成两张图,
每张图的 Prompt 都是独立生成的,会根据内容调整布局和排版。
拆分后的图,细节更清晰,文字更容易读。
而且 Baoyu Skills 还会自动生成每张图的 Prompt 文件,保存在输出目录里。如果你对某张图不满意,可以直接拿 Prompt 去微调,不用从头写。
这个功能在做长图、知识卡片、教程图的时候特别有用。
实际用下来的感受
现在这套流程在我的工作里基本是标配了。
公众号配图,直接用 image_generate 生成首图和配图。
PPT 素材,用 Baoyu Skills 把大纲生成信息图,再导入 PPT。
对外宣传物料,比如朋友圈海报、活动宣传图,也是这套流程。
效果好,关键是省事。
以前做一张信息图,从构思到设计到调参数,怎么也得半小时起步。现在把素材丢进去,几十秒就出来了。
而且 Baoyu Skills 生成的图,专业度比我自己手动写 Prompt 高多了。配色、排版、图标、文字层级,这些细节都处理得很到位。
当然也不是说完全不用管,有时候生成出来的图还是需要微调。比如中文文字偶尔会有点糊,或者某个模块的排版不够紧凑。
但整体来说,这套流程已经把生图的效率提升了一个量级。
如果你也在用 Hermes,强烈建议试试这个组合。
Hermes 负责统一调度工具,Image2 负责最终出图,Baoyu Skills 负责把内容结构化成专业视觉 Prompt。
三个工具配合起来,生图直接起飞。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~
谢谢你看我的文章,我们,下次再见。