我文章里那些好看的信息图，都是这一个免费工具画的

最近有朋友问我，你文章里那些信息图是怎么画的，配色统一风格统一，看着像一个人做的。

我当时回了一句，确实是一个「人」做的，只不过这个人是 AI。

然后对方来了兴趣，追问用的什么工具。我想了想，觉得这个东西可能不止他一个人好奇，干脆写篇文章聊聊。

先说个背景。

我写文章有个习惯，每篇都会配信息图。不是随便找张网图凑数的那种，是根据文章内容专门做的。环形流程图、金字塔对比、中心辐射图、管线流程图，根据内容的结构来选合适的布局。

之前推荐 gstack 的那篇，5 张信息图。推荐 Skills 的那篇，好几张。还有其他几篇文章，加起来前前后后画了几十张了。

坦率的讲，这个量级如果是人工做，要么得请一个设计师，要么得花大量时间自己学设计软件。我一个写代码的，让我用 Figma 画信息图，画出来大概长这样，文字挤在一起，配色辣眼睛，排版全靠缘分。

但我用 AI 来画，画出来的效果你们也看到了。风格统一，配色舒服，信息层次清晰。

关键不是我有什么隐藏天赋。关键是工具选对了。

我用的这个工具叫 baoyu-skills。

它是一个开源的 Claude Code Skills 插件集，作者叫 Jim Liu，GitHub 上能找到。里面有好几个 Skill，跟画图相关的有三个，baoyu-imagine、baoyu-infographic、baoyu-cover-image。我重点聊聊前两个。

baoyu-imagine 是底层图像生成引擎。它支持 9 个模型供应商，Google、OpenAI、Replicate、阿里通义万象、MiniMax、即梦、Seedream、Azure、OpenRouter 都能用。

baoyu-imagine 支持的 9 大模型供应商

你可能会说，支持这么多供应商有什么了不起的，Midjourney 不是更好用吗。

不一样。

Midjourney 是好用，但它是一个封闭的产品。你只能在它的界面里用，不能接入你自己的工作流。而 baoyu-imagine 是一个 API 层的抽象，你可以把它嵌入到任何自动化流程里。

更重要的是，它解决了一个特别实际的问题。

你用 Google 的 Gemini 画图，得调 Google 的 API。换成 OpenAI，得换 SDK。换成国内模型，又是另一套接口。每个模型的调用方式、参数格式、返回结构全都不一样。你想对比三个模型的效果，得写三套代码。

baoyu-imagine 把这些都统一了。一行命令，改一个 --provider 参数，其他全都不用动。prompt 格式一样，输出路径一样，质量控制一样。你甚至可以用配置文件把默认供应商和模型锁死，以后每次生成都不用指定。

这个看起来好像不是什么大事。但你真的用过 3 个以上的模型供应商之后就会知道，统一调用方式这件事有多么省心。

我目前用的是 Replicate 上的 nano-banana 模型，全名 google/nano-banana-pro。

为什么选它，三个原因。

稳，快，便宜。

稳是第一位。nano-banana 对 prompt 的遵从度特别高。你让它用暖橙色调，它就用暖橙色调。你让它做手绘风，它就老老实实做手绘风。不会自作主张给你加什么彩虹渐变或者 3D 效果。

这个太重要了。

我之前用过几个模型，最大痛点就是「不稳定」。同一套 prompt，第一次出来好看，第二次出来就变了味。你花半小时调出一个满意的版本，但你不知道怎么复现它。下一次生成又是一场赌博。

nano-banana 不这样。同样的 prompt，出图风格高度一致。你可以建立一套自己的视觉语言，持续复用。

快是第二位。一般一张信息图 10 到 15 秒就出来了。我之前用某些模型有时候要等 30 秒甚至一分钟，画多了真的很烦。

便宜是第三位。Replicate 按次计费，一张图几分钱人民币。我画了几十张图，总共花了不到一顿外卖的钱。

而且 nano-banana 对中文的支持也挺好。信息图上的中文文字基本不会出现乱码或者奇怪的方块字。这个对中文内容创作者来说太关键了，很多模型画中文一塌糊涂。

说完底层引擎，再说说真正让我觉得牛逼的上层工具。

baoyu-infographic。

这个是我用得最多的 Skill，我文章里那些信息图基本都是它画的。

它做的事情用一句话概括就是，把任何内容变成一张好看的信息图。

21 种布局，20 种风格，自由组合。

你要做环形流程图展示一个循环过程，选 circular-flow。你要做金字塔展示难度递进，选 hierarchical-layers。你要做中心辐射展示角色分工，选 hub-spoke。你要做管线流程展示上下游衔接，选 linear-progression。还有 Bento 网格、冰山图、漏斗图、地铁线路图、宜家说明书风、乐高积木风，什么都有。

21 乘 20，340 种组合。

21 种布局 × 20 种风格 = 340 种组合

我跟你说，你随便选一种，出来的图都不会太难看。不是可能不难看，是不会。

为什么，因为每种布局和风格背后都有一套经过调优的 prompt 模板。

它的工作流程是这样的。你给它内容，它先做结构化分析，把你的文字拆成适合视觉表达的格式。然后根据你选的布局和风格，套用对应的 prompt 模板，生成最终的生成指令。最后调用图像生成模型出图。

整个过程中，你不需要描述图长什么样。你只需要告诉它你的内容是什么。

你想想看，我们平时用 AI 画图最大的问题是什么。不是 AI 画不出来，是你不知道怎么描述你想要的图。你脑子里有一张图的感觉，但你说不清楚。你写了半天 prompt，AI 理解的是另一个意思。

baoyu-infographic 绕过了这个问题。它不是让你描述图，而是让你描述内容。内容到图的转化，它帮你做了。

而且它有个很贴心的设计，就是 prompt 文件。每次生成的时候，它会把完整的 prompt 保存下来。你觉得哪次出图效果特别好，直接拿那个 prompt 文件复用就行。改改内容，风格和布局不用动。

我现在已经攒了一套自己的 prompt 模板库了。暖橙色调手绘风、金字塔布局、环形流程图、中心辐射图，每种布局配一种风格，调好了一次，以后直接套用。

这也是为什么你们看到我文章里的图风格那么统一。不是我每次都从零开始调，是我有模板了。同一套色板，同一套布局风格，改内容不改框架。出来的图自然就统一了。

还有一个小细节我觉得很加分。baoyu-infographic 支持水印。你在配置文件里设一下水印内容和位置，以后每张图都会自动加上。我自己的设置是右下角 @leslie，透明度 0.7。不起眼但你知道那是我的图。

说到这里可能有人会问，那 baoyu-cover-image 呢，你刚才也提到了。

baoyu-cover-image 是专门做文章封面图的。它有一个五维度的风格系统，类型、色板、渲染方式、文字层级、情绪强度，排列组合几百种。你把文章丢给它，它自动分析内容推荐风格。加个 --quick 参数全自动选择，你什么都不用管。

我个人用得不如 infographic 多，因为我的封面图风格比较固定。但如果你需要各种不同风格的封面图，这个工具能帮你省很多时间。

怎么上手呢。

三步。

第一步，去 Replicate 注册一个账号，拿到 API Token。Replicate 注册是免费的，绑一张信用卡就行，按次计费，没有最低消费。

第二步，安装 baoyu-skills。一行命令，在 Claude Code 里装就行。

第三步，配置 EXTEND.md。把默认供应商设成 Replicate，默认模型设成 nano-banana-pro，再配一下你喜欢的水印。以后每次生成都不用再指定这些参数。

三步上手 baoyu-skills

三步搞定。之后你在 Claude Code 里直接说，帮我画一张什么什么信息图，它就用你配好的模型和风格来生成。

你也可以把我这篇文章里提到的那些风格搭配拿去试。暖橙色调手绘风配圆形流程图，金字塔布局配难度递进，中心辐射配角色分工。这些搭配我都验证过了，出图效果稳定。

说到这里，我想多说几句。

其实这些信息图不只用来配文章。我最近发现它更大的价值是在工作汇报和方案设计里。

你想想看，你平时写方案做汇报，最头疼的是什么。不是内容写不出来，内容你脑子里有。最头疼的是怎么把一个复杂的架构、一个多步骤的流程、一个多层级的优先级，用一张图让领导或者客户一眼看懂。

你自己画吧，PowerPoint 里那点形状工具，拉个流程图都费劲，更别说画好看了。找设计师吧，沟通成本高，等你描述清楚你想要什么，设计师已经改了三版了，每版都不对。

但用 baoyu-infographic，你把方案的结构化内容丢给它，选一个匹配的布局，10 秒出图。

你要汇报一个技术架构迁移方案，用 structural-breakdown 布局，把新旧架构的组件拆解得清清楚楚。你要展示一个项目推进计划，用 winding-roadmap，里程碑和时间线一目了然。你要对比两个方案的优劣，用 binary-comparison，并排展示，差别一眼就看得出来。

我跟你说，我最近几次方案评审，配图全是这么画的。别人还在用黑白文字+箭头凑合画流程图的时候，你甩出一张配色统一、层次清晰、手绘风格的信息图，那个视觉冲击力完全不在一个量级。

而且因为出图快，你可以在会议前一天晚上，把方案里的每个关键环节都配一张图。不用花几个小时，十几分钟搞定。第二天开会的时候，PPT 里每一页都有一张专业的可视化配图。

说真的，这个效率提升不是线性的，是数量级的。

以前做一份汇报级别的方案，光配图就要花半天到一天。现在十几分钟。省下来的时间你可以用来打磨内容本身，想清楚逻辑，把论据夯实。而不是在 Figma 里对齐框框。

baoyu-skills 里还有一个叫 baoyu-slide-deck 的 Skill，专门做演示文稿的。不过那个我还在摸索，等我跑通了再单独写一篇，聊聊怎么用 AI 从零产出一份汇报级别的 PPT。

感兴趣的话可以先关注着。

说到最后，我想聊一个感受。

我之前对 AI 画图这件事一直有个执念，就是觉得 AI 画图不稳定。同样的 prompt 出来不一样的东西，你没法建立一个持续的视觉风格。这对做内容的人来说是致命的，因为风格不统一，读者对你的品牌感知就是模糊的。

baoyu-skills 加 nano-banana 解决了这个问题。它让 AI 画图从一门玄学变成了一门工程。标准的输入格式，稳定的模型输出，可复现的配置。今天画出来好看的图，明天同样的 prompt 还能画出一样好看的图。

这个稳定性才是核心。

AI 时代做内容，工具不是瓶颈，工具会越来越多越来越好。审美也不是纯粹的瓶颈，因为像 baoyu-infographic 这样的工具已经帮你把审美的下限兜住了。20 种风格你随便选一种都不会太丑。

真正的瓶颈是判断力。

是你能不能在 340 种布局和风格的组合里，选出最适合你内容的那一种。是你能不能在一堆出图方案里，挑出那个最好看的配色。是你能不能建立一套自己的视觉语言，然后持续用它。

工具决定下限，品味决定上限。

baoyu-skills 是我目前找到的，把 AI 画图下限拉得最高的工具。开源，免费，支持多个模型，配置灵活。如果你也在为 AI 画图不稳定而头疼，试试看。
风格展示：

![](Pasted image 20260408204644.png)
![](Pasted image 20260408204702.png)

![](Pasted image 20260408204720.png)
Jim Liu 在 GitHub 上维护这个项目，持续在更新。如果你觉得好用，去给他一个 Star。

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧，如果想第一时间收到推送，也可以给我个星标⭐～
谢谢你看我的文章，我们，下次再见。