今天我手绘了一张草图:

最近 OpenAI 动作频频,生图模型已经接近“以假乱真”,我也想测试一下各家模型在“草图到成图”上的真实表现。
提示词如下:
帮我生成图片:图片风格为「动漫」,比例「1:1」
我拿 3 个主流模型做了对比:

大家可以先直观对比一下谁更强,下面是我的观察:
- Gemini:配色不错;领结样式与草图不符;手部、袖口与草图不符;舌头细节也有偏差。
- ChatGPT:配色最贴近原草图,整体契合度最高。
- 豆包:配色单一,主要是黄色和白色;牙齿细节与草图不符。
综合来看,ChatGPT 表现最好;豆包的问题主要在配色单一;Gemini 在结构保持上还有明显差距。
我还顺手查了下「图像编辑」榜单,结论与上面的实测结果基本一致。
