图灵派对 图灵派对
-- -- --
← 返回首页

同一张草图喂给三大模型,结果差距有点大:ChatGPT、Gemini、豆包实测

今天我手绘了一张草图:

1777290562329

最近 OpenAI 动作频频,生图模型已经接近“以假乱真”,我也想测试一下各家模型在“草图到成图”上的真实表现。

提示词如下:

帮我生成图片:图片风格为「动漫」,比例「1:1」

我拿 3 个主流模型做了对比:

1777290730416

大家可以先直观对比一下谁更强,下面是我的观察:

  1. Gemini:配色不错;领结样式与草图不符;手部、袖口与草图不符;舌头细节也有偏差。
  2. ChatGPT:配色最贴近原草图,整体契合度最高。
  3. 豆包:配色单一,主要是黄色和白色;牙齿细节与草图不符。

综合来看,ChatGPT 表现最好;豆包的问题主要在配色单一;Gemini 在结构保持上还有明显差距。

我还顺手查了下「图像编辑」榜单,结论与上面的实测结果基本一致。

1777291265796