国产AI作画神器火了,更懂中文,竟然还能做周边( 二 )
懂中文 , 也懂“懒人”用起来 , 并不复杂 。
我们从操作界面、提示词要求和性能要求几方面 , 对DiscoDiffusion和文心·一格等AI画画产品进行了简单对比 。
操作界面上 , DiscoDiffusion开放的接口不能说很复杂 , 但确实有点门槛 。
它直接在谷歌Colab上运行 , 需要申请账号后使用(图片生成后保存在云盘) , 图像分辨率、尺寸需要手动输入 , 此外还有一些模型上的设置 。
好处是可更改的参数更多 , 对于高端玩家来说可操作性更强 , 只是比较适合专门研究AI算法的人群:

文章图片
相比之下 , 文心·一格的操作只需三个步骤:输入文字 , 鼠标选择风格&尺寸 , 点击生成 。

文章图片
前文已经提到 , 文心·一格同样也具备DiscoDiffusion的“高级自定义”功能 , 随后便会开放 , 对于想拥有更多“参数自由”的小伙伴们来说 , 同样是个不错的选择 。
至于提示词 , DiscoDiffusion的设置还要更麻烦一些 。
除了描述画面的内容以外 , 包括画作类别和参考的艺术家风格也都得用提示词来设置 , 通常大伙儿会在其他文档中编辑好 , 再直接粘过来 。

文章图片
关键一旦提示词设置得不好 , 生成的效果就不尽如人意 , 需要反复尝试、不断细化 , AI最终才能生成合适的画面效果 。
相比之下文心·一格倒是没有格式要求 , 输入150字的句子或词组都可以:

文章图片
当然 , 输入画家名字如莫奈 , 也能输出对应风格:

文章图片
最后是性能要求上 , DiscoDiffusion是有GPU使用限制的 , 每天只能免费跑3小时 。 抱抱脸(HuggingFace)上部分AI文生图算法的Demo虽然操作简单些 , 但一旦网速不行 , 就容易加载不出来:

文章图片
△测试miniDALL·E时加载就失败过
相比之下 , 文心·一格除了使用高峰期以外 , 基本上都是2分钟就能生成 , 对使用设备也没有要求 。
总体来看 , 同样是文字生成图片AI , 实际相比文心·一格的“真·一句话生成图片” , DALL·E和DiscoDiffusion的生成过程都不太轻松 。
所以在这背后 , 文心·一格生成图像 , 究竟是基于一个怎样的逻辑?
我们以输入“云深不知处”为例 , 希望能输出一幅中国风的画作 。 当接收到这几个字词(query)后 , AI的脑细胞就开始“运作”了起来 , 从语法、词法、语义等角度对文本进行分析 。
如果将生成过程可视化 , 这个阶段还看不出什么效果 , 处于AI理解文本的阶段:

文章图片
很快 , AI“拆解”文本后 , 理解要怎么画这幅画了 , 于是在特定尺寸(用户可选)的画纸上 , 构思出整体的轮廓 , 兼具云的元素和中国画的风格:

文章图片
随后 , 基于扩散生成模型的原理 , 迭代地完善并修正画面细节 , 不断提高清晰度、反复检查图文描述一致性 , 用更精确的配色替代噪声:

- 小米|仅巴掌大小的桌面神器!小米迷你主机图赏
- Galaxy|国产千元机就有的VC均热板 三星S23要减配:为节省成本
- 龙芯|单核追上11代酷睿、Zen3!国产CPU龙芯新一代3A6000完成流片 为销售准备
- 苹果悄悄上架看片神器!全网影视免费看,安卓也能用
- 芯片|95%依赖进口?我国又一领域被卡了“脖子”?国产EDA已开始发力
- 电池|美国芯片再受重击,中国招标服务器芯片全由国产芯片取得
- 华为|华为三振出局?旗舰机市场迎来大洗牌,国产手机危机并存
- 苹果|Q4预测:苹果第一,三星第二,国产不容乐观
- 拓尔思|电子行业报告:芯片良率的重要保障,量检测设备国产替代潜力大
- Java|MIUI14把精简当作核心卖点,国产系统急需做减法
