3 min read

理解AI文生图原理,三岁版

By dou.lu — Published 2023-05-08

理解AI文生图原理,三岁版

一个大盒子

有一个大盒子,小朋友把想要的图画写到纸上,投进盒子里,很快,盒子的另一头就吐出了一幅符合要求的画。

让盒子透明

现在,盒子变成透明的,小朋友可以观察里面的情况。原来,盒子里有一只狗,是狗完成了整个作画的过程。

狗并不会画画

这只狗比人还聪明吗,并不是,它是一只普通的狗,它不但不理解人类的画,甚至也看不懂纸条上的字。

再次观察盒子里发生的事

小朋友又写了纸条投进去,观察盒子里的状况,发现纸条被投进去后进入了一个小机器,这个机器接收了纸条后,把纸条上的文字翻译成各种骨头的图案,并让狗看见。

狗看见了骨头信息,便拿出了一张画,这张画由无数个密密麻麻的点组成。狗用爪子将很多点一次次的扣掉,最后就成了一幅小朋友需要的画。

狗是如何做到的

宠物的类人行为都经过训练。

有一个厉害的训犬师叔叔,将很多幅画贴上密密麻麻的点,并将对图片的描述翻译成由骨头图案组成的信息,狗不认识字,但认识骨头。

训犬师把骨头图案给狗看,把贴上点的画放在狗的脚下, 训练狗随意的把点扣掉,然后比较被狗抠过的画与原来的画有多大差异。

差异越小,奖励给狗的食物越多,差异的不同给狗的食物种类也不同。

就这样,用无数的画去训练这只狗,狗抠出的画与原画的差异越来越小,直到训犬师满意。

最终,狗只要看见骨头组成的信息,就能根据训练出的条件反射抠出对应的画。

术语

  • 狗是扩散模型
  • 翻译成骨头的机器是文本编码器
  • 骨头是潜在向量
  • 盒子里全是点的图片是随机噪声图

返回

TOP

©2012 - 2024