(报告出品方/作者:国海证券,陈梦竹、尹芮)
底层模型技术框架梳理文生图:基于文本生成图像,StableDiffusion开源后迎来快速发展
文生图(Text-to-Image)是基于文本通过生成式AI生成图像的模式。近3年时间,文生图的技术已实现大幅的进步,海外的StableDiffusion、Midjourney已经能够提供较高质量的图像,国内的万兴科技的万兴爱画、百度的文心·一格也投入商用。文本生成图像的底层模型可以分为GAN、扩散模型、自回归模型三类。目前行业内的明星模型主要基于扩散模型。
文生视频:与文生图底层技术一致,自回归和扩散模型为主流
文生视频(Text-to-Video)是基于文本通过生成式AI生成视频的模式。随着文生图技术的精进与成熟,对于文生视频的技术的发展和
转载请注明:http://www.0431gb208.com/sjszlfa/6501.html