概念掘金 | 国产版Sora横空出世!Vidu概念“新衣”一穿,再迎爆炒?

背后公司已融资数亿元

今年2月,OpenAI发布视频生成模型Sora,一个首次由 AI 生成了长达1分钟的多镜头长视频,输入寥寥数语便能生成效果炸裂视频,镜头感媲美专业电影,震惊全球。

随后,全球掀起了一场关于Sora的讨论风暴,犹如23年的ChatGPT热潮,很快有大量 AI 公司开始以做“中国版 Sora”为目标。

二级市场,sora概念也是在当时迎来一波爆炒,板块指数在一个月时间,最高涨幅近55%。

4月27日上午,在2024中关村论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型——Vidu,它所展示的效果立刻刷屏。这是国内首个全面对标 Sora 的视频模型。


全面对标Sora,

可生成16 秒、1080P 视频


根据官方描述,Vidu 模型融合 Diffusion 与 Transformer,开创性创建了 U-ViT,支持一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。

更令人惊喜的是,“Vidu”画面效果非常接近 Sora,在多镜头语言、时间和空间一致性、遵循物理规律等方面表现都十分出色,而且还能虚构出真实世界不存在的超现实主义画面,这是当前的视频生成模型难以实现的。

作为中国自研视频大模型,Vidu还能理解中国元素,能够在视频中生成例如熊猫、龙等特有的中国元素。

值得一提的是,短片中的画面是连续生成的,没有出现插帧的情况。这表明Vidu采用的是一种“一步生成”的方法,与Sora类似,它能够直接且连贯地将文本转换成视频。在底层的算法实现上,Vidu使用的是一个单一的模型,实现了从文本到视频的完全端到端生成,没有涉及到中间的插帧或其他多步骤的处理过程。

从这里就能看出来,未来,不管是在影视剧行业,创意广告行业,还是其他视频应用的领域,都将见到 AI 的影子,而Vidu作为能理解中国元素的国产大模型,必定会大放异彩。

背后技术,专业性描述来说,Vidu模型采用的是团队原创的Diffusion与Transformer融合的架构U-ViT。

该架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构

2023年3月,团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser,率先完成了U-ViT架构的大规模可扩展性验证


背后创业公司已融资数亿元


Vidu的背后,是一家来自清华的明星创业公司北京生数科技有限公司(简称“生数科技”)

生数科技成立于2023年3月,核心团队成员来自清华大学人工智能研究院,此外汇集了来自阿里、腾讯、字节等知名科技公司的顶尖人才,是全球范围内领先的深度生成式算法研究团队,拥有扩散概率模型底层创新研发能力。

据悉,生数科技的研发和原创能力非常强悍,已在全球顶级期刊arxiv上发布了超过15篇技术论文,这也是其能原创Vidu架构的重要原因之一。

天眼查数据显示,生数科技目前共完成3轮融资。

2023年6月19日,完成近亿元人民币天使轮融资,投资方包括蚂蚁集团、BV百度风投、卓源亚洲、卓源资本。

2023年8月20日,完成数千万人民币天使+轮融资,投资方为锦秋基金。

最新来看,2024年3月12日,生数科技刚刚完成新一轮数亿元融资。由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投,华兴资本担任独家财务顾问。

在三轮融资总计数亿元人民币的资本加持下,生数科技已成为目前国内多模态大模型中估值最高的初创公司之一。


高光后的Sora概念



2月来,Sora的爆火,自然也是延伸到二级市场,板块指数近一个月(24个交易日)涨幅超55%,个股更是杀出四只翻倍牛股,其中因赛集团位居榜首,最高涨幅超132%;中广天择涨超125%,华策影视涨超115%,安诺其涨超103%;涨幅超30%个股便有13只。

不过,很快指数也在一个月内,近乎会吐完这波涨幅,近一个月行情中,板块指数最高跌超28%,即使近日迎来一波反弹,但仍旧跌近18%》

业绩方面,根据已经披露的信息来看,2023年和2024年一季度均展现出了积极的增长态势,其中:

国投智能以2023年营收同比增长239.06%的卓越表现领先,安诺其一季度净利润同比大幅增长168.80%,开普云一季度营收同比增长104.98%展现了强劲的增长势头,金财互联以2023年净利润同比增长126.97%显示盈利能力显著增强,而国脉文化则以2023年营收和净利润分别增长102.60%和78.25%,在文生视频技术应用方面取得了显著的进展。


附概念股👇:

因赛集团 :公司InsightGPT具备文生文、视频智能剪辑、图生视频等功能,目前正在开发文生视频功能。

中广天择 :公司是全媒体优质视频内容提供商,根据万兴科技2024年1月31日官微, 万兴科技正式宣布与长沙广电国有控股上市公司中广天择达成战略合作 。

引力传媒:公司内部自研上线“核力 AI”的 1.0 版本、已具备“营销文案 生成”、“图片识别与生成”及“数字分身复刻及驱动”等功能应用。

华策影视:公司去年组建了AIGC应用研究院,自研的编剧助手、剧本评估、视频检索、AI剧照等功能已在内部应用或内测。通过对开源技术的学习吸收和消化,目前技术储备已可实现4秒时长的文生视频。

万兴科技:天幕大模型主要基于公司在数字创意领域二十年的产品开发与运营经验而打造的音视频多媒体大模型,具备多媒体、垂直解决方案、算力数据及应用本土化等特色。

国脉文化:公司在文生视频方面,已内部开发基于大模型的AIGC数字内容生成平台,平台利用多模态技术,使用自有的版权内容,生成文字、音频、图片、视频等影视素材,进行内容的创作生产,正在内部试用中。

新华网:新华智云的妙笔是AI文本生成,生花就是AI文生图,这两个今年上线的新产品都是AIGC内容生产工具。MAGIC有文生视频的功能,目前也在尝试提升视频生成效果,通过内部测试后将对外发布。


投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关股票

相关阅读

评论