该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
据介绍,Vidu不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。Vidu是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。
自今年2月Sora发布推出后,团队基于对U-ViT架构的深入理解以及长期积累的工程与数据经验,在短短两个月进一步突破长视频表示与处理关键技术,研发推出Vidu视频大模型,显著提升视频的连贯性与动态性。
“Vidu的命名不仅谐音‘Vedio’,也蕴含‘We do’的寓意。”朱军表示,模型的突破是一个多维度、跨领域的综合性过程,需要技术与产业应用的深度融合,希望与产业链上下游企业、研究机构加强合作,共同推动视频大模型进展。(完)
朱军表示,Vidu的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构,完全由团队自主研发。
hahabet中新社北京4月27日电(记者 陈溯)在2024中关村论坛年会未来人工智能先锋论坛上,清华大学联合生数科技27日正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。
“值得一提的是,Vidu采用的是‘一步到位’的生成方式。”朱军表示,与Sora一样,文本到视频的转换是直接且连续的,在底层算法实现上是基于单一模型完全端到端生成,不涉及中间的插帧和其他多步骤的处理。
在当天的论坛上,清华大学教授、生数科技首席科学家朱军表示,与Sora一致,Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。除了在时长方面的突破外,Vidu在视频效果方面实现显著提升,主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。
535.82MB
查看905.94MB
查看71.5MB
查看635.20MB
查看920.68MB
查看509.25MB
查看753.70MB
查看113.53MB
查看449.99MB
查看964.78MB
查看235.91MB
查看695.75MB
查看780.54MB
查看272.52MB
查看186.61MB
查看291.63MB
查看534.74MB
查看166.57MB
查看438.15MB
查看544.63MB
查看948.44MB
查看936.60MB
查看438.87MB
查看492.44MB
查看580.91MB
查看205.12MB
查看634.76MB
查看134.33MB
查看355.99MB
查看886.35MB
查看486.96MB
查看743.87MB
查看830.84MB
查看945.71MB
查看551.17MB
查看966.37MB
查看140.61MB
查看931.50MB
查看357.78MB
查看744.65MB
查看472.10MB
查看703.64MB
查看214.61MB
查看351.38MB
查看516.53MB
查看122.24MB
查看126.80MB
查看715.82MB
查看734.30MB
查看191.41MB
查看490.12MB
查看735.51MB
查看136.37MB
查看591.66MB
查看543.79MB
查看539.70MB
查看217.38MB
查看833.26MB
查看191.11MB
查看617.48MB
查看536.36MB
查看816.69MB
查看994.40MB
查看600.40MB
查看850.96MB
查看275.25MB
查看489.83MB
查看458.74MB
查看593.56MB
查看436.38MB
查看218.22MB
查看177.91MB
查看531.34MB
查看684.56MB
查看364.28MB
查看162.95MB
查看122.77MB
查看448.78MB
查看754.77MB
查看386.97MB
查看594.79MB
查看655.24MB
查看261.40MB
查看236.64MB
查看751.37MB
查看439.85MB
查看939.51MB
查看315.40MB
查看420.78MB
查看387.86MB
查看258.95MB
查看662.53MB
查看648.79MB
查看123.88MB
查看302.87MB
查看923.16MB
查看523.96MB
查看969.45MB
查看362.58MB
查看856.58MB
查看925.62MB
查看252.73MB
查看218.72MB
查看883.39MB
查看
862北镇bx
2025-06-25 05:35:15 推荐
646188****4491
海信视像2023年营收、利润创新高 大屏化高端化拓宽成长空间➵
2025-06-25 09:26:54 不推荐
954152****3381
心玮医疗-B(6609.HK)年报解读:创新力和全球化,治疗类产品积蓄发展势能➹
2025-06-26 16:04:28 推荐
47速度与极限
从2023年财报,看雍禾医疗(2279.HK)的投资价值重估与前景展望➼
2025-06-24 10:16:11 推荐