当前位置：首页 > news >正文

阶跃星辰开源Step-Video-T2V模型：300亿参数打造高保真视频生成新标杆

news 2025/9/15 14:23:39

在AI视频生成技术快速发展的当下，国内AI公司阶跃星辰正式宣布开源其最新研发的Step-Video-T2V文生视频模型。这款参数规模高达300亿的大模型能够生成长达204帧的540P高清视频，在多个关键指标上展现出行业领先水平。目前该模型已在Gitee AI平台开放在线体验，为开发者和创作者提供了全新的视觉内容创作工具。

技术架构与核心优势

Step-Video-T2V采用创新的多模态架构设计，通过深度融合文本理解与视觉生成能力，实现了对复杂语义的精准解析和高质量视频输出。模型在运动连贯性方面表现尤为突出，能够准确捕捉并还原物理世界的运动规律。从官方展示的样片可以看到，无论是猛犸象在雪地中行走的毛发动态，还是火车车窗反射的细腻光影，都呈现出令人惊叹的真实感。

对比当前主流开源视频生成模型，Step-Video-T2V在多项基准测试中表现优异。其独创的时序建模算法有效解决了视频帧间闪烁和内容跳变问题，使生成内容在204帧的时长内保持高度一致性。特别值得一提的是，模型对中文语义的理解深度显著优于同类产品，能够准确捕捉提示词中的细节要求，如"20多岁的年轻人"这类具象描述。

开放生态与行业影响

为促进视频生成技术的标准化发展，阶跃星辰同步开源了Step-Video-T2V-Eval评测数据集。这套包含128条中文评测问题的基准测试涵盖11个内容类别，为行业提供了客观的模型评估工具。测试数据显示，该模型在指令遵循准确度、运动流畅度、物理规律符合度等核心指标上均大幅领先。

从实际应用场景来看，Step-Video-T2V展现出强大的商业化潜力。广告创意、影视特效、教育课件等领域的从业者，可以通过简单的文字描述快速获得高质量视频素材，大幅降低制作成本。模型对复杂概念的可视化能力，也为科普教育、产品演示等场景提供了创新解决方案。

在开源策略方面，阶跃星辰采取了"模型+工具链"的组合拳。除了基础模型外，还提供了完整的部署方案和优化工具，帮助开发者快速实现业务落地。这种开放态度将有效推动AI视频生成技术在更广泛场景的应用创新，有望重塑数字内容生产的工作流程。null

查看全文

http://www.wxhsa.cn/company.asp?id=4672