当前位置: 首页 > news >正文

阿里发布电影级视频模型万相2.6,人人都能当电影主角

12月16日,阿里发布新一代万相2.6系列模型,该系列模型面向专业影视制作和图像创作场景进行了全面升级,全新的万相2.6是国内首个支持角色扮演功能的视频模型。该模型同时支持音画同步、多镜头生成及声音驱动等功能,是全球功能最全的视频生成模型。据记者了解,万相2.6已同步上线阿里云百炼、万相官网。

今年9月,阿里率先在国内发布音画同步的视频生成模型万相2.5,极大提升视频创作的效率,在权威大模型评测集LMArena上,万相图生视频位居国内第一。此次发布的万相2.6进一步提升了画质、音效、指令遵循等能力,单次视频时长实现国内最高的15s,万相2.6还新增了角色扮演和分镜控制功能,不仅能一键完成单人、多人、人与物合拍的视频,还能自动实现多镜头切换等专业任务,满足专业影视级场景需求。

万相2.6是国内首个支持角色扮演功能的模型,能参考输入视频中的角色外观和音色、实现角色扮演,按照提示词生成单人、多人、人与物合拍的视频

据介绍,通义万相在模型结构上集成了多项创新技术,可对输入参考视频进行多模态联合建模与学习,参考具有时序信息的主体情绪、姿态和多角度全面视觉特征,同时提取音色、语速等声学特征,在生成阶段作为参考条件控制,实现从画面到声音的全感官全维度一致性保持与迁移,目前万相可支持单人和多人的表演。

万相2.6可将用户简单的提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,并且保持多镜头间的主体、场景等关键信息的一致性

在分镜控制上,通义万相能通过高层语义理解,将原始输入构建为具备完整故事线与叙事张力的专业级多镜头段落,在多镜头丝滑切换的过程中保持核心主体、场景布局和环境氛围统一建模,确保全片在内容、节奏和氛围上的高一致性。

万相2.6的角色扮演功能让普通用户也能在影视级画面里表现精湛的演技。例如,用户上传一段个人视频,并输入一段科幻悬疑风格的提示词,万相2.6能快速完成分镜设计、角色演绎、画面配音等环节工作,生成一段镜头叙事完整、电影级运镜的短片,仅需几分钟就能帮用户圆电影主角梦。

面向广告设计、短剧制作等专业场景,通过输入连续提示词,万相还能生成一段完整叙事的短片,让人人都能当导演。例如,输入一段广告创意的提示词,万相2.6能生成一段包含人物角色和商品的广告视频,并且在多镜头切换的情况下保持主体、场景等关键信息的一致性。

即日起,所有人可直接在万相官网体验万相2.6,企业用户还能通过阿里云百炼调用模型API,据悉,千问APP也将于近期上线该模型,并提供更丰富的玩法。

目前,万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力,已广泛应用于AI漫剧、广告设计和短视频创作等领域。

http://www.cnnetsun.cn/news/90727.html

相关文章:

  • 倒计时 5 天!GOBI 2025 全球开源商业创新大会全日程发布,附参会指南!
  • Docker Offload优先级机制详解:90%工程师忽略的关键参数
  • 【Dify高性能视频处理指南】:精准帧率设置提升提取速度300%
  • 为什么你的Tesseract在Dify中处理慢?这5个批量优化关键点必须掌握
  • CDM(充电器件模型)导致芯片失效原因
  • IL-2:调控免疫稳态的“双面因子”
  • 【环境风险评估效能革命】:基于R语言的动态监测系统搭建实录
  • 揭秘Dify中PDF加密与权限验证机制:企业级数据防护必备技能
  • 酒精饮料市场:挑战中寻找机遇 eBest
  • 为什么顶尖数据团队都在用R Shiny做多模态报告?真相令人震惊
  • ChatTTS与GPT-SoVITS语音合成对比分析
  • MySQL Shell 使用方法
  • Docker多阶段构建与精简基础镜像(边缘Agent瘦身必看)
  • PPIO上线阿里Wan 2.6:制作电影级AI视频,对标Sora2
  • 【混合检索的Dify结果融合】:揭秘高效信息聚合背后的黑科技
  • 从零搭建高效音频流水线:Dify 1.7.0切片配置完整教程
  • 大数据ETL中的数据质量提升工具与方法
  • 筑巢引凤 - Ascend C开发环境极速部署与验证全攻略
  • 模型训练中的精度保障:Ascend C算子数值稳定性分析
  • 【金融风险对冲实战指南】:掌握R语言在投资组合风险管理中的7大核心技巧
  • 空间转录组批次校正实战指南(R语言完整代码+案例解析)
  • 计算机毕业设计附项目源码帮做/Java管理系统/springboot网站/深度学习/神经网络算法/yolo图像识别/从选题到部署,一篇搞定!
  • 紧急应对模型版本混乱:R与Python部署同步的实时解决方案
  • 气象模型预测失败的真相,R语言误差分析告诉你答案
  • 【Dify 1.7.0语音识别革命】:为什么专业团队都在抢用新转写引擎?
  • 强化学习DeepQLearning求最优策略的代码实现
  • 加密PDF处理新进展(Dify进度跟踪深度剖析)
  • 从零构建智能Agent文档系统:Dify配置与最佳实践全揭秘
  • 高负载环境下Docker Offload调度失控?优先级设置不当是元凶!
  • 还在手动校验语音数据?Dify 1.7.0自动检测功能已上线(限时体验)