稀宇科技 MiniMax 开源 M3 模型权重,发布 MSA 技术论文,输出速度大幅提升!
稀宇科技 MiniMax 宣布开源 MiniMax M3 模型权重,发布 MSA 技术论文。M3 是原生多模态旗舰模型,优化后输出速度提升,还上线调用量看板。
稀宇科技 MiniMax 开源了 MiniMax M3 的模型权重,同步发布 MSA 技术论文。MSA 架构设计让 M3 长上下文计算成本大幅降低,论文披露了架构与工程实现细节。
M3 是 MiniMax 原生多模态旗舰模型,总参数 428B,激活参数 23B,是首个从 Step 0 开始做多模态混合训练的开源模型。训练时融合多模态数据,建立统一跨模态语义空间。
针对访问量激增问题,优化后的 M3 输出速度从约 30 TPS 提升至约 80 TPS,预计还将提速 30 - 40%,模型响应更流畅。
Token Plan 后台上线调用量看板,用户能直观查看用量及剩余额度,方便规划用量与成本。
编辑观点:MiniMax 的开源举措及模型优化,将推动多模态模型发展,为行业带来新机遇,后续提速也值得期待。
