不缺卡的阿里系选择了讯飞星火的国产算力路线
作者:小编 日期:2025-03-27 点击数:
阿里所有部门已被告知,他们2025年的绩效将通过如何利用AI促进增长来评估。时隔一周,阿里系企业蚂蚁集团便发表了AI方面最新进展的论文。
实验表明,其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE 模型相当。MoE模型训练通常依赖英伟达H100 / H800等高性能GPU,成本高完美体育wm昂且芯片短缺,限制了其在资源受限环境中的应用。
这是继深度求索(DeepSeek)公开MoE训练方案后,业界首个完全基于国产算力的解决方案。
科大讯飞称,这一突破性的解决方案也将应用于讯飞星火深度推理模型X1的训练加速,预期训练时推理效率将提升200%。星火X1模型基于华为昇腾910B芯片,以70B参数量,实现了在数学能力上全面对标DeepSeek R1(参数量671B)和OpenAI o1,中文数学任务全面领先的效果。这种小参数强算法与大模型低成本的互补创新,形成对传统算力范式的降维打击。
美国对华AI芯片出口限制的持续加码,加速了技术迁徙进程,而讯飞与蚂蚁的实践超越了硬件替代逻辑。讯飞星火验证了国产算力训练MoE架构大模型的可行性,蚂蚁百灵快速跟进取得突破,不仅验证了算力自主的可能性,更揭示了全球AI竞赛规则的深层变革——从硬件性能追逐转向架构创新与场景适配的深度融合,从技术替代逻辑演变为创新范式的定义权之争。