首页

豆包提出全新稀疏架构 降低推理成本

2025年02月13日 17:14:23 新京报韦博雅

2月12日,据“豆包大模型团队”微信公众号,近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem,该架构有效解决了 MoE 推理时高额的访存问题,推理速度较 MoE 架构提升 2-6 倍,推理成本最高可降低 83%。该研究还揭示了新架构的 Scaling Law,证明其不仅具备优异的 Scaling 特性,更在性能上超越了 MoE。实验结果表明,训练规模达 2000 万 value 的 UltraMem 模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模 value 或 expert 开辟了新路径。


责任编辑:张阿嫱

架构推理moe

热点新闻

新闻推荐

关于我们

报社简介 联系我们

人员查询

城市服务

广告服务 诚招英才

版权合作 商务合作

报社业务

新闻投稿 读者来信

报社公告 品牌监督

Copyright © 2016-2026 by www.zgcsb.com.

《中国城市报》社有限公司 中国城市网 版权所有

京ICP备15005404号-4 京公网安备 11010502043907号