返回列表 发布新帖
查看: 3|回复: 0

首个全流程国产化类脑脉冲大模型推出

发表于 前天 22:13 | 查看全部 |阅读模式

马上注册!

您需要 登录 才可以下载或查看,没有账号?注册

×


  科技日报北京9月8日电 (记者陆成宽)记者8日从中国科学院自动化研究所获悉,来自该所等单位的科研人员首次在国产GPU(图形处理器)算力平台上完成原生类脑脉冲大模型“瞬悉”1.0的全流程训练和推理,并正式开源了70亿参数版本大模型,同时开放了760亿参数版本大模型的测试网址。这是全球首个类脑脉冲大模型,实现了全流程国产化,标志着我国在类脑计算与大模型融合创新方面取得重要突破。

  当前,基于Transformer架构的大模型主要依赖简单“点神经元”与大规模算力提升智能,但其训练和推理成本随文本长度急剧增加,严重制约超长文本处理能力的提升。

  在这项研究中,研究团队借鉴大脑神经元的工作机制,提出了一种“基于内生复杂性”的具有线性复杂度的类脑脉冲大模型架构,成功打造出“瞬悉”1.0。“这个模型不仅在理论上揭示了新型计算路径,还构建了适配国产算力的训练推理框架,为构建更高效、更复杂且性能更强的新型大模型开辟了新路径。”中国科学院自动化研究所研究员李国齐说。

  相比传统模型,“瞬悉”1.0展现出四大核心优势:首先,在极低数据量下实现了高效训练,显著提升了长序列训练效率;其次,推理效率得到数量级提升,特别是在超长序列处理上展现出显著优势;再次,构建了国产自主可控的类脑大模型生态,支持将现有Transformer模型高效转换为类脑脉冲架构;最后,设计了多尺度稀疏机制,为低功耗类脑大模型运行提供了有力支撑。

  李国齐表示,这项成果不仅是我国在类脑脉冲大模型架构和国产算力全流程建设上的重大突破,更为法律、医疗、科学模拟等超长序列应用场景提供了更高效的建模工具,也将启迪下一代神经形态计算理论和芯片设计。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

关注公众号
QQ会员群

Copyright © 2021-2025 中企互动平台 版权所有 All Rights Reserved.

相关侵权、举报、投诉及建议等,请发 E-mail:bztdxxl@vip.sina.com

Powered by Discuz! X3.5|京ICP备10020731号-1|京公网安备 11010102001080号

关灯 在本版发帖
扫一扫添加管理员微信
返回顶部
快速回复 返回顶部 返回列表