关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2578人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

荣耀 MagicPad3 Pro 13.3 平板电脑核心参数公布:165Hz LCD 面板

IT之家 浏览 3331

女友BELLA+封面 | 高杨:步履稳定,心向未知

伊周潮流 浏览 2248

高市早苗求见特朗普要聊聊中国 美国没憋住开口"帮腔"

观察者网 浏览 6962

决战星期四:懂球帝6-3战胜超越足球俱乐部

懂球帝 浏览 2506

从一秒起身的机器人到降本80%的数据,鹿明机器人破解具身机器人智能化困境

雷峰网 浏览 1766

烂!58岁邹兆龙翻拍《怒火重案》,擦边卖肉制作粗糙,票房仅65万

靠谱电影君 浏览 1716

汪涵老婆自曝独自住院,素颜憔悴没人陪

大龄女一晓彤 浏览 2880

姚明将在今年开始正式领取NBA退休金,每月可领约1.3万人民币

懂球帝 浏览 2779

伊利契奇:有人出钱让我讲述经历;加斯佩里尼让我突破极限

懂球帝 浏览 2879

这个「疯批」星二代,撕碎了娱乐圈的滤镜

独立鱼 浏览 1547

限量30台 仰望U9X将于广州车展亮相

车质网 浏览 2467

零跑汽车引入一汽作为大股东,朱江明回应控制权不变

财闻 浏览 2004

美国为何长期觊觎委石油 委专家:对美具有互补性

海外网 浏览 1784

以色列攻入加沙城 多国寻求将其逐出联合国

看看新闻Knews 浏览 3551

巴特勒18+10勇士轻取鹈鹕3连胜,库里9+5穆迪单节7三分比肩传奇

湖人崛起 浏览 2414

梁小龙一生刚直!因一句“我是中国人”被逼写悔过书,他当场拒写

萌神木木 浏览 1735

岛内学者:若赖清德无法降低两岸紧张 特朗普会不开心

海峡导报社 浏览 8079

金靖靠卖笑成名却被宋丹丹嫌弃?

小椰的奶奶 浏览 2393

闫学晶风波终于落幕,6个男人惨遭牵连

青橘罐头 浏览 1526

短剧翻拍《新英雄本色》,刘萧旭主演?

最爱酷影视 浏览 2865

比亚迪秦家族新款7.98万起售!爆胎稳定系统上车,综合续航超2000km

车东西 浏览 1707
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1