关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者3890人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泰柬两国密集表态说法大相径庭 泰国称不会停止行动

环球网资讯 浏览 9310

张馨予医院打吊水!自曝体重降到100斤体质变差

韩小娱 浏览 2926

最长纯电续航335km 智己LS8动力曝光

车质网 浏览 2798

春天衣服不用准备太多!这几大单品提前备好,百搭实用又不过时

静儿时尚达人 浏览 1251

以后请叫甄子丹为超级丹

港剧叔 浏览 4382

26款奇瑞冰淇淋/小蚂蚁上市 报废双补价3.4万元起

网易汽车 浏览 3135

牛弹琴:美印突然和好 一个与俄方有关的细节很不寻常

现代快报 浏览 6444

升级800V高压架构 新款奔驰EQS谍照曝光

车质网 浏览 3082

OPPO Find X9 手机核心规格公布:6.78 英寸 1.5K OLED 直屏

IT之家 浏览 4814

中年女人,冬天这么穿羽绒服、大衣,优雅都藏在这3个细节里

静儿时尚达人 浏览 3389

理想为什么不做轿车,有了解释……

道哥说车 浏览 826

特朗普称已考虑接替穆杰塔巴的人选 外交部表态

潇湘晨报 浏览 32873

研究领军人物告别一线!广发证券全球首席沈明高到龄卸任

券商中国 浏览 2863

刘涛为95花作配,国民女星的资源降级还是新机遇?

八卦三缺一 浏览 4868

还是这些穿搭适合初春季节!外套不多买、常穿裙子,优雅舒适

静儿时尚达人 浏览 1576

今年最时髦的穿法:长外套+长裤,太高级了!

LinkFashion 浏览 2637

收评:沪指13连阳再创十年新高 两市成交额突破2.8万亿

财联社 浏览 9547

泰军警告柬方:若敢用中国战略武器 将直接纵深打击

时时有聊 浏览 20137

75岁谭咏麟街头买金鱼!与老板老友式寒暄

丁睋解说 浏览 2836

联合国安理会通过决议,将对海地制裁延期一年

界面新闻 浏览 3430

海盗船发布《使命召唤:黑色行动 7》联名外设,含键盘等多款产品

IT之家 浏览 3790
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1