关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2523人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2025年净利至少增超78%!减肥药价格战凶猛,甘李药业:相关产品未上市,价格策略待定

时代周报 浏览 1608

法尔克:曼城有意科隆前锋赛义德-马拉,巴黎和国米也在关注

懂球帝 浏览 2649

皮耶罗评尤文浪费机会太多:皇马就不会浪费这么多机会

懂球帝 浏览 2687

蓝军太难黑猫太黑!切尔西一周内两张脸

体坛周报 浏览 2684

内娱清流!这4位女星从不拍“吻戏”

喜欢历史的阿繁 浏览 3267

《向往》口碑翻车!官方以嘉宾清闲为豪?

萌神木木 浏览 2856

冬季穿搭越简单越好看!衣服不多买、搭配彩色围巾,真的耐看

静儿时尚达人 浏览 1562

福建200亿国企董事长卸任,去年薪酬545万元

华美财经 浏览 2808

AI闭环交易再引争议:OpenAI入股Thrive Holdings,或瞄准更多私募

华尔街见闻官方 浏览 2236

RMC:姆巴佩找到外部专家以检查膝伤,他有望3月中旬回归

懂球帝 浏览 884

乔-科尔:波特根本就没得到足够的支持,西汉姆对他有所怀疑

懂球帝 浏览 3294

一下老了30岁?!她真让人认不出

Yuki女人故事 浏览 2718

发投入同比“八连增”,贝壳Q3财报研发投入增长13.2%

市值Observation 浏览 2472

梅根·凯利怒怼谷爱凌争议,揭露政客背后的偏见

动物奇奇怪怪 浏览 899

51岁的何炅自曝非常痛苦,如今谁都救不了他?

小梊搞笑解说 浏览 2810

特朗普称赞高市:如果安倍知道你当首相 肯定非常高兴

第一财经资讯 浏览 12818

赵本山还是没叫醒闫学晶,儿子被举报涉高考移民,本人辽晚遭抵制

萌神木木 浏览 1488

没补贴、收购置税,新能源车好日子到头了?现实会打服“恨电派”

小李车评李建红 浏览 3435

曝卡塞米罗续约曼联条款,一条件可保35万周薪!卖齐尔克泽恐已定

罗米的曼联博客 浏览 1674

日本经济长期疲软,日元购买力跌至53年来最低

环球网资讯 浏览 1041

卷首语 | 拒绝和解的勇气

时尚COSMO 浏览 2588
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1