关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4199人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

商汤绝影发布可悠,把“龙虾”揣兜里随身携带?

南方都市报 浏览 1557

演讲遭抗议 以总理下令:"黑"进加沙手机 用扩音器直播发言

红星新闻 浏览 4789

圣米伦夺苏格兰联赛杯,进球队员赛后采访不慎爆粗后道歉

懂球帝 浏览 3489

2026年第一票房惨案诞生了

靠谱电影君 浏览 3224

海港0-2町田,傅欢乌龙,海港全场1射正,相马勇纪破门

懂球帝 浏览 3735

全红婵家建了新楼,哥哥直播卖菠萝被骂吃软饭

陈意小可爱 浏览 2872

Amazon和UCLA团队突破传统界限,开启无监督智能训练新纪元

科技行者 浏览 3139

马克龙:法国将新建一艘航母

澎湃新闻 浏览 3341

00后吴宜泽夺冠 业内:球员赴英国训练 每年花几十万

每日经济新闻 浏览 94480

大量iPhone 17系列新机无法激活 苹果客服回应

界面新闻 浏览 9041

中央巡视后卸任七年的姜德果被查 曾任唐山市委书记

中国新闻周刊 浏览 24625

上海AI实验室重新定义视频理解:让AI像侦探一样思考长视频

科技行者 浏览 4177

燃油+电动全都配 全新宝马4系最新消息曝光

乐选爱车 浏览 2937

卡塔尔首相与法国总统举行会谈 重点讨论加沙局势

上观新闻 浏览 4195

采用900V高压架构 蔚来ES9将于5月27日上市

车质网 浏览 813

西北大学教授刘建妮 被撤销“中国青年女科学家奖”

每日经济新闻 浏览 26605

怒摔球拍被拍下!高芙不满澳网直播:我们一点隐私都没有了

全景体育V 浏览 3036

记者:NBA正考虑取消伦纳德与快船的合同使其成为自由球员

懂球帝 浏览 2476

说它抄袭,打脸了吧

独立鱼 浏览 2538

离婚5年,她真的面相大变

江湖人称艾掌门 浏览 3375

以军先斩后奏空袭加沙多地 特朗普:以色列没做错

上观新闻 浏览 3180
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1