关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2806人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

海港亚冠8战不胜!3轮仅1分,对日本球队9战不胜,延续5魔咒

奥拜尔 浏览 2734

黄景瑜将上太空,官宣成为009号太空游客,乘坐中国自制飞船升空

扒虾侃娱 浏览 1595

以色列部长回应"虐待环保少女":很自豪

CCTV国际时讯 浏览 2048

亚奇雷AGI将参展CES 2026:展出10000MT/s内存条与Gen5 SSD

IT之家 浏览 2120

特朗普突然改口:暂时不想见普京 浪费时间

北京日报客户端-长安街知事 浏览 2052

欧洲对美方"28点计划"逐一删改 令俄罗斯舆论颇为不满

环球网资讯 浏览 15232

鲁尼:萨拉赫应该回撤参与协防;范戴克的进球应该算作有效

懂球帝 浏览 2457

德容:弗里克很有个性,他思路非常清晰、平易近人

懂球帝 浏览 2785

万亿美元豪赌,Open AI创始人:泡沫化的故事很诱人

21世纪经济报道 浏览 2762

美CPI降温别高兴太早:经济学家怀疑政府关门导致数据失真,有人指明显出错

华尔街见闻官方 浏览 1911

最高法明确:醉驾启用辅助驾驶仍需担刑责

网易汽车 浏览 764

中印边境士兵交换糖果 中使馆:展现双方善意

环球网资讯 浏览 2763

E句话| 在西藏办烟花秀的品牌已道歉?

仙女事件簿 浏览 3152

刚放行中欧班列波兰又来找事 中方接下挑战书强硬反击

文雅笔墨 浏览 38637

一年一度的秋装趋势,来了!

黎贝卡的异想世界 浏览 4530

哈马斯同意“20点计划”提议:释放所有以色列人质

央视新闻客户端 浏览 2953

独家 | 好想来、良品铺子转型综合超市,筹划做“万市大集”

商业观察家 浏览 2929

杨振宁和她的53年婚姻,是这样的

Yuki女人故事 浏览 2708

为了万亿美元薪酬!马斯克取消FSD买断制,但不适合中国国情?

电车通 浏览 1657

《一路繁花2》出圈理由

娱乐圈笔娱君 浏览 2725

霸榜热搜,尺度惊人,他绝对值得你追

Yuki女人故事 浏览 1419
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1