关闭广告

东南大学团队首次揭示:视觉欺骗如何让AI"看走眼"

科技行者3033人阅读


这项由东南大学计算机科学与工程学院的陈慧怡、彭佳伟、杨旭等研究人员,联合同济大学国豪学院陈凯杰,以及伊利诺伊大学芝加哥分校的闵德海、孙常昌、严岩、程璐等学者共同完成的突破性研究,于2024年11月发表在arXiv预印本平台(编号:arXiv:2511.14159v1)。研究团队首次创建了专门用于评估大型视觉语言模型(类似于能看图说话的AI系统)在面对视觉误导时表现的综合性测试基准。

要理解这项研究的重要性,我们可以把AI模型比作一个正在学习观察世界的学生。过去,研究人员主要关注的是如何通过文字来"误导"这个学生,就像给他一个包含错误信息的题目。然而,在现实世界中,视觉本身就经常带有欺骗性——就像我们有时会把远处的灯光误认为星星,或者在昏暗的光线下把一把椅子看成人影。这种视觉上的"错觉"对AI来说同样是个挑战,但此前却很少有人系统性地研究过这个问题。

研究团队发现,现有的AI模型评估基准主要集中在两个方面:一是检测AI是否会产生"幻觉"(即编造不存在的内容),二是测试它们对恶意攻击的抵抗能力。然而,这些测试都忽略了一个关键问题:当视觉信息本身就容易产生误解时,AI会如何表现。这就像我们一直在测试学生能否正确回答

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

好美啊!58岁的她开挂了

黎贝卡的异想世界 浏览 3146

60+女性穿搭指南来了:4招告别“大妈感”,解锁冬日优雅气质

静儿时尚达人 浏览 3211

布云朝克特遭遇新赛季开门黑,周意送蛋横扫受到网友表扬!

网球之家 浏览 3351

女子把100克黄金当垃圾扔了急哭 查监控发现被人捡走

黄河新闻网吕梁频道 浏览 9523

奔驰A级车延至2028年,新车型同步推进

MOTO 浏览 4880

51亿买公司捆绑69亿负债,佛塑科技“蛇吞象”并购是赚是亏?

野马财经 浏览 3191

宏福苑4小时内火警连升三级:单户最大面积44.9平方米

红星新闻 浏览 30965

新势力比传统车企更乐观,2026年车市充斥着哪些挑战?

汽车头条APP 浏览 2955

美国举起关税大棒持续施压 伊朗要给“难忘教训”

环球网资讯 浏览 3193

29.2万辆!难怪比亚迪9月跟“疯了”一样,原来是给这几天憋大招

小李车评李建红 浏览 4323

50岁女性过冬穿搭:有大衣和羽绒服就够了,简约从容才是优雅

静儿时尚达人 浏览 2598

珠海收获2金!广东省无人机应用技术职业技能大赛结果揭晓

南方都市报 浏览 3733

NVIDIA显卡真变砖了!买了一张RTX 5080:收到却是真砖块

快科技 浏览 4891

周末两大利空!科技股被一致看空,国常会、证监会重磅

看财经show 浏览 3951

4战狂胜266分!韩旭14+8四川全运女篮大胜辽宁 头名进八强

醉卧浮生 浏览 3992

中科大团队发布Agent-R1:让AI智能体像人类一样学习和成长的框架

科技行者 浏览 3061

阿 Sa4 段公开情史终定局,兜兜转转还是选了他

南万说娱26 浏览 1062

Google与约翰霍普金斯大学联手打造AI"审计官"

科技行者 浏览 3432

这些才是真正接地气的穿搭!裤子基础、外套保暖,简单又自然

静儿时尚达人 浏览 3206

车主针对FSD功能起诉特斯拉案将开庭:要求退一赔三

新京报 浏览 9632

单依纯演唱会再唱“区区三万天”宣战

凛若秋霜 浏览 1172
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1