爆点资讯

这项由东南大学计算机科学与工程学院的陈慧怡、彭佳伟、杨旭等研究人员，联合同济大学国豪学院陈凯杰，以及伊利诺伊大学芝加哥分校的闵德海、孙常昌、严岩、程璐等学者共同完成的突破性研究，于2024年11月发表在arXiv预印本平台（编号：arXiv:2511.14159v1）。研究团队首次创建了专门用于评估大型视觉语言模型（类似于能看图说话的AI系统）在面对视觉误导时表现的综合性测试基准。

要理解这项研究的重要性，我们可以把AI模型比作一个正在学习观察世界的学生。过去，研究人员主要关注的是如何通过文字来"误导"这个学生，就像给他一个包含错误信息的题目。然而，在现实世界中，视觉本身就经常带有欺骗性——就像我们有时会把远处的灯光误认为星星，或者在昏暗的光线下把一把椅子看成人影。这种视觉上的"错觉"对AI来说同样是个挑战，但此前却很少有人系统性地研究过这个问题。

研究团队发现，现有的AI模型评估基准主要集中在两个方面：一是检测AI是否会产生"幻觉"（即编造不存在的内容），二是测试它们对恶意攻击的抵抗能力。然而，这些测试都忽略了一个关键问题：当视觉信息本身就容易产生误解时，AI会如何表现。这就像我们一直在测试学生能否正确回答

东南大学团队首次揭示：视觉欺骗如何让AI＂看走眼＂

一年暴赚23...

B级车杀入八...

欧盟考虑强制...

德天空：法比...

为了考公上岸...

拉什福德渴望...

可能被“没收”一半股权，谷歌创始人逃离硅谷

与孙继海翻脸！董路：我的对手们甘愿被当枪使，自降身价智商全无

配华为舱内激光视觉技术华境S明年上半年上市

好美啊！58岁的她开挂了

60+女性穿搭指南来了：4招告别“大妈感”，解锁冬日优雅气质

布云朝克特遭遇新赛季开门黑，周意送蛋横扫受到网友表扬！

女子把100克黄金当垃圾扔了急哭查监控发现被人捡走

奔驰A级车延至2028年，新车型同步推进

51亿买公司捆绑69亿负债，佛塑科技“蛇吞象”并购是赚是亏？

宏福苑4小时内火警连升三级：单户最大面积44.9平方米

新势力比传统车企更乐观，2026年车市充斥着哪些挑战？

美国举起关税大棒持续施压伊朗要给“难忘教训”

29.2万辆！难怪比亚迪9月跟“疯了”一样，原来是给这几天憋大招

50岁女性过冬穿搭：有大衣和羽绒服就够了，简约从容才是优雅

珠海收获2金！广东省无人机应用技术职业技能大赛结果揭晓

NVIDIA显卡真变砖了！买了一张RTX 5080：收到却是真砖块

周末两大利空！科技股被一致看空，国常会、证监会重磅

4战狂胜266分！韩旭14+8四川全运女篮大胜辽宁头名进八强

中科大团队发布Agent-R1：让AI智能体像人类一样学习和成长的框架

阿 Sa4 段公开情史终定局，兜兜转转还是选了他

Google与约翰霍普金斯大学联手打造AI＂审计官＂

这些才是真正接地气的穿搭！裤子基础、外套保暖，简单又自然

车主针对FSD功能起诉特斯拉案将开庭：要求退一赔三

单依纯演唱会再唱“区区三万天”宣战