关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4035人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美媒询问缅甸大选后中国会否同缅甸深化关系 中方回应

外交部网站 浏览 7618

晒"妈妈牌"耐克书包男子已收到耐克礼物 当事人发声

极目新闻 浏览 25918

抢在苹果之前,三星推出三折叠手机

华尔街见闻官方 浏览 3686

贝克汉姆和长子彻底闹掰!布鲁克林:我们只能通过律师沟通

素素娱乐 浏览 2538

敛财4.49亿"老虎"王波被判死缓:长期对其子失管失教

政知新媒体 浏览 8985

小德:我的25个大满贯冠军和C罗的1000个进球也许能一起实现

懂球帝 浏览 3375

当“中国表格之王”开始发力多维表格

硅星人 浏览 4025

杨紫新剧邀林志玲演上海名媛,两人11年前亲吻

小邵说剧 浏览 3034

伊朗针对以色列心脏地带发起打击 对美国发出威胁

每日经济新闻 浏览 115232

日本渣男骗前女友拍全裸写真出轨

孤独的独角兽影视 浏览 3112

小S金钟奖获奖,坦言无助的时候想打电话给大s

韩小娱 浏览 4173

电动豪华的再进化 新款奔驰EQS新车图解

车质网 浏览 955

奚梦瑶何猷君解绑6年婚姻她终于支棱起来了?

如安青何 浏览 3980

哔哩哔哩CEO陈睿:优质创作者是社会的财富丨2025世界互联网大会

红星资本局 浏览 3833

冯德莱恩:欧盟将向乌提供紧急能源援助

每日经济新闻 浏览 3914

高市早苗当选首相 日本史上首名"第一先生"信息披露

环球网资讯 浏览 8128

战斗感十足 雷克萨斯LFR内饰谍照曝光

车质网 浏览 3794

北京105-74大胜广东 球员评价:3人满分,7人及格,2人低迷

篮球资讯达人 浏览 3355

以称打死两名越过加沙地带“黄线”人员

环球网资讯 浏览 3924

NBA战报:爵士123-110篮网,马尔卡宁30+8+1

懂球帝 浏览 3593

胡润百富榜发布!刘永行、朱义、刘永好、刘汉元、张勇排川商前五

红星资本局 浏览 4096
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1