关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者4038人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

1.78万亿宁德时代牵手“张雪”,造出电摩给谁骑?

野马财经 浏览 1593

瓜帅:B席是曼城成功的原因之一;我永远感激京多安和萨内

懂球帝 浏览 2877

王菲女儿李嫣疑恋爱!与帅气男生现身机场

二妹扯娱 浏览 3194

廷贝尔:联赛杯决赛也许能成为争冠动力;哈弗茨不是安静的人

懂球帝 浏览 2877

官方:福建浔兴SBS俱乐部签下法国中锋约安-马昆杜

懂球帝 浏览 2295

特朗普:俄方知道美国在俄海岸附近部署核潜艇

环球时报 浏览 4023

TOP TOY,成不了泡泡玛特?

斑马消费 浏览 4845

走过五年黑暗隧道后,江小白靠一瓶酒杀回来

财经无忌 浏览 3097

350亿vs25000亿!国产模型正打破美国AI编程垄断

无相商业趋势 浏览 2972

650km续航 广汽埃安AION RT焕新款9月22日上市

网易汽车 浏览 4913

科氪 | 荣耀MagicOS 10重构智能体验:AI成伙伴,全品牌互联破冰

36氪 浏览 4234

股价暴涨!又一超级风口来了?

财经锐眼 浏览 3113

问界M8官宣将增瑞红/湛蓝双新色 将于3月23日发布

网易汽车 浏览 2149

印度的“真正敌人” 莫迪挑明了

参考消息 浏览 26190

对不起陈星旭,这次被36岁代旭迷倒了

温柔娱公子 浏览 2561

媒体:郑丽文当选回复大陆贺电 表述难得一见意义重大

经济观察报 浏览 9303

“单亲妈妈”叶珂哄娃引热议 网友:黄晓明不管么

韩小娱 浏览 3586

TII发布Falcon-H1R:7B小模型推理能力超越32B大模型

科技行者 浏览 3128

中美达成共识让美豆农松口气 盼望中方订单快点来

环球网资讯 浏览 15054

首款星闪音频耳机!华为FreeBuds Pro 5悦彰耳机开售:1499元 母带级无损音质

快科技 浏览 3573

硬刚资本!这一次,我要为陈思诚起立鼓掌

皮皮电影 浏览 1081
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1