关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者3610人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

香港科技大学突破AI画图"作弊"难题:让机器学会诚实创作

科技行者 浏览 2630

俄总统新闻秘书:普京愿与特朗普在莫斯科会晤

环球网资讯 浏览 39006

巴萨向拉什福德提出买断条件!帮助压价曼联并降薪,承诺加强防守

罗米的曼联博客 浏览 2892

朱媛媛离世7个月后遗作定档,辛柏青状态令人担忧

林雁飞 浏览 2710

冬天还是“羽绒服”最保暖!看看这些穿搭,简单舒适又不老气

静儿时尚达人 浏览 2435

贾国龙宣战失败,西贝亏损超6亿元,到底谁的责任?

数字财经智库 浏览 2610

日本知名女星结婚:酷似高圆圆 曾和林志玲老公交往

新民周刊 浏览 7091

孔蒂:球迷应忽略球队的谣言;欧洲裁判比意甲好?我不聊这个

懂球帝 浏览 3450

落实个人消费贷款最新财政贴息政策,六大行集体公告

界面新闻 浏览 2468

“烟管裤”今年冬天爆火,怎么搭都时髦!

LinkFashion 浏览 2943

"台独"分子沈伯洋十分担忧求助台陆委会:不敢离开台湾

看看新闻Knews 浏览 14317

大众汽车营收微降却亏麻了,利润腰斩暴跌53.5%!

财视传播 浏览 1827

美国进逼委内瑞拉 分析人士:已突破国际法的危险界限

上观新闻 浏览 3447

沈建光:从国庆长假看消费前景

首席经济学家论坛 浏览 3555

U23亚洲杯8强出炉 1/4决赛对阵:国足第2出线战上届亚军 避开日韩

我爱英超 浏览 2650

送别聂卫平队伍长度超200米 韩国围棋名宿前来吊唁

极目新闻 浏览 6739

12月电车成绩单:小米首破5万大关,蔚来、鸿蒙智行交付再创新高,零跑同增超四成

华尔街见闻官方 浏览 2800

泽连斯基:美提议举行美俄乌国家安全顾问级别会议

国际在线 浏览 2932

活塞112-105复仇绿军迎4连胜,坎宁安32+10,布朗空砍34分

懂球帝 浏览 2859

美国发射洲际弹道导弹 俄方回应

央视新闻客户端 浏览 3405

23万粉丝博主为百色抗洪捐1分钱惹争议 本人回应

极目新闻 浏览 3812
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1