关闭广告

ServiceNow团队破解检索系统评分难题:让AI搜索更懂你的真实需求

科技行者3511人阅读


这项由ServiceNow公司的Nima Sheikholeslami领导的研究团队完成的突破性工作,发表于2025年9月30日的arXiv预印本平台(论文编号:arXiv:2510.00137v1)。感兴趣的读者可以通过该编号查询完整论文。这项研究揭开了当前AI检索系统的一个重大缺陷,并提出了一种全新的训练方法,让搜索引擎能够给出更可靠、更一致的相关性评分。

在日常使用搜索引擎或问答系统时,你是否遇到过这样的困扰:明明搜索的是同一个问题,但系统给出的答案质量却忽高忽低,有时候不相关的内容反而排在前面?这个问题的根源其实隐藏在AI检索系统的核心训练机制中。目前主流的检索系统就像一个只会相对比较的评委,它能判断在同一个问题下哪个答案更好,但无法给出绝对的好坏评分。这就导致了一个尴尬的局面:对于不同问题的答案,系统无法进行跨问题的质量比较。

ServiceNow的研究团队发现,这个问题源于目前广泛使用的对比学习方法。这种方法就像让学生只做选择题,永远不做绝对评分题。学生虽然能在给定选项中选出最好的答案,但无法给每个答案一个独立的分数。更严重的是,研究团队通过严格的数学证明发现,现有的训练方法在提升检索质量这个核心

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

创三年新低 销量暴跌63% 超越特斯拉难不难?

正在说车 浏览 3292

这届双十一,充满了“AI味”与“本地生活味”

连线Insight 浏览 3512

郭富城三胎还是女儿!狗仔拍到其扁嘴照,方媛发声强调不在乎性别

萌神木木 浏览 3676

吉林长春中东新天地购物公园:丰富多元体验 焕新商业地标

中国商报 浏览 2919

气场拉满:泰国改装厂让长城坦克300“变身”Brabus G63

IT之家 浏览 2726

三镇小将姜利勋:中超首秀还是有点放不开,教练一直在鼓励我

懂球帝 浏览 1832

莫斯科空域遭侵袭 多位中国游客滞留

极目新闻 浏览 2016

三星电子市值突破万亿美元

第一财经资讯 浏览 260

陈道明被王家卫说他是阴阳同体的极品

包饺子ai剪辑 浏览 3431

最大纯电续航达335km 智己LS8官图发布

车质网 浏览 2675

老而弥坚,追梦:我还能再打4-5年,新赛季我仍充满动力

懂球帝 浏览 3583

美军高官称希望韩建核潜艇对抗中国 还引了句"蜘蛛侠"

澎湃新闻 浏览 44867

每体:老佛爷想立即解雇阿隆索,但身边人士说服他不让其下课

懂球帝 浏览 2937

美防长抨击美军士兵肥胖后 一张照片火了

环球网资讯 浏览 8069

德云社岳云鹏五姐包大巴车,带亲友们看演唱会

情感大头说说 浏览 3767

黄晓明刚带娃去过,Angelababy后脚也来了?

今古深日报 浏览 281

RedPlay新阵地:小红书游戏行业峰会解码「种草用增」新思路

环球网资讯 浏览 2328

小米手表5灰度OS3.0.152.0版本,带来表端独立微信版本更新等

IT之家 浏览 2595

白百何工作室放聊天记录了!锤了剧组没撒谎,东京之前就有矛盾

萌神木木 浏览 2786

26款名爵MG7限时11.69万起 好玩才是必杀技

网易汽车 浏览 2692

长期的“台积电第一大客户”,苹果如今也不得不“抢产能”了

华尔街见闻官方 浏览 2562
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1