关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者3739人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马德里竞技,贝蒂斯国王杯四分之一决赛对手

绿茵情报局 浏览 2587

"九一八事变"纪念日当天 有些日媒还"警戒"上了

澎湃新闻 浏览 16142

19岁女生挪用千万打赏主播细节曝光!主播不无辜,疑买房转移资金

萌神木木 浏览 784

如今,领导班子责任落实,成了老大难

识局 浏览 3421

聚焦AI+畜牧,刘松柏攻破鸡味密码,打造终身学习广东样本

南方都市报 浏览 2004

日本外务省高官今日访华 将解释高市早苗言论

界面新闻 浏览 43555

曼城虐菜之战:18场18胜!哈兰德再冲英超100球 首发曝光

叶青足球世界 浏览 3118

7万+再创造车新势力月销纪录 零跑或成下一个中国前十

道哥说车 浏览 3443

汪小菲接俩娃回北京过春节!玥儿和奶奶逛公园

地理三体说 浏览 2530

最大纯电续航达335km 智己LS8官图发布

车质网 浏览 2724

疑一则广告惹祸 特朗普宣布终止与加拿大所有贸易谈判

财联社 浏览 9581

72岁大佬完美谢幕,套现22亿无人反对,国资和股民都很满意

壹只灰鸽子 浏览 2974

讲解员回忆杨振宁95岁来访两弹城:他说这个时代特别需要“两弹一星”精神

封面新闻 浏览 3761

罗永浩被禁言后首亮相 现身B站颁奖典礼获年度新人奖

扬子晚报 浏览 7121

被你们的金饰狠狠美到!这篇是大型种草现场

黎贝卡的异想世界 浏览 1007

俄三防部队司令遇袭身亡案调查结束 细节披露

每日经济新闻 浏览 3837

主打新潮科技 smart精灵#6内饰官图发布

车质网 浏览 1128

颜骏凌:武磊赛前对球队做了动员,我们争冠经验丰富没有包袱

懂球帝 浏览 3548

山东海阳老人扎堆领结婚证现场挤满人 有村庄包车去办

极目新闻 浏览 9722

真有品味的中年女人,穿衣打扮都有这4个共同点,你中了吗?

静儿时尚达人 浏览 3853

日本渣男骗前女友拍全裸写真出轨

孤独的独角兽影视 浏览 2644
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1