关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者904人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

精致穷,我们在为“符号消费”买单

时尚COSMO 浏览 1040

小个子不容错过的初春搭配 每一套都简单实用

虎哥说衣不二 浏览 19513

大咖对话:从L2到L4,如何破解高阶智驾落地难题

网易汽车 浏览 86

人步赛后!里弗斯爆赞哈登+丹尼尔斯,并亲承杀招!马克西谈趣事

篮球资讯达人 浏览 19440

牵手长安汽车,京东、宁德时代继续拓新

观察者网 浏览 1045

已生龙凤胎?何超莲近照曝光 身材纤瘦力破谣言

扒虾侃娱 浏览 16253

2023最流行的4款单品,时髦炸了!

仙爷种草机 浏览 19905

物资极端短缺 加沙人被迫步行5公里买几张饼

北青网-北京青年报 浏览 916

张伟丽不在状态被ko了_张伟丽被对手罗斯抓住机会

趣看热点 浏览 26096

湾芯展顶流新凯来:当“隐形基建”浮出水面

北京商报 浏览 986

用热爱赚钱,其实不难

虎嗅APP 浏览 14911

戴森新一代无叶冷暖风扇AM15发布,首发价3790元

IT之家 浏览 566

媒体:2个月被罚4.3亿美元 "成功商人"特朗普遭受重创

新京报外事儿 浏览 79362

为拍电影与父母闹掰的翁虹 不让女儿进娱乐圈

二妹扯娱 浏览 1043

以方袭击后 美副总统表态:加沙停火协议仍在维持

国际在线 浏览 756

曾经一文不值的锂矿石火了 郴州村民:一晚能搞一两万

海报新闻 浏览 124150

小波特:我们需要所有人都能出战 这样化学反应才能达到最佳

直播吧 浏览 19145

44岁吴佩慈罕见素装现身 和范玮琪一起为闺蜜庆生

素素娱乐 浏览 19976

台军退役扫雷车放公园 "26根大钢牙几乎被拔光"

环球网资讯 浏览 16797

古尔曼披露苹果汽车项目细节:多种设计方案均为面包车

IT之家 浏览 11173

俄乌“和平计划”又生变 欧洲“强有力”回应特朗普批评

环球网资讯 浏览 64
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1