关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11399人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

白宫:美政府正密切关注胡塞武装任何报复性袭击

环球网资讯 浏览 12763

54岁萧蔷穿印花裙配齐刘海 少女感真的强!

蓓小西 浏览 15100

特朗普寻求加快大型电力项目,以满足AI需求

华尔街见闻官方 浏览 1634

玩换电,推增程,埃安到底要干什么

汽车公社 浏览 564

迈瑞医疗市值跌了三千亿,第三次上市,74岁李西廷越来越忙

懂财帝 浏览 987

让AI学会"边看边判断":韩国GIST团队突破视频实时事件分割技术

科技行者 浏览 628

西部联体育主管被指控未经许可挪用好友资金,给俱乐部修球场

懂球帝 浏览 908

美中央司令部证实:一艘美国货轮遭胡塞武装袭击

央视新闻客户端 浏览 77914

杨颖全网账号解除禁言!风波三个月后频频试水,实力堪忧复出渺茫

萌神木木 浏览 12440

G7对中国提出三个“不许” 媒体质问:凭什么

上游新闻 浏览 15297

国产新能源还在内讧,福特CEO已经吓破胆了:能让我们全军覆没

小李车评李建红 浏览 692

媒体:翻脸比翻书快 美国拟进一步升级对华芯片制裁

直新闻 浏览 89608

韩国3岁女童被遗弃饿死,DNA检测结果更是震惊所有人

趣看热点 浏览 814787

王健林“限高”已取消,万达知情人士最新回应

红星资本局 浏览 1491

美媒承认:西方对乌军反攻态度有明显变化

环球网资讯 浏览 14693

前央视主持人水均益直播 额头顶"中国人"纸条否认移民

极目新闻 浏览 6265

秦煌如今过成这样只能算他活该?

一针见娱 浏览 1045

他被谢霆锋打成重伤,如今怎么样了?

卷史 浏览 888

媒体:美国向俄方通报拜登访问基辅 是说了"软话"的

经济观察报 浏览 97062

伊周周六热推:电视剧《繁花》、综艺《最强大脑11》......

伊周潮流 浏览 13491

泡泡玛特股价连跌6天

YOUNG财经 浏览 813
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1