关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11399人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

白宫：美政府正密切关注胡塞武装任何报复性袭击

环球网资讯浏览 12763

54岁萧蔷穿印花裙配齐刘海少女感真的强！

蓓小西浏览 15100

特朗普寻求加快大型电力项目，以满足AI需求

华尔街见闻官方浏览 1634

玩换电，推增程，埃安到底要干什么

汽车公社浏览 564

迈瑞医疗市值跌了三千亿，第三次上市，74岁李西廷越来越忙

懂财帝浏览 987

让AI学会＂边看边判断＂：韩国GIST团队突破视频实时事件分割技术

科技行者浏览 628

西部联体育主管被指控未经许可挪用好友资金，给俱乐部修球场

懂球帝浏览 908

美中央司令部证实：一艘美国货轮遭胡塞武装袭击

央视新闻客户端浏览 77914

杨颖全网账号解除禁言！风波三个月后频频试水，实力堪忧复出渺茫

萌神木木浏览 12440

G7对中国提出三个“不许” 媒体质问：凭什么

上游新闻浏览 15297

国产新能源还在内讧，福特CEO已经吓破胆了：能让我们全军覆没

小李车评李建红浏览 692

媒体：翻脸比翻书快美国拟进一步升级对华芯片制裁

直新闻浏览 89608

韩国3岁女童被遗弃饿死，DNA检测结果更是震惊所有人

趣看热点浏览 814787

王健林“限高”已取消，万达知情人士最新回应

红星资本局浏览 1491

美媒承认：西方对乌军反攻态度有明显变化

环球网资讯浏览 14693

前央视主持人水均益直播额头顶＂中国人＂纸条否认移民

极目新闻浏览 6265

秦煌如今过成这样只能算他活该？

一针见娱浏览 1045

他被谢霆锋打成重伤，如今怎么样了？

卷史浏览 888

媒体：美国向俄方通报拜登访问基辅是说了＂软话＂的

经济观察报浏览 97062

伊周周六热推：电视剧《繁花》、综艺《最强大脑11》......

伊周潮流浏览 13491

泡泡玛特股价连跌6天

YOUNG财经浏览 813

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

小鹏开启“甩...

克洛普：斯洛...

借助配饰的力...

米体：伊尔迪...

北京大学联合...

周年庆专场|...

颜强：反腐短期内有震慑作用，但中国足球只是反腐这肯定没用

埃弗拉：成功接受脚后跟手术，这处伤已让我忍受了几年的痛苦

地方大员密集调整多位正部级官员履新

白宫：美政府正密切关注胡塞武装任何报复性袭击

54岁萧蔷穿印花裙配齐刘海少女感真的强！

特朗普寻求加快大型电力项目，以满足AI需求

玩换电，推增程，埃安到底要干什么

迈瑞医疗市值跌了三千亿，第三次上市，74岁李西廷越来越忙

让AI学会＂边看边判断＂：韩国GIST团队突破视频实时事件分割技术

西部联体育主管被指控未经许可挪用好友资金，给俱乐部修球场

美中央司令部证实：一艘美国货轮遭胡塞武装袭击

杨颖全网账号解除禁言！风波三个月后频频试水，实力堪忧复出渺茫

G7对中国提出三个“不许” 媒体质问：凭什么

国产新能源还在内讧，福特CEO已经吓破胆了：能让我们全军覆没

媒体：翻脸比翻书快美国拟进一步升级对华芯片制裁

韩国3岁女童被遗弃饿死，DNA检测结果更是震惊所有人

王健林“限高”已取消，万达知情人士最新回应

美媒承认：西方对乌军反攻态度有明显变化

前央视主持人水均益直播额头顶＂中国人＂纸条否认移民

秦煌如今过成这样只能算他活该？

他被谢霆锋打成重伤，如今怎么样了？

媒体：美国向俄方通报拜登访问基辅是说了＂软话＂的

伊周周六热推：电视剧《繁花》、综艺《最强大脑11》......

泡泡玛特股价连跌6天

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

小鹏开启“甩...

克洛普：斯洛...

借助配饰的力...

米体：伊尔迪...

北京大学联合...

周年庆专场|...

颜强：反腐短期内有震慑作用，但中国足球只是反腐这肯定没用

埃弗拉：成功接受脚后跟手术，这处伤已让我忍受了几年的痛苦

地方大员密集调整 多位正部级官员履新

白宫：美政府正密切关注胡塞武装任何报复性袭击

54岁萧蔷穿印花裙配齐刘海 少女感真的强！

特朗普寻求加快大型电力项目，以满足AI需求

玩换电，推增程，埃安到底要干什么

迈瑞医疗市值跌了三千亿，第三次上市，74岁李西廷越来越忙

让AI学会＂边看边判断＂：韩国GIST团队突破视频实时事件分割技术

西部联体育主管被指控未经许可挪用好友资金，给俱乐部修球场

美中央司令部证实：一艘美国货轮遭胡塞武装袭击

杨颖全网账号解除禁言！风波三个月后频频试水，实力堪忧复出渺茫

G7对中国提出三个“不许” 媒体质问：凭什么

国产新能源还在内讧，福特CEO已经吓破胆了：能让我们全军覆没

媒体：翻脸比翻书快 美国拟进一步升级对华芯片制裁

韩国3岁女童被遗弃饿死，DNA检测结果更是震惊所有人

王健林“限高”已取消，万达知情人士最新回应

美媒承认：西方对乌军反攻态度有明显变化

前央视主持人水均益直播 额头顶＂中国人＂纸条否认移民

秦煌如今过成这样只能算他活该？

他被谢霆锋打成重伤，如今怎么样了？

媒体：美国向俄方通报拜登访问基辅 是说了＂软话＂的

伊周周六热推：电视剧《繁花》、综艺《最强大脑11》......

泡泡玛特股价连跌6天

地方大员密集调整多位正部级官员履新

54岁萧蔷穿印花裙配齐刘海少女感真的强！

媒体：翻脸比翻书快美国拟进一步升级对华芯片制裁

前央视主持人水均益直播额头顶＂中国人＂纸条否认移民

媒体：美国向俄方通报拜登访问基辅是说了＂软话＂的