关闭广告

我让7个AI写了今年的高考作文,还找语文老师打了分

差评13573人阅读



一年一度的全民热点——高考!

又来了!

每到这个时候,各大网站的热搜头条,必定被高考二字占领,之所以那些网友们对高考的关注度这么高,除了自己曾经也参与过高考之外,更多的还是心里想着,终于有人感受我曾经的痛苦了!



而高考词条中的语文作文,更是每位网友们逃不开的话题。

不到一天,和高考作文相关的微博,就达成了评论上万,点赞十几万的成就。



而今年大家对于高考作文的讨论,和往年有点不一样。随着 AI 大模型的井喷,大家也突然好奇起来了:如果用 AI 来写语文作文,会是一个什么水平呢?

只不过对于这事吧,大家的意见好像并不怎么统一。有说现在的 AI ,写作文水平已经到了双一流学生的水平了。



但也有专家说,现在 AI 写作文,拿不了高分。



巧了嘛,咱们手上别的可能缺, AI 大模型那是一点也不缺的。世超也好奇,这个 AI 写作文到底能是个啥水平?

实践出真理,为了解决我这个疑问,我分别让 6 大语言模型—— ChatGPT 3.5/4 、百度文心一言、科大讯飞星火、 360 智脑、还有微软 Newbing 各写了一篇高考作文。

使用的是这次全国新高考 I 卷,题目是 “ 故事的力量 ” 。



为了让这次的评测更有置信度,世超我还专门去找了一位语文老师,以满分 60 分为标准,对这六大语言模型进行打分。

改分过程采用盲改形式,老师将不会知道他改的文章是由哪个模型写的,最大程度上保证了公平性。

百闻不如一见,下面世超就把这六篇 AI 写的文章和老师的打分评语给出来,不过呢,世超这里先不告诉大家,哪篇文章是哪个 AI 模型写的,大家可以先猜一猜,等到文章结尾,再来给大家公布答案。

咱们先来看第一篇:



老师评语:得分 41 分。

立意基本准确,无偏题现象。但是整篇文章泛泛而谈,太空洞。在写故事的三个部分的时候,过于浮于表面。同时缺少多样的论证方法,全篇以道理论证为主。青少年应该怎么做这一板块里,没有提出具体措施,只是一味强调故事是有力量的,重要的。

第二篇:



老师评语:得分 44 分。

立意准确,但是写的过于官方,尽量不要出现 “ 首先、其次、最后 ” 等字眼,无个人深度思考。其中的亮点是提出了故事的力量具有两面性,要避免故事的滥用。同时在怎么做这一板块中,从创作者、传播者、听众这些角度出发进行思考,是可取的。

第三篇:



老师评语:得分 48 分。

立意准确,逻辑清晰严密。文章文学性较强,在第一段开门见山摆出观点,善于运用举例、引用等多种方式。但是每一段都在举例,缺少更深度的辨析。最后怎么做这一板块也论述的较为合理。比较明显的失分点在于每段都在举例,有堆砌材料凑字数的嫌疑。

第四篇:



老师评语:得分 40 分。

立意基本符合,和第一篇很类似,都是浮于表面泛泛而谈。把故事的作用在翻来覆去的说,没有挖掘出故事作用的内在重要性,也没有例子加以佐证。尽量不要出现 “ 首先、其次、最后 ” 等字眼,是很明显的失分点。

第五篇:



老师评语:得分 39 分。

对于材料内容切记不可直接引用,角度新颖,从个人思维、未来发展、民族形象等角度入手来论述。可惜没有说到如何开拓我们的思维,如何塑造我们对未来的价值观和眼界,也没有具体说如何展现民族形象的。说到底还是写的不够深刻,没有闪光点。

尽量不要出现 “ 首先、其次、最后、综上所述 ” 等字眼。这不是论述类文本,这是议论文,通过表达观点立场,加以论述分析自己的观点。分析论述观点是重点。

第六篇:



老师评语:得分 40 分。

立意基本符合,都是浮于表面泛泛而谈。把故事的作用在翻来覆去的说,要论述的是独特的故事与其价值认知,少说国家,多讨论青年成长!没有挖掘出故事作用的内在重要性,也没有例子加以佐证。

第七篇:



老师评语:得分 49 分。

做好故事的概念诠释是高下。谁的故事,谁讲故事,故事讲的好不好,故事的生活价值社会价值文化价值思考。

本篇文章并不像之前的文章切入点那么大,而是选取小的切入点,有条理的进行分析。这是很不错的。但是缺少一定的对于社会价值生活价值的反思,这是能不能获得高分的关键。

评分结束啦,不知道大家对这样的打分满不满意呢?

大家可以先猜猜这七篇文章分别是哪个 AI 写的,然后再看下面的答案。



第一篇和第二篇,分别是 OpenAI 的 GPT 3.5 和 GPT 4 。

第三篇是来自百度的文心一言。

第四篇是科大讯飞的星火。

第五篇是微软的 Newbing 。

第六篇是 360 智脑。

最后一篇,则是阿里的通义千问。

其中得分最高的两篇,分别来自咱们国内的大模型,通义千问和文心一言,据这位老师说,之所以给通义千问高一分,主要是觉得文心一言的论证方法较为单一,没有更深层次的思考,通义千问虽然切入口比较小,不过他能够有一定的思考在里面。



总结到这次的题目和大模型作文,老师的看法是:

这次作文题目审题门槛低,但概念诠释门槛高。立意基本不会出错,不过要得高分很难。要谈论独特的故事与其价值认知,少说国家,多讨论青年成长。谁的故事,谁讲故事,故事讲的好不好,故事的生活价值、社会价值、文化价值思考,所以做好故事的概念诠释是高下。

其实从这次的评分来看,现在的AI大模型,虽然很难拿到接近60分的高分,但是最高49分的表现,在实际情况下,也超过了不少的中游学生。

单从这次作文的得分上来判断,AI想要考顶尖大学恐怕还不行,但是,考一些稍好的普本应该是没啥问题。



不过也没必要太焦虑,想想,毕竟连曾经的围棋之王柯洁都败在AI手下,世超认为,人类在考试上被AI全面超越也是迟早的事。

只不过,AI只是工具。工具越好用, 占便宜的,不还是我们嘛。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以色列和哈马斯不会有新年休战

CCTV国际时讯 浏览 9784

登陆中超?海港绯闻外援茹萨发文告别克鲁塞罗,结束租借之旅

懂球帝 浏览 9619

真宿敌!枪手旧将拉姆塞打趣布伦南-约翰逊:真希望他没去热刺

直播吧 浏览 11217

姚明:中国篮球的大环境是好的;篮协某种程度是要做园艺师

懂球帝 浏览 9404

“北斗”冲刺IPO,干“上天入地大买卖”的公司来了?

BT财经 浏览 13687

七月开始!穿上最好看的衣服享受风景

LinkFashion 浏览 12708

3种风格50套搭配 今夏照着穿就时髦

LinkFashion 浏览 15878

马斯克:我更喜欢磷酸铁锂电池 可充电到100%

盖世汽车 浏览 17255

红海危机持续发酵 著名咨询公司警告:供应链受损程度已显著超过疫情早期

智通财经 浏览 9842

英国政府要求领事探视"英国公民黎智英" 外交部表态

澎湃新闻 浏览 62218

高圆圆现身苍蝇小馆 在路边大口啃饭团表情可爱

盖饭娱乐官方号 浏览 16276

乌军:俄无人机“机敏难防”

参考消息 浏览 9533

市盈率10倍以内,估值历史新低白马股,未来潜力巨大

资本百科 浏览 9154

莱昂纳多被曝以每天600万美金参加萝莉岛盛宴,有57任女友太风流

缘木不求娱 浏览 10236

全新雷克萨斯GX550即将上市,约合人民币45万,配3.5T四驱+差速锁

小史谈车 浏览 9797

美国军舰再度擅闯南沙群岛,南部战区时刻保持高度戒备状态

趣看热点 浏览 23044

河北女子每天通勤5小时到北京上班:坚持了3年 月薪近4万

潇湘晨报 浏览 91639

面向“年轻品味前行者”,启辰大V推出“年轻潮力量”

BusinessCar 浏览 17426

中年女人怎么选裤子 看完这3点就知道了

形象设计师飞飞 浏览 13920

《中国刑警》阵容曝光,李现白敬亭搭档朱亚文

趣看热点 浏览 23925

马克龙:成为美国盟友并不意味着是附庸

环球网资讯 浏览 16007
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1