chatgpt的推理能力到底有多强,究竟是AI觉醒还是弄巧成拙呢,连open AI的创始人山姆·阿尔特曼都无法完全解释他的工作机理,那么这是否意味着这个庞大的黑盒模型已经产生了思维和认知能力呢。
百闻不如一见,让我们来看一下AI测试吧。
我找了一些逻辑推理题来作为测试科目(测试模型是chatgpt3.5)。
测试正式开始:
首先一个非常简单的问题:找出与确信意思相同或者意义最相近的词。
1.正确 2.明确 3.信心 4.肯定 5.真实
chatgpt给出的答案是:肯定。完全正确,这说明啊他对中文词意的理解呢是比较到位的。
下一个问题:找出与众不同的一个
1.水 2.太阳 3.汽油 4.风 5.水泥
给出的答案是:水泥。完全正确,水泥是人造建筑材料,其他四个都是自然界中存在的东西。
对于基本的特征识别问题,AI表现的非常好,那么我们再稍微的把这个难度给提高一点。
问题是:樱桃对于红相当于牛奶对于湿冷白甜熟
给出的答案是:白。回答正确,并且呢给出了推理过程,解释的还很流畅。
下一题:
全班学生排成一行从左数和从右数甲都是第15名,那么问全班一共有多少学生
那么给出答案是:29人。回答正确,一个简单的数学题,完美解答。
接下来我们开始真正的暴击,看一看他对于较长的token理解如何?
题目是:
假如你给女朋友发红包发了0.1元,结果呢女友回了0.2元,于是呢你再次发0.3元,女友再次回了你0.4元……,那么你再次发了99.9元,女友这次没有回你了,真的没有回你了,那么请问你亏了多少钱。
我们来看一下chatgpt给出的计算结果,
这答案有点喜感哈哈哈,正确答案是50元。
看来chatgpt3.5对于复杂的问题理解能力还是有限的。
下次我们用chatgpt4.0来测试一下。GPT4拥有超过100万亿个参数(1e+15),而GPT3只有1750亿个参数(1.75e+11),这意味着GPT4可以处理更多的数据,生成更长、更复杂、更连贯、更准确、更多样化和更有创造力的文本。
有什么想测试的问题欢迎评论区留言,让我们一起测试一下chatgpt的能力究竟怎样。
页面更新:2024-03-22
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号