最近爆火的ChatGPT到底能否通过图灵测试的改进版-WS挑战？

在我看来啊，ChatGPT没有完全通过Winograd Schema Challenge，但不可否认的是，经过这么多年的发展，现在的AI的确渐渐有了思考的这个动作。我们更想知道的是，AI是否有思考的这个动作，因此有了图灵测试的改进版：WinogradSchema Challenge。这里我一共找了三组话，从易到难，每组话里有两个句子，以此来判断ChatGPT是否具有思考的动作。但是值得注意的是，在

KnightHONG

4958人浏览 · 2022-12-13 08:08:52

KnightHONG · 2022-12-13 08:08:52 发布

最近ChatGPT很火啊，我也去试着玩了一下。
当然我一上来就想给它做一个图灵测试的改进版。
为什么不是做图灵测试呢？
因为图灵测试存在很多已知的问题，并且不能代表这个机器人真的有思维。
我们更想知道的是，AI是否有思考的这个动作，因此有了图灵测试的改进版：Winograd Schema Challenge。
这里我一共找了三组话，从易到难，每组话里有两个句子，以此来判断ChatGPT是否具有思考的动作。
比如说我们给它打第一句话，然后问它这句话中的代词指代的物体是哪一个。

奖杯不能放在棕色行李箱里，因为它太小了。什么太小了？
在这里插入图片描述
这个很明显ChatGPT没有思考的行为，单纯的比大小也不能进行。
然后我们来问一下哪一个太大了。
奖杯不能放在棕色行李箱里，因为它太大了。什么太大了？

但是值得注意的是，在第一组的第二句话，它回答正确了，并且给出了思考的过程。