×

Loading...
Ad by
  • 推荐 OXIO 加拿大高速网络,最低月费仅$40. 使用推荐码 RCR37MB 可获得一个月的免费服务
Ad by
  • 推荐 OXIO 加拿大高速网络,最低月费仅$40. 使用推荐码 RCR37MB 可获得一个月的免费服务

《GPT-4,AGI的火花》: 心智理论水平, GPT4 vs ChatGPT:

摘自《GPT-4,AGI的火花》

原文:https://arxiv.org/pdf/2303.12712v1.pdf

内容精选与翻译:https://orangeblog.notion.site/GPT-4-8fc50010291d47efb92cbbd668c8c893


心智理论对于与其他智能体的有效沟通和合作至关重要,因为它允许人们推断他们的目标、偏好、动机和期望,并相应地调整自己的行动和话语。此外,心智理论对于向他人学习也很重要,因为它使人能够解释他们的反馈、建议和示范。
在现实场景中进行心智理论测试

对话:
马克:我不喜欢你昨天晚上对待杰克的方式
朱迪:你看到他在做什么了吗?他打了他哥哥的头!
马克:这并不能成为你对他大喊大叫的理由
朱迪:你想让我怎么做?让他打他的弟弟,然后什么都不说?
马克:不,我不同意 朱迪:那你为什么要为他辩护?

提问:马克的意图似乎是什么?
GPT4: 马克的意图似乎是要表达他对朱迪处理与杰克关系的方式的不满,并建议她可以更加冷静和尊重。
ChatGPT:根据谈话内容,马克的意图似乎是为杰克的行为辩护,并表达他对朱迪对待杰克的不满。

提问:朱迪如何看待汤姆的回应?
GPT4: 朱迪认为他的评论是对她的分析能力的攻击,也是对杰克的不当行为表示同情的表现。她的反应是防御性的和愤怒的,并质疑马克的动机。
ChatGPT:如果没有更多的文字,我不可能准确判断朱迪是如何接受马克的评论的。然而,根据朱迪的回应,她似乎并不同意马克的观点,而且可能对他为杰克的行为辩护感到沮丧。

提问:他们的谈话为什么没有实际进展?
GPT4: 他们没有取得进展,因为他们在谈论对方,没有倾听对方的观点。他们还在使用指责性和煽动性的语言,如 "辩解"、"吼叫"、"辩护 "和 "打人"。他们没有承认自己话语背后的情绪或需求,也没有试图找到一个共同点或解决方案。
ChatGPT:从所提供的信息中并不清楚为什么马克和朱迪在他们的对话中没有取得进展。有可能是他们的观点有冲突,或者在所讨论的问题上无法找到共同点。如果没有更多的背景,就很难确定他们没有取得进展的具体原因。

提问:他们中的任何一个人如何能改善情况以达成一致意见?


GPT4:他们中的任何一个人都可以通过几种方式来改善局面,以达成协议,比如说:
马克可以先承认朱迪对弟弟安全的担忧以及她对杰克行为的挫败感,然后解释他不是在为杰克辩护,而是担心喊叫对他们的关系和自尊的影响。他还可以问朱迪,她认为什么是管教杰克的更好方法,并提供他的支持和建议。
朱迪可以降低她的声音,调低她的怒气,并倾听马克的观点,不打断或评判。她也可以承认,她可能反应过度,她感到压力和不知所措。她还可以问马克,他认为与杰克沟通的更好方式是什么,并表示她愿意作为一个团队一起工作。

ChatGPT:马克和朱迪有几种方法可以尝试改善情况并达成协议:
他们可以尝试理解对方的观点,积极听取对方的观点。这可能有助于他们发现任何误解并找到共同点。
他们可以尝试妥协,找到一个能满足他们双方需求或关注的解决方案。
他们可以尝试使用尊重和非正面的语言来交流他们的想法和感受。
他们可以寻求中立第三方的帮助,如调解员,以促进交流并帮助他们达成协议。
如果对话变得过于激烈或困难,他们可以先休息一下,等以后双方都比较冷静,能够更有效地进行沟通时再回来讨论。

结果表明:GPT-4在需要推理他人心理状态的现实场景中优于ChatGPT,并且在社会环境中会为共同目标提出合作行动。

GPT-4具有非常高级的心智理论水平。虽然ChatGPT在基本测试中也表现良好,但似乎GPT-4更加心思细腻,能够更好地推理多个行动者,以及各种行动如何影响他们的心理状态,特别是在更现实的场景中。

Report