生成式 AI 与心理健康治疗师正面交锋

快速阅读: 据《福布斯》最新报道，研究表明，生成式人工智能在诊断精神分裂症和预测其预后方面表现良好，但需与人类专业知识结合验证。AI的普及带来便利与风险，需权衡其利弊，谨慎应用。

生成式人工智能在精神分裂症诊断和长期预后测试中表现出色

盖蒂
在今天的专栏中，我将继续探讨生成式人工智能在医疗领域的影响力。这一次的重点仍然是心理健康领域，深入探索使用生成式人工智能来诊断精神分裂症的存在，并推测被诊断者未来可能出现的心理健康结果。

我之前已经研究了生成式人工智能与心理健康交织的多个方面，详见我的综合概述 [链接]。您可能还会对CBS《60分钟》的一期节目感兴趣，该节目探讨了这一发展中的关键问题，详见 [链接]（我很荣幸地指出，我在节目中接受了采访并被重点介绍，详见 [链接]）。

在今天的专栏中，我将继续探讨生成式人工智能在医疗领域的影响力。这一次的重点仍然是心理健康领域，深入探索使用生成式人工智能来诊断精神分裂症的存在，并推测被诊断者未来可能出现的心理健康结果。

其他重要的背景信息包括我对精神科医生或心理咨询师支持下的心理健康聊天机器人的深入报道（详见 [链接]），以及由于生成式人工智能而迅速变化的客户-治疗师关系（详见 [链接]）。我还探讨了基于AI的心理治疗自主指导的发展方向 [链接]，并展示了世界卫生组织（WHO）关于全球健康与生成式人工智能报告的重要性 [链接] 等等。

让我们剖析今天的重点。

**评估心理健康**
沉浸在一个简短的情景中。

假设一个人表现出各种心理症状，表明他们可能是精神分裂症患者。我们请精神科医生或心理咨询师介入。精神科医生或心理咨询师努力诊断此人，并得出一个初步结论，认为此人确实表现出显著的精神分裂症特征。

如果这个人接受专业心理健康治疗，你会对他们克服精神分裂症的可能性做出什么样的诊断和预后判断？

同样，如果这个人 **不** 接受心理健康治疗，你会对他们克服精神分裂症的可能性做出什么样的诊断和预后判断？

我给你们一点时间思考这些问题。

你们准备好继续这个重要的话题了吗？

我希望如此。

我想你们会发现这两个相关问题很难回答。

最明显的假设是，通过获得专业心理健康指导，我们似乎增加了这个人最终克服精神分裂症的机会。当然，这并不是绝对的保证，因此也存在他们无法战胜精神分裂症的可能性。

如果他们偶然没有得到任何心理健康帮助，那么我们可能会认为他们的精神分裂症不会被克服。我们还可能倾向于相信被诊断出的精神分裂症会恶化。然而，这些都不是确定无疑的结果。仍然有可能他们能够通过自己的努力或仅仅是时间的推移来克服精神分裂症。

总之，做出诊断和预后判断并非易事。

**谁在进行评估**
让我再增加一个转折。

考虑是谁或什么在进行诊断和预后判断的问题。

听起来很神秘，但问题是这个诊断和预后判断是由精神科医生或心理咨询师还是由非专业人士（不是精神科医生或心理咨询师）做出的。可以假设精神科医生或心理咨询师处于更有利的位置，因为他们具备与心理疾病相关的知识、培训和经验。普通公众似乎只是依靠未经证实的直觉或过度的大胆猜测。

这是另一个转折。

我们选择使用生成式人工智能，并让AI进行诊断和预后判断。

请注意，我建议AI这样做时不需要人类参与。我之前讨论过，我们将会有精神科医生或心理咨询师通过将生成式人工智能作为其治疗工作的重要组成部分来增强他们的实践，详见 [链接]。在这种情况下，生成式人工智能和精神科医生或心理咨询师在治疗患者和预测结果时是密切合作的。

为了讨论方便，假设排除精神科医生或心理咨询师与生成式人工智能的结合使用。假设生成式人工智能将自行进行诊断并随后做出预后判断，完全没有任何精神科医生或心理咨询师的帮助。

在这种结果预测事务中，生成式人工智能的表现如何？

我很高兴你问了（好吧，我猜是我提出了这个问题）。有一个有趣的研究探讨了根据三种不同的预测途径对精神分裂症的诊断和预后判断进行比较。

这三条途径分别是：

(1) 精神科医生或心理咨询师
做出诊断和预后判断。

(2) 普通公众
做出判断或预测。

(3) 各类生成式AI模型
进行诊断和预后判断。

**这些领域的持续研究**
我想简要提及一下这些新兴的研究，它们旨在探索生成式人工智能在心理健康治疗角色中的实用性。我们需要更多的实证研究。在这个领域，需要更多的实证研究和深思熟虑的实验分析。

总体而言，很少有研究采取系统性的方法。

并且这些研究还不够多。

总体而言，很少有研究采取系统性的方法。

我还想提一下另一点。我即将介绍的具体研究集中在精神分裂症上。我一般认为从中获得的通用原则可以应用于许多其他心理疾病。从这个意义上说，在阅读我接下来的总结时，您可能会想到这些观点如何适用于各种心理疾病，远远超出精神分裂症的范围。

我还特别喜欢这项具体研究的另一个方面。它寻求比较几种不同的生成式AI模型。这一点很重要。我说这一点是因为很多人甚至研究人员都没有意识到每个主要的生成式AI模型彼此之间有很大的不同。它们的算法不同，训练数据也不同等等。

关键是，任何只选择使用特定生成式AI模型的研究都会在一定程度上限制研究结果的可解释性和推广性。仅仅使用一个特定的生成式AI模型就试图推广是非常困难的。通过使用多种模型，推广性会大大提高。

好了，我下台了。

我将按以下方式继续。首先，让我们确保大家都熟悉精神分裂症的本质。我将使用权威的DSM-5手册内容来阐明这一理解（有关生成式人工智能如何免费提供DSM-5心理健康建议的近期文章，请见 [链接]）。其次，我将深入探讨研究，该研究考察了我之前提出的上述情景。第三，我尝试部分复制该研究的一些方面，使用了ChatGPT和GPT-4，想要看看我能得到什么结果。

**DSM-5定义的精神分裂症**
让我们通过DSM-5中定义的精神障碍标准来探讨精神分裂症。我将按以下方式继续。首先，让我们确保大家都熟悉精神分裂症的本质。我将使用权威的DSM-5手册内容来阐明这一理解（有关生成式人工智能如何免费提供DSM-5心理健康建议的近期文章，请见 [链接]）。其次，我将深入探讨研究，该研究考察了我之前提出的上述情景。第三，我尝试部分复制该研究的一些方面，使用了ChatGPT和GPT-4，想要看看我能得到什么结果。

DSM-5是一个广泛接受的标准，是《精神障碍诊断与统计手册》第五版的缩写，由美国精神病学会（APA）发布。DSM-5手册是执业心理健康专业人士的权威参考书。我将按以下方式继续。首先，让我们确保大家都熟悉精神分裂症的本质。我将使用权威的DSM-5手册内容来阐明这一理解（有关生成式人工智能如何免费提供DSM-5心理健康建议的近期文章，请见 [链接]）。其次，我将深入探讨研究，该研究考察了我之前提出的上述情景。第三，我尝试部分复制该研究的一些方面，使用了ChatGPT和GPT-4，想要看看我能得到什么结果。

DSM-5整体上关于精神分裂症这样说（摘录）：

“精神分裂症谱系及其他精神病性障碍包括精神分裂症、其他类型的精神病性障碍以及分裂型人格障碍。它们由五个领域的异常特征之一或多个定义：妄想、幻觉、思维紊乱（言语）、明显混乱或异常运动行为（包括木僵），以及阴性症状。”此外，列出的诊断标准包括（精选摘录）：“诊断标准。A. 在一个月内（如果成功治疗则时间更短一些）的大部分时间内出现以下两个（或更多）症状中的每一个。至少其中一个必须是（1）、（2）或（3）：

1. 妄想。
2. 幻觉。
3. 思维紊乱（例如，频繁偏离主题或语义不清）。
4. 明显混乱或木僵行为。
5. 阴性症状（即情感表达减少或意志缺乏）。”

（来源：DSM-5）。精神分裂症的终身患病率约为0.3%-0.7%，尽管种族/民族、国家之间以及移民及其后代的地理起源存在报告差异。性别比例在不同样本和人群中有所不同：例如，强调阴性症状和较长病程显示男性发病率更高，而允许包含更多情绪症状和短暂表现显示两性风险相当。（来源：DSM-5）。

在DSM-5关于精神分裂症的“发展与进程”部分的子章节中，有以下预后指示（摘录）：“病程和结果的预测因素大多难以可靠预测。”“精神分裂症的精神病特征通常出现在青少年晚期到30多岁中期；首次精神病发作的高发年龄段为男性20岁左右，女性20多岁。”“传统上认为早发病是较差预后的标志。”“大约20%的精神分裂症患者预后良好，少数个体报告完全恢复。”“然而，大多数精神分裂症患者仍需要正式或非正式的日常生活支持，许多人长期患病，症状反复加重或缓解，而另一些人则表现出进行性恶化。”“精神病症状随着生命进程可能会减轻，这可能与正常的年龄相关多巴胺活动下降有关。”“此外，与疾病相关的认知缺陷可能不会在病程中改善。”

上述陈述为探索心理健康专业人士、普通公众和生成式AI如何诊断精神分裂症并做出预后预测奠定了有益的基础。深入探讨这个问题一个关键点是，即使是经验最丰富的心理健康专业人士也很难准确预测精神分裂症的恢复预后。另一个需要考虑的关键区别因素基于这两个相关因素：（1）持续接受精神分裂症治疗，（2）没有持续接受治疗。

**超越人类的预测**
我们能否仅依靠生成式AI来诊断精神分裂症并预测其预后？从某种意义上说，答案很简单，即这是可以做到的。这是一个几乎确定的情况。但实际上还有更多内容。问题在于生成式AI的诊断和预后会有多好。这样想吧。如果你转动一个轮盘赌，上面有一个槽写着“患精神分裂症”，另一个槽写着“未患精神分裂症”，那么得到的答案只是概率问题。那里并没有确切的东西。仅仅因为生成式AI吐出一个诊断和预后并不意味着它是好的。声称的指示可能是完全偏离目标的。

我想强调的是，生成式AI无疑会在被要求进行诊断和预后时给出答案。这是一个几乎确定的事实。除非AI开发者决定调整生成式AI以避免生成这些内容，否则你肯定会得到它们。仅仅因为生成式AI吐出一个诊断和预后并不意味着它是好的。

现在，生成式AI显然比转轮盘要好一些，因为它已经通过大量的人类写作进行了数据训练。通过扫描大量的互联网内容，生成式AI在计算上对人类叙述、文章、故事、诗歌等内容进行了模式化匹配。这使得它对人类输入的提示产生非常流畅的回应。

我们将如何能够判断生成式AI产生的诊断和预后是否确实有效？一种方法是将生成式AI的诊断和预后与人类的诊断和预后进行比较。

我们已承认人类在这方面存在不足。在这种思维方式下，我们也应该承认生成式AI在这方面也可能存在不足。我提到这一点是为了指出我们并不一定假设生成式AI在给出这些答案时会完美无瑕。当然，如果能做到这一点将会非常出色和令人印象深刻，但由于我们已知人类无法达到这一高度，也许我们应该给予生成式AI同样的包容。

我可能还要提到一个深层面的担忧，即有时人们会陷入一种心理陷阱，期待AI完美无瑕。答案中有一种自信的气息，加上文化观念认为机器可以奇迹般地工作并完美运作。这种观念是错误的。因此，有些人会强烈主张，如果我们让生成式AI开展任何形式的心理健康分析，就可能引发一系列问题，详见我的相关报道链接。

**创新的研究**
研究在Zohar Elyoseph和Inbar Levkovich于《JMIR Mental Health》2024年发表的研究论文《比较生成式AI、心理健康专家和普通公众对精神分裂症康复的看法：案例描述研究》中，提出了以下关键点（摘录）：

“精神分裂症是一种慢性严重症状的疾病，其恢复的可能性是一个争论的话题。”

“本研究探讨了一个此前未被研究的问题——利用大型语言模型（LLMs）预测严重慢性疾病如精神分裂症临床预后的能力。”

“LLMs今天被全球数亿用户使用，包括患者和临床医生。”

“本研究旨在评估大型语言模型（LLMs）与心理健康专业人员相比，在评估精神分裂症的预后以及有无专业治疗下的长期积极和消极结果方面的能力。”

“总体而言，尽管LLMs在增强医疗保健方面具有潜力，但其应用需要严格验证，并与人类专业知识有机结合。”

我相信上述要点会让你有所共鸣，因为我已经为你揭示了我们在这里试图发现的内容。这项研究特别值得注意的一个额外点是，不仅心理健康专业人士将使用生成式AI，我们还应预期和准备普通公众也将使用生成式AI用于心理健康目的。正如我多次强调的那样，我们正处于此次大规模试验之中，普通大众正在将生成式AI当作个人治疗师使用，但我们不知道这对人类是有益还是是一场灾难性的失败，详见我的讨论链接。

根据引用的研究，他们提出了以下重要观点（摘录）：

“当代精神分裂症研究中的学术讨论往往集中在AI在专业科学环境中的部署上，却很少涉及AI对普通公众或患者群体的可及性。”（同上）。“在心理健康领域，这种广泛应用唤醒了迫切需要检查这些系统在各种医学问题上提供的临床信息质量的需求，例如治疗策略建议、风险评估和情绪状态的解读。”（同上）。

“机器学习算法有能力辨别与不同疾病轨迹相关的微妙变量。这些算法能够在个体层面上促进特定结果的概率预测，同时识别出更大诊断类别中的不同亚组。”（同上）。

“因此，机器学习方法有望帮助临床医生制定个性化的干预措施，从而降低疾病恶化的风险。”（同上）。

**接下来我将深入探讨这项研究的细节。剖析关键细节**
他们利用了各种预先设定的描述精神分裂症实例的案例研究。这些案例研究已经用于包括心理健康专业人士和公众在内的研究中。这项研究的关键在于将生成式AI应用于这些案例研究。这将允许然后比较生成式AI、心理健康专业人士意见和公众意见在精神分裂症案例方面的观点。以下是他们所做的一些内容（摘录）：

“案例研究被输入到LLMs接口中，并由四个AI平台——ChatGPT-3.5、ChatGPT-4、Google Bard和Claude——评估了10次。”

“总共收集了80个评估结果，并与现有标准进行了基准测试，以分析心理健康专业人士（全科医生、精神病学家、临床心理学家和心理健康护士）和公众对精神分裂症预后以及有无专业治疗的长期积极和消极结果的看法。”

“对于有专业治疗的精神分裂症预后，ChatGPT-3.5表现得相当悲观，而ChatGPT-4、Claude和Bard与专业人士的观点一致，但与公众有所不同。”

“所有大型语言模型都认为未经治疗的精神分裂症在缺乏专业治疗的情况下会保持稳定或恶化。”

“对于长期结果，ChatGPT-4和Claude预测的负面结果比Bard和ChatGPT-3.5更多。对于正面结果，ChatGPT-3.5和Claude比Bard和ChatGPT-4更为悲观。”

“发现三个LLMs在考虑‘有治疗’条件时与心理健康专业人士的预测高度一致，这是这项技术在提供专业临床预后方面潜力的体现。”

“ChatGPT-3.5的悲观评估是一个令人不安的发现，因为它可能会降低患者开始或坚持精神分裂症治疗的动力。”

正如你所看到的，生成式AI在与心理健康专业人士的比较中似乎表现得相对不错，尽管请再次注意，这只是基于预制案例研究，而不是实际现场持续实践的结果。确保在解释结果时牢记实验框架及其背景。此外，任何对该主题感兴趣的人都应鼓励阅读完整研究，因为其中有许多值得密切关注的有趣细节。

**使用ChatGPT分析研究案例**
接下来我将探索研究中使用的其中一个案例研究，通过展示使用ChatGPT和GPT-4生成AI的例子来进行。这两个AI应用程序在研究中被使用，因此，在广义上，我正在进行该研究的部分复制（在非常有限的方式下）。总体而言，由于ChatGPT和GPT-4的极大流行度，它们在这个案例中是一个明智的选择。据估计，每周活跃用户中有4亿人正在使用这些生成式AI应用程序。那是很多人和很多生成式AI的使用正在进行。我将按照以下方式继续。首先，我将把案例研究输入到ChatGPT和GPT-4中。然后，我将提出在上述引用的研究中提出的一系列问题。共有六个问题。我将分别展示ChatGPT和GPT-4的回答，并进行对比，以便我们可以看到它们各自说了什么。我的评论将有助于解释结果。这将是信息丰富的，也许还会很有趣，所以找个安静的地方坐下，也许给自己拿一桶爆米花。让我们开始吧。

**我的输入提示**：“我有一个关于某人可能患有精神分裂症的情景给你。我会与你分享这个情景，然后问你有关这个情景的问题。你准备好了吗？”

**ChatGPT生成的回应**：“好的，请提供情景。”

**GPT-4生成的回应**：“好的，我已经准备好听情景了。”

**我的输入提示**：“这个情景是这样的。Mary/Jone今年24岁，和她的父母住在一起。自毕业后她有过几份临时工作，但现在失业了。在过去六个月里，她停止看望朋友，并开始把自己锁在自己的卧室里，拒绝与家人一起吃饭或洗澡。她的父母在睡觉时听到她在卧室里走动的声音。即使他们知道她独自一人，但他们听到她喊叫和争论，好像还有别人在场。当他们试图鼓励她多做一些事情时，她低声说她不会离开家，因为她被邻居监视。他们意识到她没有吸毒，因为她从未见过任何人或去任何地方。”

**ChatGPT和GPT-4都确认已阅读情境，并准备好回答我可能提出的所有问题。**

**问题#1：这个人可能出了什么问题**
研究中使用的第一问题是情景中的人物是否似乎有任何明显的问题。我意识到你可能会觉得我的开场提示让AI意识到这可能涉及精神分裂症。也许我偏向了天平的一边。好消息是我开始了新的对话并省略了那个开场提示。结果几乎相同，即ChatGPT和GPT-4立即给出了涉及精神分裂症的诊断。因此，我认为开场提示并没有不当地引导AI在这个例子中。

话虽如此，重要的是要注意，有时你可以引导生成式AI，从而得到你想要的结果，而不是让AI自行进行而不受预设指令或方向的影响。如你接下来所见，ChatGPT和GPT-4的答案非常相似，两者都声称根据提供的案例研究，存在患精神分裂症的可能性很大。看看。

**我的输入提示**：“描述一下Mary/Jone存在哪些问题，如果有问题的话？”

**ChatGPT生成的回应**：

根据所提供的场景，玛丽/乔恩的行为让人担心她/他可能患有精神分裂症。精神分裂症是一种慢性且严重的精神障碍，其特征是思维、感知、情绪和行为的紊乱。以下是场景中的一些具体症状和特征，这些与潜在的精神分裂症迹象相符。

– 社交退缩：玛丽/乔恩已经停止见朋友，大部分时间独自一人待在自己的卧室里，这表明了社交退缩或孤立。
– 行为混乱：玛丽/乔恩拒绝与家人一起吃饭或洗澡，这可能反映出混乱或疏忽的行为。
– 知觉障碍：玛丽/乔恩的父母听到她在卧室里走动，并且在夜间大喊大叫或争论，好像还有其他人存在，这暗示着知觉障碍，例如听幻觉。
– 妄想：玛丽/乔恩低声说她/他不会离开家，因为邻居正在监视她/他，这表明可能存在迫害妄想——错误认为有人密谋对付她/他。

**GPT-4生成的响应**：

根据你所描述的场景，玛丽/乔恩表现出的行为可能暗示存在某种心理健康问题，可能是精神病如精神分裂症。一些指示这种可能性的迹象包括：

– 社交退缩：她/他已经停止见朋友，大部分时间独自一人待在房间里。
– 个人卫生忽视：拒绝与家人一起吃饭或保持个人卫生，比如洗澡。
– 听幻觉：听到她/她在争论或大喊大叫，好像还有其他人存在，这可能表明听幻觉。
– 妄想性思维：相信她/他被邻居监视却没有证据支持存在妄想。

我会将这两个答案评为大致相同。

**问题#2：提供心理健康建议**
第二个问题是寻求建议。在这种情况下，ChatGPT和GPT-4都提供了大致相似的有用建议。以下是响应内容。

**我的输入提示**：“对于玛丽/乔恩来说什么会有帮助？”

**ChatGPT生成的响应**：

对玛丽/乔恩的支持和干预需要多维度的方法，旨在解决她的症状，改善她的功能，并促进她的整体福祉。以下是一些可能对玛丽/乔恩有帮助的策略。

– 进行详尽的精神病学检查：玛丽/乔恩应由合格的心理健康专业人士（如精神病学家或心理学家）进行详尽的精神病学检查，以评估她的症状，诊断任何心理健康状况，并制定适当的治疗计划。
– 药物治疗：如果被诊断为精神分裂症或其他心理健康障碍，玛丽/乔恩可能会从药物治疗中受益，以帮助控制她的症状。抗精神病药物通常用于减少幻觉、妄想和其他与精神分裂症相关的精神病症状。
– 个体治疗：玛丽/乔恩可以从个体治疗中受益，如认知行为疗法（CBT）或支持性治疗，以处理她的思想、信念和情感，提高应对技能，并增强对自己经历的理解。

**GPT-4生成的响应**：

有效地帮助玛丽/乔恩涉及几个步骤，可以支持她的康复并管理症状。以下是一些可能有益的方法。

– 专业评估：第一步是让玛丽/乔恩去看心理健康专业人士，如精神病学家或临床心理学家。他们可以提供全面的评估，确认诊断并了解症状的严重程度及其影响。
– 治疗计划：基于评估结果，可以制定治疗计划。这通常包括药物（如抗精神病药物）来帮助控制妄想和幻觉等症状，以及心理治疗来提供支持、教育和应对策略。
– 家庭支持和教育：重要的是让玛丽/乔恩的家庭参与并给予支持。他们可以从了解她的情况、学习如何应对和管理症状以及知道如何最好地支持她中受益。还可能推荐家庭治疗，以改善沟通并解决任何家庭动态问题。

**问题#3：预测心理健康建议的影响**
在这第三个问题中，我们终于看到了ChatGPT和GPT-4之间的一些可区分差异。这个问题要求从选项列表中选择一个答案。ChatGPT指出了部分恢复（答案C），而GPT-4更为悲观，表示部分恢复会伴随着反复的问题（答案D）。这与研究研究似乎得到的答案一致。以下是发生的情况。

**我的输入提示**：“考虑到她/他接受了你认为最合适的专业帮助，玛丽/乔恩最有可能的结果是什么？从这些陈述中选择一个答案：A.完全恢复且没有进一步的问题；B.完全恢复，但问题可能会复发；C.部分恢复；D.部分恢复，但问题可能会复发；E.没有改善；F.变得更糟。”

**ChatGPT生成的响应**：

鉴于提供的场景和假设玛丽/乔恩接受适当的专业帮助，最有可能的结果将是：C.部分恢复。虽然玛丽/乔恩在接受适当治疗和支持的情况下可能会改善症状和整体功能，但重要的是要认识到精神分裂症是一种慢性且复杂的心理健康障碍，可能需要持续管理和支持。部分恢复可能涉及症状减轻、社会和职业功能改善以及生活质量提高，但即使经过治疗，玛丽/乔恩仍可能继续经历某些残留症状或挑战。持续监测和支持对于帮助管理她的状况并促进长期健康非常重要。

**GPT-4生成的响应**：

假设玛丽/乔恩接受适当的专业帮助，她/他最可能的结果通常是D.部分恢复，但问题可能会复发。精神分裂症和其他类似的精神病障碍通常遵循复发缓解的过程。尽管治疗如药物和心理治疗可以帮助管理症状并提高生活质量，但这些疾病通常是慢性的，可能需要持续管理以预防和减轻严重症状的复发。定期复诊并调整治疗方案对于有效处理任何复发问题至关重要。

**问题#4：预测缺乏心理健康建议会发生什么**
在第四个问题中，ChatGPT和GPT-4再次达成了共识。两者都指出，如果没有专业帮助，这个人最有可能的结果是选中的答案“F”，即被标记为“变得更糟”的情况。这是怎么回事。

**我的输入提示**：“如果玛丽/乔恩不接受任何专业帮助，她/他最有可能的结果是什么？从这些陈述中选择一个答案：A.完全恢复且没有进一步的问题；B.完全恢复，但问题可能会复发；C.部分恢复；D.部分恢复，但问题可能会复发；E.没有改善；F.变得更糟。”

**ChatGTP生成的响应**：

如果玛丽/乔恩不接受任何专业帮助，她/他最有可能的结果是：F.变得更糟。在没有专业帮助的情况下，玛丽/乔恩的精神分裂症症状可能会随着时间推移而恶化，导致更大的痛苦、功能受损和生活质量下降。若缺乏适当干预和支持，玛丽/乔恩可能经历持续或加剧的症状、进一步的社会孤立、维持关系的困难、自我照顾的挑战，甚至可能增加对自己或他人造成伤害的风险。早期干预和治疗对于管理精神分裂症和最小化疾病对其健康和功能的影响至关重要。

**GPT-4生成的响应**：

若未接受任何专业帮助，依据描述的症状，最可能的结果是F.变得更糟。如果没有治疗，像精神分裂症这样的涉及精神病症状的疾病通常会进展，症状可能会加剧。这可能导致社会、职业及个人功能显著下降。此外，未经治疗的精神病可能导致严重的并发症，包括自伤或伤人的风险增加，以及深刻的的社会孤立。

如果不接受治疗，涉及精神病症状的疾病（如精神分裂症）通常会恶化，症状可能会加剧。这可能导致社会、职业和个人功能的显著退化。此外，未经治疗的精神病可能会导致严重的并发症，包括自残或伤害他人的风险增加，以及严重的社会孤立。

**问题#5：给出长期预后**
在问题#5中，我们得到了一些不同的答案。关于负面结果，ChatGPT比GPT-4更为乐观，而两者在正面结果上大致相同。尽管我没有要求，GPT-4还是提供了解释。这里有一个有用的提示。在使用生成式AI时，你可以考虑明确要求AI提供解释。这可以在许多方面有所帮助。一种帮助方式是你可以检查解释以确定你认为给出的答案是否有道理。第二种有用之处是有时通过被迫给出解释，AI回答问题的表现会更好，详见我对此的进一步讨论：链接在这里。以下是回应。

**我的输入提示**：“你认为Mary/Jone与社区中的其他人相比，在长期内会如何？根据以下刻度对以下陈述进行评级：（i）更有可能，（ii）同样可能，或（iii）不太可能。负面长期结果：A.可能会暴力；B.可能会酗酒；C.可能会吸毒；D.可能会有不满意的友谊；E.可能会尝试自杀。正面长期结果：F.可能会更好地理解他人的情感；G.可能会有良好的婚姻；H.可能会成为一个有爱心的父母；I.可能会成为一个有生产力的工人；J.可能会表现出创造力或艺术性。”

**ChatGPT生成的回应**：

需要注意的是，预测患有精神分裂症的个体的长期结果可能是复杂且多变的，因为结果可能受到多种因素的影响，包括症状的严重程度、获得治疗和支持的机会、个人的韧性以及环境因素。然而，我将基于常见的趋势和研究结果提供一个总体评估。

负面长期结果：

– A. 可能会暴力：（iii）不太可能
– B. 可能会酗酒：（ii）同样可能
– C. 可能会吸毒：（ii）同样可能
– D. 可能会有不满意的友谊：（iii）不太可能
– E. 可能会尝试自杀：（iii）不太可能

正面长期结果：

– F. 可能会更好地理解他人的情感：（ii）同样可能
– G. 可能会有良好的婚姻：（ii）同样可能
– H. 可能会成为一个有爱心的父母：（iii）不太可能
– I. 可能会成为一个有生产力的工人：（iii）不太可能
– J. 可能会表现出创造力或艺术性：（ii）同样可能

ChatGPT回应结束

**GPT-4生成的回应**：

基于该情景和典型的结果，对于未治疗或部分治疗的类似精神分裂症的精神性障碍患者，以下是Mary/Jone与社区中的其他人相比在长期内的情况。

负面长期结果：

– A. 可能会暴力：（i）更有可能 – 虽然大多数精神分裂症患者并非暴力，但如果病情未得到治疗并且伴随严重的症状（如偏执），风险可能会增加。
– B. 可能会酗酒：（ii）同样可能 – 物质滥用可以是一种应对机制，但除非已有倾向，否则并不普遍更常见。
– C. 可能会吸毒：（ii）同样可能 – 和酒精一样，药物使用因人而异，取决于个人情况和倾向。
– D. 可能会有不满意的友谊：（i）更有可能 – 社交退缩和社交互动的挑战在精神分裂症中很常见，影响友谊。
– E. 可能会尝试自杀：（i）更有可能 – 精神分裂症患者有更高的自杀风险，尤其是如果未接受治疗。

正面长期结果：

– F. 可能会更好地理解他人的情感：（iii）不太可能 – 精神分裂症患者的社交认知可能受损，影响对他人情感的理解。
– G. 可能会有良好的婚姻：（iii）不太可能 – 精神分裂症的症状可能会使关系紧张，除非有强大的支持和有效的治疗。
– H. 可能会成为一个有爱心的父母：（iii）不太可能 – 精神病症状可能会影响养育能力，但这可以通过支持和治疗的程度而有所不同。
– I. 可能会成为一个有生产力的工人：（iii）不太可能 – 精神分裂症患者在就业方面面临挑战，主要是由于认知和社会障碍，但支持性就业项目可以改善结果。
– J. 可能会表现出创造力或艺术性：（ii）同样可能 – 创造力可以是许多精神分裂症患者的一个优势，独立于其他症状。

GPT-4回应结束

**问题#6：是否存在歧视的可能性**
这是最后一个问题是询问这个人是否可能会面临歧视。ChatGPT和GPT-4都说有可能。看看。

**我的输入提示**：“你认为如果社区中的人得知Mary/Jone的问题，她/他可能会受到其他人的歧视吗？（是/否）。”

**ChatGPT生成的回应**：

是的，如果社区中的人得知Mary/Jone的心理健康问题，她/他可能会受到其他人的歧视，特别是如果有针对精神分裂症或其他心理疾病的污名或误解。对心理健康问题者的歧视不幸地较为常见，并可能以多种形式表现出来，包括社会污名、刻板印象、偏见以及在就业、住房、医疗保健和社会交往中的歧视。这种歧视会对Mary/Jone的幸福感、自尊和生活质量产生重大负面影响，并突显了在社会中提升心理健康问题意识、理解和接纳的重要性。

**GPT-4生成的回应**：

是的，不幸的是，像精神分裂症这样的心理健康问题患者常常面临污名和歧视。这可能以多种形式出现，包括社会排斥、就业歧视以及对他行为和能力的误解。社区中对心理健康问题的认识和理解差异很大，如果没有适当的教育和倡导，歧视仍然是一个重大挑战。

**学到的经验和下一步**
生成式AI正逐渐成为心理健康领域的重要力量。除了被心理健康专业人士使用外，我们还看到公众每天都在越来越多地使用生成式AI进行周期性的心理健康咨询，有时甚至是持续的咨询。这是好还是坏？我们不知道。我们可以合理推测其中既有好的一面也有坏的一面。这就是我所说的AI的双重性。任何使用AI（如生成式AI）的行为都必然会有好的或积极的品质，同时也会有坏的或不理想的品质。需要一种ROI（投资回报率）来判断好的部分是否超过了坏的部分，以及坏的部分是否如此之差以至于我们应该想办法重新考虑获取好处的方式，即使它总是伴随着坏的部分。详见我对此的详细讨论：链接在这里。

最后的一点评论。著名的作曲家和喜剧演员奥斯卡·列文特曾幽默地说过，精神分裂症胜过独自用餐。我们是否希望生成式AI自行进行诊断并作出预后？你在上面的情景中清楚地看到了，生成式AI随时可用且迅速提供了一些看似心理健康建议的指示。毫无疑问。假设这种情况涉及一个真实的人。假设这个情景是对一个实际存在的人的隐晦描述。我们是否希望生成式AI自行进行诊断并作出预后？我们必须戴上我们的思考帽，决定在这一领域生成式AI应该在多大程度上不受限制。

有些人认为从AI那里获得心理健康建议总比没有要好。另一些人则反驳说，如果心理健康建议不当或无能为力，你可能会更好一点什么也不做。

总体而言，我希望你对生成式人工智能在心理健康领域的应用感到有趣且有启发。我会继续深入研究这个问题，尽管它很重要却尚未引起足够的重视。

常言道，时间紧迫，事情繁杂（顺便提及并致敬：奥斯卡·列文特因幽默地表示时间有限，但无事可做而闻名）。

(以上内容均由Ai生成)