聊天机器人可以成为您的治疗师吗?一项研究发现,正确的护栏具有“惊人的潜力”
快速阅读: 据《CNET 公司》称,研究显示,定制的AI聊天机器人“Therabot”在减轻抑郁、焦虑和饮食失调症状方面效果显著,但需人类监督。尽管AI能全天候提供支持,但不当使用可能带来风险,建议谨慎对待AI提供的心理健康建议。
你的未来治疗师可能是一个聊天机器人,你可能会看到积极的结果,但不要急于向聊天机器人分享你的感受。
达特茅斯大学的一项新研究表明,一种旨在充当治疗师的生成式人工智能工具,对患有抑郁症、焦虑症和饮食失调的患者带来了显著改善——但这种工具仍需要人类专家的严密监管。这项研究于今年3月发表在《新英格兰医学杂志·人工智能》上。
研究人员对106名使用达特茅斯大学近年来开发的智能手机应用“Therabot”的参与者进行了试验。样本量虽然较小,但研究人员表示这是首个针对AI疗法聊天机器人的临床试验。结果显示了显著的优势,主要是因为该机器人可以全天候提供服务,填补了传统疗法中患者面临的即时性差距。
然而,研究人员警告说,如果操作不当,生成式AI辅助疗法可能会带来危险。“我认为这个领域还有许多需要发展的空间,”该研究的资深作者、达特茅斯大学生物医学数据科学与精神病学副教授尼克·雅各布森说。“它在个性化和可扩展影响方面潜力巨大。”
**欲了解更多:苹果的AI医生可能会在2026年见到你**
**Therabot研究**
210名参与者被分为两组——一组106人被允许使用聊天机器人,而对照组则留在“等待名单”上。参与者在测试期前后通过标准化评估对其焦虑、抑郁或饮食失调症状进行了评估。
在最初的四周内,应用程序提示用户每天与其互动。在接下来的四周内,提示停止,但人们仍然可以自行参与。研究参与者实际上使用了该应用程序,研究人员表示他们惊讶于人们与机器人沟通的频率和深度。在接受调查后,参与者报告称与面对面治疗师相似的信任和合作程度。交互时间也值得注意,在深夜及其他患者常感担忧的时间段内交互次数明显增加。
这些是联系人类治疗师特别困难的时间段。“有了Therabot,人们会在试验期间在其日常生活中最需要的时候访问并确实访问它,”雅各布森说。这包括在凌晨两点因焦虑难以入睡或在经历困难时刻后立即的情况。
患者的后续评估显示,重度抑郁症症状降低了51%,广泛性焦虑障碍症状降低了31%,而有特定条件风险的患者饮食失调症状降低了19%。
“参加试验的人不仅仅是轻度病例,”雅各布森说。“该组成员在开始时在抑郁方面中度至严重。但平均而言,他们的症状减少了50%,从严重到轻微,从中度到几乎消失。”
患者的后续评估显示,重度抑郁症症状降低了51%,广泛性焦虑障碍症状降低了31%,而有特定条件风险的患者饮食失调症状降低了19%。
**Therabot的独特之处**
研究团队并没有仅仅选择100多名需要支持的人,给他们访问像OpenAI的ChatGPT这样的大型语言模型并观察结果。Therabot是定制构建的——经过人工精心训练——以遵循特定的治疗程序。它被设计用来关注严重的关切事项,如潜在的自我伤害迹象,并报告以便在需要时由人类专业人士介入。人类还会追踪机器人的交流内容,以便在机器人说出不当内容时进行干预。
雅各布森在研究的最初四周表示,由于对机器人行为的不确定性,他尽可能快地阅读了每一条消息。“我在试验的初期没有睡多少觉,”他说。
雅各布森说,人类干预很少。两年前对早期模型的测试显示超过90%的响应符合最佳实践。当研究人员确实进行干预时,通常是因为机器人提供的建议超出了治疗师的范围——例如,尝试提供更一般的医疗建议,如如何治疗性传播疾病,而不是将患者转介给医疗服务提供者。
“其具体建议均属合理范畴,但这超出了我们提供的护理范围。”
Therabot并非典型的大型语言模型;它本质上是人工精心训练的。雅各布森说,一个超过100人的团队使用治疗师应对真实人类经验的最佳实践创建了一个数据集。“只有最高质量的数据最终成为其中的一部分,”他说。
像谷歌的Gemini或Anthropic的Claude这类通用型模型训练的数据远远超过仅限于医学文献的内容,可能会做出不恰当的反应。
雅各布森说,人类干预很少。两年前对早期模型的测试显示超过90%的响应符合最佳实践。当研究人员确实进行干预时,通常是因为机器人提供的建议超出了治疗师的范围——例如,尝试提供更一般的医疗建议,如如何治疗性传播疾病,而不是将患者转介给医疗服务提供者。
“其具体建议均属合理范畴,但这超出了我们提供的护理范围。”
**生成式AI能成为你的治疗师吗?**
达特茅斯大学的研究表明,专门构建的生成式AI工具在某些情况下可能是有用的,但这并不意味着任何AI聊天机器人都可以成为你的治疗师。这是一个由人类专家监控的受控研究,自行尝试存在危险。
生成式AI能成为你的治疗师吗?
记住,大多数通用大型语言模型是在互联网上的海量数据上进行训练的。因此,虽然它们有时可以提供一些良好的心理健康指导,但也包含错误信息——比如虚构的治疗师的行为,或者人们在网上论坛上关于心理健康的内容。
“在健康环境中,它们的行为方式有许多非常不安全的地方,”他说。
即使提供有益建议的聊天机器人也可能在错误的环境中造成危害。雅各布森说,如果你告诉聊天机器人你在减肥,它会想出帮助你的方法。但如果正在处理饮食失调问题,这可能会有害。
许多人已经在使用聊天机器人来执行类似于治疗师的工作任务。雅各布森说你应该小心。
即使提供有益建议的聊天机器人也可能在错误的环境中造成危害。雅各布森说,如果你告诉聊天机器人你在减肥,它会想出帮助你的方法。但如果正在处理饮食失调问题,这可能会有害。
“就其训练方式而言,它与互联网的质量非常接近,”他说。“那里既有优质内容,也有危险内容。”
雅各布森说,对待从聊天机器人获得的任何内容都要像对待不熟悉的网站一样持怀疑态度。即使它看似更精致,但仍可能存在不准确性。
如果你或你身边的人正面临紧急情况,请联系国家饮食失调协会获取相关帮助资源。
如果你觉得自己或你认识的人处于紧急状况,请拨打988或发送“NEDA”到741741以连接危机短信热线求助。
(以上内容均由Ai生成)