John Snow Labs 发布生成式 AI Lab 7.0,帮助领域专家评估和改进 LLM 应用程序并进行 HCC 编码审查
快速阅读: 据《GlobeNewswire(新闻稿)》最新报道,刘易斯市,2025年4月2日——约翰·斯诺实验室推出生成式AI实验室7.0,新增无代码功能,帮助专家评估和改进自定义大语言模型,支持HTML模板、HCC编码及多维度模型评估,促进AI安全部署。
刘易斯市,特拉华州,2025年4月2日(环球新闻专线)——专注医疗领域的人工智能公司约翰·斯诺实验室今日宣布推出生成式AI实验室7.0版本。此次更新让医生、律师等领域的专家能够以精确和透明的方式评估和改进自定义构建的大规模语言模型(LLMs)。新增的无代码功能简化了审计和调整AI模型的操作流程。尽管生成式AI实验室已作为测试、调校和部署前沿语言模型的工具被使用,但此次升级增强了评估工作流的质量。通过对比LLM输出、标注特定文本片段、进行结构化评分并导出结果,领域专家可以快速且轻松地训练或微调下游的LLMs。此次发布的亮点包括:
– 支持HTML内容的可定制项目模板,包括参考的超链接。支持两种模式:单独响应评估和并排响应评估。对于这些项目,还提供注释者间一致性(IAA)图表。
– 支持分级条件类别(HCC)编码,使用户能够通过自动将国际疾病分类(ICD)代码链接到HCC类别、优先处理高价值任务和更有效地验证代码来简化临床风险调整工作流。
– 全面且可配置的框架用于评估AI模型在准确性、偏差、鲁棒性、公平性和性能等维度的表现——使用户能够识别模型弱点、提高可靠性并通过自动化测试管理、视觉洞察和数据增强能力实现迭代模型优化。
领域专家通常最适合开发满足其特定业务需求的人工智能驱动解决方案。然而,技术能力和资源不足可能成为采用人工智能解决方案的主要障碍。生成式AI实验室通过提供易于使用的无代码平台解决了这一难题,使团队能够构建可靠的模型、识别潜在问题、评估输出质量,并将人工智能负责任地整合到关键工作流中。
“为特定用例评估自定义构建的AI模型和LLMs是复杂的,并且不能仅仅依赖公共基准。确定它们的有效性、安全性和价值需要有针对性的、上下文感知的测试,以确保模型在实际应用中可靠运行,”约翰·斯诺实验室首席执行官大卫·塔尔比表示,“借助生成式AI实验室中的新结构化评估和详细反馈,领域专家可以提高模型质量、减少错误并加速安全、可扩展的AI部署,而无需数据科学家的支持。”
点击这里了解生成式AI实验室7.0更多信息,或注册即将举办的培训课程,以查看新的并排响应评估功能的实际演示。
**关于约翰·斯诺实验室**
一家专注于医疗领域的人工智能公司,约翰·斯诺实验室提供最先进的软件、模型及数据,助力医疗与生命科学机构充分发挥AI潜力。作为医学LLMs、医疗NLP、Spark NLP、生成式AI实验室无代码平台和医疗聊天机器人的开发者,约翰·斯诺实验室屡获殊荣的医疗AI软件为全球领先的制药公司、学术医学中心和健康科技公司提供动力。作为《自然语言处理峰会》的发起方和主办单位,该公司致力于进一步教育和推动全球AI社区的发展。
**联系人**:吉娜·德文,约翰·斯诺实验室传播主管,邮箱:gina@johnsnowlabs.com
随附本公告的图片可在以下网址获取:
[https://www.globenewswire.com/NewsRoom/AttachmentNg/fed0ab53-c5fd-41e0-8078-8bca92ad7e59](https://www.globenewswire.com/NewsRoom/AttachmentNg/fed0ab53-c5fd-41e0-8078-8bca92ad7e59)
(以上内容均由Ai生成)