快速阅读: 《JD Supra》消息,使用大型语言模型(LLM)进行文档审查时,其非确定性导致预测分数波动,影响置信度评估。单次运行可能低估模型性能,多次查询虽可改善但成本高昂。如何准确报告模型性能仍需探讨。 在依赖大型语言模型(LLMs) […]