快速阅读: 谷歌AI发布Stax工具,帮助开发者有效测试大语言模型,提供“快速比较”和“项目与数据集”功能,支持自定义评估器,提升模型评估的针对性和效率。 谷歌 AI 最近发布了一款名为 Stax 的实验性评估工具,旨在帮助开发者更有效地测 […]