华为芯片助力重训DeepSeek模型,大幅提升安全性能
快速阅读: 大学利用华为芯片构建再训练框架,调整DeepSeek模型,对抗14种恶意威胁成功率近100%,命名DeepSeek-R1-Safe,抗破解能力强,性能仅下降1%。
大学解释了如何利用华为芯片构建了一个再训练框架,该框架重新调整了DeepSeek模型,使其在对抗14种常见恶意威胁时达到了接近100%的成功率,这些威胁包括有毒有害言论、政治敏感内容以及煽动非法行为。重新训练后的模型被命名为DeepSeek-R1-Safe,其抗破解能力也得到了增强。与DeepSeek-R1相比,该模型仅损失了1%的性能。
(以上内容均由Ai生成)