DeepSeek AI编码测试:三项通过,一项失败
快速阅读: DeepSeek测试结果显示,其在创建WordPress插件时耗时较长但代码质量高,提供贴心设计如“复制到剪贴板”按钮,前三个测试表现良好,但在最终脚本挑战中未能通过。
DeepSeek 提供了访问 DeepSeek-V3.2 模型的机会,因此我们对其进行了测试。DeepSeek 在创建 WordPress 插件方面花费的时间比其他人工智能略长,其代码也更长。不过,代码质量不错。和 Copilot 一样,DeepSeek 最初只提供了一个字段。当我在其中粘贴测试数据后,该字段会动态更新状态,显示粘贴的行数。
点击“随机排序行”按钮后,会出现第二个字段。这个字段有浅灰色背景,其他人工智能没有在输出字段上做出这种区分。
此外,DeepSeek 提供了两种方法来本地运行以保护隐私。DeepSeek 还做了一件其他人工智能未想到的事情——添加了一个“复制到剪贴板”按钮。虽然这不是必需的,因为用户可以直接选择输出文本,但这确实是一个贴心的设计。
DeepSeek 在第一次测试中表现出色。
然而,第二次测试有些奇怪。在美元和美分验证测试中,当被要求重写字符串函数时,DeepSeek 给出了两个版本。第一个版本描述为“这是允许美元和美分(最多两位小数的十进制数)的重写代码。”第二个版本被描述为“更明确的替代版本”。可能是训练过程中存在语言问题,“明确”在此上下文中不太合适。尽管如此,第一个版本的代码中有一些验证错误,而第二个版本则完美运行。DeepSeek 显然知道第一个版本不够好,但为何不直接给出第二个版本呢?
尽管这实际上增加了我的工作量,因为需要测试并比较两个版本才能做出选择,但我还是将其视为成功。
另外,在调试错误方面,DeepSeek 成功找到了框架中的错误。至此,它已经通过了四个测试中的三个。
但情况并未继续好转。在最终的脚本挑战中,DeepSeek 又提供了两个版本,这两个版本都无法使用。不仅完全忽略了提示中的 Keyboard Maestro 部分,还在每个版本中加入了多个不必要的低效进程分支,试图强制实现不区分大小写。其实 AppleScript 默认就是不区分大小写的。
如果我想要的是“我不知道,我就尝试我能想到的所有方法”的代码,我会明确提出。尽管如此,DeepSeek 在前三个测试中的表现还是值得称赞的。
(以上内容均由Ai生成)