DeepSeek AI编码测试:三项通过,一项失败

发布时间:2025年11月7日    来源:szf
DeepSeek AI编码测试:三项通过,一项失败

快速阅读: DeepSeek测试结果显示,其在创建WordPress插件时耗时较长但代码质量高,提供贴心设计如“复制到剪贴板”按钮,前三个测试表现良好,但在最终脚本挑战中未能通过。

DeepSeek 提供了访问 DeepSeek-V3.2 模型的机会,因此我们对其进行了测试。DeepSeek 在创建 WordPress 插件方面花费的时间比其他人工智能略长,其代码也更长。不过,代码质量不错。和 Copilot 一样,DeepSeek 最初只提供了一个字段。当我在其中粘贴测试数据后,该字段会动态更新状态,显示粘贴的行数。

点击“随机排序行”按钮后,会出现第二个字段。这个字段有浅灰色背景,其他人工智能没有在输出字段上做出这种区分。

此外,DeepSeek 提供了两种方法来本地运行以保护隐私。DeepSeek 还做了一件其他人工智能未想到的事情——添加了一个“复制到剪贴板”按钮。虽然这不是必需的,因为用户可以直接选择输出文本,但这确实是一个贴心的设计。

DeepSeek 在第一次测试中表现出色。

然而,第二次测试有些奇怪。在美元和美分验证测试中,当被要求重写字符串函数时,DeepSeek 给出了两个版本。第一个版本描述为“这是允许美元和美分(最多两位小数的十进制数)的重写代码。”第二个版本被描述为“更明确的替代版本”。可能是训练过程中存在语言问题,“明确”在此上下文中不太合适。尽管如此,第一个版本的代码中有一些验证错误,而第二个版本则完美运行。DeepSeek 显然知道第一个版本不够好,但为何不直接给出第二个版本呢?

尽管这实际上增加了我的工作量,因为需要测试并比较两个版本才能做出选择,但我还是将其视为成功。

另外,在调试错误方面,DeepSeek 成功找到了框架中的错误。至此,它已经通过了四个测试中的三个。

但情况并未继续好转。在最终的脚本挑战中,DeepSeek 又提供了两个版本,这两个版本都无法使用。不仅完全忽略了提示中的 Keyboard Maestro 部分,还在每个版本中加入了多个不必要的低效进程分支,试图强制实现不区分大小写。其实 AppleScript 默认就是不区分大小写的。

如果我想要的是“我不知道,我就尝试我能想到的所有方法”的代码,我会明确提出。尽管如此,DeepSeek 在前三个测试中的表现还是值得称赞的。

(以上内容均由Ai生成)

关键词: AiDeepseek测试

你可能还想读

蒋尚义:摩尔定律放缓催动半导体变局,芯粒化解 AI 芯片成本危机

蒋尚义:摩尔定律放缓催动半导体变局,芯粒化解 AI 芯片成本危机

快速阅读: 鸿海董事蒋尚义出席2025远见高峰会,指出AI将成为半导体应用新驱动力,需多元化芯片支持广泛应用,面对摩尔定律放缓,Chiplet设计降低成本,提升竞争力。 IT之家 11 月 7 日消息,鸿海科技集团董事、前台积电联席 COO […]

发布时间:2025年11月7日
微软首款硬件Z-80 SoftCard,意外成80年代摇钱树

微软首款硬件Z-80 SoftCard,意外成80年代摇钱树

快速阅读: 微软资深工程师Raymond Chen讲述Z-80 SoftCard设计初衷及技术挑战,该扩展卡使Apple II用户能运行CP/M操作系统,售价350美元,成为微软80年代最赚钱产品之一。 11 月 7 日,IT之家报道,微软 […]

发布时间:2025年11月7日
Lloyd’s 2026年推出AI财务助手,革新移动银行体验

Lloyd’s 2026年推出AI财务助手,革新移动银行体验

快速阅读: 劳埃德银行计划2026年推出英国首款AI财务助手,通过移动应用帮助客户管理财务,已内部测试12,000次,目标覆盖2100万客户。 劳埃德银行集团宣布,计划于2026年初推出一款由人工智能驱动的财务助手,供客户使用。该行表示,这 […]

发布时间:2025年11月7日
AI先驱者困境:愿景还是数据先行?

AI先驱者困境:愿景还是数据先行?

快速阅读: 人工智能发展面临先有鸡还是先有蛋的难题:应从数据入手还是重塑业务流程?文章指出,仅凭数据无法实现显著回报,需先构想未来运营模式,再确定所需数据和技术,以实现真正变革。 人工智能的先有鸡还是先有蛋难题:愿景与数据,哪个更重要? 我 […]

发布时间:2025年11月7日
OpenAI CEO否认寻求政府支持,强调市场公平竞争

OpenAI CEO否认寻求政府支持,强调市场公平竞争

快速阅读: OpenAI CFO弗里亚称正寻求政府支持以助巨额贷款融资,降低融资成本。CEO阿尔特曼澄清公司不需政府担保,强调私营部门与政府合作重要性。 OpenAI首席执行官山姆·阿尔特曼似乎正在采取措施,以控制近期关于政府可能支持该公司 […]

发布时间:2025年11月7日
OpenAI CEO否认寻求政府担保,强调市场公平竞争

OpenAI CEO否认寻求政府担保,强调市场公平竞争

快速阅读: OpenAI CFO Sarah Friar提出公司寻求政府对其基础设施贷款的支持,引发关于政府是否应资助AI公司的争论。CEO Sam Altman澄清公司不需要政府担保,强调自身盈利能力和长期规划。 OpenAI首席执行官S […]

发布时间:2025年11月7日
企业需先治理数据再推进AI,避免业务受损

企业需先治理数据再推进AI,避免业务受损

快速阅读: AI技术快速发展,但数据质量问题引起关注。专家指出,缺乏良好数据治理可能导致AI项目失败,强调数据治理重要性,建议企业谨慎采用AI,重视数据质量和治理,以实现长期竞争优势。 近年来,人工智能(AI)技术迅速发展,逐渐渗透到商业企 […]

发布时间:2025年11月7日
研究称中国AI模型风险水平接近美国同行

研究称中国AI模型风险水平接近美国同行

快速阅读: Concordia AI研究显示,中国AI系统如DeepSeek的前沿风险接近美国水平,增加恶意利用风险。评估基于50个模型,关注公共安全和社会稳定的潜在威胁。 据一项研究显示,中国的AI系统正接近与美国同行类似的“前沿风险”水 […]

发布时间:2025年11月7日