“AI 必须从一开始就与正确的价值观保持一致”：Ctgt 的 Cyril Gorlla

快速阅读: 《印度快运》消息，CTGT完成720万美元种子轮融资，其技术能消除AI偏见和审查。创始人戈拉介绍，该技术无需重新训练模型即可大幅提高效率，并有效减少幻觉现象。他认为AI应体现民主价值观，增强而非取代人类工作，美国应在AI竞赛中以价值观胜出。

CTGT最近在超额认购的种子轮融资中筹集了720万美元。本轮融资由Gradient领投，Google早期的人工智能基金参与，General Catalyst、Y Combinator、Liquid 2、Deepwater等知名天使投资人也提供了支持。戈拉与特雷弗·塔特共同创立了CTGT，塔特同时担任公司的首席技术官。年初时，中国人工智能初创公司深度求索（DeepSeek）因推出其旗舰AI模型DeepSeek-R1而备受全球关注。据说这款模型的成本仅为顶级AI模型（如OpenAI、微软、谷歌等）投资成本的几分之一。然而，除了成本效益外，DeepSeek-R1也因其明显的偏见而备受瞩目。

由戈拉领导的CTGT开发了一种数学方法，在模型层面消除审查和偏见。CTGT分离并调整了负责过滤偏见的内部模型特性。该公司声称，这种方法消除了反向传播的需要，使模型能够训练、定制和发展快500倍。通过这种方法，该公司能够立即识别导致偏见和审查的模型特征，将其隔离并进行修改。在测试中，CTGT成功在100%的情况下消除了DeepSeek R1中的偏见和审查。据该公司称，这种方法可以应用于任何开放权重模型以去除偏见。

**消除偏见和审查**

当被问及他们是如何从DeepSeek模型中剥离审查和偏见时，他说：“当DeepSeek推出时，由于其偏见引发了国家安全担忧。我们决定公开展示我们的平台已具备的能力。我们分析了在敏感查询（如天安门广场）期间哪些神经元被激活。尽管模型拥有这些知识，却被压制了。我们识别并削弱了这些审查特征的影响，使模型能够自由响应而不需重新训练。”

由于该公司声称在消除偏见和审查方面取得了100%的成功率，我们询问他们是如何测试和验证这一点的。戈拉回应说，在CTGT，他们使用了一组通常会被DeepSeek屏蔽的专有提示数据集。“最初，DeepSeek只回答了大约32%的提示。经过我们的干预后，它几乎回答了所有提示。这些查询范围从政治敏感话题到一般的偏见输出。我们通过比较干预前后拒绝率和答案完整度来验证改进。”

**关于AI社区和投资者的反应**

关于AI社区和投资者对他们方法的反应，戈拉表示，他们的论文、推文和他的华盛顿演讲获得了超过百万次的观看次数。“我认为这引起了广泛反响，因为它展示了新的路径，从第一原理理解模型，而不仅仅是扩大规模。我们的工作让智能、个性化的人工智能成为可能，而无需昂贵的微调，使其更加可访问，并与民主价值观保持一致。”

**幻觉和对人工智能的担忧**

对于AI模型来说，幻觉是指模型生成的事实错误、误导性或有时甚至无意义的输出。有趣的是，这些输出起初可能会显得令人信服。当被问及他们的方法如何解决幻觉问题时，戈拉表示，目前大多数幻觉预防措施都涉及提示工程，这反而会降低模型性能。“我们的方法识别出导致幻觉的具体特征，就像那个臭名昭著的谷歌模型所说的在披萨上涂胶水一样。我们通过数学方式识别并削弱错误特征的影响，而不会降低整体性能，”戈拉解释道。

同样地，戈拉还谈到了人们对医疗保健和金融等关键领域中人工智能的担忧。根据UC圣地亚哥HDSI校友的说法，GTCT的平台基于可靠的来源构建模型，允许精准控制。“例如，网络安全客户输入内部文件，我们会隔离相关特征。在医疗保健领域，我们帮助改善床边礼仪和事实性回应。这些并非数学基准，而是微妙的人际互动，我们允许客户直接嵌入自己的价值观。”

**人工智能是严重威胁还是误解？**

在对话中，戈拉还分享了他对人工智能快速发展及其恐惧和希望的看法。关于OpenAI高级图像生成器的爆炸式发展以及AI生成艺术和版权的状态，戈拉表示他将其视为创造力的民主化。“想想汽车取代马车，那也很有争议。人工智能让人们表达想法，否则他们可能不会拿起铅笔。现在限制的不再是技术技能，而是创造力和构思。这是一个强大的转变，”他说。

当被问及人工智能是否对就业构成严重威胁或只是误解时，戈拉表示“这是复杂的”。他认为，即使人工智能优于人类，人们也会抗拒被替代。他坚信，在法律和医疗等专业领域，人类将长期存在。然而，在像文案撰写或营销这样的可替代角色中，人工智能将会带来变革。“这不是替代，而是增强。那些使用人工智能的人可以将他们的产出提高10倍或100倍。那些不使用的人可能会被淘汰。”

**人工智能的未来展望**

当被问及他对人工智能未来的展望以及最担心什么时，戈拉表示他最大的担忧一直是盲目追求规模，他将其描述为“只是制造更大的黑箱”。戈拉提倡“有原则和理性的”方法，其中模型是可理解的、价值一致的和个性化的。“这就是我们正在建设的未来：安全、可信的AI，反映个人，而不是公司或国家。”

在中国和美国之间持续的AI军备竞赛中，戈拉强调美国不需要通过规模取胜，而是通过价值观取胜。这位年轻的企业家和创新者认为美国应该倾向于开放性、思想多样性和安全部署。“这就是我告诉白宫和国会的：胜利在于有原则、可信的AI，将控制权交到用户手中。”

(以上内容均由Ai生成)