“AI 必须从一开始就与正确的价值观保持一致”:Ctgt 的 Cyril Gorlla
快速阅读: 《印度快运》消息,CTGT完成720万美元种子轮融资,其技术能消除AI偏见和审查。创始人戈拉介绍,该技术无需重新训练模型即可大幅提高效率,并有效减少幻觉现象。他认为AI应体现民主价值观,增强而非取代人类工作,美国应在AI竞赛中以价值观胜出。
CTGT最近在超额认购的种子轮融资中筹集了720万美元。本轮融资由Gradient领投,Google早期的人工智能基金参与,General Catalyst、Y Combinator、Liquid 2、Deepwater等知名天使投资人也提供了支持。戈拉与特雷弗·塔特共同创立了CTGT,塔特同时担任公司的首席技术官。年初时,中国人工智能初创公司深度求索(DeepSeek)因推出其旗舰AI模型DeepSeek-R1而备受全球关注。据说这款模型的成本仅为顶级AI模型(如OpenAI、微软、谷歌等)投资成本的几分之一。然而,除了成本效益外,DeepSeek-R1也因其明显的偏见而备受瞩目。
由戈拉领导的CTGT开发了一种数学方法,在模型层面消除审查和偏见。CTGT分离并调整了负责过滤偏见的内部模型特性。该公司声称,这种方法消除了反向传播的需要,使模型能够训练、定制和发展快500倍。通过这种方法,该公司能够立即识别导致偏见和审查的模型特征,将其隔离并进行修改。在测试中,CTGT成功在100%的情况下消除了DeepSeek R1中的偏见和审查。据该公司称,这种方法可以应用于任何开放权重模型以去除偏见。
**消除偏见和审查**
当被问及他们是如何从DeepSeek模型中剥离审查和偏见时,他说:“当DeepSeek推出时,由于其偏见引发了国家安全担忧。我们决定公开展示我们的平台已具备的能力。我们分析了在敏感查询(如天安门广场)期间哪些神经元被激活。尽管模型拥有这些知识,却被压制了。我们识别并削弱了这些审查特征的影响,使模型能够自由响应而不需重新训练。”
由于该公司声称在消除偏见和审查方面取得了100%的成功率,我们询问他们是如何测试和验证这一点的。戈拉回应说,在CTGT,他们使用了一组通常会被DeepSeek屏蔽的专有提示数据集。“最初,DeepSeek只回答了大约32%的提示。经过我们的干预后,它几乎回答了所有提示。这些查询范围从政治敏感话题到一般的偏见输出。我们通过比较干预前后拒绝率和答案完整度来验证改进。”
**关于AI社区和投资者的反应**
关于AI社区和投资者对他们方法的反应,戈拉表示,他们的论文、推文和他的华盛顿演讲获得了超过百万次的观看次数。“我认为这引起了广泛反响,因为它展示了新的路径,从第一原理理解模型,而不仅仅是扩大规模。我们的工作让智能、个性化的人工智能成为可能,而无需昂贵的微调,使其更加可访问,并与民主价值观保持一致。”
**幻觉和对人工智能的担忧**
对于AI模型来说,幻觉是指模型生成的事实错误、误导性或有时甚至无意义的输出。有趣的是,这些输出起初可能会显得令人信服。当被问及他们的方法如何解决幻觉问题时,戈拉表示,目前大多数幻觉预防措施都涉及提示工程,这反而会降低模型性能。“我们的方法识别出导致幻觉的具体特征,就像那个臭名昭著的谷歌模型所说的在披萨上涂胶水一样。我们通过数学方式识别并削弱错误特征的影响,而不会降低整体性能,”戈拉解释道。
同样地,戈拉还谈到了人们对医疗保健和金融等关键领域中人工智能的担忧。根据UC圣地亚哥HDSI校友的说法,GTCT的平台基于可靠的来源构建模型,允许精准控制。“例如,网络安全客户输入内部文件,我们会隔离相关特征。在医疗保健领域,我们帮助改善床边礼仪和事实性回应。这些并非数学基准,而是微妙的人际互动,我们允许客户直接嵌入自己的价值观。”
**人工智能是严重威胁还是误解?**
在对话中,戈拉还分享了他对人工智能快速发展及其恐惧和希望的看法。关于OpenAI高级图像生成器的爆炸式发展以及AI生成艺术和版权的状态,戈拉表示他将其视为创造力的民主化。“想想汽车取代马车,那也很有争议。人工智能让人们表达想法,否则他们可能不会拿起铅笔。现在限制的不再是技术技能,而是创造力和构思。这是一个强大的转变,”他说。
当被问及人工智能是否对就业构成严重威胁或只是误解时,戈拉表示“这是复杂的”。他认为,即使人工智能优于人类,人们也会抗拒被替代。他坚信,在法律和医疗等专业领域,人类将长期存在。然而,在像文案撰写或营销这样的可替代角色中,人工智能将会带来变革。“这不是替代,而是增强。那些使用人工智能的人可以将他们的产出提高10倍或100倍。那些不使用的人可能会被淘汰。”
**人工智能的未来展望**
当被问及他对人工智能未来的展望以及最担心什么时,戈拉表示他最大的担忧一直是盲目追求规模,他将其描述为“只是制造更大的黑箱”。戈拉提倡“有原则和理性的”方法,其中模型是可理解的、价值一致的和个性化的。“这就是我们正在建设的未来:安全、可信的AI,反映个人,而不是公司或国家。”
在中国和美国之间持续的AI军备竞赛中,戈拉强调美国不需要通过规模取胜,而是通过价值观取胜。这位年轻的企业家和创新者认为美国应该倾向于开放性、思想多样性和安全部署。“这就是我告诉白宫和国会的:胜利在于有原则、可信的AI,将控制权交到用户手中。”
(以上内容均由Ai生成)