“AI 必须从一开始就与正确的价值观保持一致”:Ctgt 的 Cyril Gorlla

发布时间:2025年4月16日    来源:szf
“AI 必须从一开始就与正确的价值观保持一致”:Ctgt 的 Cyril Gorlla

快速阅读: 《印度快运》消息,CTGT完成720万美元种子轮融资,其技术能消除AI偏见和审查。创始人戈拉介绍,该技术无需重新训练模型即可大幅提高效率,并有效减少幻觉现象。他认为AI应体现民主价值观,增强而非取代人类工作,美国应在AI竞赛中以价值观胜出。

CTGT最近在超额认购的种子轮融资中筹集了720万美元。本轮融资由Gradient领投,Google早期的人工智能基金参与,General Catalyst、Y Combinator、Liquid 2、Deepwater等知名天使投资人也提供了支持。戈拉与特雷弗·塔特共同创立了CTGT,塔特同时担任公司的首席技术官。年初时,中国人工智能初创公司深度求索(DeepSeek)因推出其旗舰AI模型DeepSeek-R1而备受全球关注。据说这款模型的成本仅为顶级AI模型(如OpenAI、微软、谷歌等)投资成本的几分之一。然而,除了成本效益外,DeepSeek-R1也因其明显的偏见而备受瞩目。

由戈拉领导的CTGT开发了一种数学方法,在模型层面消除审查和偏见。CTGT分离并调整了负责过滤偏见的内部模型特性。该公司声称,这种方法消除了反向传播的需要,使模型能够训练、定制和发展快500倍。通过这种方法,该公司能够立即识别导致偏见和审查的模型特征,将其隔离并进行修改。在测试中,CTGT成功在100%的情况下消除了DeepSeek R1中的偏见和审查。据该公司称,这种方法可以应用于任何开放权重模型以去除偏见。

**消除偏见和审查**

当被问及他们是如何从DeepSeek模型中剥离审查和偏见时,他说:“当DeepSeek推出时,由于其偏见引发了国家安全担忧。我们决定公开展示我们的平台已具备的能力。我们分析了在敏感查询(如天安门广场)期间哪些神经元被激活。尽管模型拥有这些知识,却被压制了。我们识别并削弱了这些审查特征的影响,使模型能够自由响应而不需重新训练。”

由于该公司声称在消除偏见和审查方面取得了100%的成功率,我们询问他们是如何测试和验证这一点的。戈拉回应说,在CTGT,他们使用了一组通常会被DeepSeek屏蔽的专有提示数据集。“最初,DeepSeek只回答了大约32%的提示。经过我们的干预后,它几乎回答了所有提示。这些查询范围从政治敏感话题到一般的偏见输出。我们通过比较干预前后拒绝率和答案完整度来验证改进。”

**关于AI社区和投资者的反应**

关于AI社区和投资者对他们方法的反应,戈拉表示,他们的论文、推文和他的华盛顿演讲获得了超过百万次的观看次数。“我认为这引起了广泛反响,因为它展示了新的路径,从第一原理理解模型,而不仅仅是扩大规模。我们的工作让智能、个性化的人工智能成为可能,而无需昂贵的微调,使其更加可访问,并与民主价值观保持一致。”

**幻觉和对人工智能的担忧**

对于AI模型来说,幻觉是指模型生成的事实错误、误导性或有时甚至无意义的输出。有趣的是,这些输出起初可能会显得令人信服。当被问及他们的方法如何解决幻觉问题时,戈拉表示,目前大多数幻觉预防措施都涉及提示工程,这反而会降低模型性能。“我们的方法识别出导致幻觉的具体特征,就像那个臭名昭著的谷歌模型所说的在披萨上涂胶水一样。我们通过数学方式识别并削弱错误特征的影响,而不会降低整体性能,”戈拉解释道。

同样地,戈拉还谈到了人们对医疗保健和金融等关键领域中人工智能的担忧。根据UC圣地亚哥HDSI校友的说法,GTCT的平台基于可靠的来源构建模型,允许精准控制。“例如,网络安全客户输入内部文件,我们会隔离相关特征。在医疗保健领域,我们帮助改善床边礼仪和事实性回应。这些并非数学基准,而是微妙的人际互动,我们允许客户直接嵌入自己的价值观。”

**人工智能是严重威胁还是误解?**

在对话中,戈拉还分享了他对人工智能快速发展及其恐惧和希望的看法。关于OpenAI高级图像生成器的爆炸式发展以及AI生成艺术和版权的状态,戈拉表示他将其视为创造力的民主化。“想想汽车取代马车,那也很有争议。人工智能让人们表达想法,否则他们可能不会拿起铅笔。现在限制的不再是技术技能,而是创造力和构思。这是一个强大的转变,”他说。

当被问及人工智能是否对就业构成严重威胁或只是误解时,戈拉表示“这是复杂的”。他认为,即使人工智能优于人类,人们也会抗拒被替代。他坚信,在法律和医疗等专业领域,人类将长期存在。然而,在像文案撰写或营销这样的可替代角色中,人工智能将会带来变革。“这不是替代,而是增强。那些使用人工智能的人可以将他们的产出提高10倍或100倍。那些不使用的人可能会被淘汰。”

**人工智能的未来展望**

当被问及他对人工智能未来的展望以及最担心什么时,戈拉表示他最大的担忧一直是盲目追求规模,他将其描述为“只是制造更大的黑箱”。戈拉提倡“有原则和理性的”方法,其中模型是可理解的、价值一致的和个性化的。“这就是我们正在建设的未来:安全、可信的AI,反映个人,而不是公司或国家。”

在中国和美国之间持续的AI军备竞赛中,戈拉强调美国不需要通过规模取胜,而是通过价值观取胜。这位年轻的企业家和创新者认为美国应该倾向于开放性、思想多样性和安全部署。“这就是我告诉白宫和国会的:胜利在于有原则、可信的AI,将控制权交到用户手中。”

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日