开源 LLM 为印度的负责任 AI 铺平了道路

发布时间:2025年5月21日    来源:szf
开源 LLM 为印度的负责任 AI 铺平了道路

快速阅读: 《印度分析杂志》消息,开源大模型助力印度发展负责任AI。专家指出,通过微调模型以反映国家多样性,可提升AI道德与效率。强调消除偏见、保障数据安全及制定伦理准则的重要性,印度正利用AI应对社会挑战。

开源大型语言模型正成为印度追求负责任人工智能的重要工具。通过允许开发者基于本地相关数据集微调模型,组织正在构建能够体现国家多样性的解决方案。在最近与《AIM》的对话中,由Meta支持,瓦德瓦尼人工智能的首席AI/ML科学家阿尔潘·拉瓦尔和联合关怀公司的首席技术官兼联合创始人索拉夫·班纳吉解释了这种方法如何使人工智能既更具道德又更有效。

“我们在医疗、农业和基础教育领域进行项目,利用大型语言模型(LLMs),其中一些得到Meta的支持,”拉瓦尔说。构建可靠的生成式人工智能互动,确保模型的一致性、准确性及可预测性。

拉瓦尔进一步补充说,开源模型在微调、在其顶部添加额外层以及从头开始重新训练方面提供了很多自由度。阿尔潘分享了另一个例子,他们使用人工智能开发了一种口语流利度评估工具,目前部署在印度古吉拉特邦的公立学校中。这一倡议利用了AI4Bharat的开源模型。拉瓦尔表示,他们从全州收集学生数据,并利用这些学生数据和通过伪标签生成的合成数据对更先进的模型进行了训练。他强调,如果没有基础模型的开源化,这项成果便无法达成。

班纳吉补充说,如果任何公司正在针对垂直用例,最好的方法是选择一个开源模型并在其上进行后训练。“我们应该专注于现有预训练模型的后训练,并与用例一起工作,”他说。

解决偏见

阿尔潘说,开源本身并不能神奇地消除偏见。“这取决于方法论、模型训练所使用的数据类型等,”他说。他解释说,许多开源模型是在与农村和未服务社区观察到的数据差异显著的数据集上训练的。“为了防止偏见,我们必须对这些数据集进行微调,这是必不可少的。”

阿尔潘说,开源本身并不能神奇地消除偏见。“这取决于方法论、模型训练所使用的数据类型等,”他说。班纳吉讨论幻觉时说,LLMs不会停止产生幻觉,我们不得不接受这一点。然而,他认为将权重、偏差和训练方法公开是有道理的。他解释说,这种透明性允许公众审查并帮助识别内在错误。“将其公开以接受公众审查。让人们决定他们要进入什么,而不是封闭、封闭的方法。”

他还对偏见提出了细致入微的观点,认为它并不总是负面的。他举了一些常见的人工智能局限性的例子,例如生成一个模拟时钟在6:25或左撇子书写的图像。班纳吉解释说,这些局限性源于训练数据偏向某些表现形式。为了提高模型准确性,他说可能有必要引入一种不同的偏见,他称之为积极偏见。他以医疗为例,说明准确性比完全中立更重要。在这种情况下,增加积极偏见可以帮助系统更加准确,即使这意味着做出权衡。

安全与人工智能护栏

对于社会领域的组织来说,个人身份信息(PII)的安全仍然是首要关注点。阿尔潘说:“我们有一个规则——大致来说——我们根本不将PII引入组织,除非在某些情况下我们别无选择。”

关于伦理护栏和治理,阿尔潘说没有“一刀切”的解决方案。开源模型的伦理使用取决于其预期应用。另一方面,班纳吉说由于人工智能处理和训练的分散性质,需要类似航空安全的“政府间倡议”。他补充说,尤其是在人机交互领域,需要明确的指导方针,明确“哪些行为在某个领域是可以接受的,哪些是不可接受的”。

班纳吉说,印度不应盲目效仿西方,而应为自己在负责任人工智能方面的工作感到自豪,并赞扬NASSCOM的开发者指南。他表示,开发者指南非常实用,是个人和组织理解自身责任的重要参考,无论是在使用、构建还是微调基础模型时。

阿尔潘说,印度在利用人工智能造福社会方面的领导地位得到了强有力的政府合作的支持。“印度是世界上第一个强调人工智能造福社会的国家——这不仅体现在形式上,也体现在实质上,”他补充道。他还表示,开源人工智能正被用于解决从医疗、农业到教育和气候等领域的紧迫挑战。“纳丹·尼莱肯多次说过,印度将成为世界的应用案例之都,这同样适用于人工智能,”他总结道。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日