8 月前获得第一本泰卢固语 LLM,以当地方言获取信息
快速阅读: 《印度时报》消息,海得拉巴即将发布首个泰卢固语大型语言模型(LLM),由国际信息技术研究院(IIITH)和斯韦查合作推出。该模型将于八月发布完整版,可搜索泰卢固文化、文学等,并支持文本翻译。项目已数字化八亿页书籍和四千小时语音数据。IIITH教授拉梅什·洛加纳坦表示,此模型将在八月推出,可用于查询泰卢固语相关数据。模型将在四月的人工智能日会议上发布基础版本。
海得拉巴:很快,人们将能够搜索泰卢固文化、文学、地区,甚至可以将任何文本翻译成本地方言,因为首个泰卢固语的大型语言模型(LLM)即将在八月发布。国际信息技术研究院(IIITH)和斯韦查共同推出了维斯瓦姆.ai,旨在为发展中国家和地区创建人工智能解决方案,并计划在四月的人工智能日会议上发布基础版本,在八月发布第一个完整版本。“与英语不同,泰卢固语,或者更确切地说,任何区域语言,在数字方面都处于饥饿状态。我们成功地为该语言创建了一个庞大的数据集。我们数字化了八亿页书籍和四千小时的语音数据,其中包括各种泰卢固语口音。利用这些数据,我们计划在八月推出首个泰卢固语的大型语言模型”,IIITH创新实践教授拉梅什·洛加纳坦说。
他表示,使用该模型可以查找有关泰卢固语或泰卢固邦的食物、艺术、寺庙、堡垒和职业的任何数据。“然而,由于语言限制,它无法提供像OpenAI那样的信息,”他补充道。在人工智能日会议的第二天,团队计划组织一次编程马拉松并发布泰卢固语的大型语言模型的基础版本。会议结束后,他们计划招募十万名实习生,通过采访收集数据,以创建更强大的数据集,以便在八月前推出首个泰卢固语的大型语言模型。维斯瓦姆.ai中心负责人Y Kiran Chandra表示,该模型将是开放的,任何人都可以使用它,甚至可以修改源代码来创建自己的模型。“我们在2023年首次开始数字化《坎达玛玛故事》时就奠定了这一基础。现在,我们拥有丰富的数据集,这使得推出首个泰卢固语人工智能成为可能,”他补充道。
请关注最新的消息、天气预报、银行休假日和三月即将到来的公共假期。
(以上内容均由Ai生成)