认识这位 19 岁的少年,他正在通过 AI 驱动的词干分离改变印度古典音乐
快速阅读: 据《您的故事》最新报道,19岁的尚伊特·戈塞开发了Sur,一款专为印度古典音乐设计的人工智能stem分割和样本库工具。Sur使用AI算法和深度学习模型,经过350首印度古典音乐训练,能精准分离乐器和人声。该平台提供免费试用和订阅服务,收入分成模式确保艺术家获益。目前,Sur已吸引100名用户,目标是在一年内达到10,000多名用户。
40岁时,路德维希·范·贝多芬已经失聪,但这并未阻止他创作出标志性作品《第九交响曲》——这部杰作将影响古典音乐数个世纪。他的天才在于除了数十年的辛勤工作外,还能在从未亲耳听到的情况下想象每一种乐器层,证明了音乐的本质在于其构建模块。今天,我们将这些组成部分称为“stem”——即(人声、乐器、打击乐)等单独部分组合成完整作品的部分。虽然每种音乐流派以独特的方式组装它们的stem,印度古典音乐——以其看似相似的乐器而闻名——在隔离方面提出了特殊挑战。现有的stem分割工具由于其西方中心视角而不适用于印度古典音乐。这就是Sur发挥作用的地方。由19岁的尚伊特·戈塞开发的Sur是一款专为印度古典音乐(ICM)设计的人工智能stem分割和样本库工具。与通用工具不同,它旨在精确捕捉该流派的细微层次,使现代制作人能够轻松地将传统元素融入他们的作品中。“从第一天起,我的愿景就是引导全球音乐行业向更多利基流派的采样方向发展。这里有一整片未被发现的音乐流派。我认为印度古典音乐就是其中之一,因为有如此多的乐器和多样性,”戈塞告诉《你的故事》。
此外阅读:印度古典音乐的SaaS;将科技引入纺织业利用人工智能 戈塞是孟买奥伯伊国际学校的校友,从小音乐就一直是他的伴侣,四岁开始弹钢琴,十岁转而学习吉他。Sur的想法在他高中时期形成,当时他是乐队的主音吉他手,创作摇滚翻唱并尝试新曲目。他目前正在探索工程学士学位的课程。“每次我需要为吉他独奏准备伴奏时,我都很难找到不包含原吉他部分的歌曲版本。有时我能找到只包含人声或个别乐器的好版本,但大多数时候可用的文件都是不完整的或无法使用的,”戈塞说。
沮丧之下,他转而使用音频软件手动移除吉他部分并录制自己的独奏。这让他更深入地了解了stem的概念——即一个轨道的独立层。最终,戈塞投身于音乐制作,受到他的阿姨——一位宝莱坞音乐作曲家的影响,她向他介绍了Logic Pro X音乐制作应用程序。正是在这段时间里,他决定采样印度古典音乐中的元素,如特定的旋律和人声纹理。然而,戈塞很快意识到没有现成的工具可以从印度古典录音中分离stem,这使得在原创曲目中再现这些声音变得困难。简单来说,stem就是构成一首完整歌曲的独立音频轨道。每个stem都可以识别为音乐的一个独立元素,如人声、鼓、贝斯或旋律。“这种限制影响了任何希望在作品中加入印度古典音乐的音乐制作人或DJ。尽管做这件事的人不多,但他们面临着同样的问题。网上有音频‘分割器’,但这些工具通常是在流行、摇滚或主流西方音乐数据库上训练的,所以它们处理印度古典音乐并不好。因此,我想,‘为什么不为我的需求建立自己的数据库?’这就是Sur诞生的原因。”
Sur于2024年初推出,使用专有的AI算法,经过超过350首印度古典音乐的训练,采用先进的深度学习模型进行频率分离,并结合独立艺术家的精选样本库。戈塞主要使用一个名为Demucs的程序来处理歌曲,并将乐器保存为单独的文件。“为了构建模型,我不得不从零开始创建一个训练库。我手动分离了350首歌曲,教会模型识别印度乐器如西塔尔琴和塔布拉鼓,而不是标准的西方乐器。我发现虽然吉他和西塔尔琴听起来可能相似,但它们在不同的频率范围内运作。这需要广泛的微调来识别峰值和谷值,以及哪些应该被放大或抑制,”他说。
除了stem分割器外,该平台还通过与独立艺术家合作提供精选样本库(不受标签限制),允许他们的作品被采样,同时让他们访问多样化的图书馆用于自己的项目。此前,戈塞在Sarvam AI,一家AI创业公司,担任语音活动检测工程师2-3个月,进一步增强了他对在各种音频环境中应用AI的理解。“虽然我没有直接参与大型语言模型(LLM),但我的重点是语音识别挑战,尤其是在处理多种语言方面。使用Demucs,我采用了与乐器分离相同的方法——这次训练模型在男性和女性人声频率范围内,而不是印度乐器。在2-3个月内,我微调系统以识别平均男性和女性声音的位置,提高其准确检测和处理语音的能力,”他说。
此外阅读:从蕾哈娜到迪利普:2024年震撼音乐界的头条新闻 未来计划 全球音乐制作软件市场估值约为75亿美元,复合年增长率为9.1%。印度音乐软件市场预计到2029年将达到5亿美元。目前,这家初创公司正在寻求种子投资,著名的印度音乐作曲家兼歌手萨利姆·默克特对该倡议表示兴趣。“我向萨利姆展示了这个项目,我们一起讨论了每一个细节。他提供了诚恳的反馈,并同意帮助扩大项目规模——通过他的网络分享它,并建立一个平台,让行业内所有人都能访问,”戈塞声称。
“尚伊特的创新Sur将印度古典音乐与现代技术完美融合。其精准提取古典stem的能力对全球音乐制作人来说是一个游戏规则改变者。我真诚地相信它的潜力可以扩展,并为印度古典音乐在主流平台上找到一席之地打开新的机会,”萨利姆·默克特告诉《你的故事》。“尚伊特的愿景鼓舞人心,我很高兴在我的网络内分享Sur并支持它的旅程。这里有明确的发展路径,我期待看到Sur如何塑造音乐制作的未来,”他补充道。
Sur采用订阅模式,提供基础stem分割的免费试用,标准订阅(每月10美元)可访问精选库,高级订阅(每月20美元)则包括额外的AI功能和专属样本。Sur采用公平的收入分成模式,确保每位贡献艺术家每次他们的样本被使用都能获得收入,同时为创作者提供高质量、流派特定的工具。它旨在与Logic Pro、Ableton和FL Studio等平台合作,整合全球音乐教育项目,并成为印度古典音乐(ICM)国际上的首选平台。在竞争方面,本地工具如Spleeter缺乏针对ICM的专业能力,而全球平台如Splice和Tracklib专注于一般音乐采样,但忽视了文化差异,戈塞说。
未来,戈塞计划在接下来的几个月内探索俄罗斯和意大利音乐的采样。目前,该平台已有100名用户,目标是在一年内吸引10,000多名用户。“这一模式不仅鼓励制作人探索新的声音,也帮助独立艺术家获得认可和稳定的收入。随着更多用户加入,它设计得像其他订阅服务一样扩展,但明确关注赋能小众音乐流派,”戈塞说。
(以上内容均由Ai生成)