苏北网
当前位置:首页>综合 >

DeepMusic:最有音乐气质的AI公司

时间 2023-04-14 08:54:48 来源:金融界  

2016年,谷歌的人工智能开发者们推出了一个名叫“Magenta”的项目,尝试用AI来生成音乐。那时,即便是最先进的AI,也难以模仿艺术家创作的绘画或者音乐,至于自主生成、AIGC的概念,就更遥远了。

也正在同一时间,清华大学的几位本科生和研究生组成了一个在AI音乐领域开展研究的兴趣小组。2016年底,曾经担任清华大学吉他协会会长的刘晓光加入了这个小组。


(资料图片)

想要把研究成果在行业中落地,就要建立起对音乐内容、音乐产业的认知来。刘晓光恰好就是这样的人。2018年,当初的兴趣小组发展成为公司——DeepMusic,刘晓光担任这个公司的CEO。

那时,AIGC的浪潮远未到来。和一些在2023年看到Chat GPT的火爆才匆匆“上车”的创业者不同,DeepMusic已经在AI领域积累了5年多的探索经验。

“这是个挺长周期的事情,坚持到现在才有一些收获。”刘晓光告诉刺猬公社(ID:ciweigongshe),做AI音乐这件事,大家基本上都是长期坚持下来的。

一家AI公司的音乐气质

DeepMusic公司有一间设施完备的乐器室,四壁包裹了吸音海绵,放满了长长短短的乐器,桌子上甚至还摆着一套Genelec(真力)音响。一般情况下,这种音响只会出现在专业音乐工作室里。

3岁半的时候,刘晓光就开始学习电子琴,9岁那年考过了电子琴9级。对于音乐的热爱和投入并没有影响他成为一名学科成绩突出的“好学生”,学业的压力也没有阻挡他对音乐的热爱。上中学时,他喜欢周杰伦、林俊杰和王力宏,白天听到喜欢的歌,晚上回家就用电子琴把它弹出来,一点点建立起了对于音乐创作和制作的认知。

进入大学之后,刘晓光把更多的空余时间放在了和音乐有关的事情上,还在化学系就读大三的刘晓光就已经在吉他协会担任会长。吉他协会有上千名会员,几十名骨干成员中的不少人毕业后加入了DeepMusic。

大学毕业之后,刘晓光和发小一起创业做VR、AR,也在音乐培训机构做过老师。在做音乐培训时结识的音乐老师们,后来也有不少成为了DeepMusic的员工。

刘晓光还创作过不少歌,到目前为止,完成过大约100首发行级作品的音乐制作,也认识了一群擅长音乐制作的朋友,成了公司的第三拨同事。“第一拨是又懂音乐又懂技术的理工男,第二拨是一些对乐理了解很多、并且知道怎么教别人音乐的音乐老师。”

就连一开始的投资人也是音乐气质满满——除了清华系的投资,还有清华的音乐人前辈李健的个人投资。

公司成立的那段日子,刘晓光很想继续深入做和音乐创作有关的业务,AI行业的爆发让他看到了机会:身边有不少朋友都能自己写歌词和旋律,但更深一步的音乐创作,包括制作歌曲的流程就很困难。“如果能用AI技术,去帮他们实现音乐理想,我觉得市场机会挺大。”

当时的AI行业创业方向并不倾向于用AI生成内容,而是用AI去解决一些功能性问题。但DeepMusic“一开始就很AIGC”,希望用AI去解决音乐创作、音乐学习的问题,让AI基于和人的交互去生产内容。

真正的大规模应用,要等到两年后的2020年。这也是在创业过程中,让刘晓光印象最深刻的一件事。腾讯的全民K歌找到了他们,希望能够在平台内开发“一键remix”的功能,将已有的音乐伴奏进行风格化改编。比如,把流行音乐风格的歌曲,一键转换成古风的风格。

全民K歌提出,一个月左右要做出大约5万首伴奏。这个需求相当大,几乎是DeepMusic当时产能的10倍。一般来说,一个20人的音乐人团队手动完成这项工作,大约需要两年的时间。尽管DeepMusic的AI生成技术已经相对成熟,但并没有产品化,每个环节中还需要人工去操作程序完成任务。后来,DeepMusic建立了一个流水线化的生产流程后,他们最终按期完成了任务,5万首伴奏的通过率达到99%。

“这个技术目前已经触达了千万级的用户,使用次数已经3亿次了。”刘晓光说,“那是我们第一次觉得,我们做的技术真的获得这么多用户的认可。”

让AI辅助UGC

“我们的判断是,未来的一两年,AI生成音乐一定会有一些让人觉得非常厉害的成果出来。”

在谈到“AI生成音频领域为什么没有ChatGPT式产品时”,刘晓光说道,在AIGC发展的过程中,最先被解决的一定是需求最多、最密集的领域,首先是自然语言的生成,然后是图片——比如Midjourney,再是视频,音乐等。

如今,AI生成音乐领域同样处于爆发的前夜。现在,已经不仅仅可以实现音乐的AI生成,生成出来的音乐还能一定程度满足人期待的效果。

“但这件事的商业价值在目前阶段还比较有限。”刘晓光给我们了一个颇为反直觉的判断:可以用AI生成音乐之后,生成的音乐内容为什么反而“商业价值有限”了呢?

在音乐行业中,内容会被分为功能性和艺术性两种,比如抖音短视频的背景音乐一般属于前者;周杰伦的歌曲,属于后者。AI直接生成的音乐,主要是在解决功能性音乐问题。但现实是,功能性音乐只占音乐市场的1%,是一个超饱和的市场了。如何用AIGC在一个已经供大于求的市场里产生价值,这个问题相当难以解决。

“我们输入一段自然语言,然后生成一段音乐,这个东西一定会很好玩,但是它不一定是真的有用的东西。”刘晓光将“AIGC”拆分成了三部分:AI,指生成内容的方式;G,指生产的过程;C,指生产出的内容。他的判断是,在音频生成领域,最有价值的是”G”,即AI生产内容的过程。

比如,有的人很有制作音乐的兴趣,但会因为音乐学习、音乐制作的较高门槛而难以创作属于自己的音乐。而在AI的帮助之下,人们可以不必接受长时间的复杂学习,就能参与到音乐的生产过程中来。

如今,虽然AI很难听懂音乐中蕴藏的情感,但已经可以去理解音乐里面的蕴含的知识——用了什么乐器,音高是什么、用了什么和弦,歌词又是什么,等等,可以实现对音乐信息的提取。

过去几年,DeepMusic将超过2万首歌曲进行了分析,并把其中的音乐知识收集起来,转化为一个可以用于模型训练的数据库。当我们确定下来这些知识能够和音乐产生什么样的联系之后,就可以在这个基础上生成音乐。

DeepMusic要做的,就是把AI生成和音乐制作的每一个环节结合起来,嵌入到音乐的生产流里面。也就是说,在使用AI进行艺术性的探索时,可以把AI当成一个工具去使用,来表达内容、传递情绪。刘晓光将这种模式称之为“AI辅助的UGC”,对于音乐生产者来说也是“有用”的。

AI如何搅动音乐产业?

相比视频,音频市场规模小了一些,但仍是百亿级别的大市场。但在音乐行业中,能赚到钱的往往都是少数人,并不是每个认真的创作者都能从中赚到钱。“音乐行业最大的问题并不是生产端的问题,而是消费端的问题、大家到底为什么而买单的问题。”刘晓光说。

因此,DeepMusic希望做些“增量”:在AI技术的支持下,让更多人参与到音乐的生产过程中,同时让AI技术辅助音乐的玩法、音乐的消费场景,乃至音乐教育上面,让更多人体会到音乐实践的过程,而不是原来的听音乐、唱歌,给人们的音乐消费体验带来一些新的东西。

“我们会比较关注对音乐创作这件事有兴趣的用户。”刘晓光表示,“他们有可能在生产的过程中,为了更好的体验去付费。”

在商业化上,DeepMusic其中的一个路线是作为“好用的工具”,吸引用户付费。而如果把生产过程的趣味性做到极致,它的本质更接近游戏;如果用户对生产过程本身非常感兴趣,就可以采用教育产品的路线。

因此,DeepMusic的商业路线有三条——软件服务、教育和游戏。在刘晓光看来,软件服务的优势在于稳定,但其上限比较有限;但教育和游戏上,用户的付费意愿会更大一些。“所以我觉得AIGC第一波成功的商业化,会在游戏和教育上。”

目前,DeepMusic的产品有内测阶段的音乐工作站“和弦派”,主打降低音乐创作门槛;已经上线的“口袋乐队”,融合了音乐创作和娱乐玩法;另一款正在开发的产品“音梦岛”,把线下的音乐娱乐场景搬到了线上,瞄准泛音乐社交用户。

值得一提的是,最近DeepMusic还获得了知名创投机构GGV纪源资本和丰元资本的近千万美元A+轮投资。

而从市场大盘的角度看,真的对音乐感兴趣的人规模可能并不小,刘晓光认为,国内的用户规模至少在数千万级。

“DeepMusic的伙伴们都是正在音乐中收获幸福的人。”刘晓光说,“DeepMusic的价值观即是MakeEveryone a Musician,坚信我们的AI一定可以让更多的人通过音乐自如地表达自我。”

本文源自:刺猬公社

作者:园长

标签:

相关阅读RELEVANT

  • 版权及免责声明:

内容搜集整理于网络,不代表本站同意文章中的说法或者描述。文中陈述文字和内容未经本站证实,其全部或者部分内容、文字的真实性、完整性、及时性本站不做任何保证或者承诺,并且本站对内容资料不承担任何法律责任,请读者自行甄别。如因文章内容、版权和其他问题侵犯了您的合法权益请联系邮箱:43 520 349@qq.com 进行删除处理,谢谢合作!