音乐与科技的协同共生之路
作者 郭西洋
发表于 2025年2月

2019年,教育部正式提出大力发展新文科的要求,意在突破传统文科的思维模式,打破文理科之间的学科壁垒,实现文理交融。在此背景下,艺术学界提出了构建“新艺科”的设想,其含义是“新文科语境下的艺术学学科建设构想”,既要具备“新文科”提倡的文理交融性,又要顾及艺术学各学科的独特性。长期以来,文科与艺术学学科处于相对封闭的状态, 欲迅速改变现状须借助外力做功, 而科技正是新时代的最佳外力。“新艺科”的建设方针正是基于科技飞速发展的背景下提出, 为包括音乐在内的艺术创作与研究带来了全新的生态环境。

2024年10月11—13日,中国地质大学(武汉) 举办了第11届全国声音与音乐技术会议。大会聚集了来自人工智能、计算机科学、电子工程、数学以及音乐学等领域的众多学者。此次会议可谓是对“新文科”与“新艺科”建设构想的一次积极响应,极大促进了“两科”的发展。会议研讨专题多达14个,如音乐学+ 计算机、民族乐器+ 计算机、声学+ 计算机等。根据这些专题的研究对象和研究方法,可将其分为三类:音乐与人工智能的新兴结合点、乐器与乐谱的数字化研究、音乐与声音评价标准的定量研究。本文试图以会议内容为出发点, 一窥音乐与科技协同共生的态势及其所面临的诸多问题。

一、音乐与人工智能的新兴结合点

音乐与科技的结合很早便存在于人类漫长的历史长河中。如早在先秦时期,编钟的铸造要兼顾尺寸大小成序和音阶模式成列的双重目的,这对铸钟技术提出了非常严格的“标准化”要求。

人工智能时代,音乐与科技的关系进入到全新的态势中,一些新兴技术给音乐带来了近乎颠覆性的影响。音乐与人工智能的深度结合是两个领域共生发展的重要增长点, 也是本次会议的重要议题之一。

科技为音乐生产带来了新模式和新生态。“人工智能生成内容”(Artificial Intelligence Generated Content,简称AIGC)是指通过训练人工智能模型以生成与原始训练数据相似的内容,如当下日益更新的音乐生成模型、语音克隆和文本转语音等均是AIGC在音乐上的实际应用。日本广岛大学于漪副教授从多模态人工智能的角度探讨了音乐生成的方法。她的研究关注音乐的歌词、旋律和舞蹈三者之间以“语义”为联通枢纽的潜在关系, 通过整合三者之间的“语义”相关性,便可生成具有语义一致性的音乐与舞蹈。网易云音乐的邓阳介绍了流媒体平台在音乐AIGC 方面的应用,他首先剖析了国际上音乐生产的主流模式及其难题, 再以网易天音内容生产引擎为例, 详述其设计理念和技术框架。中国传媒大学的林义超等人采用AI 语音克隆技术,探索跨语言语音在电影领域的应用;此类技术能够将任意语音素材转换成跨语言的语音内容, 它可解决演员遇到非母语台词发音不准的难题。美国罗彻斯特大学段志尧副教授分享了其实验室团队在实时人机即兴演奏、中西音乐风格融合、音乐模型框架开发和歌声深度鉴伪等方面的成果。

“基于内容的音乐信息检索”(Content-based Music Information Retrieval,简称CBMIR)是在海量数字音乐带来分类组织、查询检索、内容理解与分析等一系列问题的基础上产生的一个新兴交叉学科。如相似歌曲检索是当今每个智能手机用户都会碰到的场景, 但是如何根据用户输入的内容(如歌词、旋律等)得到与之相似或匹配的输出结果? 来自网易云音乐的何其锜指出, 通过应用经过深度学习和训练的语义大模型, 可提高检索效率与结果准度; 在音乐平台中, 这项技术还可根据用户的需求提供个性化的音乐服务。

可见, 人工智能的介入为音乐带来了新的机遇,音乐也为人工智能拓宽了应用范围,这种互动关系本身成为一个重要思考点。例如,华中科技大学蔡新元教授并不局限于讲述AI 工作流程等复杂的技术原理,而是站在艺术的立场,思考如何利用AI 技术拓宽艺术研究的范围和视角,增加人机共创的可能性。这是艺术学界与科技学界需要共同思索的延展性问题。

二、乐器与乐谱的数字化研究

自古以来, 乐器是音乐中最能与科技产生直接联系的部分, 如中国历朝历代对弦律与管律的实验与实践,无不融合了数学、声学和古代天文学等多学科知识。中国古代乐谱自魏晋南北朝至明清时,便已有文字谱、减字谱、律吕谱和工尺谱等多种记谱形态。

本文刊登于《人民音乐》2025年1期
龙源期刊网正版版权
更多文章来自
订阅