当下,互联网、人工智能快速发展,声音的记载、利用与传播的方式正经历着前所未有的变革,声音与人格的关联变得愈发紧密,声音的利用价值愈发凸显。民法典第1023条规定,对自然人声音的保护参照适用肖像权的保护,明确将声音权益作为特殊的人格利益予以保护。但随着AI语音合成技术的广泛应用,声音被收集、合成、制作、模仿甚至篡改的现象越来越普遍,这对声音权益的保护提出了前所未有的挑战。
2024年4月23日,北京互联网法院一审开庭宣判全国首例AI生成声音人格权侵权案,明确认定在具备可识别性的前提下,自然人声音权益的保护范围可及于AI生成声音。AI生成声音可识别性的认定应综合考虑行为人使用情况,并以相关领域普通听众能否识别作为判断标准。
【案情简介】
原告殷某是一名配音师,经朋友告知,原告发现他人利用其配音制作的作品在多个知名App广泛流传。经声音筛选和溯源,发现上述作品中的声音来自被告一北京某智能科技公司运营的平台中的文本转语音产品,用户通过输入文本、调整参数,可实现文本转化成语音的功能。
原告曾接受被告二北京某文化传媒公司的委托录制录音制品,被告二为录音制品的著作权人。后被告二将原告为其录制的录音制品的音频提供给被告三某软件公司,允许被告三以商业或非商业的用途使用、复制、修改数据用于其产品及服务。被告三仅以原告录制的录音制品作为素材进行AI化处理,生成了涉案文本转语音产品并在被告四上海某网络科技公司运营的云服务平台对外出售。被告一北京某智能科技公司与被告五北京某科技发展公司签订在线服务买卖合同,由被告五向被告三下单采购,其中包括了涉案文本转语音产品。被告一北京某智能科技公司采取应用程序接口形式,在未经技术处理的情况下,直接调取并生成文本转语音产品在其平台中使用。
原告主张,被告的行为已经严重侵犯了原告的声音权益,被告一北京某智能科技公司、被告三某软件公司应立即停止侵权、赔礼道歉,五被告应当赔偿原告经济损失、精神损失。




