引言:近年来随着技术及产业发展,AI领域司法纠纷案例不断呈现。笔者通过大量案例总结梳理发现当前AI案例主要涉及著作权、数据不正当竞争、人格权纠纷,司法对于AI内容生成、使用涉及的平台及使用方侵权责任边界划定相对丰富,对于AI模型训练的技术底层法律合规指引也有个案深入,现精选部分案例裁判要点及个人观点如下:
一、AI插画著作权案 北京互联网法院裁判观点:本案中,原告希望画出一幅在黄昏的光线条件下具有摄影风格的美女特写,其随即在 Stable Diffusion 模型中输入了提示词,提示词中艺术类型为“超逼真照片”“彩色照片”,主体为“日本偶像”并详细描绘了人物细节如皮肤状态、眼睛和辫子的颜色等,环境为“外景”“黄金时间”“动态灯光”,人物呈现方式为“酷姿势”“看着镜头”,风格为“胶片纹理”“胶片仿真”等,同时设置了相关参数,根据初步生成的图片,又增加了提示词、调整了参数,最终选择了一幅自己满意的图片。从原告构思涉案图片起,到最终选定涉案图片止,这整个过程来看,原告进行了一定的智力投入,比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等等。涉案图片体现了原告的智力投入,故涉案图片具备了“智力成果”要件。 当然,并非所有智力成果都是作品,只有具备“独创性”的智力成果才能构成作品。通常来讲,“独创性”要求作品由作者独立完成,并体现出作者的个性化表达。“机械性智力成果”应当被排除在外。比如按照一定的顺序、公式或结构完成的作品,不同的人会得到相同的结果,因表达具有唯一性,因此不具有独创性。而利用人工智能生成图片,是否体现作者的个性化表达,需要个案判断,不能一概而论。一般来说,人们利用 Stable Diffusion 类模型生成图片时,其所提出的需求与他人越具有差异性,对画面元素、布局构图描述越明确具体,越能体现出人的个性化表达。因此,涉案图片并非“机械性智力成果”。在无相反证据的情况下,可以认定涉案图片由原告独立完成,体现出了原告的个性化表达。综上,涉案图片具备“独创性”要件。.....而现阶段,生成式人工智能模型不具备自由意志,不是法律上的主体。因此,人们利用人工智能模型生成图片时,不存在两个主体之间确定谁为创作者的问题,本质上,仍然是人利用工具进行创作,即整个创作过程中进行智力投入的是人而非人工智能模型。 而涉案人工智能模型设计者既没有创作涉案图片的意愿,也没有预先设定后续生成内容,其并未参与 到涉案图片的生成过程中,于本案而言,其仅是创作工具的生产者。其通过设计算法和模型,并使用大量数据“训练”人工智能,使人工智能模型具备面对不同需求能自主生成内容的功能,在这个过程中必然是进行了智力投入,但是设计者的智力投入体现在人工智能模型的设计上,即体现在“创作工具”的生产上,而不是涉案图片上。故涉案人工智能模型设计者亦不是涉案图片的作者。 此外,本案中,从相关主体的约定来看,根据在案证据,涉案人工智能模型的设计者,在其提供的许可证中表示,“不主张对输出内容的权利”,可以认定设计者亦对输出内容不主张相关权利。 如前所述,原告是直接根据需要对涉案人工智能模型进行相关设置,并最终选定涉案图片的人,涉案 图片是基于原告的智力投入直接产生,且体现出了原告的个性化表达,故原告是涉案图片的作者,享有涉案图片的著作权。 个人观点:针对AI创作内容的可版权性,AI工具论及独创性智力成果投入系当前阶段主流观点。 二、AI声音人格权侵权案 北京互联网法院裁判观点:相较于肖像,声音具备无形性、不可视的特征,其识别性相对较弱,一般建立在反复多次或长期聆听特定声音的基础上,他人才能通过该声音特征识别出特定自然人。对于从事配音等特定职业的自然人,若一定范围内的听众能够将声音与该特定自然人建立一一对应关系,则可认定该声音具备识别性。 自然人的声音经人工智能技术处理后,是否落入自然人声音权益保护范围,关键在于通过该声音是否仍能识别出该特定自然人。本院认为,对于人工智能技术处理后的声音,只要一般社会公众或者一定范围内的公众根据音色、语调和发音风格,能够识别出特定自然人,则该自然人声音权益可及于该 AI 声音。具体到本案中,某软件公司仅使用了原告一人的声音开发案涉文本转语音产品,且经庭审中进行文本转语音操作,生成的 AI 声音与原告的音色、语调、发音风格等具有高度一致性。综上,可以认定,一定范围内的听众能够将案涉 AI 声音与原告本人建立一一对应的联系,因此,原告的声音权益及于案涉 AI 声音。 个人观点:人工智能语音大模型的训练语料与模型表达结果的合规性要求具有差异性。 三、“虚拟数字人”知识产权侵权案 杭州互联网法院裁判观点:虚拟数字人系通过建模、智能合成、动作捕捉及其他数字技术手段制作的,具有外貌、声音等方面的特征和行为模式的虚拟角色的可视化呈现形象。虚拟数字人不是自然人,不具有作者身份,在弱人工智能场景下,人工智能创作成果的智力创作空间有限,即使人工智能生成的内容具有独创性,能够构成某种类型的作品,也不归属于虚拟数字人。在现有的著作权法律体系框架下,虚拟数字人不享有著作权和邻接权。涉案虚拟数字人 Ada 系真人驱动型虚拟数字人,其表现形式借鉴了真人的体格形态,同时又通过虚拟美化的手法表达了作者对线条、色彩和具体形象设计的独特的美学选择和判断,构成美术作品。 使用 Ada 形象的涉案两段视频分别构成视听作品和录像制品。魔珐公司享有上述作品的财产性权利及录像制作者权。因虚拟数字人 Ada 系真人驱动,经过实时语音生成及智能穿戴式装备的动作捕捉而成,故其所展现的“表演”的声音、神态、动作等系高度还原“中之人”徐某某的相关表现,并非是在真人表演的基础上所产生的新的表演。徐某某属于《著作权法》规定的表演者,其作为魔珐公司员工,系进行职务表演,结合双方书面约定,应由魔珐公司享有表演者权中的财产性权利。 个人观点:真人驱动型“虚拟数字人”可以视为技术手段下的真人镜像,作者系真人。 四、“AI合成数据合集”不正当竞争案 厦门中院裁判观点:双方经营模式、服务内容、盈利方式基本相同,存在直接竞争关系。从数据的性质分析、劳动贡献程度、竞争优势、数据实用性和商业价值等方面看,有某公司将单个的、分散的市场有色金属价格进行搜集、整理、AI汇编并对外有偿公布,使消费者可以查询、获悉历史价格数据及有关态势,能够为消费者提供商业决策参考,其享有竞争优势,且应受到相关法律保护。 在案证据可以认定被告存在接触原告SMM价格数据的可能性。经比对,被告发布的大量价格数据与原告SMM价格数据存在高度近似。在原告已举证证明其数据形成过程并提供初步证据证明可能存在侵权下,被告经法院释明后,仍未提供初步证据佐证其数据来源,且对错误数据的形成无法作出合理解释,根据《最高人民法院关于适用<中华人民共和国民事诉讼法>的解释》第一百零八条之规定,足以推定被告未经许可使用了原告数据。 本案被告未付出创造性劳动,将原告拥有合法权益的数据信息提供给消费者牟利,有悖于公认的商业道德,属于不劳而获“搭便车”的行为,更扰乱了大数据行业的竞争秩序,应当作出否定性评价,以维护数据产品开发者权益,构建公平、公开、公正、诚信有序、兼顾各方利益的数据产业竞争秩序。 个人观点:利用AI合成的商业数据合集可以作为反法保护的对象。进一步能否作为数据知识产权登记对象,进一步侵权比对构成标准司法指引? 五、“AI模型语料库”知识产权侵权案 北京知识产权法院裁判观点:本案中,涉案数据集通过对原始数据的提炼整合,将原本单一且价值有限的碎片化数据信息通过算法分析处理,可以提升数据的使用价值,具有数据财产权益。从现行法律规定和现实利益两个层面,均可得出涉案数据集具有财产性利益需法律保护的结论。本案中,数某公司于 2019 年 7 月 2 日已经在其官方网站面向不特定公众公开披露了涉案 200 小时数据集的下载渠道和训练方法,即被诉行为发生时(2021 年 9 月 15 日),涉案 200 小时数据集已经因数某公司的主动公开而丧失秘密性。虽然涉案 200 小时数据集已被数某公司主动公开,但并不当然据此丧失其应受 2019 年反不正当竞争法第二条保护的可能性。判断公开的数据是否可以纳入 2019 年反不正当竞争法的保护,还需结合被诉行为是否借用或寄生于该公开数据而不当获得了本不应由隐某公司获得的交易机会、竞争优势,进而获得商业利益。 数据集合保护本质上是对不具有独创性的数据或事实的集合提供保护,如果保护数据数量的门槛过低,会妨碍公众利用公共领域数据信息创作普通作品,为避免对普通公众的创作和表达自由产生负面影响,且数据规模的扩大增加了数据集合的价值,也增加了社会容忍法律制度负面影响的意愿,因而获得保护的数据集合应当具有实质量的数据条目。同时,数据条目的实质数量应结合数据集合的性质、数据来源、数据集合价值等因素综合判断。本案中,在案证据已经证明,涉案 200 小时数据集是数某公司主动收集并整理,含有 70 余万条可用于人工智能模型训练的声音数据条目,且被众多人工智能模型研发主体所使用,符合公开数据条目应具有实质量的要求。故,隐某公司提出的公开数据集合应当具有实质量时才可受到反不正当竞争法保护的意见是正确的,但涉案 200 小时数据集已经符合实质量的要求,隐某公司有关涉案数据集音频数量过少不应得到保护上诉理由依据不足,不能成立。 个人观点:AI模型训练的数据集合可以作为反法保护的对象,获得保护的数据集合应当具有实质量的数据条目,如果优化AI模型后大幅压缩数据量要求至二分之一甚至更低是否仍然具有实质量? 六、“AI模型结构、参数”知识产权侵权案 北京知识产权法院裁判观点:本案中,北京某公司主张通过真人照片及手绘师绘制的漫画作品训练形成的模型(结构及参数)能够使用户使用变身漫画特效实时生成与真人具有对应关系的动漫形象,北京某公司认为变身漫画特效的模型(结构及参数)属于其竞争优势,从而受到反不正当竞争法第二条的保护。在案证据显示,在模型风格设定过程中,北京某公司通过对市场上大量动漫形象分析对比,从多名手绘师中广泛收集漫画数据风格,最终从中选出最终设定的风格,并根据该风格确定漫画数据的具体绘制标准和要求。在训练数据的形成阶段,北京某公司聘请十余名手绘师,按照统一漫画数据的具体绘制标准手工绘制漫画图,用于模型的学习训练,并在模型训练过程中根据模型的输出结果调整画法、再次绘制漫画图,用于模型的训练和提升,最终形成五万余张漫画训练数据。在模型研发阶段,在北京某公司模型的基础上,不断调整模型结构、模型参数、反复输入数据进行模型训练,并通过画法调整、增加数据量、算法进一步调整等方式解决中间模型的效果瑕疵问题,使得模型效果趋于接近目标。在模型效果确认阶段,从迭代速度极快的众多模型版本中挑选出最终确定的模型。综上可知,北京某公司为研发变身漫画特效模型投入大量经营资源,变身漫画特效的成像效果也经历了不断优化的过程,而变身漫画特效模型经过数据训某信息技术公司与北京某科技公司练和调校后的参数与结构,使得用户在使用某音 App 时可生成与真人具有对应关系的动漫形象,为北京某公司取得了创新优势、经营收益和市场利益,变身漫画特效的模型(结构及参数)应当构成北京某公司受到反不正当竞争法保护的竞争利益。 个人观点:非开源AI模型的结构、参数一般属于开发企业的技术秘密,如果可以通过反法商业秘密条款保护,直接适用原则性条款是否合适? 七、“AI换脸”侵权案 1、北互“AI换脸案” 北京互联网法院裁判观点:由于肖像具有识别特定自然人、区分自然人的标表功能,因此,法律赋予自然人对肖像制作、使用、 公开等支配性权利,目的在于防止自然人的肖像被他人滥用或发生混淆,从而侵害自然人的精神利益和基 于肖像与该自然人的对应而产生的财产利益,侵害肖像权的行为不能脱离肖像的识别性。本案中,被告并 未制作含有原告肖像的视频;被告虽使用了“甜度超标”视频,但并非是对原告肖像的利用,恰恰是替换了能够识别原告本人的面部特征,去除了肖像的识别性,进而利用视频中的非人格要素,即利用妆容、服 饰、发型、光线、镜头切换等等劳动成果;被告将原告出镜视频中的面部特征予以替换,用以替换的新的 肖像亦为年轻及面容姣好的女性,并未丑化、污损原告肖像;同时,被告的行为也不属于伪造原告肖像的行为。因此,被告实施的行为不属于法律规定的侵害原告肖像权的行为,未侵害原告附着在本人肖像上的人格利益和财产利益。就原告所主张的“肖像完整性”这一利益,并无法律依据,且外部形象核心的识别性要素被替换后,肖像权的保护范围仍扩大至妆容、发型、服饰等,可能导致人格权这一绝对权的控制范围超过必要限度,影响妆容、发型、服饰等的自由创作和合法利用。 个人信息处理者处理已公开的个人信息,对个人权益有重大影响的,应当依照本法规定取得个人同意。”法律赋予个人对其个人信息处理的知情权、决定权,旨在防范泄露、滥用等风险。“甜度超标”视频虽然属于已经公开的视频,但“*******”账号说明处标注有“没有授权任何换脸”,不应推定原告同意他人对其人脸信息进行处理。此外,被告作为经营主体,获取包含原告人脸信息的视频,利用人工智能深度合成这一新兴技术进行分析、修改后进行商业化利用,可能对个人权益产生重大影响。综合本案中涉案软件的商业模式及个人信息处理方式,考虑到产业发展初期应注重引导市场主体规范发展,本案认为被告的个人信息处理行为应依法征得原告同意。被告无证据证明其经过原告同意,构成对原告个人信息权益的侵害。 2、上海“AI换脸案” 上海嘉定法院裁判观点:本案争议焦点为被告利用 AI 技术“换脸”原告视频,以此开展运营活动,是否侵害原告作品信息网络传播权。对此评判如下:第一,原始视频具有独创性表达,受著作权法保护。原始视频系古风人像写真类视频,由一系列有伴音的连续画面组成,在内容编排、景别选取、拍摄角度等方面体现了制作者独创性的选择安排,属于受著作权法保护的视听作品。原告通过其实名认证的抖音账号发布原始视频,声明其系视频拍摄者,并提供视频底稿等信息,在无相反证据的情况下,原告主张其系原始视频的著作权人,本院予以认可。第二,涉案视频与原始视频构成实质性相似。涉案视频的内容系通过 AI 算法对原始视频进行局部替换合成,本身并不具有独创性,被告既未参与内容创作过程,也未将其个性化表达体现在生成的“换脸”视频中。被告在不改变原始视频基本内容的情况下,以 AI 技术更换人物面部肖像,保留了视频实质及核心表达内容,即便涉案视频删减了原始视频部分侧面镜头,二者仍构成实质性相似。 个人观点:AI训练涉及的海量数据包括用户投喂数据如涉及个人信息是否也应依法征得个人同意? 八、“AI交互语音指令”不正当竞争案 北京市海淀区人民法院裁判观点:关于“xiaoduxiaodu”语音指令,尽管人机交互过程中的语音指令,并未在反不正当竞争法第六条中予以列明,但从该条文义来看,其目的在于制止混淆行为,避免相关公众产生误认。因此,尽管语音指令作为人工智能发展到一定阶段的产物,较之商品名称、企业名称、网络域名、网站名称等出现得较晚,在类型方面亦存在一定差别,但只要其能够与该商品或服务及其提供者建立起特定的联系,且具有一定的影响,即应被纳入反不正当竞争法第六条所规定的权益保护范围之内。擅自将他人符合上述条件的语音指令进行使用,属于该条第四项所规定的,其他足以引人误认为是他人商品或者与他人存在特定联系的混淆行为。 个人观点:如果基于用户主动设置的相同交互指令,经营者是否需要采取过滤屏蔽措施? 九、“奥特曼”AI模型案 1、杭州案 杭州互联网法院裁判观点:生成式人工智能主要包括四个重要阶段:数据输入、数据训练、内容输出、内容使用,从促进生成式人工智能技术发展的角度来看,对于大模型的数据输入、数据训练行为的侵权认定,宜采取相对宽松包容的认定标准,对大模型的生成内容输出、生成内容使用行为的侵权认定,则宜采取相对从严的认定标准,通过分类施策实现发展与保护的平衡。平台主观上无共同侵权故意,客观上未参与用户上传或生成行为,因此不构成直接侵权,未采取“符合技术水平”的预防措施,被认定为未尽合理注意义务,应当承担帮助侵权责任。 鉴于生成式人工智能在数据训练阶段使用他人作品的目的,原则上应是用于学习分析在先作品所表达的思想感情、语言特征、特色风格等内容,从中提取出相应的规则、结构、模式、趋势,便于后续转换性创作新作品。该种使用行为聚合大量作品作为分析样本数据进行提高作品创作能力训练,并非以再现作品的独创性表达为目的,且一般情况下数据训练只是对语料数据作结构特征分析时暂时保留了在先作品,数据训练及生成过程中也未将在先作品展示给公众,因此,在无证据证明生成式人工智能是为使用权利作品的独创性表达为目的、已影响到权利作品正常使用或者不合理地损害相关著作权人的合法利益等情形下,可以被认为是合理使用。 杭州中院院裁判观点:生成式人工智能服务提供者,属于《反不正当竞争法》规定的“经营者”。与传统的搜索链接服务提供者和网络内容服务提供者不同,人工智能作为知识创造工具,其生成内容的行为兼具技术服务与内容供给的双重属性。在生成式人工智能服务中,创作行为需要用户提示予以激发,模型与人类用户之间的交叠增强,服务提供者对于生成的内容控制力降低,属于新型网络服务提供者。主观上,认定生成式人工智能服务提供者的过错一般有输入端的注意义务和输出端的注意义务两个维度。但是生成式人工智能的数据来源不仅有平台自己输入的训练数据库,还有平台在服务用户过程中,由用户输入的数据。当服务提供者向公众提供由用户参与训练的模型服务时,有来自全球各地的海量用户对模型进行数据“投喂”,这些数据的合法性和版权状态可能各不相同。在此情况下,若严格要求服务提供者对用户输入端的每一份数据进行逐一审查和验证,既不具有可行性,也与其法律属性不相适应,无疑会加重开发监管负担,势必阻碍生成式人工智能的发展,因此服务提供者的注意义务应当与其身份及信息管理能力相适应。 2、广州案 广州互联网法院裁判观点:平台的注意义务边界应以《生成式人工智能管理暂行办法》对于生成式人工智能服务提供者的要求进行判断,包括但不限于是否建立了投诉举报机制、是否进行了潜在风险提示以及是否进行了显著标识等。 个人观点:生成式人工智能服务提供者,生成内容的行为兼具技术服务与内容供给的双重属性。生成式人工智能不同阶段的侵权认定具有不同的宽严标准,尤其是数据训练阶段相对司法包容。生成内容使用行为的侵权认定,则宜采取相对从严的认定标准,即“符合技术水平”的预防措施以及“红旗原则”。 十、皮肤检测发明专利侵权纠纷案 北京知识产权法院裁判观点:被告公司辩称,被诉侵权软件是基于“神经网络”和“人工智能”实现对用户面部肌肤的打分,并未采用涉案专利所要求保护的“与大众相关的预定值进行比较”的方法。对此,法院认为,首先,如本院之前所述,被诉侵权软件基于用户的地理位置得出了“你的肤质综合得分超过了全国 65%的女生”的结果,其中已经包含了与基于地理和种族的预定值的比较,而修改用户的年龄之后,在总分未变的先提下,该总分与同年龄女性的平均值的相对关系发生了变化,即已经包含了与基于年龄的预定值的比较;其次,被告公司并未提供相应证据证明被诉侵权软件使用了如其所述的“神经网络”和“人工智能”方法实现软件打分功能。被诉侵权软件的技术方案包含了涉案专利权利要求 1 记载的全部技术特征,落入了涉案专利权利要求 1 的保护范围。 个人观点:假设被诉侵权软件是基于“神经网络”和“人工智能”实现对用户面部肌肤的打分,其模型训练推定应用到大众相关的数据集合,是否仍构成技术特征相同? 十一、“AI答题助手”不正当竞争案件 北京市海淀区人民法院裁判观点:二被告辩称答题助手使用的 AI 识别和检索技术本身具有正当性,提高了信息获取的效率;被告答题助手对原告的“头号英雄”活动具有正向增利作用,对该活动起到了推广作用,二者是双赢关系。对此,本院认为,互联网领域中的被诉行为在给其他经营者利益带来冲击的同时,也往往因存在商业模式和技术的创新,而可能提升消费者福利或社会公共利益的保障水平。因此,在此种情形下判断被诉行为的正当与否,既要考虑对经营者合法权益的保障,还应当从更广阔的市场环境、更多的利益主体的角度,去考察该行为是否有助于消费者利益乃至公共利益。但技术本身是否有非侵权用途不能作为使用该项技术干预他人的抗辩事由。本院未否认二被告的涉案技术具有一定的创新性,但二被告将该项技术用于本案所涉应用场景下,妨碍了原告提供的网络产品和服务的正常运行,不具有正当性。且如前所述“答题助手”会使原告的部分用户流失,并非二被告所称的“双赢”关系。本院对二被告的辩称不予采信。 个人观点:AI 技术天然具有替代性,容易导致损人利己,难以“双赢”,不正当竞争的边界何在? 备注:本文非法律意见,如需判例原文可关注公众号并添加作者微信fdsos66