里兰大学和纽约大学联合研究团队的论文,题目叫《扩散艺术还是数字伪造?》
/pdf/2212.03860.pdf
,研究了扩散模型当中的过度拟合和数据复制现象。结论指出,一款当下著名的AI绘图工具生成的内容与数据集作品的相似度超过50%的可能性达到了1.88%。也就是说,每一百幅AI生成的图片当中,就有将近两幅存在一半以上的复制的现象。而且,训练数据集的大小在很大程度上影响着这个复制率,在使用具体艺术家姓名或者“某某某风格”作为提示词的情况下,这种复制拼接尤其明显,甚至可能达到赝品的程度。”
结论和数据再次引起旁听席上轻微的骚动,被告那边郭家阳和孙力行倒是不觉得意外,这篇论文在今年六月份温哥华国际计算机视觉与模式识别会议的推荐阅读清单里,相关行业的人应该都读过。他们只是侧首低语,显然已经在准备稍后的诘问。
言谨并未停顿,提出下一个问题,说:“那您是否同意方才刘教授的观点,对人工智能发起著作权诉讼,会造成反公共地悲剧,为它的发展设置人为障碍?”