去年,世界知识产权组织(WIPO)就知识产权与人工智能(AI)的交叉问题进行了调查。关于版权用户权利的全球专家网络(Global Expert Networkon Copyright User Rights)的成员提交了反馈意见,重点谈到了版权在文本和数据挖掘(TDM)技术中的应用。
版权与TDM研究
TDM对机器学习系统的训练是不必可少的。TDM通过算法从材料中获取数据。TDM可用于发现新的事实,例如数据库信息点之间的相关性、模式和联系。机器学习对TDM收集的信息进行额外分析和处理,让机器动态“学习”非专门为其编辑的任务。AI是多种技术或系统的总称,包括机器学习或其高级应用(例如深度学习)以及进化算法和基于规则的系统。
许多非常实用的TDM和AI项目都涉及版权作品的使用。例如,发现新冠病毒爆发轨迹的Blue Dot项目分析了各种信息来源,每天处理65种语言的10万条新闻报道,以识别疫情爆发的轨迹。
实施TDM通常需要临时或永久性地复制版权作品。只要研究人员查询数据库,临时复制就会发生。因为这些复制是转瞬即逝的,所以属于限制与例外的范围。许多法律都有相关规定。TDM研究还要求进行永久性的复制,以构建要挖掘的作品数据库。为了让其他研究人员使用数据库并测试其准确定和透明性,数据库本身的复制和传播也必不可少。
版权法为作者的物质利益提供保护,禁止他人使用,包括复制。与此同时,版权法中有一条公理,即专有权仅适用于原创表达,不适用于事实、想法、程序或操作方法。人们还普遍认为,版权包含进行继续创作的自由空间,并且尊重重要的基本权利和公共利益,特别是允许使用受保护的材料进行研究。因此,现在的问题是TDM研究使用作品是否属于版权持有人的专有权范围而必须获得许可。在政策层面要解决的问题是如何进一步促进这种以创新和研究为目的重要使用,而不是被版权制度所束缚。
TDM复制不损害专有权的核心利益。这是因为TDM仅对作品进行“非表达”使用。甚至可以说,这些附带复制不属于专有权的范围。而且,正如一些学者所强调的,仅阅读不涉及与版权相关的行为,将作品读入计算机随机存储器也是如此。不允许TDM复制作品将剥夺人们阅读和访问这些作品里的思想、事实和数据的可能性,从而限制人们享受所谓的“研究权”。
研究权
开展、接收或获取研究是公众的基本权利,尤其是信息自由和公众获取信息的权利。为了实现这些基本利益,使用受知识产权法保护的材料进行研究非常普遍。保护这些研究活动属于专有权的限制与例外范围。除了将事实排除在保护范围外,版权法还通过限制与例外允许将版权作品用于研究或私人学习。
对于一些TDM(例如调查现有数据库),将事实与想法从版权保护中排除足以合法开展此类活动,但其他活动,例如创建复制作品数据库用于挖掘似乎需要获得明确的授权。为了提供此类授权,许多司法管辖区的法律将限制与例外应用于TDM、信息分析、计算机分析或类似活动。为达此目的,欧盟在最新的版权法中引入了具体的限制与例外条款,但不幸的是,这些条款与另外几条限制规定为TDM活动带来更大的法律不确定性。
WIPO的作用
WIPO应发挥表率作用,让每个国家制定TDM例外,包括就TDM数据库的跨境使用制定国际协定。
在技术援助活动中,WIPO应将开放的例外用于TDM研究中。这些例外与日本和其他法律类似,允许出于研究目的进行合理的活动。在此方面,2019年欧盟《数字化单一市场版权指令》(CDSM)中的TDM例外并非最佳实践。
在规则制定方面,WIPO应就TDM工具和数据库的跨境分享制定国际文书。由于一些国家缺乏TDM例外以及许多国家未纳入例外与限制规定,研究人员能否开展TDM项目跨境合作没有明确的规定。
假如欧盟(根据CDSM,创建TDM数据库属于合法行为)的一名研究员与美国(TDM在美国根据合理使用权规定也是合法的)的一名研究人员合作,那么欧盟的研究人员能把在欧盟合法创建的数据库转让给美国的研究伙伴吗?答案尚不明确,因为各自的TDM权仅适用于版权中的“复制权”,但不适用于各自受保护的传播权和向公众提供权。
这个问题需要WIPO来解决。《关于为盲人、视力障碍者或其他印刷品阅读障碍者获得已出版作品提供便利的马拉喀什条约》采用了比较新颖的国际规则,允许任一成员方制作的合法无障碍的材料进行跨境流通。WIPO版权与相关权常设委员会应为合法的TDM研究材料进行跨境分享制定类似的规则。(编译自infojustice.org)
翻译:罗先群 校对:王丹