研究权:文本与数据挖掘
为了抗击新冠肺炎疫情,全球科学家们正在与时间赛跑。数据与研究结果正在通过开放的研究数据库进行实时共享,这在以前是从未有过的事。世界卫生组织(WHO)的新型冠状病毒(COVID-19)数据库收集最新的国际和多语种科学发现和知识。
理解数据
文本与数据挖掘(TDM)是弄懂这些新兴数据的强大工具。TDM通过计算机对大量数据进行分析,以获取知识。复杂的计算技术用于识别数据库中可挖掘的相关研究报告,并在不相关联的文献中建立有意义的模型和联系,从而获取新的见解和认识。
事实上,TDM已在抗击疫情中发挥了重要作用。2019年底,加拿大的一家初创企业BlueDot每天使用数据分析工具挖掘10万个信息源,涵盖65种语言。作为最先发现COVID-19新风险的企业之一,BlueDot在第一时间向世界发出了预警。
TDM与版权
TDM研究人员感兴趣的数据库通常由某机构的图书馆管理,例如,订阅式的电子资源(使用由出版商许可控制)和机构存储库,这些存储库提供对机构研究结果的开放访问。
由于TDM项目通常涉及受版权保护的作品,版权法便发挥作用。一些TDM活动,例如纯粹的数据库读取,不在版权保护范围内,并且版权不能保护事实和数据。但是,除非数据库为开放获取或获得知识共享许可,否则其他活动很可能受限并需要获得授权。
例如,有效的TDM需要复制整个作品以创建挖掘过程所需的数据库(复制权),数据需要共享给其他研究人员供其审查和复制(可能包含向公众传播的权利)。如果该项目涉及国际合作,还要将其发送给其他国家的研究人员。
各国法律上的差异
一些出版商试图将TDM许可给数据库订阅者(例如图书馆)来获利。但每个出版商只能许可自己的作品,而研究人员通常要横向检索整个领域的研究,而不是按出版商进行纵向检索。TDM的真正功能在于同时检索多个数据库和学科,可能会跨国检索。另外,与成千上万个出版商协商达成无缝连接的有效TDM许可实际上是不可能完成的任务。
为了评估现有版权规则,美国大学的信息公正和知识产权项目(PIJIP)对全球版权法中的研究权进行探究。2020年7月,该项工作的初步结果在世界知识产权组织(WIPO)举行的一场研讨会上公布。
研究表明,在大多数国家,研究人员能基于研究或私人学习的权利建立并将TDM数据库用于非商业项目。但一些国家却明确限制这么做,因为例外仅限于作品的“摘录”和“引用”。这样一来,不仅在抗击COVID-19方面,而且在解决人类面临的从癌症治疗到气候变化的一系列重大问题方面,版权实际上隔绝了重要的具有价值的现代工具。
PIJIP的研究还发现,一些法律禁止商业用途,或施加合同或技术限制。只有极少数的法律解决了研究人员之间共享TDM数据库的问题,而研究发现没有法律明确授权可以跨境使用数据库。
TDM是抗击疫情的重要工具
各国法律所允许的活动范围不同以及跨境使用存在的不确定性有可能让打算开展全球科学协作的科学家陷入法律困境。
与佩戴面罩和追踪接触者一样,现代化的TDM研究技术也是抗击疫情工具的一部分。全球不仅要允许TDM,还应该鼓励TDM。
研究权:数字保存
传统和现代的研究方式(例如TDM)有一个共同点。二者都需要获取数据和出版物。根据研究学科和性质的不同,所需的原始资料可能是最新出版的或已有数百年历史的,已出版的或未出版的,在售的或早已绝版的,数字形式的或纸质形式的。
例如,研究冠状病毒传播的流行病学家可能还需要其他传染病传播数据,例如亚洲流感(1950年代)或埃博拉病毒(1970年代)。就公共卫生信息向政府提供建议以减缓Covid-19传播的行为科学家需要查阅所有类型的材料,例如调查和社交媒体、新闻报道以及专业期刊和参考书。帮助子孙后代了解COVID-19的范围及其对社会的影响的历史学家需要获取当前和以往事件的官方记录和其他主要来源资料,包括1918年流感大流行——迄今为止最严重的全球卫生紧急情况。
数字研究和版权
确保长期访问图书馆藏书最有效的方法之一是将作品数字化,如果本来就是数字化作品,则需将其转换为具有馆藏品质的文件格式。但是,数字材料的保存策略始终需要制作副本,而且许多国家的版权法不允许对受版权保护的材料进行数字保存。
实际上,WIPO超过1/4的成员根本没有明确允许保存,即使是印刷格式也是如此。在允许保存的成员中,关于谁可以制作保存副本,可以复制哪些内容以及采用哪种格式的规定也存在很大的差异,这与TDM情况相似。缺乏明确的图书进出口权使问题更加复杂,扼杀了图书馆之间在共同保存项目方面的国际合作。
就像科学家不应该受到版权法的束缚一样,也不能阻碍图书管理员和档案管理员向无论身处何处的研究人员提供无使用限制的馆藏作品的电子访问权限。
TDM以及数字保存是研究权的基础。出版商许可无法提供适当的解决方案,并且现有版权法存在不足,尤其是对于跨境使用而言。
公认的WIPO实践
全球性问题需要全球性解决方案。为此,EIFL与国际图书馆和研究团体呼吁WIPO着手制定国际法律文书促进TDM工具和数据库的跨境分享,并制定明确的规则允许文化遗产机构保存作品,包括跨境分布的藏品。只有WIPO拥有制定全球版权标准的权限,也只有WIPO能解决跨境问题。
WIPO已介入。为印刷品阅读障碍者制定的《马拉喀什条约》解决了成员之间版权法的差异问题。
《马拉喀什条约》制定了强制例外,允许制作无障碍的版本,允许图书馆等受益方在条约的成员中分享副本。该条约还包含一项新条款,允许在一个成员方合法创作的作品在另一成员方使用。该规则对于确保当前不允许创建TDM数据库的成员使用其他成员创建的数据库大有帮助。
《马拉喀什条约》是WIPO迄今最成功最受欢迎的条约。基于该公认的实践,WIPO可以解决冠状病毒大流行所需的研究方面的版权障碍。(编译自infojustice.org)
翻译:罗先群 校对:王丹