由于数据本身的可复制性和可重复利用性的特点,大数据与著作权保护有着千丝万缕的联系。
联合国发布的《大数据促发展:挑战与机遇》白皮书预测,2017年,全球大数据市场收入将达到500亿美元。中国市场情报中心有关统计显示,到2018年,中国大数据市场规模将达到463.4亿元。在市场茁壮成长的同时,大数据相关纠纷也层出不穷。由于数据本身的可复制性和可重复利用性的特点,大数据这个巨大的市场与著作权保护有着千丝万缕的联系。
北京市海淀区人民法院中关村法庭和中国互联网协会调解中心联合发布的《大数据与知识产权司法保护的现状及展望调研报告》公布的数据就显示,在国内,大数据与司法实践相关案件当中,涉及著作权的是23%。那么,在现有著作权法律框架下,能对大数据产业起到哪些保护作用?大数据相关案件在司法实践中目前还面临哪些困境?在2017中国互联网大会上,第二届中国互联网纠纷解决机制高峰论坛暨“互联网+”时代下的大数据法律问题论坛对此进行了探讨。
现状
大数据屡被侵权却面临维权困境
在互联网时代,随着海量信息的到来,几乎每家网站都积累了大量的大数据信息。这些大数据主要是互联网平台在提供服务的过程中沉淀下来的数据,包括用户的个人数据,以及一些可以与大众分析的个人资料等。这些信息很容易被其他网站抓取。
由此,各大互联网平台之间,各种各样关于大数据的侵权案例屡见不鲜。北京搜狐互联网信息服务有限公司法务经理马晓明就分享了一个搜狐APP上的典型案例:“我们APP上,娱乐新闻的内容被第三方网站未经授权转载,转载的同时,客户端底下的用户评论也一并被抓取了。这些评论被实时抓取,并且是一个不断扩充的过程。”
在搜狐网站上,也有同样的侵权事件发生。搜狐焦点网是以销售楼盘信息为主的在线服务商。为了提供一手楼盘的销售数据,搜狐会做实地的取景拍照、勘验,并会对周边环境进行实地考察,会生产VR(虚拟现实)产品,也会积累对这个楼盘有意向的一些用户的评论。但是,搜狐检索后发现,一个竞品网站把其整个楼盘的信息全盘抓取了,被抓取内容包括用户的评论信息。
“这些原始数据的权利主体到底是谁,被侵权后我们应该选择什么样的案由去起诉,选择什么样的权利来保护自己的权益。现在的理论探讨和司法实务都没有给出明确的回答。”马晓明对此提出疑问。
在目前的法律框架下,即使是法官也不能给出定论。北京市海淀区人民法院中关村法庭庭长陈昶屹表示,在适应新技术革命的基础上,他也希望能充分发挥司法保护知识产权的主导作用,同时将符合知识产权特征的数据纳入知识产权保护的体系,建立相关完善的知识产权数据保护模式,为大数据的发展保驾护航。
分析
数据存储和成果可适用著作权法保护
大数据一向以海量著称,那么,这些海量的内容目前就没有法律可以进行保障吗?陈昶屹介绍说,目前一些大数据可以采用著作权保护的方法进行保护。
据了解,大数据的主要处理流程包括四个阶段:一、采集与预处理。采集数据之后,不能直接运用,而是要进行一定的梳理之后才可以进行运用。二、数据的存储和管理。三、数据在存储之后进行处理和分析。四、对处理和分析的数据形成成果之后进行数据的应用。
其中对于第二个阶段“数据存储和管理”当中,数据经过集合、汇总,形成了数据库、数据仓库、云数据库这样的一些形式,对这一部分的内容,陈昶屹认为,可以通过著作权法进行保护。在第四个阶段“处理和分析的数据形成成果之后进行数据的应用”中,由于成果最终是通过数据具像化的,并且主要以软件方式存在,这时也可以通过软件著作权的形式进行保护。
陈昶屹介绍说,在大数据的其他环节中,也可以通过专利、商标等知识产权手段进行保护。
难题
保护大数据时既要限制又要开放
根据陈昶屹的观点,当下在大数据适用的著作权保护中,主要有两方面可以保护,一方面是数据库著作权,另一方面是在大数据应用当中形成的软件。他同时强调,著作权主要是对大数据形成的汇编作品进行保护。“保护数据库主要也是基于著作权法当中关于汇编作品相关的保护,其主要保护大数据当中体现的独创性的特点,以及在独创性当中体现的选择、编排、数据库的体系和结构,主要对这部分汇编作品进行保护,而不是对数据内容本身进行保护。”
另外,对于大数据的软件著作权保护也是当下一个难点。目前大数据软件很容易遭受到侵权,比如被抄袭,即大数据软件作品的原代码可能直接发生抄袭和雷同的问题。或者大数据软件作品被第三方恶意修改,第三方对大数据软件进行屏蔽,进而产生侵权行为。但在这个侵权过程当中,侵权方有可能会提出技术中立的抗辩。“侵权方式在技术上中立还是在内容上中立是有区别的,目前涉及这方面的纠纷对于大数据软件是内容还是技术,并没有定论,这是大数据软件著作权中的一个难点。另外关于大数据软件雷同的判定过程当中,怎么判断实质性相似的问题,也是司法实践当中遇到的一个基本难点。”陈昶屹说。
大数据案件逐年增多,并且与以往互联网案件存在显著不同,也因此带来维权方面的困难。尽管困难重重,但司法界对于大数据著作权保护方面的探索也一直在继续。陈昶屹对此也提出,保护大数据的手段可以多种多样,由于大数据的特性,在大数据保护方面,要给予它适当的权利和排他性,同时也应该保护大数据本身的开放性和流动性。“大数据本来是基于开放和流动而形成的大数据,如果说在数据保护的过程当中形成了垄断,影响到了数据资源的开放性和流动性,就有可能会影响整个数据产业的发展。”(任晓宁)