背景概述
众所周知,“大数据”是一个近些年来才出现的全新概念,其指的是人类借助各种技术与智能设备所创造出来的连续、庞大且看似无限的数据流。换句话来讲,这个概念描述的是每天都出现在人类生活中的各类结构化、非结构化以及多结构化的海量数据集合。这些数据来自于手机、信用卡、互联网业务、嵌入式系统、电视以及计算机;来自于城市的基础设施、配备有传感器的建筑物、火车、公共汽车、飞机、桥梁、工厂以及全球大约50亿部电话。由于全球的信息存储量可谓是逐年猛增,因此技术人员不得不去创造出新的术语来描述如此体量的数据,例如泽字节(zettabyte)以及尧字节(yottabyte)。
现如今,大数据似乎无所不在。数字世界的规模每两年就会翻一番。预计到2020年底,全球的信息存储量将会达到44泽字节。在这里需要指出的是,单个泽字节的容量相当于1000艾字节(exabyte)、10亿太字节(terabyte)或者是1兆吉字节(gigabyte)。那这个容量究竟有多大呢?如果按照当前全新主流智能手机的容量标准(一般为32吉字节),那么上述1个泽字节可以填满344亿部智能手机的存储容量。试想一下,如果人们将344亿部三星S5智能手机头尾相连在一起,那么这可以环绕地球121.8次。
显然,大数据的体量是非常庞大的。不过,如果从这些数据自身的角度来看,实际上也算不上有多大的用处。
因此,为了更好地推动全社会的发展,人们必须要借助各类技术(诸如人工智能、先进的计算能力以及精密的数据分析工具)来对这些数据进行收集、存储与挖掘。换句话来讲,大数据已经成为了像石油一样的基础性资源。石油推动了20世纪的工业革命,而数据也可以推动未来数字经济的发展与腾飞。
除了数字技术以外,知识产权(即发明、概念以及创新成果)也是现代经济的核心驱动力之一。现代技术的飞速发展以及全球经济重心逐渐从有形资产(诸如工厂、货车以及仓库)转移到无形资产(例如企业的商誉、商标以及各类软件)的趋势都让知识产权成为当今世界上最为宝贵的一种资产。例如,谷歌公司拥有全世界最贵的商标,这个商标的估值为440亿美元,几乎占到该公司整体市值的27%。
根据相关的知识产权法律,创新作品(包括文学、软件、标识、外观设计以及发明等)的创作者以及著作者的权利是可以获得保护的。在利用大数据分析与挖掘技术来获得具有价值的信息时,知识产权可以发挥出重要的作用,例如利用某一台拥有专利权的硬件设备来收集与存储信息,或者利用某一款拥有版权的软件来对数据进行组织与分析。而且,根据各国的法律规定,上述利用大数据分析与挖掘出来的最终成果也是可以作为一种商业秘密来获得保护的。
因此,本文将重点介绍下大数据与知识产权之间的关系。
大数据与版权
一般来讲,各国的《版权法》可为那些用于收集与分析大数据的软件以及计算机程序提供保护。因此,用来挖掘、清洗、分离以及转换数据的原创性数据分析工具在尼日利亚以及其他大部分国家也是可以获得版权保护的。
在这里需要指出的是,为了有资格获得保护,寻求版权保护的软件以及其他数据分析工具必须要能简化成书面的形式或者固定于一种有形的表现形式,同时,其还必须要具备某种程度的原创性。就这种“原创性”的规定而言,尼日利亚此前所加入的《伯尔尼公约》作出了如下表述:文学或艺术作品的汇编,诸如百科全书和选集,凡由于对材料的选择和编排而构成智力创作的,均应得到相应的但不损害汇编内每一作品版权的保护。
因此,与百科全书和选集一样,大数据也有望获得类似的保护(当然,前提是其可以固定于一种有形的表现形式,对内容的选择与安排具有一定的原创性以及能够证明相关人员已为此付出了合理的努力)。不过,考虑到这些数据庞大的容量、花样繁多的种类以及令人眼花缭乱的变化速度,特别是这些数据几乎都来自于完全不同的数据段来源,因此从实际角度来看,对大数据进行选择与安排是一件颇为棘手的事情,有时候甚至是一件不可能完成的任务。
大数据与专利
由于大数据从本质上讲是一种数据流,因此并不完全符合“发明”的定义。然而,在这里需要指出的是,虽然大数据本身并不能获得专利权,但是某些国家却可以为那些专门用来分析大数据的算法提供专利保护。此外,人们也可以为一部分从大数据中挖掘出来的、有一定价值的信息(诸如饮料的配方)来提交专利申请。
不过,就像人工智能一样,大数据的出现实际上也对当前传统的知识产权保护工作构成了挑战。举例来讲,也许人们在未来将很难获得新的专利。造成这个局面的原因很简单,那就是随着大数据挖掘工作的普及,能够阻碍新专利申请获得授权的现有技术数量将会呈现出指数性的增长,从而导致授权专利数量增幅放缓,甚至下滑。
就当前形势来看,大数据技术的发展尚未对专利授权工作产生实质性影响的原因之一只是在于各国的专利局在审查新颖性和非显而易见性时还没有将那些非专利性的技术信息与数据纳入考量。
大数据与商业秘密
对于企业来讲,除了为核心技术申请专利以外,对于自家的机密信息也要“严防死守”。这种可以让企业获得一定竞争优势的机密信息通常被称为商业秘密。商业秘密可以是化合物、给药方案、改良的变种与工艺以及本文所提到的大量机密的数据集合。事实上,现在已经有一部分国家将商业秘密的保护范围扩大到了大数据。
一般来讲,相比于提交专利申请,企业可能会更倾向于保护好自家的商业秘密,因为商业秘密既没有使用期限的限制,又不用缴纳任何的注册费用,同时也无需遵守各类繁冗的法律规定(诸如强制向政府机构进行披露等)。
不过,在企业选择以商业秘密的形式保护自家的知识产权时,其一定要明白下列一点:如果有朝一日,自家的工艺或者创新成果被公众所知晓,那么该企业可能无法采取任何的补救措施,并会因此而丧失掉相关的独占性权利。正是考虑到这一点,很多企业和机构都在用一种近乎疯狂的方式来保护自己的发明,例如谷歌那被列为绝对机密的检索算法、肯德基那从未对外公开过的原始配方以及可口可乐那受到严格保护的饮料配方等都是为商业秘密提供充足保护的知名案例。
有些突破传统的大数据管理模式
从传统角度来看,为了享受到自家无形资产所带来的各种收益,创新型企业通常会制定出一个缜密的知识产权保护策略。这种策略包括为企业的发明、品牌以及工艺等提供严格的保护措施,并以此来充分挖掘出这些资产的潜力。通过此举,企业将会获得使用这些知识产权的独占性权利,并会利用这种权利来阻止他人擅自使用这些资产或者开展侵权活动。
然而,就大数据的管理工作而言,这种传统方法似乎就不那么适合了。这主要是因为数据本身并不是一种常规的资产。这些数据不会自行减少,而只会持续增长,甚至是大规模、呈指数型的增长。同时,数据也不会出现任何的“损耗”,并且可以跨多个价值创造协作平台来进行使用。而且,这些平台还可以帮助各家企业以近乎为零的边际成本来获取、优化以及共享这些数据。
因此,从上述几个特点来看,很明显大数据的价值以及潜力只有在被人们分享以及自由流动的时候才能真正体现出来,而不应该只是被锁在某一家企业的保险柜中。众所周知,河流的宝贵之处在于其能够不断的流动,大数据亦是如此。当然如果能对数据的来源以及形式做一些筛选和把控的话,最终获得的数据集会更加有价值。总而言之,允许人们自由获取和访问数据远比对数据实施隔离措施要重要得多。
特别是,这些大数据拆开来看仍然属于公共领域的信息,因此对其进行共享才是一种明智之举。例如,一家企业只需要先收集好各种有用的信息并搭建好一个数据库,然后再与其他实体机构签订一份数据使用许可协议便可以此来获取收益。而其他的实体机构只需要按照约定缴纳一定的费用便可随时在上述数据库中查到某一特定时间段中的数据。
结语
大数据行业的发展势必会改变全球的知识产权法律框架,以及创新型企业的运营模式。如上文所述,当前的知识产权法律还不足以为数字领域中的宝贵数据库提供保护。各国政府可能不得不在扩大现有知识产权法律的保护范围以及制定出全新的知识产权保护制度之间做出抉择。
尽管各国的知识产权法律会随着大数据以及相关技术的发展而出现某些变化,但是那些试图从海量数据中获取更多价值的企业仍会在管理和使用大数据时采取一些可能会突破常规的方式。特别是,利用大数据来获得高额商业回报的方式似乎就是要与众多战略合作伙伴形成一个商业联盟,并以一种全新的方式来分享数据。因此,从商业的角度来看,相比于保留使用数据的独占性权利以及阻止他人访问这些数据,通过签订许可协议来在各个开放式平台上共享数据的模式显得更加合理。当然,在这样做时,人们一定要考虑到相关的隐私问题以及这些大数据将要用来做什么。(编译自:www.mondaq.com)
翻译:刘鹏校对:李艳秋