在多数情况下,专利分析是基于各种专利数据进行的,因此专利分析中的一项重要工作是分析处理专利数据。虽然多种工具(如Excel和一些专利分析系统)已被用于分析专利数据,但利用这些工具应对某些复杂分析时仍存在一些问题。例如,在使用Excel时需要灵活运用Excel函数,这无疑增加了分析人员的工具学习成本。而多数专利分析系统是通过运行分析模板实现既定的分析任务,因此其提供的分析功能有限,难以满足分析人员的多种分析需求。因此,专利分析迫切需要操作简便、功能全面的分析工具,以帮助分析人员全面有效地完成分析工作。
PowerBI(下称PBI)是微软公司推出的一套用于商业数据分析的交互式可视化数据分析工具,其兼具数据获取、加工、建模和可视化多种数据处理和分析功能,能够实现多数据源的数据整合、数据模型的建立、数据可视化图表的交互式呈现,其操作简便,降低了工具的使用门槛。此外,PBI能够通过建立多数据表间关系形成数据模型,由此能够利用多维度数据信息进行分析。同时,PBI中形成的图表能够以人机交互方式动态呈现关联数据的信息——相比静态图表能够提供更为丰富的数据信息,便于分析者就此发掘价值信息。
虽然PBI主要应用于商业数据分析,但其仍然属于数据分析工具,因而理论上同样能够适用于专利数据的分析。本文试将PBI用于专利数据分析,通过借助该工具操作简便和功能全面的优势,尝试完成一些较为复杂的专利数据分析任务,以期为专利分析人员提供参考。
数据建模
由于专利数据间的关系复杂,进行数据间的分析往往难度很大。例如,一般情况下,一项专利文献会对应多个发明人。如果一件专利申请为共同申请,还会对应多个申请人。在一些分析场景中,如何将上述多种数据信息相互关联以实现相互分析仍有一定难度。
PBI能够通过多种数据关系表中的共有数据字段建立各关系表间的关联,即实现数据建模,并允许分析过程中不同关系表中数据间相互筛选分析。对于前述分析场景,可以分别就“公开号-国家名称”“公开号-申请人”和“公开号-发明人”建立独立的关联表格,同时由于这些表格均含有与原始数据相对应的“公开号”字段,因此能够以“公开号”字段作为桥梁建立申请人、发明人和国家数据的联系,由此构建数据模型。
交互联动
在数据建模的基础上,通过PBI能够快速完成可视化图表的绘制。在PBI中绘制图表仅需如下三步:选择所需的可视化图表类型,将要分析的字段拖动到图表数据栏中,必要时可在图表属性中调整图表格式即可完成绘制。
在不同数据表建立关系后,在PBI中还能够通过不同数据表中的字段进行可视化图表绘制,即分析不同数据表中字段的数据关系。对于前文提到的两个数据分析问题,能够分别通过可视化方案“ZoomChartsNetworkChart”和“弦图”将“申请人-发明人-专利申请量”“申请来源国-申请目标国”数据可视化。在图表绘制后便可以通过其交互特性进行多角度分析。例如,在“申请人-发明人-专利申请量”图中选中其中一个申请人,则会使“申请来源国-申请目标国”图中自动筛选对应申请人的专利申请流向信息。再如,在“申请来源国-申请目标国”图中选择某一国家,则“申请人-发明人-专利申请量”图则会仅显示相应国家的申请人及其发明人情况。
上面例子简单展示了PBI可视化的交互特性,为了进一步说明其在专利分析中的应用价值,下面通过实际分析情景进一步说明。
专利分析其中一个分析项目是申请人分析,具体需要就申请人的专利申请情况、专利布局分布、发明人员情况以及重点专利和技术脉络等问题进行梳理和分析。为此,利用PBI分别绘制出“申请人申请量排名”“申请流向”“申请量趋势”“发明人数量趋势”以及“技术主题分布”可视化图表,并将其布置于同一报表页面中(注:PBI中可视化方案均可通过复制/剪切方式重复/移动可视化方案),由此便能够利用这些图表联动即时分析多个申请人的相关数据情况。在具体分析操作中,在“申请人申请量排名”表中选中特定申请人,由此便会使其他图表显示/突出显示该申请人的在申请流向、申请量趋势、发明人数量趋势以及技术主题分布的信息。在“申请人申请量排名”表中改变选中的申请人,则相应信息依申请人选择改变而相应调整,因此可以即时显示不同申请人的相关信息,而无需重复绘制同类图表。
为了进一步分析特定申请人的专利技术情况,可以创建第二个分析报表,其中保留了第一个分析报表中的技术主题分布图,在此基础上加入了专利文献的引用关系图(利用专利引用数据并采用可视化方案“NetworkNavigator”绘制)和申请人数据的切片器。其中,文献引用关系图中会以节点形式表示一个专利族,并在节点旁显示该专利族的一个专利的公开号以作为该族代表,节点间连线表示其具有引用关系,节点大小以该专利族被引用频次设定,由此能够清楚发现高引用频次专利,有利于判断专利族的重要程度。在针对特定申请人进行分析时,可以在切片器中选择该申请人,由此使该报表中其他可视化图表均仅显示该申请人相应数据,即显示该申请人的技术主题分布、专利文献引用关系图。该可视化方案有助于迅速发现不同技术主题下申请人的高频引用专利,同时文献引用关系也能够对于梳理该申请人该技术主题的技术脉络提供帮助。
通过上面的实例能够看出,PBI中通过多种可视化图表的组合能够衍生出多种维度的分析,以满足多种分析场景的要求。同时,由于各图表间的相互联动呈现,事实上特定字段间的可视化图表仅需要制作一次,便可结合其他图表展现出更多数据维度的情况,这相比静态图具有更高的效率。
综上所述,PowerBI虽然并非专利分析的专用工具,但其在数据分析方面操作简单、功能全面。PowerBI数据建模支持多维度数据的协同利用,可视化图表绘制便捷,可视化交互联动允许分析者根据分析需要灵活创建分析场景,能够真正用于专利数据分析中,满足多变、深入的分析需求,并且相比静态图表具有更高的制图效率。这有利于使分析者从图表绘制的繁杂低产出工作中解放出来,而聚焦分析本身,进而促进专利分析质量的提高。(赵佳睿左良军危峰)