今天,知识产权信息珠珠给大家分享带来的《化学物质信息标引在专利数据库建设中的重要性》,如果您对化学物质信息标引在专利数据库建设中的重要性感兴趣,请往下看。
在化学领域的技术创新过程中,为了避免重复研究以及侵权问题,更好地制定研究方向和市场竞争策略,研究人员需要对已有的文献信息进行检索和分析,掌握最新技术进展,这就需要规范、完善的化学专业领域的数据库作支撑。数据显示,90%以上的科技类信息会首先在专利申请中被披露,因此化学领域专利数据库的建设在科研创新、国家安全领域具有重要意义,拥有独立完备的数据库更具有突出的现实和战略需要。专业数据库的建设并不是简单的文献堆积,为了方便检索,需要对文献进行规范化的处理,这个过程就是文献标引。标引是指对文献的主题信息和有检索意义的技术特征进行分析,并使用关键字符、符号等来表示文献的过程。
标引是一项重要的文献处理技术,在文献数据库建设过程中起关键作用。在化学类数据库的建设发展中,化学物质的标引和处理方法尤为重要。世界主要发达国家均拥有各自的相对完善的化学数据库,以美国化学文摘社(CAS)为例,CAS拥有世界上最大的化学相关信息数据库,现有多个数据库和检索平台为全世界的化学研究者提供文献检索服务,包括STN国际联机检索系统和SciFinderScholar数据库等。在这些众多的数据库和检索平台中,其中CASRegistry化学物质数据库是CAS的基础数据库,也是最重要的数据库。由化学物质库关联到其他数据库,建立了庞大的化学类数据库网络,包括专利数据库和非专利数据库。我国相关机构也有对化学专利数据的整理和总结,但数据相对分散、重复,缺乏统一的标引策略和检索入口,造成了数据资源的重叠、不完善,检索效率较低。经过几十年的艰苦努力,中国的发展对世界经济的影响越来越大,因此,我国亟需建设系统的化学领域数据库,这其中化学专利数据库的建设是重中之重。
在化学专利数据库的建设过程中,化学物质的标引是基础。研究人员在使用化学类数据库的过程中,一般会先检索化学物质,再筛选相关文献。化学物质的检索方式有化合物名称、CAS号以及分子结构式等。因此,化学物质的标引是否准确、全面,往往会直接影响到数据库检索的准确性和效率。
在专利数据库建设过程中,化学物质信息的标引包括物质属性信息和文献关联信息两种。物质属性信息包括物质名称、数据库登记号、分子结构式、分子量、SMILES字符串、InChI国际化学品标识等;文献关联信息包括物质的职能符、制备方法以及在原文中的位置等,这些信息是物质与相应文献相关联的信息。这两类信息在建设化学专利数据库同时需要。在标引过程中,化学物质的信息要尽量全面,比如物质名称包括中文名、英文名、系统名、俗名等,不同的检索人员可能会用不同的名称检索,因此应该给与全面的记录。对于一些新的化合物,如果文献中没有提供相关的名称,可以用数据库登记号和分子结构式相结合的方式去标引。因为数据库登记号相当于化学物质的身份证号,配合分子结构式就可以完全表示一个化学物质,避免重复和混淆。另外,复杂的族性结构化合物的标引策略又与确定结构化合物有很大的不同,母体的选择,多重取代基的表示方法、组合方法等,须建立系统、完备的标引规则和相应的操作系统。
专利申请中化学物质的标引工作量较大,有的一篇专利中需要标引的化合物可能有几百个甚至几千个,如果全部采用人工标引,绘制结构式的工作量太大,比较耗时耗力。因此,可以借助计算机实现数据批量处理,自动完成专利中化学物质的快速标引。比如可以借助机器识别的手段,将专利中大量的化学结构式直接识别成标准的摩尔格式文件,再进行人工校对,这样可以大大提高标引效率。
化学是一门重要的基础科学,化学知识渗透到国民生产、生活以及国防等各个领域,化学领域专利数据库的建设在收集化学领域研究成果的同时,为科研人员提供文献检索服务,掌握研究基础,分析行业动态,具有重要意义。在实施知识产权战略的当下,我国拥有自主知识产权的、完善的、方便检索的化学专利数据库作为必要的战略资源,具有非常重要的经济价值和战略意义。(知识产权出版社有限责任公司张艳)
(编辑:蒋朔)
好了,关于“数据库”化学物质信息标引在专利数据库建设中的重要性的内容就介绍到这。