专利检索——关键词是确定和实用
对于专利检索是个“系统工程”,主要包括以下几个工作:检索目的的确定,选取数据库,了解技术方案并进行技术分解,选取检索要素构建检索式,调整检索策略和检索数据库,中止检索的判断(查全率查准率的评估)。
其中检索要素以分类号及关键词为主,关键词是专利文献最直观的表现,是进行专利分析检索的核心手段之一,直接影响专利信息的全面性和准确性。决定这专利专利分析结果的质量。
同时关键词是选取应该立足于对应的技术领域及技术分支。
以下是对专利检索中关键词的确定方法:
//由技术分支确定关键词//
1、制定技术分解表,选取关键词
从技术分解表中选择关键词,,关键词是可以较为准确的表达技术分支的关键词。
2、扩展关键词
意义上的扩展
考虑检索词的同义词、反义词、近义词、上下位的概念、横向等同,并根据领域特点对关键词进行再次的取舍和修正。
形式上的扩展
中文—英文—英文不同词性、单复数、简称、缩写、英美拼音的差异、单复数。
角度上的扩展
考虑技术方案解决的技术问题、技术效果、或者用途进行分析。
如确定自动驾驶中雷达系统的失调角度的计算这个技术分支中,失调角这个关键词可以出现在其他很多的领域中。根据总分的检索策略,同时应该从本领域选择自动驾驶领域确定失调角的区别点选取关键词作为检索要素。
//结合检索策略确定关键词//
如确定自动驾驶中雷达系统的失调角度的计算这个技术分支中,失调角这个关键词可以出现在其他很多的领域中。根据总分的检索策略,同时应该从本领域选择自动驾驶领域确定失调角的区别点选取关键词作为检索要素。
结合数据库特点确定关键词//
不同的数据库中对技术特征的关键词的表达可能存在很大的差别,或者不同的关键词表达的同一个技术特征。这在我们平时对技术领域的检索过程中应该做好记录和收集。例如“槽”一般将其翻译为“groove”“slit”"slot"而日本的申请会将其翻译为“pit”"ditch"。这个有时候需要我们通过采用定向抽取的方式阅读相关的文献,获取关键词的扩展。
//与检索符号组合使用//
W(有序临近)、nW(有序临近至多n个词)、=nW(有序临近n个词)属于同一算符的不同用法,表示两个检索词之间可以间隔几个词,n的取值范围为正整数,默认值是0。如:NIGHT 1W TRAIN 可以匹配 'NIGHT IN TRAIN'和'NIGHT TRAIN',而NIGHT =1W TRAIN只能匹配'NIGHT IN TRAIN'。
D(无序临近)、nD(无序临近至多n个词)、=nD(无序临近n个词)属于同一算符的不同用法,含义与W算符意义相同,只是对检索词的顺序没有了要求。如:NIGHT 1W TRAIN 可以匹配出 ‘NIGHT IN TRAIN’、'NIGHT TRAIN'、‘TRAIN IN NIGHT’、‘TRAIN IN NIGHT’。
F(同字段)两个检索词同时存在于同一个字段中,例如:“说明书=(NIGHT F TRAIN)”,只要说明书里包含这两个词,这篇文献才会命中;
P(同段落)两个检索词同时存在一个段落中,例如 :“说明书=(NIGHT F TRAIN)”,只有当说明书里的某一段文字中同时包含这两个词,这篇文献才会命中。
S(同句子)两个检索词同时存在一句话中,例如:“说明书=(NIGHT F TRAIN)”,只有当说明书里的某一个句话同时包含这个检索词,这篇文献才会命中。
NOTF(非同字段)、NOTP(非同段落)、NOTS(非同句子)意义与F\P\S相反。
截词符:“?”取0-1个字符,“#”仅取代一个字符,“+”表示末尾或词前紧跟任意个数字符,“*”表示任意多个字符。
逻辑符:或与非(or and not)
合理使用上述的逻辑符和截词符,可以在一定程度上避免噪声。
//基于协议标准确定关键词//
可以根据分析对象的行业标准结合行业标准、行业协议确定关键词。结合行业领域中的特点,选取行业标准或者协议中的术语作为关键词。
//关键词的补充//
对检索结果进行取样阅读和评估,在阅读中发现和补充适用的关键词。补充的内容可以是有效的关键词,也可以是噪声词,可以用于噪声的去处。
同时可以通过抽样的阅读可以发现存在于摘要,背景技术中的弱相关的关键词,可以作为后续的补充检索使用。