法岸律师事务所 FAAN.COM
如何玩转美国专利检索工具-PPUBS
Patent Public Search (PPUBS) 工具是一种新的基于网络的专利搜索应用程序,它将取代了内部搜索工具 PubEast 和 PubWest 以及外部搜索工具 PatFT 和 AppFT。 Patent Public Search 有两个用户可选择的现代界面(PPUBS基础搜索以及PPUBS高级搜索),可增强对现有专利技术资料的访问。该应用程序强大而灵活的新功能将改善整个专利检索流程。
如果您不熟悉专利搜索,或者想使用 USPTO 的 PatFT/AppFT 中提供的功能,请选择“基本搜索”,按关键字或常用字段(例如发明人或公开号)查找专利。选择“高级搜索”使用完整的查询选项以及通过数据库进一步过滤专利搜索或通过标记组织文档。
基本搜索
下表提供了简单搜索的示例以及此类搜索的预期结果。
例子 | 搜索结果 |
oxide | 返回文档文本中任何位置包含单词“oxide”的所有文档。 |
oxidizing bacteria | 如果选定的默认运算符是OR,则返回文档文本中任何位置包含单词“oxide”或"Bacteria"的所有文档。 |
通配符 (?, $, *)
下表提供了通配符搜索的示例以及此类搜索的预期结果。
通配符 | 含义 | 示例 | 搜索结果 |
? | 匹配任何单个字符,可以出现在单词的开头、中间或结尾。 | m?cro | 返回文档文本中任何位置包含单词“micro”或“macro”的所有文档。您将看到每个术语的不同加亮显示。 |
$[#] | 匹配不超过指定数量的字符。 | micro$3 | 这里的 $3 表示最多匹配 3 个字符,涵盖“micro”、“micron”、“microns”、“microvia”、“microbio”之类的术语。 |
* | 匹配任意数量的字符。 | micro* | 涵盖任何以"micro"开头的单词,例如"microencapsulated"、"Microelectronic" 、"microelectromechanical"等。 |
$ | 匹配任意数量的字符。 | micro$ | 涵盖任何以"micro"开头的单词,例如“micro”、“microprocessor”、“mircrophone”、"microencapsulated"等。 |
布尔搜索(AND、OR、NOT、XOR)
下表提供了布尔搜索的示例以及此类搜索的预期结果。陈伟涛律师提醒,这些布尔搜索应用于整个文档,而不是特定的段落或句子。
运算符 | 含义 | 示例 | 搜索结果 |
AND | 两个术语必须同时出现在文档中。 | photographic AND noodle | 返回文档中某处同时包含 “photographic” 和“noodle”的文档 。 |
OR | 至少其中一个术语必须出现在文档中。 | dog OR cat | 这两个术语之一必须出现在文档中。 |
NOT | 第一个术语必须出现,第二个不得出现。 | cardboard NOT box | 返回文档中包含“cardboard”,而比包含“box”的文档。 |
XOR | 只有其中一个术语出现在文档,不能两个同时出现。 | pipe XOR ptfe | 这两个术语之一必须出现在文档中,但不能同时出现。 |
邻近运算符(相同、有、相邻、靠近)
下表提供了使用邻近运算符进行搜索的示例。陈伟涛律师指出,除SAME针对特定段落搜索外,下表中的其它词都针对特定的句子进行搜索。
搜索 | 含义 | 示例 | 搜索结果 |
ADJ | 两个术语必须紧挨着彼此出现,并且按顺序出现。 ADJ 是唯一的有序运算符。 | oxidizing ADJ bacteria | 返回这两个术语彼此相邻且顺序相同的文档。没有运算符时,这个就是默认运算符。 |
ADJ[n] | 两个术语必须在 相邻[n] 个术语中按顺序出现在同一个句子中。 | wet adj4 silicon | "silicon"必须出现在 "silicon"之后的 4 个词中 - 因此以下 "wet oxidized, polysilazane-based silicon oxide" 将会被列入搜索结果。 N 的最大值为 450。 |
NEAR | 与 ADJ 类似,但顺序无关。 | electrospray NEAR ion | 返回“electrospray”和“ion”彼此相邻且在同一个句子中,但顺序不限的文档。因此,与 ADJ 不同,"negative ion electrospray" 会被列入搜索匹配项。 |
NEAR[n] | 同样,类似于 ADJ[n],但顺序无关紧要。 | cyclotron NEAR7 magnetic | 查找cyclotron和magnetic在相邻 7 个单词以内出现,但先后顺序不限的文档。"a magnetic sector mass analyzer, or an ion cyclotron."是一个搜索匹配项。N 的最大值为 450。 |
WITH | WITH 连接的两个术语必须出现在同一个句子中。 | detect WITH light | 查找在同一句子中出现术语“Light”和“detect”的文档。 |
WITH[n] | WITH 连接的两个术语必须出现在相邻的n个句子中。 | detect WITH10 light | 查找术语“Light”和“detect”出现在彼此 10 个句子以内的文档。 N 的最大值为 25。 |
SAME | SAME 连接的两个术语必须出现在同一个段落中。 | synthesizing SAME tomography | 查找在同一段落中出现术语“synthesizing”和“tomography”的文档。 |
SAME[n] | SAME 连接的两个术语必须出现在相邻的n个句子中。 | wheel SAME3 wood | 查找术语“wheel”和“wood”出现在彼此 10 个段落以内的文档。 N 的最大值为 25。 |
特定领域的搜索
下表列出了一些最常用的索引。可搜索索引的完整列表可以在USPTO网站上查询。
后缀 | 含义 | 示例 |
AB | 检索专利的摘要文本 (Abstract)。 | amethyst.ab. |
AD | 检索专利的申请提交日期。 | |
APP | 检索专利的申请号(必须使用斜杠)。 | 10/501576.app. |
AS | 检索专利的受让人名称。 | |
AY | 检索专利的申请提交年份。 | 2006.ay. |
BSUM | 检索专利的简要摘要部分。 | medicinal.bsum. |
CCLS | 针对美国专利分类和子类进行检索。 | 138/$.ccls. |
CLAS | 检索专利的USPC 分类文本。 | 435.clas. |
CLM | 检索专利的权利要求部分。 | tube.clm. |
CLMS | 检索专利的权利要求部分。 | computer.clms. |
CPC | 检索合作专利分类。 | F16L11/00.cpc. |
CPCA | 检索合作专利分类。 | B32B2307/50.cpca. |
CPCI | 检索合作专利分类。 | A61M5/385.cpci. |
Date Ranges | 申请年份、申请日期、专利日期和专利年份的各种日期范围。 | Equal = @pd=20011118 Greater than > @ad>19961231 Greater than or equal to >= @ay>=2014 Less than < @py<1997 Less than or equal to <= @py<=1975 Not equal to <> @pd<>19990216 Range >=…<= @ay>=1980<=1986 |
DCLM | 检索专利的权利要求部分。 | program.dclm. |
DETD | 检索专利的详细描述部分。 | sheepdog.detd. |
DID | 搜索特定的文档 ID 。 | US-2418590.did. 注意必须包括连字符。 |
FD | 检索专利的申请提交日期。 | 20110811.fd. |
FY | 检索专利的申请提交年份。 | 2016.fy. |
IN | 检索专利发明人姓名。 | |
INV | 检索专利发明人姓名。 | sontag.inv. |
IPC | 检索专利的国际专利分类。 | G06F17/00.ipc. |
PD | 检索专利的公开日期。 | 20150217.pd. |
PN | 搜索特定的专利号。 | |
SPEC | 检索专利的说明书部分。 | sheltie.spec. |
TI | 检索专利的标题文本。 | concrete.ti. |
URPN | 检索专引用的专利号。 | 8025207.urpn. |
XA | 检索专利的助理审查员姓名。 | smith.xa. |
XP | 检索专利的主要审查员姓名。 | hook.xp. |
快速参考表
下面的简单表格显示了运算符的应用范围、术语是否要求按顺序排列以及它们是否在末尾接受数字修饰符。
运算符 | 应用范围 | 顺序要求 | 数字修饰符 |
ADJ | 句子 | 有 | 有(单词的数量) |
AND | 文档 | 无 | 无 |
NEAR | 句子 | 无 | 有(单词的数量) |
OR | 文档 | 无 | 无 |
SAME | 段落 | 无 | 有(句子的数量) |
WITH | 句子 | 无 | 有(句子的数量) |
NOT | 文档 | 无 | 无 |
XOR | 文档 | 无 | 无 |
按相关性排序
搜索引擎首先使用布尔模型返回与用户查询匹配的文档。返回的搜索结果按相关性得分进行排名和排序,得分最高的文档出现在结果的顶部。陈伟涛律师介绍,文档的相关性得分使用一种称为 TF-IDF(关键词频率和逆向文档频率)的统计方法,该方法基于查询中的词。如果一个文档中的术语频率高于另一个文档,则该文档被认为与查询更“相关”。当术语“罕见”并且因此是与查询更相关的术语时,查询术语的 IDF 很高。如果查询词是大量文档中的“常见”词,则该查询词的 IDF 较低。
非索引词(Stopwords)
非索引词是在专利公开搜索的文本中未编入索引的词,由于它们出现的频率很高,因此对文档意义不大。排除非索引词可以节省存储空间。陈伟涛律师指出,当在专利公开搜索中使用非索引词进行查询时,该术语仅在某些元数据字段(例如受让人名称和PCT数据)中进行搜索。如果在文本字段/文档正文中发现非搜索词(例如在标题、摘要、详细说明或权利要求中),则不会返回任何结果。
专利公开搜索中的非索引词 | 专利公开搜索中的非索引词 |
---|---|
a* | on |
an | or* |
and* | such |
are | that |
as* | the |
at* | their |
be* | then |
by | there |
for | these |
if | they |
into | this |
in* | to |
is | was |
it* | will |
no | |
not | |
of | |
"*"表示该词是可搜索的非索引词。