这篇文章总结下 Google 一些高级搜索方法。
1. 背景需求
因女朋友做翻译训练,有时候需要知道一些词组如何搭配,普通的搜索满足不了需求,需要用到 Google 高级搜索,于是向我求助。我也借这个机会学习了下如何使用 Google 的高级搜索,发现有些功能确实很实用也很方便使用。所以打算单独写一篇文章总结下,方便后续查阅。
2. 高级搜索技巧
2.1 site
site
命令后面跟某一个具体的网站地址,表示只单独查找这个网站的内容,使用很简单。
举个例子:我需要在 time.com
上查找 coronavirus
相关的报道,可以这样做:
1 | coronavirus site:time.com |
site
命令在搜索关键字 coronavirus
的前面还是后面不影响搜索结果。
也就是说:
1 | site:time.com coronavirus |
的效果一样。
搜索结果:
从结果可以看到,所有的条目都是 time.com
的内容。
*注:site:
命令中的冒号是英文输入状态下的冒号,冒号后面不能有空格。
2.2 filetype
filetype
后面跟某种文件类型,如 pdf
、doc
、ppt
等,表示搜索特定类型的文件。但是亲测目前 Google 不能搜索 epub
类型的文件。下面通过一个例子来了解这个命令的使用。
比方说:我要搜索《The Little Prince》的 pdf
版本,可以这样做:
1 | the little prince filetype:pdf |
同样,filetype
命令在关键字前面还是后面不影响搜索结果。
搜索结果如下:
从上面的结果可以看到,我们搜出来的都是 PDF 版本的《The Little Prince》。
2.3 intitle
和 allintitle
intitle
后面跟一个搜索关键字,表示在网页的标题 中进行搜索。
比方说,我需要搜索在网页标题中出现 coronavirus
关键字的网页,可以这样做:
1 | intitle:coronavirus |
搜索结果:
可以看到,搜索到的网页的标题中都包含 coronavirus
。
当然,intitle
命令还能配合 site
和 filetype
命令一起使用。
举个例子,我们需要在一些政府网站(一般是 .gov
结尾)中搜索标题中包含 coronavirus
的 PDF 文件,我们可以这么做:
1 | site:.gov intitle:coronavirus filetype:pdf |
搜索结果:
intitle
后面只能跟一个搜索关键字,如果我们需要搜索多个关键字,可以使用 allinititle
命令,使用方法和 intile
一样。
举个例子,我们想要在 www.washingtonpost.com
中搜索网页标题中包含 global pandemic
的报到,可以这样做:
1 | allintitle:global pandemic site:www.washingtonpost.com |
2.4 intext
和 allintext
intext
和 allintext
的使用和前面介绍的 intitle
& allintitle
一样,只不过 intext
表示搜索网页的正文,后面只能跟一个关键字。如果需要在网页正文中搜索多个关键字,需要用 allintext
。
举个例子:在 time.com
下面搜索网页正文中包含 quarantine
关键字的新闻报到:
1 | intext:quarantine site:time.com |
搜索结果:
同理,如果需要搜索的关键字是 coronavirus disease
,可以这么做:
1 | allintext:coronavirus disease site:time.com |
从搜索结果中可以看到,第二条和第三天结果中并不精准包含 coronavirus disease
关键字,而只是出现了 disease
。
如果需要精准搜索,我们需要用到双引号""
。
2.5 双引号 ""
的使用
双引号 ""
表示精准搜索,即搜索结果一定要和双引号内的搜索关键字精准匹配。
同样是 2.4 节的例子,如果我们需要搜索结果中精确地、一字不差的包含 coronavirus disease
关键字的话,我们可以加上双引号:
1 | allintext:"coronavirus disease" site:time.com |
这一次可以明显看到,搜索结果中都精确包含了 coronavirus disease
关键字。
2.6 通配符 *
和 .
的使用
学过数据库、接触过 Linux 的朋友对通配符的概念应该比较熟悉,Google 高级搜索中也可以使用通配符。
.
: 表示匹配某一个字符;*
: 表示匹配任意长度的字符串。
举个很不恰当的例子。比方说我们这么搜:
1 | tu.k |
在第 3 个字符的位置,我们使用 .
通配符,表示这个位置可以出现任意一种字符,那么可以预期的是,包含 tuck
、tu&k
、tu3k
etc. 的网页都会被检索出来。
搜索结果如下:
我们可以看到,TU-K
被检索出来。这里,.
就表示 -
。
个人认为 .
单个字符通配功能一般,还是 *
更加强大。
举个英语翻译中实际碰到的例子:我们知道主语 agriculture
和宾语 hunger
,我们想搭配一个谓语动词,但是不知道用什么词好,这时候就可以用上 *
通配符以及双引号 ""
来精确搜索了:
1 | "agriculture * hunger" |
我们还可以在 intitle
或者 intext
中使用 *
通配符,不过涉及到空格问题,使用起来需要注意,具体来说分下面几种情况:
intitle
+""
+*
: 通配符前后不能有空格
1 | intitle:"global*" site:time.com |
intitle
+*
: 通配符前后可以有空格
1 | intitle:global * site:time.com |
""
+*
: 通配符前后可以有空格
1 | "global * " |
*
: 通配符前后可以有空格
1 | global * |
2.7 其它
其它一些个人认为不是很常用的命令的使用方法,可以参考 Google高级搜索指令 和 Google高级搜索技巧之高级语法查询指令 。
3. References
- https://www.lifewire.com/search-using-wildcards-google-1616504
- https://www.searchenginejournal.com/how-to-use-wildcard-search-with-various-google-services/28911/
- http://www.googleguide.com/wildcard_operator.html
- http://blog.sina.com.cn/s/blog_72b6f3e20102vxnf.html
- https://zhuanlan.zhihu.com/p/23650199
- https://www.bilibili.com/video/BV1Vs411T7jX?p=8