搜索入门

多个关键字

搜索结果要求包含两个及以上关键字,以空格分隔;

1
搜索引擎 历史

不包含特定关键字

搜索结果不包含某些特定资讯,用减号-操作;

1
2
搜索引擎 历史 -文化 -中国历史 -世界历史
// 注意:减号后面没有空格

或搜索

搜索结果至少包含多个关键字中的任意一个,用大写的OR操作;

1
2
搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo -文化
// 至少包含 [archie][蜘蛛][lycos][yahoo]中的一个,不包含[文化]

通配符

目前可以用*来代替单个字元,而且必须用英文的双引号””引起来;

1
“以*治国”

字母大小写不敏感

GODgod搜索的结果是一样的;

搜整个短语或句子

关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号””,否则空格会被当作操作符。

1
“world war I

忽略字元及强制搜索

搜索引擎忽略的字元以及强制搜索,如icomwww等,以及一些符号如*.等,作忽略处理。

1
2
www的历史 internet
// 搜索结果中不会有与[www]相关的结果

搜索引擎实际上把www的历史这个短语分成三部分:www历史,分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的www的历史,但搜索引擎还是把这个短语当成三个关键字分别检索。

要对忽略的关键字进行强制检索,可以用英文双引号””引起来:

1
2
“www的历史” internet
// 搜索结果中会有与[www]相关的结果

注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。

搜索进阶

特定网站

对搜索的网站进行限制——site:

1
2
3
4
5
// eg1:
搜索引擎 技巧 site:edu.cn

// eg2:
“search engine” tips site:www.zhihu.com OR site:www.douban.com

site表示搜索结果局限于某个具体网站或者网站频道,如http://www.zhihu.comedu.sina.com.cn,或者是某个顶级域名,如com.cncom等等。如果是要排除某网站或者顶级域名范围内的页面,只需用“–网站/顶级域名”。

注意:site:中的冒号后面不能有空格。

特定文档

在某一类档中查找资讯——filetype:

1
2
3
4
5
// eg1:
资产负债表 filetype:doc OR filetype:xls OR filetype:ppt

// eg2:
冰与火之歌 filetype:mkv OR filetype:mp4

filetype:是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进位文档进行检索。

包含在URL链接中

搜索的关键字包含在URL链接中——inurl:allinurl:

1
2
3
4
5
// eg1:
inurl:mp3 “这个世界会好吗”

// eg2:
allinurl:”cgi-bin” phf +com

网页链接中包含第一个关键字mp3,第二个关键字这个世界会好吗出现在链接中或网页文档中。

allinurl返回的网页链接中包含所有关键字。

包含在网页标题中

搜索的关键字包含在网页标题中——intitle:allintitle:

intitle:allintitle:的用法类似于上面的inurlallinurl,只是后者对URL进行查询,而前者对网页的标题栏(即标签中的内容)进行查询。

1
2
3
4
5
// eg1:
intitle:重庆 “轨道交通”

// eg2:
allintitle:重庆 “轨道交通”

包含在网页锚点内

搜索的关键字包含在网页的“锚”(anchor)点内——inanchorallinanchor
用法与URL和TITLE类似。

链接到某URL的网页

搜索所有链接到某个URL位置的网页——link:

1
2
link:www.zhihu.com
// 搜索所有链接到http://www.zhihu.com的网页。

如果你拥有一个个人网站,想知道有多少人对你的网站做了链接,link:可以迅速达到这个目的。

link:不能与其他语法混合操作;另外,link只列出Google索引链接很小一部分,而非全部。

link的妙用:一般来说,做友情链接的网站都有相似的地方。这样,你可以通过友情链接,找到一大批具有相似内容的网站。

页面结构相似的页面

查找与某个页面结构内容相似的页面——related:

1
related:www.zhihu.com

从缓存页面查询

从Google伺服器上缓存页面中查询资讯——cache: