Google强大的网页抓取功能,文件也不放过.

去年在点石上看到了某某人写的关于google可以抓取flash之后我也在我以前的一个垃圾站点上发现了这个情况,那个时候也没有什么太大的注意,不过今天在搜索一个东西的时候发现了google也可以抓取很多格式的内容了.比如:PDF,DOC等.如下图所示:

去点石找了半天也没有找到以前写这个现象发生的文章,不过找到了一篇论坛回帖,说Google现在可以支持13种非HTML文件的搜索.其中包括PDF,DOC,SWF,ppt,xls,rtf,ps,等等,后3者为试验过,不过我曾经见到过ppt文档的搜索结果.需要某种类型的搜索结果,只需要在搜索引擎上输入: 关键字 filetype:文件格式,比如搜索包含"小哀"内容的SWF文件就输入:小哀 filetype:swf.其他类型也一样.

google作为SE行业的领头羊,在搜索技术上一直出于最前端.现在google更加智能,更加的人性化,更加的先进,不同类型文件的全能搜索扩展了google的覆盖领域,在慢慢适应着各种类型的网站.Google,加油!

相关推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注

微信扫一扫

微信扫一扫

微信扫一扫,分享到朋友圈

Google强大的网页抓取功能,文件也不放过.
嘿!有什么能帮到您的吗?
返回顶部

显示

忘记密码?

显示

显示

获取验证码

Close