搜索引擎怎么让其数据库里面涵盖互联网所有信息
作者:热度:Loading...时间:2010-0301
前面在谈到搜索引擎的本质的时候,说道搜索引擎的数据库里面必须涵盖整个互联网的所有信息。
这就是平时许多人都在讲到的收录。如果你的网站没有被搜索引擎收录,那么你的网站是无论如何也不可能在搜索引擎的结果页面看到的。所以网站排名,收录是一切的前提。
我们查询一个是否被搜索引擎放到数据库里面用这个命令:site:www.xxxx.com,在对应的搜索引擎框里面。如果出来有结果,说明你们的网站被搜索引擎收录了,反之,则没有。
例如:site:www.baigu.org,这个网址看到有结果证明搜索引擎已经收录了该站。
搜索引擎要把你的网站完全收录在数据库里面的工具就是搜索引擎蜘蛛。
各搜索引擎蜘蛛名字如下:
| 搜索引擎蜘蛛名 | 所属搜索引擎 |
| baiduspider | 百度 |
| Googlebot | |
| MSNbot | LIVE搜索 |
| Yahoo Slurp | 雅虎网页搜索 |
| sogou spider | 搜狗搜索 |
| YodaoBot | 有道 |
| Sosospider | 搜搜 |
| ia_archiver | Alexa.com |
| Ask Jeeves/Teoma | Ask.com |
| Architext spider | Excite.com |
| FAST-WebCrawler | FAST (AllTheWeb.com) |
| Slurp | Inktomi.com |
| Scooter | AltaVista.com |
| crawler@fast | FAST (AllTheWeb.com) |
| Crawler | Crawler.de |
| InfoSeek sidewinder | InfoSeek.com |
| Lycos_Spider_(T-Rex) | Lycos.com |
各大搜索引擎就是靠这些搜索引擎机器人把互联网的信息抓取到自己的数据库。这每一个搜索引擎的数据库都是现行的互联网。这个数据库是庞大的。
搜索引擎蜘蛛机器人是分工工作的。第一种蜘蛛专门沿着互联网的超级链接把互联网当中的链接抓取到数据库里面。第二种蜘蛛沿着第一种经过处理后的网站链接抓取内容。分工使得搜索引擎节约资源提高工作效率。
本文首发百谷创想www.bggoogle.com,北京SEO培训,转载请保留版权
Tag:



