俯视深渊：十大深网搜索引擎介绍 Secer's Blog - 记录互联网安全历程与个人成长经历

导语：“深网”也称为“隐形网络”，这个术语指的是大量底层内容的存储库，比如普通网络爬虫无法爬取到的在线数据库文档。

当我们需要搜索什么东西时，第一个想到的便是Google或者Bing。但是Google和Bing搜索不到暗网下的隐藏信息。

当你通过Google进行搜索时，Google会记录你在网上的每一个操作。如果你不想Google收集你的信息和在线活动，你应该在网络上保持匿名。

“深网”也称为“隐形网络”，这个术语指的是大量底层内容的存储库，比如普通网络爬虫无法爬取到的在线数据库文档。

深网内容估计比普通搜索内容大500倍，但由于传统搜索引擎的限制，大部分内容都无法搜索到。

由于大多数个人档案，公共记录和其他与人有关的文档都存储在数据库中而不是静态网页上，因此大多数关于人的重要隐私信息对于常规搜索引擎来说都是“不可见的”。

不过，由于搜索算法的不断完善和更新，找到需要的商品，内容或信息是非常容易的。

另请阅读：如何匿名访问深网并了解其秘密和神秘活动

为什么Google不提供深网搜索结果？

通常来说，深网和暗网的隐藏内容是没有索引的，所以通过Google和Bing的普通搜索引擎是搜不到结果的。

所有Deb网站(.onion)都没有进行索引。

Google不会提供不通过万维网索引的搜索结果。

另请阅读：使用TOR和OnionShare匿名共享文件

当你访问暗网时，你访问的不再是平时你经常访问的服务器。相反，所有东西都保留在Tor网络内部，为每个人提供安全，保护隐私。

据研究人员称，只有4%的互联网内容是公众可见的，其余96%的网站和数据隐藏在深网中。

深网包括很多非法活动，包括毒品，武器交易，高度精密的黑客工具，非法色情，政府军事机密和其他非法活动。

Robots文件

robots.txt文件通常位于站点根目录下，它的作用是告诉爬虫机器人哪些记录和注册表，文件和目录禁止被爬取。

因此被称为robots排除文件。如果设置了这个文件，它将阻止对某些页面进行遍历，这样搜索者就察觉不到。

这里，我们来探索几个有趣的搜索引擎来获取深网搜索结果，大多数人都不知道。

另请阅读：使用TOR和VPN匿名访问暗网

1. pipl

Pipl的查询引擎可以帮助你找到在常规搜索引擎上找不到的深层网页。

与Google和Bing搜索引擎链接不同，pipl提供从Deep Web获取的搜索结果。

Pipl robots文件设置为与可搜索的数据库进行交互，并从个人档案、成员目录、科学出版物、法庭记录和许多其他深网资源中提取事实，联系方式和其他相关信息。

pipl搜索引擎使用高级语言分析和排名算法，为你提供有关一个人的最相关信息，并且在一个单独的页面以易于阅读的方式展现出来。

2. My Life

Mylife公共页面可以列出一个人的数据，包括年龄、过去和现在的居住地点、电话号码、电子邮件地址、就业信息、照片、亲属等，还有一个个人调查板块，可以让其他MyLife个体对彼此进行评价。

你可以免费注册此服务并获得大量信息。当然，你也可以支付6.95美元，使用该服务一个月，并获得完整的报告和各种丰富多彩的信息。

Mylife拥有“超过2.25亿个公共页面，其中包含几乎所有美国人，18岁及以上人士的数据。”

据MyLife所说，“打开过的页面无法删除”，只有高级成员可以隐藏其公共页面上的内容并从第一个来源删除信息。

3. Yippy

事实上，Yippy是元搜索引擎（它通过利用其他网络索引得到它的结果），我之所以把Yippy列在十大搜索引擎中，因为它有一个入口通道，一个web客户端可能正在使用的设备，例如电子邮件，游戏，视频等。

Yippy是一个有对家庭友好的网站，特别是保护隐私方面。完全不像Google，他们不会存储你的历史，查看条款或电子邮件。

他们断言500万“不受欢迎”的网站已经在索引中屏蔽以保护敏感搜索者。

搜索[酒精]会返回酗酒者，匿名团体的结果，而不是维基百科页面上有关酒精的例子。

因此，对于查找信息的人来说，Yippy并不好，但对于拥有笔记本电脑的孩子的父母来说，他们可能会对孩子的搜索感兴趣。

4. Surfwax

SurfWax搜索以免费和订阅服务的形式提供。搜索网站提供了除普通搜索之外的许多功能。功能包括：

· “焦点”链接功能，可以添加“焦点词”到搜索中。焦点词可以是广义的也可以是狭义的，可用于扩大或缩小你的搜索范围。

· “SiteSnaps”重点突出获取网站页面的概况并进一步识别引擎认为相关的术语。

· “ResultStats”功能，强调要对大量的结果和恢复结果所花费的时间进行衡量。

依据Surfwax的比喻，对于在实际的浪潮中，surfwax会帮助冲浪者抓住他们的冲浪板; 对于网上冲浪来说，SurfWax可以帮助你获得最佳的信息控制 – 提供最佳的相关搜索结果。

SurfWax的UI设计非常独特，使搜索成为一种“视觉过程”，这还是第一个这么做的，将基于意义的搜索与关键知识搜索元素无缝集成，以实现有效的关联和回调。

5. Way Back Machine

Wayback Machine是互联网档案馆(Internet Archive)的一个前端，用来收集web页面。它包含超过100 TB的数据 – 一个巨大的收集与储存的先决条件。

Wayback Machine通过URL访问这些丰富的信息。它是无法通过内容来访问的–客户端必须知道特定网页或Web网站的正确URL才能进入主页并查看庞大的信息。

互联网档案馆允许公众将数字资料上传和下载到其数据集群，但其大部分数据是由其网络爬取工具自动收集的，这些爬取工具可以尽可能多的保留公共网络。

Wayback Machine的web档案包含超过1500亿的网络捕获数据。该档案还监督着世界上最大的图书数字化项目的其中一个项目。

6. Google Scholar

Google学术搜索允许您搜索各种学术文献。它从期刊出版商、大学资料库和其他它认为是学术性的网站上获取信息。

Google学术搜索旨在帮助你发现与你主题有关的学术资源。一旦你发现了这些资源，你就会想要获取它们。你可以配置Google学术搜索，以允许自动访问NCSU库对期刊和数据库的订阅。

7. DuckDuckgo

这个深网搜索引擎与此列表中的其他深网搜索引擎一样，也允许你搜索常规网络界面干净整洁，易于使用，并且不会追踪你的搜索。

搜索主题的选项是无穷无尽的，你甚至可以自定义它以增强您的体验。

DuckDuckGo的特点是返回最好的结果，而不是最多的结果，并从400多个独立资源中筛选出这些结果，包括关键的百科网站，如维基百科，以及其他搜索引擎，如Bing，Yahoo！，Yandex和Yummly。

8. Fazzle

Fazzle.com是一个元网络索引，可以用英语，法语和荷兰语访问。Fazzle会搜索120多个经过修改的web索引，以传达“快速准确的结果”，每个搜索到的帖子旁边都有一个查看页面

。Fazzle的查询项目包括网站，下载，图像，视频，音频，黄页，白页，购物和新闻等。

不管其他的查询项是什么，都是从Fazzle运行的众多搜索列表中组合起来的，但是Fazzle会在它的SERPS（搜索引擎结果页面）上显示“最佳选择”和20个不同的结果。

9. not Evil

与其他Tor搜索引擎不同，not Evil不是以营利为目的的。not Evil的运行是为了做贡献，人们对于网络上的各种记录隐私的行为已经无法忍耐，而这个搜索引擎就是来抵抗这些行为的。

not Evil是TOR网络中的另一个搜索引擎。根据其功能和搜索质量，它在众多搜索引擎中非常具有竞争力。

没有广告和跟踪。由于算法不断更新和完善，很容易找到需要的商品，内容或信息。使用not Evil，你可以节省大量时间并保持完全匿名，而且用户界面非常直观。

10. Start Page

如果你担心隐私问题，并且你没有使用Tor浏览器，那么，startpage是一个不错的选择，Ixquick的Start Page也是最好的搜索引擎之一。

与其他搜索引擎不同，Start Page不会记录你的IP地址，因此能够保护你的搜索历史。而谷歌知道你的一切，这非常让人头疼。

Start Page搜索引擎是进行研究的很好的方式，而且不会泄露你的个人信息。

源链接

Hacking more

...

#attack #hack