Teoma是一个曾经存在的网络搜索引擎,后来被Ask Jeeves(现在的Ask.com)收购。Teoma搜索引擎使用了一种叫做“主题目录”(Subject-Specific Popularity)的算法,该算法通过分析网页之间的相关性来提供搜索结果。
Teoma的网络爬虫程序会抓取互联网上的网页内容,并根据其主题和相关性进行索引。这种算法的特点是更加注重网页的内容和主题之间的关联性,而不仅仅是页面的链接结构。
不过对于国内网站来说不会带来什么流量,可以选择robots.txt协议禁止。
User-agent: Teoma
Disallow: /
如果还是禁止不了,可以选择nginx规则禁止访问,如下:
if ($http_user_agent ~* "Teoma") {
return 403;
}