首页

230问答网 > 搜索引擎有哪些信息不能爬取？

搜索引擎有哪些信息不能爬取？

2025-01-28 19:27:05

推荐回答（1个）

回答1：

1、链接编码是Javascript，因为这被称为“蜘蛛陷阱”，爬行站点的时候，蜘蛛会自动屏蔽爬行这些链接；
　　　2、链接被标记为robots.txt的 “禁止指令；
　　　3、孤立的链接；
　　　4、链接所在的页面是一个包含链nofollow指令的页面；
　　　5、本来是要抓取的链接，但是因为服务器不稳定的原因无法进行抓取。
　　　因此，爬行和索引虽然表示的都是蜘蛛抓取站点，但他们所包含的方向是不一样的，这里长沙网络营销奇谋天下建议注意区分开。

相关问答

如何禁止所有搜索引擎蜘蛛的爬行收录

什么程序做的网页搜索引擎不能爬取

如何禁止搜索引擎爬虫抓取网站页面

网站SEO：提高搜索引擎蜘蛛爬取的技巧有哪些

如何用Python爬取搜索引擎的结果

搜索引擎能爬取到网页脚本内容吗

做过搜索引擎的来看看,爬虫爬取的文本如何提取自己想要的信息啊

除了网站日志还有哪些方法可以查看搜索引擎蜘蛛爬取记录？

最新问答

员工在试用期内单位需要为其缴纳养老保险吗

形容笑容温暖人心的词语或诗句？

上次我发一个女的照片在朋友圈，她评论我变态，这次我发一个女的图片在朋友圈，她评论我不要脸，什么意思

泉州丰泽区家具城推荐！

孩子感冒咳嗽可以喝蜂蜜水吗

以前看过一本古代的言情穿越小说，女主好像是姓莫，男主姓容，男主反

合同七月低到期，公司估计同意续签，我想问一下，如果要求涨工资而公司不同意，只愿意按照原合同续签，

如果试用期不交养老保险,我可以单方面解约吗

广发信用卡普卡一般额度是多少的？能提升额度的吗？

我的身份证年龄与实际大了10年，请问大家一下什么改回来啊？