反爬虫攻略

来自网友 - 八爪鱼采集器的回答
https://www.zhihu.com/question/22324380/answer/1053878896

作为一款智能爬虫工具，我来说最让自己头疼的一些反爬措施吧！

1.数据只到APP中展现，不提供相应的web端页面，数据传输尽量不提供json链接，或json链接中含随机参数，请求为post请求。
2.在网页源码中对文本进行css混淆，页面上可以正常显示，不影响用户查看，但源码中均用其他值代替，实现加密。
3.采用Google的人机验证。
4."投毒"给对方提供虚假的数据。

来自网友 - 刘城的回答
https://www.zhihu.com/question/22324380/answer/21002391

一种是分析爬虫特征，尝试过滤爬虫的请求另外一些可能技巧：

1. 在页面开头放上一些钓鱼的链接（一般人点不到），爬虫会去访问，一访问就把对应的ip封了
2. 页面全是图像
3. 页面内容用javascript来生成
4. 页面上不提供可以供爬虫追踪的链接，跳转都用js触发

个人认为：在页面开头放上一些钓鱼的链接（一般人点不到），爬虫会去访问，一访问就把对应的ip封了 这个方法是真的实用，让我想起了有些垃圾邮件中会特意放上一张“像素小到肉眼看不到的图片，通过图片链接来判断目标用户”的那个邪招，这次又跟网友学习了一招。

最后一次更新于2021-06-24

If you love something, set it free.

哆啦钢镚儿

Windows控制台 / 命令行 / PowerShell 中列出所有环境变量

[Android] 记一次Android Studio 启动时异常：java.net.BindException: Address already in use