本帖最后由 plasniper 于 2023-12-30 16:29 编辑
由于最近比较忙,所以本周搞了一个相对简单的验证码,就是抖音Tktok只的滑块验证码,这也是接到客户的一个需求,这种验证码通常 在电脑端登录抖音、巨量引警的的时候出现。 首先看一下最终的效果: 验证码识别过程 1、利用爬中采集图像 由于是识别滑块只缺口位置,分析了一下,大图已经包含了滑块缺口的位置信息,所以这里只需要采集大图就够了。不需要小图进行比对,这样可以简单一点。
2、人工标记 为了保障识别的精度,这里需要进行大量的人工标记,最好将误差控制在1-2像素以内,这样训练出来的识别模型效果才好。 3、训练模型 4、测试验证 我们将训练好的模型用100张图片来进行测试,发现全部都能正确识别位置,所以正确率接近100%,因为100张测试图片比较少,所以保守估计正确率应该在99%左右。 如果再想提升正确率,可以再增加训练的数据量,就需要再投入大量人力,这个投入与提升产出比需要自己权衡。
5、总结分析 (1)抖音图片标注工作比较复杂,我统计了一下背景图的种类超过800中,所以给标注、识别增加了一定难度 (2)抖音的滑动轨迹检测比较厉害,直接滑动到位完全无法通过,分段轨迹也很难通过。所以我首先滑过,再返回对齐,这样就能完美次通过验证(最前面动图就是这样的效果) (3)抖音页面有很强的反爬措施,检测我使用 selenium 始终无法通过验证,始终不会条验证码,这一点如何防检测 selenium 也请各位大神指点。所以我代码使用的巨量引擎(巨量引警是字节跳动旗下的品牌)网站进行的测试 各位大神也请指出我的不足,或者有其他建议都可以给我留言,或私信我,谢谢指点
源码在下方: 下方隐藏内容为本帖所有文件或源码下载链接:
游客你好,如果您要查看本帖隐藏链接需要登录才能查看,
请先登录
|