大神论坛

找回密码
快速注册
查看: 282 | 回复: 0

[思路] 抖音滑块分析 抖音Tiktok 巨量引擎滑块验证码识别 附源码

主题

帖子

0

积分

初入江湖

UID
680
积分
0
精华
威望
0 点
违规
大神币
68 枚
注册时间
2023-10-14 10:54
发表于 2023-12-30 16:29
本帖最后由 plasniper 于 2023-12-30 16:29 编辑

由于最近比较忙,所以本周搞了一个相对简单的验证码,就是抖音Tktok只的滑块验证码,这也是接到客户的一个需求,这种验证码通常
在电脑端登录抖音、巨量引警的的时候出现。
首先看一下最终的效果:

验证码识别过程
1、利用爬中采集图像
由于是识别滑块只缺口位置,分析了一下,大图已经包含了滑块缺口的位置信息,所以这里只需要采集大图就够了。不需要小图进行比对,这样可以简单一点。


2、人工标记
为了保障识别的精度,这里需要进行大量的人工标记,最好将误差控制在1-2像素以内,这样训练出来的识别模型效果才好。

3、训练模型

4、测试验证
我们将训练好的模型用100张图片来进行测试,发现全部都能正确识别位置,所以正确率接近100%,因为100张测试图片比较少,所以保守估计正确率应该在99%左右。
如果再想提升正确率,可以再增加训练的数据量,就需要再投入大量人力,这个投入与提升产出比需要自己权衡。


5、总结分析
(1)抖音图片标注工作比较复杂,我统计了一下背景图的种类超过800中,所以给标注、识别增加了一定难度
(2)抖音的滑动轨迹检测比较厉害,直接滑动到位完全无法通过,分段轨迹也很难通过。所以我首先滑过,再返回对齐,这样就能完美次通过验证(最前面动图就是这样的效果)
(3)抖音页面有很强的反爬措施,检测我使用 selenium 始终无法通过验证,始终不会条验证码,这一点如何防检测 selenium 也请各位大神指点。所以我代码使用的巨量引擎(巨量引警是字节跳动旗下的品牌)网站进行的测试
各位大神也请指出我的不足,或者有其他建议都可以给我留言,或私信我,谢谢指点


源码在下方:

下方隐藏内容为本帖所有文件或源码下载链接:

游客你好,如果您要查看本帖隐藏链接需要登录才能查看, 请先登录

返回顶部