最近工作过程中,一个常用的被测网站突然增加了滑块验证环节,导致整个自动化项目失效了。
为了解决这个滑块验证问题,在网上查阅了一些资料后,总结并实现了解决方案,现记录如下。
1、滑块验证思路
被测对象的滑块对象长这个样子。相对而言是比较简单的一种形式,需要将左侧的拼图通过下方的滑块进行拖动,嵌入到右侧空槽中,即完成验证。
要自动化完成这个验证过程,关键点就在于确定滑块滑动的距离。
根据上面的分析,验证的关键点在于确定滑块滑动的距离。但是看似简单的一个需求,完成起来却并不简单。
如果使用自然逻辑来分析这个过程,可以拆解如下:
1. 定位到左侧拼图所在的位置,由于拼图的形状和大小固定,那么其实只需要定位其左边边界离背景图片的左侧距离。(实际在本例中,拼图的起始位置也是固定的,节省了不少工夫)
2. 定位到右侧凹槽所在位置,同样其形状和大小是固定的,那么只需要定位其左边边界离背景图片的左侧距离。
3. 用2中探测到的距离减去1中的距离,既是滑块需要被拖动的距离。
要完成上述的探测计算,首先我们想到的是使用元素定位的方法定位到拼图和凹槽的位置。
然而这一想法是不可行的,原因在于这个验证模块是使用两个 canvas 即画布元素实现的:
拼图和凹槽都是“画”在画布上的,其本身并不是一个页面元素,不能使用元素定位的方法。
因此我们考虑使用图片解析的方法,分析画布图像本身,来确定相应图形的位置。
2、使用 openCV 进行图片解析
这里我们将引入OpenCV库,来帮我完成图片解析过程:
OpenCV是一个基于 Apache 2.0许可(开源)发行的跨平台 计算机视觉 和机器学习软件库,可以运行在 Linux 、Windows、Android和 Mac OS 操作系统上。
它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了 Python 、 Ruby 、 MATLAB 等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。
OpenCV用C++语言编写,它具有C ++,Python, Java 和MATLAB接口,并支持Windows,Linux,Android和Mac OS,OpenCV主要倾向于实时视觉应用,并在可用时利用MMX和 SSE 指令, 如今也提供对于C#、Ch、Ruby,GO的支持。
2.1 OpenCV引入项目
1:下载 OpenCV
进入到官网 下载对应系统的 openCV 软件包后,解压放置到本地。
使用 Maven 依赖并不能引入正确的OpenCV外部依赖,这里需使用外部
2:工程中添加 jar 包
Intellij 中选择 File -> Project Structure -> Modules -> Dependencies
点击 add -> JARS or directories… 选择
3. 新建滑块验证工具类,引入OpenCV动态链接库文件:opencv_java450.dll
public class slideUtil {
public static String dllPath = "D:\\AutoTest\\src\\main\\resources\\lib\\opencv\\opencv_java450.dll";
public static void main(String[] args) {
//getDistance();//调试用的main方法,调用一个getDistance方法,获取拼图和凹槽之间的距离,返回double类型数值。
}
2.2 实现图片解析,计算所需距离
由于本项目的特点,拼图的形状和位置是固定的,首先我们将拼图和凹槽图片下载到本地,方便后续处理。(其它项目可能出现图片形状不固定的情况,可以直接用 Selenium 实时下载图片,这过程比较简单,因此不赘述)。 下载完的图片如下:
凹槽图片:
拼图图片:
下面直接上代码再做说明:
public static double getDistance(){
// 加载OpenCV本地库
System.load(dllPath);
//System.loadLibrary(Core.NATIVE_LIBRARY_NAME);
//对拼图图形进行处理,存储为Mat类型①
Mat slideBlockMat=Imgcodecs.imread("slide_blk.png");//由于本项目的特点,拼图的形状和位置是固定的,因此直接将拼图图片保存到本地进行使用了
//Step、灰度化图片②
Imgproc.cvtColor(slideBlockMat,slideBlockMat,Imgproc.COLOR_BGRGRAY);
imwrite("cvt_blk.png",slideBlockMat);
//Step、去除周围黑边
for (int row =; row < slideBlockMat.height(); row++) {
for (int col =; col < slideBlockMat.width(); col++) {
if (slideBlockMat.get(row, col)[] == 0) {
slideBlockMat.put(row, col,);
}
}
}
imwrite("nsr_blk.png",slideBlockMat);
//Step、转黑白图
Core.inRange(slideBlockMat, Scalar.all(), Scalar.all(96), slideBlockMat);
imwrite("ezh_blk.png",slideBlockMat);
//对滑动背景图进行处理③
Mat slideBgMat = Imgcodecs.imread("slide_bg.png");//背景凹槽图片需要动态获取,见下面的解析
//Step、灰度化图片④
Imgproc.cvtColor(slideBgMat,slideBgMat,Imgproc.COLOR_BGRGRAY);
imwrite("hdh_bg.png",slideBgMat);
//Step、二值化
//Core.inRange(slideBgMat, Scalar.all(), Scalar.all(96), slideBgMat);
Imgproc.threshold(slideBgMat,slideBgMat,,255, Imgproc.THRESH_BINARY);
imwrite("ezh_bg.png",slideBgMat);
Mat g_result = new Mat();
/*
* 将凹槽背景和拼图图形进行匹配⑤
*/
Imgproc.matchTemplate(slideBgMat,slideBlockMat,g_result, Imgproc.TM_CCOEFF_NORMED);
Point matchLocation= Core.minMaxLoc(g_result).maxLoc;
//返回匹配点的横向距离
System.out.println(matchLocation.x);
return matchLocation.x;
}
2.3 算法解析说明
①什么是Mat类型:
Mat 是 OpenCV 用来存储图像信息的内存对象。Mat 对象中除了存储图像的像素数据外,还包括图像的其它属性:宽、高、类型、维度、大小、深度等。
可以认为在OpenCV中,一个Mat对象就定义了一个图像。
②对于slide_blk.png的处理经过了以下过程:
灰度化 :
去黑边:
二值化:
最终的目的在于将图形转化为黑白分明的图形,便于后续匹配。
③本项目中,由于背景凹槽图片,凹槽的位置是动态的,所以需要实时动态获取:(如果遇到拼图也需要动态获取,可以同样处理)
WebElement bg_canvas = driver.findElement(slide_ver_bg_by);//元素定位,定位到背景图片
Object base = ((JavascriptExecutor) driver)
.executeScript("return arguments[].toDataURL('image/png').substring(21);", bg_canvas);//页面元素转Base64
String baseStr = base64.toString();
generateImage(baseStr , "slide_bg.png");// 将base64把 字符串 装换成图片
④对于slide_bg.png的处理经过了以下过程:
灰度化:
二值化:
这里省略了去黑边这一过程,因为实践发现,经过上述两步后,我们已经能够进行较为准确的图片匹配了。
⑤matchTemplate:在模板和输入图像之间寻找匹配,获得匹配结果图像
esult:保存匹配的结果矩阵
TM_CCOEFF_NORMED标准相关匹配算法
minMaxLoc:在给定的结果矩阵中寻找最大和最小值,并给出它们的位置
3、Selenium处理滑块滑动
Selenium的滑块处理是库里的标准玩法,使用actions类或者javaScript的方式都可以实现,本例采用的是actions类方法:
public void slide_verify(WebDriver driver) throws Interrupted Exception {
double slideDistance = getDistance();//此处就是调用中的OpenCV计算拼图和凹槽距离
System.out.println("滑动距离是" + slideDistance);
WebElement dragElement = driver.findElement(slide_obj_by);//定位到滑块
Actions actions = new Actions(driver);
actions.clickAndHold(dragElement);//模拟鼠标动作,按住滑块
Thread.sleep();
//滑动,分两次进行①
actions.moveByOffset(((int)slideDistance -)/2,0);
Thread.sleep();
actions.moveByOffset(((int)slideDistance -)/2,0);
Thread.sleep();
actions.release();
actions.perform();
}
①这里进行滑动时,首先滑动距离之所以要减去11,是因为本例中拼图的初始位置固定离整体图形的左边距是11.
分两次滑行并且中间sleep了一个时间,是为了防止全匀速拖动而被识别为机器人。
其它文章中有提到使用比较复杂的拖动轨迹算法,本项目中实践得知,滑动轨迹并没有太重要,分两次拖动就可以了,没必要复杂化。
4、最终效果
最终的滑动效果,因为被测网站的敏感性就不放上来了,最终实现成果是较为理想的。
希望这篇文章能够帮助到有需要的人。