这段时间在处理文字验证码问题,需要对文字验证码的图片以及提示的图片合成一块来进行截图,然后识别,分析到这两个都有同一个父类html元素,所以拟定对父类元素进行定位,然后截图。
项目使用Java开发,实现采用senenim对元素截图。因为没有发现更好的对元素截图的方法,所以采用先对整个屏幕进行截图,然后在对具体元素截取这部分图片。
先对driver进行类型转换成TakesScreenshot,然后调用他的getScreenshotAs(OutputType.FILE);,这里把截图存储文件类型。
OutputType可以指定为文件类型,字节数组,或者是base64编码后的字符串。
File src = ((TakesScreenshot) driver).getScreenshotAs(OutputType.FILE);
然后我们分析到具体的元素源码,发现这个class属性值为msn的div标签是验证码图片和文字提示的直接父标签,所以我们这里对定位到这个标签。

首先通过driver获取到这个元素
WebElement element = driver.findElement(By.xpath("//div\[@class='msn'\]"));
然后调用这个元素的getRect()方法可以获取到这个元素的区域块信息,包括宽度和高度,以及该元素相对于网页最左上原点的坐标。我们这里获取到这些信息,然后对全屏图片进行截图。
Rectangle rect = element.getRect();
BufferedImage subImage= ImageIO.read(src).getSubimage(rect.x, rect.y, rect.getWidth(), rect.height);
这样我们可以对截取后的图片保存到文件,或者其他操作。
ImageIO.write(subImage, "png", src);
到此已经完成了对该图片的截取了。
Java Selenium截图与验证码识别
本文介绍了一种使用Java和Selenium对特定HTML元素进行截图的方法,尤其适用于处理文字验证码图片。通过将driver转换为TakesScreenshot接口,可以对整个屏幕进行截图,再通过分析元素的矩形区域信息,精确截取所需部分。
688

被折叠的 条评论
为什么被折叠?



