爬虫技术经常会需要图像识别,但图像识别是另一个技术范畴,两者不要混为一谈。 那么,怎么进行图像识别呢?
传统的图像识别,往往需要去噪,二值化,过滤,图像变换,图像分割等技术处理,然
爬虫技术经常会需要图像识别,但图像识别是另一个技术范畴,两者不要混为一谈。 那么,怎么进行图像识别呢?
传统的图像识别,往往需要去噪,二值化,过滤,图像变换,图像分割等技术处理,然后根据处理后的图像和图库比较,以识别出图像。这里必须介绍opencv,最强大的图像处理。这种办法的识别率,就不好说了,可能很高,也可能很低。
现在由于人工智能的高速发展,不需要复杂的图像处理,只需要用大量的图像给神经网络训练模型,训练完毕即可获得高准确率的识别,识别率有多高取决于训练的效果,顶尖的识别率已经超越人类,99%以上的准确率。注意,训练往往需要大量的数据,1万张通常是不够的。
其实爬虫中对图像识别往往是验证码,验证码完全可以通过第三方接口识别,仅仅调用一下就可以,价格最低0.001一个码。