本篇文章为大家展示了使用python爬虫怎么实现一个发送短信验证码功能,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
创新互联公司是一家专注于做网站、成都网站制作与策划设计,南城网站建设哪家好?创新互联公司做网站,专注于网站建设10多年,网设计领域的专业建站公司;建站业务涵盖:南城等地区。南城做网站价格咨询:028-86922220内联代码片
。
import time def get_time() : " 获取当前的时间戳" now_time =str(int(time.time()*1000))#获取毫秒级的时间戳 print('当前的时间戳',now_time) return now_time get_time()
来看运行结果
我们目前可以这样去做
我们把这个获取到的时间戳参数加入到url中,我们可以实现动态的获取,每次要要获取这个二维码时就需要指定当前的时间time参数,那我们完全可以这样来构造这个url。我们用一个变量来接收获取的时间戳,然后以字符串的形式加入到time后面。
下面展示一些内联代码片
。
import time def get_time() : " 获取当前的时间戳" now_time =str(int(time.time()*1000))#获取毫秒级的时间戳 print('当前的时间戳',now_time) return now_time time_one = get_time() img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one print(img_url)
我们来看是否可以获取到相应正确的url
我们点入那个蓝色的链接,来看有没有获取到这个验证码图片。
测试证明我们完全是对的。
下一步我们要做的是实现代码的访问,获取并保存这个验证码。为什么保存,我们应该知道这点知识。
看这三个提交栏,很明显是一个要提交表单的。提交那就需要post,而post请求呢,就是要提交我们的数据,及手机号码和图形验证码。
当我们把数据提交上去以后,我们在手机上就会收到短信验证码。我们以此来实现发送短信验证码的功能。
我们来保存图片验证码
下面展示一些内联代码片
。
import time import requests def get_time() : " 获取当前的时间戳" now_time =str(int(time.time()*1000))#获取毫秒级的时间戳 print('当前的时间戳',now_time) return now_time time_one = get_time() img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one print(img_url) headers = { 'User-Agent' :'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36' } response = requests.get(url=img_url,headers = headers) img_data = response.content with open('yzm.jpg',mode = 'wb') as file : file.write(img_data)
可以看到在代码编辑器右边已经出现了保存的图片。
下一步我们继续来分析这个手机号码的数据和图片验证码的数据在哪里传入,又是如何实现。
我们输入一个手机号码,然后输入图片验证码,然后点击免费获取。此时再次进行抓包,抓包的方法与上文的第一次抓包方法相同。
我们来看会出现什么样的包。
蓝色部分的就是我们寻找的目标包。然后我们如何去做?点击打开查看相应的代码。
看到没有post请求,是因该提交表单数据的。我们看看下面的表单数据
这里你会发现有一点不同电话号码是直接的数字,图片验证码就需要你来处理了,因为我们上文保存的验证码是图片,你如何识别到这图片验证码里面额数据,来进行传入呢?这里我们还需要一个网站。
超级鹰,是用来识别验证码的,其实我们还是调用这个接口。
我们点击开发文档,我们是用Python写的代码。所以我们点击python的图标,来这里来查看我们需要的。
在下面找到超级鹰图像识别,然后点击下载。把里面的api接口的py文件导入到你的python编辑器。我这里是用Pycharm写的。所以直接将解压出来的Python文件拖入pycharm。
下面是里面的部分代码。
这里面做了小小的修改。我们直接来看这段代码写了什么。
我来告诉大家原始的代码有问题,很低级的问题。
#!/usr/bin/env python # coding:utf-8 import requests from hashlib import md5 class Chaojiying_Client(object): def __init__(self, username, password, soft_id): self.username = username password = password.encode('utf8') self.password = md5(password).hexdigest() self.soft_id = soft_id self.base_params = { 'user': self.username, 'pass2': self.password, 'softid': self.soft_id, } self.headers = { 'Connection': 'Keep-Alive', 'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)', } def PostPic(self, im, codetype): """ im: 图片字节 codetype: 题目类型 参考 http://www.chaojiying.com/price.html """ params = { 'codetype': codetype, } params.update(self.base_params) files = {'userfile': ('ccc.jpg', im)} r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers) return r.json() def ReportError(self, im_id): """ im_id:报错题目的图片ID """ params = { 'id': im_id, } params.update(self.base_params) r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers) return r.json() if __name__ == '__main__': chaojiying = Chaojiying_Client('超级鹰用户名', '超级鹰用户名的密码', '96001') #用户中心>>软件ID 生成一个替换 96001 im = open('a.jpg', 'rb').read() #本地图片文件路径 来替换 a.jpg 有时WIN系统须要// print chaojiying.PostPic(im, 1902) #1902 验证码类型 官方网站>>价格体系 3.4+版 print 后要加()
上面这个是他的原始接口代码。就很离谱。分块来分析。
def __init__(self, username, password, soft_id): self.username = username password = password.encode('utf8')#没有缩进 self.password = md5(password).hexdigest() self.soft_id = soft_id ....... .......
这块的错误在哪呢?我这里特意表明突出,上面的原始代码直接沾到这里并不突出,但是你用编辑器打开会有问题的。
if __name__ == '__main__': chaojiying = Chaojiying_Client('超级鹰用户名', '超级鹰用户名的密码', '96001') #用户中心>>软件ID 生成一个替换 96001 im = open('a.jpg', 'rb').read() #本地图片文件路径 来替换 a.jpg 有时WIN系统须要// print chaojiying.PostPic(im, 1902) #print没有加 () #1902 验证码类型 官方网站>>价格体系 3.#4+版 print 后要加()
还有一处,在这里,代码格式都没有写对,我这里指出,读者应该可以发现。这里介意读者可以去平台下载这个接口,自己去修改。
好,且不在谈这些,我们继续。我们还是修改部分代码。
def ReportError(self, im_id): """ im_id:报错题目的图片ID """ params = { 'id': im_id, } params.update(self.base_params) r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers) return r.json() if __name__ == '__main__': chaojiying = Chaojiying_Client('超级鹰用户名', '超级鹰用户名的密码', '96001') #用户中心>>软件ID 生成一个替换 96001 im = open('a.jpg', 'rb').read() #本地图片文件路径 来替换 a.jpg 有时WIN系统须要// print chaojiying.PostPic(im, 1902) #这是原始的代码 #1902 验证码类型 官方网站>>价格体系 3.4+版 print 后要加()
我们可以在这内部写一个方法,我们待会要调用这个代码接口时,直接调用这个方法。
注意我们在类里面添加这样一部分代码,就是写一个方法
def run(self): chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD, 913137) # 用户中心>>软件ID 生成一个替换 96001 im = open('yzm.jpg', 'rb').read() # 本地图片文件路径 来替换 a.jpg 有时WIN系统须要// result = chaojiying.PostPic(im, 1004) # 1902 验证码类型 官方网站>>价格体系 3.4+版 print 后要加() return result['pic_str']
注意分析这个接口代码,里面 chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD,913137)
在注释里面其实说的已经很清楚了,这里的constant代表我们要导入的py文件,里面包含你的用户名,密码,以及软件id。
im = open(‘yzm.jpg', ‘rb').read()
打开你保存的验证码文件,上面我们已经保存过。result = chaojiying.PostPic(im, 1004)
1004代表你的验证码类型。
用户名和密码你需要注册一下。那么软件id和验证码类型你该如何确定呢?
这是主页,请点击价格体系
在下面你可以来判断你的验证码类型了
我们这里需要登录进入用户中心
进入如下界面
往下拉进入软件id
进入后点击生成一个软件id,软件名称和软件说明可以随便填写
这样我们就可以获得一个软件id 。
这个constant如何编写,很简单,建立一个py文件,里面写入
USER_NAME=' …' PASSWORD='… '
然后保存即可。导入py文件到当前路劲,然后import即可。
现在我们来看完整的代码
接口完整修改后的代码
import requests from hashlib import md5 import constant import constant class Chaojiying_Client(object): def __init__(self, username, password, soft_id): self.username = username self.password = md5(password.encode('utf8')).hexdigest() self.soft_id = soft_id self.base_params = { 'user': self.username, 'pass2': self.password, 'softid': self.soft_id, } self.headers = { 'Connection': 'Keep-Alive', 'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)', } def PostPic(self, im, codetype): """ im: 图片字节 codetype: 题目类型 参考 http://www.chaojiying.com/price.html """ params = { 'codetype': codetype, } params.update(self.base_params) files = {'userfile': ('ccc.jpg', im)} r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers) return r.json() def ReportError(self, im_id): """ im_id:报错题目的图片ID """ params = { 'id': im_id, } params.update(self.base_params) r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers) return r.json() def run(self): chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD, 913137) # 用户中心>>软件ID 生成一个替换 96001 im = open('yzm.jpg', 'rb').read() # 本地图片文件路径 来替换 a.jpg 有时WIN系统须要// result = chaojiying.PostPic(im, 1004) # 1902 验证码类型 官方网站>>价格体系 3.4+版 print 后要加() return result['pic_str'] if __name__ == '__main__': chaojiying = Chaojiying_Client(constant.USER_NAME, constant.PASSWORD, 913137) # 用户中心>>软件ID 生成一个替换 96001 im = open('yzm.jpg', 'rb').read() # 本地图片文件路径 来替换 a.jpg 有时WIN系统须要// result = chaojiying.PostPic(im, 1004) print(chaojiying.PostPic(im,1004))# 1902 验证码类型 官方网站>>价格体系 3.4+版 print 后要加()
主文件代码,从这里执行
import time import requests from chaojiying import Chaojiying_Client import constant def get_time() : " 获取当前的时间戳" now_time =str(int(time.time()*1000))#获取毫秒级的时间戳 print('当前的时间戳',now_time) return now_time time_one = get_time() img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_one print(img_url) headers = { 'User-Agent' :'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36' } response = requests.get(url=img_url,headers = headers) img_data = response.content with open('yzm.jpg',mode = 'wb') as file : file.write(img_data) print(response) #验证码识别 code = Chaojiying_Client(constant.USER_NAME,constant.PASSWORD,913137).run() print('识别出来的验证码为',code) #请求保证同一个用户 cookiejar = response.cookies cookies = cookiejar.get_dict() print(cookies) data = { 'phone' :19745678397, 'imgValidCode' : code, } time_two = get_time() code_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/getsms.do?×tamp'+time_two requests_two = requests.post(url=code_url,data= data,headers=headers,cookies=cookies) print(requests_two.json())
上述内容就是使用python爬虫怎么实现一个发送短信验证码功能,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注创新互联行业资讯频道。
当前名称:使用python爬虫怎么实现一个发送短信验证码功能-创新互联
文章源于:http://scgulin.cn/article/jjigi.html