- 博客(76)
- 资源 (20)
- 收藏
- 关注
原创 微博态势感知系统开发——django实现
本文详细介绍并实践了微博态势感知系统开发的过程,其基于django实现。系统框架如下所示:本文主要使用以下技术:1.web前端开发知识——html、css、javascript2.web前端框架开发——bootstrap、jquery3.异步传输技术——ajax4.基于python的web开发——django5.数据库操作——基于ORM操作mysql6.可视化展示技术——pyecharts开发1.系统设计1.1需求分析本系统设计主要用来实现微博用户信息的自动化
2021-06-30 15:40:15
1730
1
原创 微博数据处理——获取广告用户数据集(三)
任务:需要获取广告用户候选的数据集实现思路:1.在微博话题中筛选含广告用户较多的话题2.使用python爬虫技术获取话题用户账号3.获取用户行为信息,并进行手工标注1.筛选广告话题通过对微博的使用,发现购物分享类话题广告用户较多话题链接如下:https://weibo.com/p/100808ad1339d43994fdc06618aa28e5ec38f1/super_index2.获取广告用户通过对网页结构分析可知每一页加载时初始加载一次,动态加载两次动态加
2021-05-21 23:59:24
1087
1
原创 微博模型训练——僵尸用户识别(二)
上文通过使用决策树算法简单实现了僵尸用户的识别:https://blog.youkuaiyun.com/weixin_43906500/article/details/116992642本文综合利用多种机器学习方法实现对僵尸用户的识别使用的机器学习方法有:决策树算法、随机森林算法、极端随机数算法from sklearn.model_selection import cross_val_scorefrom sklearn.datasets import make_blobsfrom sklearn.en
2021-05-19 20:44:19
462
原创 机器学习——回归
参考链接如下:https://blog.youkuaiyun.com/qq_36142114/article/details/80441363https://blog.youkuaiyun.com/weixin_44697198/article/details/109405212https://blog.youkuaiyun.com/qq_41800366/article/details/865837891.机器学习概述机器学习算法有很多,有分类、回归、聚类、推荐、图像识别领域等等,具体算法比如线性回归、逻辑回归、朴素贝叶
2021-05-18 21:14:13
6425
8
转载 机器学习——分类与回归
由于实践需要,需要学习分类和回归的相关知识参考链接:https://blog.youkuaiyun.com/shuiyixin/article/details/88816416https://www.zhihu.com/question/21329754/answer/2049574561.分类与回归的作用不管是分类,还是回归,其本质是一样的,都是对输入做出预测,并且都是监督学习。说白了,就是根据特征,分析输入的内容,判断它的类别,或者预测其值。2.分类与回归的区别2.1输出不同1.分类
2021-05-18 20:14:17
622
原创 微博模型训练——僵尸用户识别(一)
在上文已经获取处理好的数据集:https://blog.youkuaiyun.com/weixin_43906500/article/details/116916404任务:使用sklearn工具集中决策树算法进行僵尸用户识别1.数据导入首先需要配置graphviz环境参考链接:https://blog.youkuaiyun.com/linhai1028/article/details/79827331使用pandas库读取csv并进行数据处理,划分为训练集和测试集data = pd.read_csv("
2021-05-18 17:12:30
506
原创 微博数据处理——处理僵尸用户数据集(二)
获取僵尸用户数据集可见上文:https://blog.youkuaiyun.com/weixin_43906500/article/details/1164478581.数据集展示僵尸数据集如下所示2.处理数据集编写处理代码,将所需训练数据保存为csv格式代码如下:import jsonimport csvcsvfile = open("csv_test.csv","w",newline = "")writer = csv.writer(csvfile)writer.writer
2021-05-18 15:56:58
554
1
原创 微博数据处理——获取僵尸用户数据集(一)
思路:1.手工查找一些僵尸用户2.对僵尸用户的关注、粉丝列表进行多层遍历获取大量候选用户集3.手工标注僵尸用户技术难点在于第二步1.手工查找僵尸用户通过在微博手工查找,发现僵尸用户如下:其特征较为明显、关注多,粉丝少,几乎没有活跃度2.迭代遍历僵尸用户关注粉丝列表参考此前文章:https://blog.youkuaiyun.com/weixin_43906500/article/details/115919312相关代码略有修改,并封装为函数库,如下import re
2021-05-14 20:56:35
1042
1
原创 ctfhub——web——sql注入(sqlmap实现)
本次sql注入全部基于sqlmap实现1.整数型注入题目如下,为整数型注入1.1安装sqlmapsudo apt install sqlmap1.2测试注入sqlmap -u http://challenge-3c2c0ebf73b7a689.sandbox.ctfhub.com:10080/?id=1成功注入1.3查看数据库执行命令sqlmap -u http://challenge-3c2c0ebf73b7a689.sandbox.ctfhub.
2021-05-13 20:10:31
1831
原创 ctfhub——web——密码口令
1.弱口令题目如下所示,可知是管理后台用户名尝试使用admin,密码通过爆破获取使用burpsuit抓包,并将数据包发送到Intruder选择password参数为payload加载密码字典通过响应报文的长度判断正确密码,尝试了burpsuit常用密码,发现失败后来查找资料,参考:https://www.pianshen.com/article/12811579751/将密码作为admin[1-1000]进行破解破解成功由此可见,密码字典很重要
2021-05-10 23:52:25
660
原创 ctfhub——web——信息泄露
1.目录遍历通过使用burpsuit的spider获取所有目录信息如下即为flag2.phpinfo查看phpinfo信息ctfhub{c50575f0712bfbc78e8d63bf}3.备份文件下载3.1网站源码使用御剑工具扫描发现备份文件,打开通过访问路径获取flag3.2bak文件查看bak备份文件找到flag3.2vim缓存参考链接:https://blog.youkuaiyun.com/qq_41497476/artic
2021-05-10 22:31:18
397
原创 ctfhub——web——http协议
1.请求方式题目如下:解题代码:from urllib import requesturl = "http://challenge-70bc94f92962fbf6.sandbox.ctfhub.com:10080/index.php"req = request.Request(url=url, method="CTFHUB")r = request.urlopen(req).read().decode('utf-8')print(r)最终结果:2.302跳转题目如
2021-05-07 20:24:26
223
原创 windows共享文件夹报错:登录失败: 禁用当前的账户 解决办法
在虚拟机中使用共享文件夹共享文件时报错通过查找资料可知访问共享的时候,会默认以当前账户的身份去验证,因此账户密码不能通过验证,进而报错解决办法使用net use命令登录,而后访问共享文件夹net use \\192.168.1.111 /user:geest至此成功解决...
2021-05-05 13:15:54
5526
原创 内网渗透——内网环境搭建
参考链接:搭建mono防火墙视频教程https://mp.weixin.qq.com/s?__biz=MzU1NjgzOTAyMg==&mid=2247488369&idx=1&sn=3e6ca2c973caf7bf5dd25ff0c2d3e78f&chksm=fc3faa70cb4823667b4c539eabd5cdfe49d8aaae8c7892d6cea7755e84a44c6b4e5ba21c2f27&scene=178&cur_album_id
2021-05-05 13:04:02
1679
2
原创 内网渗透——搭建http反向代理
参考链接:https://sspai.com/post/52523https://blog.youkuaiyun.com/u013144287/article/details/78589643https://blog.youkuaiyun.com/lixiangss1993/article/details/879345621.基础知识正向代理(forward proxy):是一个位于客户端和目标服务器之间的服务器(代理服务器),为了从目标服务器取得内容,客户端向代理服务器发送一个请求并指定目标,然后代理服务器向
2021-05-04 19:30:28
1954
1
原创 内网渗透——搭建域控制器
参考链接:https://jingyan.baidu.com/article/19192ad8e1593ae53e5707be.html 工作组的分散管理模式不适合大型的网络环境下工作,域模式就是针对大型的网络管理需求设计的,就是共享用户账号,计算机账号和安全策略的计算机集合。域中集中存储用户账号的计算机就是域控器,域中用户账号,计算机账号和安全策略被存储在域控制器上一个名为Active Directory的数据库中。1.安装windows 2008 R2虚拟机2.安装Activ...
2021-05-02 23:25:38
588
原创 json库报错(TypeError: the JSON object must be str, bytes or bytearray, not TextIOWrapper)
使用json库导入json文件时,报错TypeError: the JSON object must be str, bytes or bytearray, not TextIOWrapperimport jsonf = open("data/data_李佳琦.json","r")data = json.loads(f)print(data)报错原因是loads方法去将json文件转换为python对象json有四个方法:dumps、loads、dump和load。dumps和
2021-04-27 11:08:31
16651
5
原创 微博数据爬虫——获取特定ID的热门转发评论用户列表(五)plus
承接上一篇文章:https://blog.youkuaiyun.com/weixin_43906500/article/details/115921689上一篇文章中实现了获取大V的热门微博下的转发列表,在本文中,通过对代码进行改造,实现对转发列表和评论列表的获取1.获取不同用户的接口转发列表用户请求如下:评论列表用户请求如下:通过设置不同参数,来选择不同接口获取数据if(type_name=="mblog"): url = "https://weibo.com/aj/v6/%
2021-04-27 09:23:08
656
1
原创 微博数据爬虫——获取用户基本信息(三)
目标:获取微博用户的基本信息,如关注数、粉丝数、微博数量、注册时间首先获取page_id使用正则匹配获取add = urllib.request.Request(url="https://weibo.com/u/%s?is_all=1" % (o_id), headers=headers)r = urllib.request.urlopen(url=add, timeout=20).read().decode('utf-8')page_id = re.findall(r'\$CONFI
2021-04-26 20:07:53
1022
原创 selenium远程调试chrome绕过反爬机制
前言:部分网站通过检测selenium指纹来识别爬虫,为了抵抗反爬机制考虑通过selenium远程调试绕过反爬1.开始chrome远程调试使用命令开始chrome远程调试端口chrome --remote-debugging-port=9222运行后打开chrome,执行python代码from selenium import webdriverchrome_options = webdriver.ChromeOptions()chrome_options.add_experi
2021-04-23 11:00:44
2184
原创 微博数据爬虫——获取用户微博相关信息(四)
任务:给定u_id,获取用户每条微博的mid、发布时间、照片数、@数、链接数1.获取微博信息查看网页源代码,发现数据保存在js中利用正则匹配可以实现获取单条微博全部信息add = urllib.request.Request(url="https://weibo.com/u/%s?is_all=1" % o_id, headers=headers)r = urllib.request.urlopen(url=add, timeout=10).read().decode('utf-
2021-04-21 23:48:57
2404
原创 hackinglab 手机验证码
1.逗比的验证码第一期获取验证码,并登录登录使用13388886666获取验证码,使用13388886667登录2.逗比的验证码第二期尝试使用burpsuit进行暴力破解2.1设置代理浏览器设置代理2.2截获数据包并发送到intruder设置变量设置破解参数开始破解找到闺蜜前任电话而后重新爆破,即可得到正确结果3.逗比的验证码第三期...
2021-04-21 14:53:10
468
原创 微博数据爬虫——获取特定ID的热门转发用户列表(五)
前言:由于微博网页采用动态加载方式,只能获取到js脚本,不能使用beautifulsoup解析,需要使用正则匹配获取信息1.获取用户热门帖子转发地址如下Kb4cwauSp为转发地址的关键参数使用正则进行匹配add = urllib.request.Request(url="https://weibo.com/u/%s?is_hot=1" % o_id, headers=headers)r = urllib.request.urlopen(url=add, timeout=10).re
2021-04-21 08:19:25
1148
1
原创 微博数据爬虫——获取特定ID的粉丝和关注(二)
注意:近期发现使用requests库访问微博数据出现ssl error错误,而使用urllib库访问则不会出现错误功能:给定特定微博用户ID,获取微博用户的粉丝和关注1.通过o_id获取p_id用户主页结构如下所示:通过使用正则匹配即可获取p_id值add = urllib.request.Request(url='https://weibo.com/u/%s' % o_id, headers=headers)r = urllib.request.urlopen(url=add,
2021-04-20 22:11:34
2117
2
原创 攻防世界(easy-apk)
下载链接如下所示:https://adworld.xctf.org.cn/media/task/attachments/989ca07c3f90426fa05406e4369901ff.apk使用JEB打开apk,如下所示:可知获得输入后进行Base64编码,并进行判断是否与特定字符编码是否一致打开Bse64New,可知其编码位置进行了改变,需要重新设计代码进行编程python实现代码如下所示:def Base64Decode(str_list): list_base =
2021-04-16 09:11:21
1064
原创 攻防世界(app1)
下载apk:https://adworld.xctf.org.cn/media/task/attachments/b9af8dfef6b749d2819ef5be16c26a0d.apk使用JEB打开程序的实现逻辑为:1)获取版本名和版本号,获取输入2)遍历输入,当输入的字符与版本名与版本号的异或不一致时,退出,一致时,继续,最终开启闯关之门版本名和版本号可在BuildConfig查看这是一个配置文件,类似R.class文件,这个类是根据build.gradle配置文件自动生成的
2021-04-14 16:53:46
329
原创 攻防世界(app3)
下载好题目后,可知文件为ab文件参考链接:https://blog.youkuaiyun.com/qq_33356474/article/details/92188491ab文件一般分两种:一种是没有加密,这种文件前面有24字节的文件头,文件头包含none标志,文件头之后就是数据;一种是加密的备份文件,它的文件头就比较复杂了,文件头包含AES-256标志。1.提取数据需要使用android-backup-extractor里的abe.jar将数据提取出来命令如下:java -jar a
2021-04-14 15:56:16
285
原创 攻防世界(app2)writeup
apk下载链接:https://adworld.xctf.org.cn/media/task/attachments/2554cf208cfb4cdf9218a840fa9bf237.apkJEB下载链接:http://down.52pojie.cn/Tools/Android_Tools/jeb-2.2.7.201608151620_crack_qtfreet00.zip1.分析程序逻辑通过链接下载apk,并通过JEB打开APK点击Bytecode和MainActivity每个种语言都
2021-04-13 19:43:26
318
1
原创 闲鱼APP爬虫
写在前面:接到一个任务,实现闲鱼APP的特定关键字商品检索,并进行尝试下单(想要功能)实现思路:首先想到使用此前用到的appium驱动app实现数据获取和订单生成,而后通过app抓包分析获取接口1.appium实现首先是搭建环境,此前进行工作时,搭建过环境,积累了一定经验,现总结如下1.1前言知识参考链接:http://www.testclass.net/appium/appium-base-summary/appium 是一个自动化测试开源工具,支持 iOS 平台和 Android
2021-04-12 15:28:33
16431
13
原创 微博数据爬虫——V影响力榜top100用户(一)
1.分析网页结构网页链接如下:https://v6.bang.weibo.com/czv/domainlist?date=202103&period_type=month可使用选择器提取button标签中share-data中信息r = requests.get("https://v6.bang.weibo.com/czv/domainlist?date=%s&period_type=month" % date)soup = BeautifulSoup(r.text)i
2021-04-06 23:40:50
765
原创 微博数据爬虫——获取转发用户列表 selenium实现(零)
1.环境配置python 3.7geckodriver 0.29.0火狐浏览器 86.0.12.相关理论selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。selenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Seleni
2021-03-25 20:49:26
1684
6
原创 蓝桥杯基础练习
BASIC-13 数列排序问题描述 给定一个长度为n的数列,将这个数列按从小到大的顺序排列。1<=n<=200输入格式 第一行为一个整数n。 第二行包含n个整数,为待排序的数,每个整数的绝对值小于10000。输出格式 输出一行,按从小到大的顺序输出排序后的数列。样例输入58 3 6 4 9样例输出3 4 6 8 9使用冒泡排序算法即可解决#include<stdio.h>int main(){ int n,m; i
2021-03-01 10:59:51
217
原创 SQL注入攻击入门详解
参考书目:《CTF特训营》《从0到1CTFer成长之路》1 什么是SQL注入SQL注入即是指web应用程序对用户输入数据的合法性没有判断或过滤不严,攻击者可以在web应用程序中事先定义好的查询语句的结尾上添加额外的SQL语句,在管理员不知情的情况下实现非法操作,以此来实现欺骗数据库服务器执行非授权的任意查询,从而进一步得到相应的数据信息。...
2021-02-24 22:33:34
558
原创 CTF中的SQL注入
1 环境配置见文章:https://blog.youkuaiyun.com/weixin_43906500/article/details/114025507docker-compose.ymlversion: '3.2'services: web: image: registry.cn-hangzhou.aliyuncs.com/n1book/web-sql-1:latest ports: - 80:80命令执行docker-compose up -d2
2021-02-24 20:47:40
381
原创 CTF信息搜集——敏感目录泄露(实验2)
1 搭建环境见文章:https://blog.youkuaiyun.com/weixin_43906500/article/details/114025507docker-compose.ymlversion: '3.2'services: web: image: registry.cn-hangzhou.aliyuncs.com/n1book/web-information-git:latest ports: - 80:802 信息搜集使用工具scrabble
2021-02-24 17:31:54
351
原创 CTF信息搜集——敏感目录泄露(实验1)
1 搭建docker环境1.1 安装dockDocker 是一个开源的应用容器引擎,基于 Go 语言 并遵从 Apache2.0 协议开源。Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口(类似 iPhone 的 app),更重要的是容器性能开销极低。使用shell脚本安装dockercurl -fsSL https://get.docker.c
2021-02-24 16:21:20
842
原创 CTF信息搜集——敏感目录泄露
文章参考:Nu1L战队所著《从0到1:CTFer成长之路》1 git泄露1.1 常规git泄露1.1.1 git介绍Git 是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。Git 是 Linus Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。Git 与常用的版本控制工具 CVS, Subversion 等不同,它采用了分布式版本库的方式,不必服务器端软件支持。1.1.2 git使用git工作流程:git使
2021-02-23 23:21:21
1423
原创 python gephi可视化 金庸人物关系图
使用python+gephi分析金庸小说人物关系参考文章:https://blog.youkuaiyun.com/weixin_39768541/article/details/849582981.模型构建当两个人物在相邻段落出现时,视为两者存在关系(该方法可以表示一定的人物关系,但是也存在显著缺陷,后续可进行相关改进)2.人物获取通过金庸小说网获取小说中所有人物import requestsfrom bs4 import BeautifulSoupimport reimport
2021-02-20 20:14:08
3438
2
原创 攻防世界 supersqli
题目1.首先尝试是否过滤单引号说明存在注入点注入成功2.查看表项可知存在表项word和19198109311145143.获取数据表内容尝试获取flag内容发现存在字符串过滤4.绕过机制使用预编译sql命令实现绕过-1';set @sql = CONCAT('se','lect * from `1919810931114514`;');prepare stmt from @sql;EXECUTE stmt;#成功获取flag5.
2021-02-02 15:36:45
129
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人