- 博客(7)
- 资源 (2)
- 收藏
- 关注
原创 利用VBA实现word文档手写体打印
在日常工作中,经常遇到需要大量手写的时候,比如申请书、读后感、观后感,还有单位要求的其他需要手写的文档。作为信息技术人员,当然是能用计算机解决的,就绝不动手。有点手写的感觉了,但仔细看你会发现许多问题,比如字体都是一样大,并且每行都十分整齐,相邻两个字左右间距一致,然而我们手写的时候是做不到打印体这样 整齐的,所以需要继续优化。大多数的系统字体都在这个路径:C:\Windows\Fonts,我们只需要把刚才下载的字体解压,然后放到这个路径就大功告成。需要实现三点,一、字体大小需要在一定范围内波动;
2023-05-15 20:11:53
3334
1
selenium破解滑动验证实现自动登录爬虫
selenium破解滑动验证实现自动登录爬虫概述:一、selenium的滑动验证码的破解概述:下文有两个部分:1、selenium的滑动验证码的破解;2、基于selenium的网络爬虫(以B站为例)一、selenium的滑动验证码的破解1、思路分析a、首先进入B站的登录界面,当输入账号密码,点击登录后,会弹出滑动验证码,如:b、查看网页源码,发现它生成了两张图片,一张完整的的图片和...
2020-04-17 19:33:49
958
原创 智源&计算所-互联网虚假新闻检测挑战赛
赛题的分析(Task 1):1、任务:给定一个新闻事件的文本,判定该事件属于真实新闻还是虚假新闻。2、方法:训练一个二分类器,判别新闻是真还是假。一、数据预处理:a、样本数据观察:训练集有38471条数据,每条数据有id、text、label三个字段,其中1代表正例 (真),0代表负例(假)b、数据清洗:1、生成训练词向量的数据2、去掉训练样本里的无意义的噪音,例如:url...
2019-10-19 10:04:50
3425
11
原创 基于SVM+LR的新闻的情感分析(完整的一个项目流程)
一、数据来源:爬取了新浪财经的新闻数据,大约30万篇文章(很遗憾全是未标记数据)二、数据标记:
2019-07-28 10:54:04
3287
3
原创 机器学习算法——决策树
决策树算法理论篇1、决策树直观理解:假设,已知10人房产、婚姻、年收入以及能否偿还债务的样本,那么第11个人来,知其房产、婚姻、以及年收入情况,问他是否能偿还债务?2、前置知识:理解决策树,我们必须知道一下概念:信息熵:描述系统的不确定度,熵越高,代表系统越混乱,包含的信息量也就越多,其公式:例(计算前10个样本能否还债y的信息熵):-0.7log2(0.7)- 0.3log2(0...
2019-03-26 13:25:02
379
原创 python——装饰器
以需求驱动来理解python——装饰器1、需求分析:在原有的功能函数上,新增一个计算该功能函数运行时消耗的时间的功能!2、假设有功能函数:def function_1():print(‘我是功能函数1…’)time.sleep(2)程序运行结果:我是功能函数1…3、功能实现:方法一:def function_1():start = time.time()print(‘我是功...
2019-03-11 13:09:52
189
new_positive_dict.txt
2019-07-26
new_negative_dict.txt
2019-07-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人