- 博客(21)
- 收藏
- 关注
原创 Rabbit MQ出现报错(reply-code=404, reply-text=NOT_FOUND - no queue ‘ACK_QUEUE‘ in vhost ‘/demo‘, class-id
Rabbit MQ出现报错(reply-code=404
2023-11-26 19:22:26
2250
原创 实现最基本的决策树——只有代码
决策树学习的目的是为了产生一颗泛化能力强,即处理未见示列能力强的决策树计算信息熵""":func:计算香农熵:param dataSet: 数据集:return: 香农熵"""numEntires = len(dataSet) # 返回数据集的行数labelCounts = {} # 保存每个标签(Label)出现次数的字典for featVec in dataSet: # 对每组特征向量进行统计。
2023-08-14 10:11:41
139
原创 机器学习之决策树——信息熵、信息增益、信息增益率、基尼指数、决策树的基本实现、Sklearn实现决策树及参数详解、绘制决策树
信息熵、信息增益、信息增益率、基尼指数的实现,决策树基本代码、绘制决策树的实现,基于Sklearn实现决策树并使用红酒数据进行实战。
2022-08-15 18:09:00
1496
原创 SSLEOFError(8, ‘EOF occurred in violation of protocol (_ssl.c:1129)‘))
SSLEOFError(8, 'EOF occurred in violation of protocol (_ssl.c:1129)'))
2022-06-18 11:18:19
2035
2
原创 在Windows中安装Hadoop出现YarnRuntimeException: Permissions incorrectly set for dir /tmp/hadoop-LeiHanhan/n
我当前是在Windows下安装Hadoop,但是出现了下面情况YarnRuntimeException: Permissions incorrectly set for dir /tmp/hadoop-LeiHanhan/nm-local-dir/filecache, should be rwxr-xr-x, actual value = rwxrwxr-x可以去看看这个这个问题,其实很简单,大意就是我们的权限问题。当你准备执行下面命令时,你一定要坚持自己Windows下面的小黑窗口是否是以管理
2022-04-07 17:28:59
1782
1
原创 在运行jar包时出现 Could not obtain block: BP-502585858-192.168.10.132-1648953135759:blk_1073741867_1043 fil
这个错误就是NN与DN失联了,我当前出现的错误是因为执行jar包时出现的此时只需要重启你的Hadoop集群即可
2022-04-06 18:01:08
3161
原创 当Hadoop中出现:Name node is in safe mode.
当Hadoop出现如下情况是:这是代表NameNode处于安全模式如何进入安全模式:使用如下代码:hadoop dfsadmin -safemode enter退出安全模式:hadoop dfsadmin -safemode leave
2022-04-06 17:56:33
1881
原创 初入matplotlib
import matplotlib.pyplot as pltimport matplotlib as mplimport numpy as npfig, ax = plt.subplots() #创建一个包含一个axes的figureax.plot([5, 6, 7, 8], [4, 8, 0, 10]) # 绘制图像和MATLAB命令类似, 你还可以通过一种更简单的方式绘制图像, matplotlib.pyplot方法能够直接在当前axes上绘制图像, 如果用户为指定...
2022-01-11 18:47:30
459
原创 Cross_Validation_Alg、Hold_out_Alg、LeaveOneOut算法的实现
交叉验证法实现:"""交叉验证法(cross validation)可以很好地解决留出法的问题,它对数据量的要求不高,并且样本信息损失不多。交叉验证法先将数据集D划分为k个大小相似的互斥子集,即D = D 1 ∪ D 2 ∪ . . . ∪ D k , D i ∩ D j = ∅ ( i ≠ j ) D = D_1 \cup D_2 \cup ...\cup D_k, D_i \cap D_j = \varnothing(i \neq j)为了保证数据分布的一致性,从D中随机分层抽样即可。
2021-12-13 14:06:17
192
原创 数据结构中顺序表线性表的部分操作
/*数据结构中对线性表的操作使用的数据元素存储方式是静态存储 */#include<stdio.h>#include<stdlib.h>#define LIST_INIT_SIZE 100typedef int ElemType;typedef struct { int listsize; /* 当前分配的存储容量(以sizeof(ElemType)为单位) */ int length; ElemType *elem;}SqList;/.
2021-11-27 10:45:53
308
原创 使用python来实现信息熵、条件熵、信息增益率
第一:引入必要的库和创建部分数据import pandas as pdimport numpy as npdata = pd.DataFrame({'天气':['晴','晴','阴','雨','雨','雨','阴','晴','晴','雨','晴','阴','阴','雨'], '温度':['高','高','高','低','低','低','低','低','低','低','低','低','高','低'], '湿度':['
2021-09-27 23:35:59
1539
原创 初步实现协程爬虫(异步爬虫)
异步爬虫就是解决我们在 爬虫中当爬取大量数据时的时间效率问题请看下面的代码# _*_ coding:utf-8 _*_# coding = utf-8from gevent import monkey#下面这串代码是把程序变成一个协作式运行,就是可以帮助程序实现异步爬取数据,monkey.patch_all() #实现让IO阻塞。import geventimport requestsimport timestart_time = time.time()#自己找一些
2021-08-15 22:00:58
318
原创 使用selenium来自动登录下面网页 https://xiaoke.kaikeba.com/example/X-Man/
首先是你的运行环境和chromedriver在同一个地方,只有这样后,下面的代码你才可以运行如下图所示当然如果你的运行环境和游览器驱动不在统一地方,那么你可以在driver = webdriver.Chrome() 这个代码添加你的游览器驱动路径, 完成以上步骤后,下面直接上代码# _*_ coding:utf-8 _*_#coding = utf-8# 使用selenium来登录下面的网页# 本地chrome游览器设置方法, 这个地方必须是你的本地的运行环境..
2021-08-11 21:09:49
596
原创 使用session获取, cookie并使用它进行登录评论,以开课吧为例。
引入我们要使用的包# _*_ coding:utf-8 _*_# coding = utf-8import jsonimport requests.utils#改变输出端口import ioimport syssys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='gb18030')接下来代码中开头没有封装成函数的都是全局变量,当然你也可以使用python中的类来进行修改,下面的代码是使用session来进行登录并获取
2021-08-11 18:02:16
939
1
原创 使用requests登录某个网站并且拿到小饼干,并且使用小饼干去做一些自己想要做的内容, 这里以评论为例
"""这里是在开课吧上使用request得到cookies,然后拿到首次评论成功的网址,之后使用代码下面的代码进行评论"""#_*_ coding:utf-8 _*_# coding = utf-8import requests#改变输出端口import ioimport syssys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='gb18030')class kaikeba(object): de.
2021-08-10 18:50:17
147
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人