- 博客(5)
- 资源 (7)
- 收藏
- 关注
原创 数据挖掘一
一般问题评价指标说明:什么是评估指标:评估指标即是我们对于一个模型效果的数值型量化。(有点类似与对于一个商品评价打分,而这是针对于模型效果和理想效果之间的一个打分)一般来说分类和回归问题的评价指标有如下一些形式:分类算法常见的评估指标如下:对于二类分类器/分类算法,评价指标主要有accuracy, [Precision,Recall,F-score,Pr曲线],ROC-AUC曲线。 对于多类分类器/分类算法,评价指标主要有accuracy, [宏平均和微平均,F-score]。对
2021-07-07 20:47:08
316
原创 Pandas df节省内存函数
def reduce_mem(df): starttime = time.time() numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64'] start_mem = df.memory_usage().sum() / 1024**2 for col in df.columns: col_type = df[col].dtypes if col_type .
2021-06-19 16:55:39
288
原创 修改clickhouse的默认数据目录和日志目录
clickhouse安装后,默认的数据目录在/var/lib/clickhouse,将其改到/data执行下面的命令mv /var/lib/clickhouse /data/默认日志目录在/var/log/clickhouse-server,将其改到/data/clickhouse/log/执行下面的命令mkdir /data/clickhouse/logmv /var/log/clickhouse-server /data/clickhouse/log/最后重新创建软连接,
2021-05-08 22:26:24
5254
原创 使用kettle发送邮件,解决中文附件名乱码的问题
第一步,下载kettle源码(我下载的是kettle8.0)https://github.com/pentaho/pentaho-kettle第二步,修改代码修改engine/src/org/pentaho/di/job/entries/mail/JobEntryMail.java文件,如下importjavax.mail.internet.MimeUtility;第1021行files.setFileName( file.getName().getBaseName() );改.
2021-05-08 22:10:47
760
转载 再论元组关系演算与SQL
1 引言 20世纪60年代诞生的数据库技术,经过近半个世纪的发展,形成了坚实的理论基础、成熟的商业产品和广泛的应用领域。E.F Codd提出的关系数据模型为当今主流的数据库管理系统提供了坚实的数学基础。关系数据模型有三种等价的操作语言:关系代数、SQL、关系演算(元组关系演算和域关系演算),它们的非过程化程度依次递增,主要应用领域也不同。SQL是关系数据库的标准语言,关系代数和
2009-04-15 15:08:00
3053
1
深入浅出MFC(Microsoft Foundation C1asses) 1
2009-04-14
VC++.NET高级编程
2009-04-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人