自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 模型泛化能力的评估(准确率、精确率、召回率、F1、ROC、AUC)与代码实现

模型泛化能力评估(准确率、精确率、召回)

2022-06-05 16:41:52 6859

原创 支持向量机(SVM)原理与代码实现

支持向量机

2022-06-05 15:10:34 529

原创 聚类(K-Means聚类)原理与代码实现

K-MEANS聚类分析原理与代码实现

2022-06-05 11:36:24 473

原创 决策树(Decision Tree)原理与代码实现

机器学习---决策树与代码实现

2022-06-04 23:47:11 307

原创 集成学习(Adaboost和Bagging,Randomforest)原理与实现

机器学习学习笔记

2022-06-04 21:59:52 462

转载 将多个文本文档合并到一个文档中

参考这个博主

2021-07-20 16:01:09 246

原创 【转】将文中标点替换成空格(收藏留用)

import reimport oslist=[',','?','.','?','!','*','(',')','“','”',':','"','`','\''] ##要替换的标点符号做成一个列表with open(r"out1无空行.txt",'r',encoding="utf-8") as f: ##text.txt是用来训练的文本 result = f.read() for i in range(len(lis.

2021-07-15 14:10:16 1355

原创 中文文本实现分词+去停用词(PYTHON)

import jieba# 创建停用词列表def stopwordslist(): stopwords = [line.strip() for line in open(r'stopwords.txt',encoding='UTF-8').readlines()] return stopwords#扩展jieba分词词库dict='fencibuchong.txt'jieba.load_userdict(dict)# 对句子进行中文分词def seg_depart(s..

2021-07-12 10:31:33 6917 7

原创 Python中read/readline/readlines的区别?

https://blog.youkuaiyun.com/bycare/article/details/80030469?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522162521454216780265497829%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=162521454216780265497829&biz_id=0&.

2021-07-02 16:34:21 151

原创 关于报错:‘DataFrame‘ object has no attribute ‘str‘

data_len = data_null_comments[data_null_comments.str.len()>4]print(data_len)运行这段代码时报错'DataFrame' object has no attribute 'str'原因是我读入的数据是DataFrame格式,只需将数据添加一个列名names=['txt']即可,然后将上述代码改为:data_len = data_null_comments[data_null_comments['txt'].st..

2021-06-30 20:23:19 15814 1

原创 DataFrame基本知识点

1.数据类型——二维数组(索引+属性)2.创建dataframe(1)二维数组创建import pandas as pddf=pd.DataFrame([[1,2,3],[4,5,6]],index=['a','b'],columns=['f','h','g'])print(df)[out] f h ga 1 2 3b 4 5 6index——指定行索引的名称columns——指定列索引的名称(2)通过字典创建dm=pd.DataFrame..

2021-06-30 15:23:41 273

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除