python
fffflyinthesky
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
支持向量机
一、概述 支持向量机(SVM,也称为支持向量网络),SVM在各种实际问题中都表现非常优秀。它在手写识别数字和人脸识别中应用广泛,在文本和超 文本的分类中举足轻重,因为SVM可以大量减少标准归纳(standard inductive)和转换设置(transductive settings)中对标记训练实例的需求。同时,SVM也被用来执行图像的分类,并用于图像分割系统。 二、支持向量机分类器的工作原理 支持向量机的分类方法,是在这组分布中找出一个超平面作为决策边界,使模型在数据上的 分类误差尽量接近于小,尤其是原创 2020-08-26 20:42:36 · 172 阅读 · 0 评论 -
机器学习算法——决策树
决策树 决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规 则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。决策树算法容易理解,适用各种数据,在解决各 种问题时都有良好表现,尤其是以树模型为核心的各种集成算法,在各个行业和领域都有广泛的应用。 节点 根节点:没有进边,有出边。包含最初的,针对特征的提问。 中间节点:既有进边也有出边,进边只有一条,出边可以有很多条。都是针对特征的提问。 叶子节点:有进边,没有出边,每个叶子节点都是一个类原创 2020-08-20 22:15:23 · 549 阅读 · 0 评论 -
机器学习算法——逻辑回归
逻辑回归 1. 逻辑回归概述 逻辑回归是一种名为“回归”线性分类器,其本质是由线性回归变化而来的。假设现在有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称为回归。利用Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。 逻辑回归的本质只有线性回归变化而来的,线性回归的方程如下: z=ω0+ω1x1+ω2x2+…+ωnxn (ω0=1) z=\omega_{0}+\omega_{1} x_{1}+\omega_{2} x原创 2020-08-18 21:56:38 · 495 阅读 · 0 评论 -
pandas 与 excel(二) python对excel表格的合并与拆分
利用pandas合并excel文件 一、多个xlsx文件合并 xlsx文件可为单sheet或多sheet混合 导入os, pandas库 import os import pandas as pd 可采用函数的形式,将文件夹作为参数,不同情况下使用时,更改参数即可 读取文件夹下所有文件,筛选出xlsx文件,将所有该格式文件汇总进列表做区分检验,利用read_excel读取所有xlsx文件为dataframe(默认第一个sheet,后面会介绍多sheet合并方法),将所有dataframe存入列表,然原创 2020-07-30 17:54:23 · 1605 阅读 · 0 评论 -
python基础学习 Task04 元组
元组 「元组」定义语法为:(元素1, 元素2, …, 元素n) 小括号把所有元素绑在一起 逗号将每个元素一一分开 1. 创建和访问一个元组 Python 的元组与列表类似,不同之处在于tuple被创建后就不能对其进行修改,类似字符串。 元组使用小括号,列表使用方括号。 元组与列表类似,也用整数来对它进行索引 (indexing) 和切片 (slicing)。 tup1 = (1, 3, 5, 's') print(tup1, type(tup1)) (1, 3, 5, 's') <class原创 2020-07-30 16:13:24 · 355 阅读 · 0 评论 -
python基础学习 Task04 列表
列表 简单数据类型 整型<class ‘int’> 浮点型<class ‘float’> 布尔型<class ‘bool’> 容器数据类型 列表<class ‘list’> 元组<class ‘tuple’> 字典<class ‘dict’> 集合<class ‘set’> 字符串<class ‘str’>| 1. 列表的定义 列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对象,原创 2020-07-29 22:43:32 · 171 阅读 · 0 评论 -
NLP学习 Task3 基于机器学习的文本分类
Task3 基于机器学习的文本分类 在上一章节,我们对赛题的数据进行了读取,并在末尾给出了两个小作业。如果你顺利完成了作业,那么你基本上对Python也比较熟悉了。在本章我们将使用传统机器学习算法来完成新闻分类的过程,将会结束到赛题的核心知识点。 基于机器学习的文本分类 在本章我们将开始使用机器学习模型来解决文本分类。机器学习发展比较广,且包括多个分支,本章侧重使用传统机器学习,从下一章开始是基于深度学习的文本分类。 学习目标 学会TF-IDF的原理和使用 使用sklearn的机器学习模型完成文本分类 机原创 2020-07-26 23:33:31 · 177 阅读 · 0 评论 -
python基础学习 Task03 异常处理
Task03: 异常处理 异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。 1. Python 标准异常总结 BaseException:所有异常的 基类 Exception:常规异常的 基类 StandardError:所有的内建标准异常的基类 ArithmeticError:所有数值计算异常的基类 FloatingPointError:浮点计算异常 OverflowError:数值运算超出最大限制 Zero原创 2020-07-25 23:14:57 · 172 阅读 · 0 评论 -
python基础学习 Task02 条件循环结构
Task02 条件循环结构 条件语句 1. if 语句 if expression: expr_true_suite if 语句的 expr_true_suite 代码块只有当条件表达式 expression 结果为真时才执行,否则将继续执行紧跟在该代码块后面的语句。 单个 if 语句中的 expression 条件表达式可以通过布尔操作符 and,or和not 实现多重条件判断。 【示例】 a = 2 b = 5 c = 3 if a < b and not b < c:原创 2020-07-23 21:32:21 · 215 阅读 · 0 评论 -
NLP学习 Task02 数据读取与数据分析
Task02 数据读取与数据分析 学习目标 学习使用pandas读取赛题数据 分析赛题数据的分布规律 数据读取 赛题数据为文本数据,但是使用csv格式存储,可用pandas进行数据读取 import pandas as pd train_df = pd.read_csv(r"D:\python\NLP learn\datasets\train_set.csv",sep = "\t") pandas中的read_csv函数在这里选取三个参数赋值: 读取的文件路径,这里需要根据改成你本地的路径,可以使原创 2020-07-22 22:58:12 · 195 阅读 · 0 评论 -
python基础学习 Task01 变量、运算符与数据类型
python基础学习 Task01 1. 注释 在python中,同其他程序语音一样,注释分为单行注释和区间(多行)注释 单行注释用 # 来注释内容 eg: # 这是注释内容 print("Hello word!") print(“I love python”) # Start of learning # 输出内容 区间注释用 ‘’’ ‘’’,或 “”" “”",用于注释多行内容 eg: ''' 第一行注释内容,用三个单引号 第二行注释内容,用三个单引号 第三行注释内容,用三个单引号 ''' print原创 2020-07-22 17:45:19 · 160 阅读 · 0 评论
分享