- 博客(8)
- 资源 (25)
- 收藏
- 关注
原创 nlp基础-----Task3 基于机器学习的文本分类
Task3 基于机器学习的文本分类在上一章节,我们对赛题的数据进行了读取,并在末尾给出了两个小作业。如果你顺利完成了作业,那么你基本上对Python也比较熟悉了。在本章我们将使用传统机器学习算法来完成新闻分类的过程,将会结束到赛题的核心知识点。基于机器学习的文本分类在本章我们将开始使用机器学习模型来解决文本分类。机器学习发展比较广,且包括多个分支,本章侧重使用传统机器学习,从下一章开始是基于深度学习的文本分类。学习目标学会TF-IDF的原理和使用使用sklearn的机器学习模型完成文本分类
2020-07-25 23:13:59
189
1
原创 python基础---task5. 异常处理
异常处理异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。1. Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDivision
2020-07-25 23:11:54
124
原创 python基础----task4. 循环语句
循环语句1. while 循环while语句最基本的形式包括一个位于顶部的布尔表达式,一个或多个属于while代码块的缩进语句。while 布尔表达式: 代码块while循环的代码块会一直循环执行,直到布尔表达式的值为布尔假。如果布尔表达式不带有<、>、==、!=、in、not in等运算符,仅仅给出数值之类的条件,也是可以的。当while后写入一个非零整数时,视为真值,执行循环体;写入0时,视为假值,不执行循环体。也可以写入str、list或任何序列,长度非零则视为真值,执
2020-07-25 23:11:09
156
原创 python基础---task3 条件语句
条件语句1. if 语句if expression: expr_true_suiteif 语句的 expr_true_suite 代码块只有当条件表达式 expression 结果为真时才执行,否则将继续执行紧跟在该代码块后面的语句。单个 if 语句中的 expression 条件表达式可以通过布尔操作符 and,or和not 实现多重条件判断。【例子】if 2 > 1 and not 2 > 3: print('Correct Judgement!')#
2020-07-23 21:07:09
118
原创 python基础----task2 位运算
python基础----task2 位运算1.原码、反码和补码二进制有三种不同的表示形式:原码、反码和补码,计算机内部使用补码来表示。原码:就是其二进制表示(注意,最高位是符号位)。原码原码:就是其二进制表示(注意,最高位是符号位)。【例】00 00 00 11 -> 310 00 00 11 -> -3反码反码:正数的反码就是原码,负数的反码是符号位不变,其余位取反(对应正数按位取反)。【例】00 00 00 11 -> 311 11 11 00 ->
2020-07-23 20:57:09
105
原创 nlp基础学习-----Task2 数据读取与数据分析
Task2 数据读取与数据分析在上一章节,我们给大家简单介绍了赛题的内容和几种解决方案。从本章开始我们将会逐渐带着大家使用思路1到思路4来完成本次赛题。在讲解工具使用的同时,我们还会讲解一些算法的原理和相关知识点,并会给出一定的参考文献供大家深入学习。数据读取与数据分析本章主要内容为数据读取和数据分析,具体使用Pandas库完成数据读取操作,并对赛题数据进行分析构成。学习目标学习使用Pandas读取赛题数据分析赛题数据的分布规律数据读取赛题数据虽然是文本数据,每个新闻是不定长的,但任然使
2020-07-22 21:24:01
144
原创 python基础学习—变量、运算符与数据类型
python基础学习task1—变量、运算符与数据类型1.注释每个编程语言都有自己的注释,python的注释就是--“#”在每一个程序语句前加上“#”即可# a=2也可以用多行注释‘’‘ ’‘’或“”“ ”“”或者用环境的快捷键command+/2.运算符算数运算符+、-、*、/、//、%、**print(1+2)#加法print(1-2)#减法print(1*2)#乘法print(1/2)#小数除法print(1//2)#整除print(1%2)#取余print(
2020-07-22 17:18:16
199
原创 Datawhale|NLP集训学习笔记
@Datawhale|NLP集训学习笔记task1—赛题理解1.赛题内容赛题名称:零基础入门NLP之新闻文本分类赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。2.赛题数据赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:【财经、彩票、房产、股票
2020-07-21 09:59:56
107
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人