- 博客(10)
- 收藏
- 关注
原创 《将博客搬至优快云》
《将博客搬至优快云》 《将博客搬至优快云》 posted @ 2018-06-04 21:59 Qamra 阅读(...) 评论(...) 编辑 收藏
2018-06-04 21:59:00
201
原创 自然语言处理--大作业
自然语言处理--大作业 1.问题描述:比较三个分类器在影评分类任务上的性能,训练机1500,测试集500;朴素贝叶斯有三个常用模型:高斯、多项式、伯努利;KNN选择k(最好是交叉验证);SVM选择核函数。问题要求:对每个模型简述原理,说明每个参数调整的意义,简单概括3个分类器在影评分类上的性能。2.综述如何使用ROC曲线和AUC评价一个二值分类器...
2018-05-01 13:54:00
2096
原创 文本自动摘要发展历程
文本自动摘要发展历程 看了近70年文本自动摘要研究综述,简单记录一下文本自动摘要的发展历程和方法。文本摘要通常是指从单个或多个文档中产生一段文本,该文本传达了原始文本的主要信息。文本自动摘要是20世纪50年代出现的一种用计算机完成的文本摘要技术,帮助人们从信息海洋中解放,提高信息的使用效率。自动摘要研究是从抽取式摘要开始的。1.抽取式自...
2018-04-15 17:13:00
1776
原创 什么是超参数?
什么是超参数? 在看机器学习时,经常碰到一个叫超参数的参数(hyperparameter),所以到底什么是超参数?超参数的定义:在机器学习的上下文中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果。理解:超参数也是一个参数,是一个...
2018-04-05 11:21:00
3811
原创 自然语言处理——3.21课后作业
自然语言处理——3.21课后作业 posted @ 2018-04-03 17:34 Qamra 阅读(...) 评论(...) 编辑 收藏
2018-04-03 17:34:00
423
原创 自然语言处理——3.28课后作业
自然语言处理——3.28课后作业 问题:设计汉语的组合标注器,训练和测试语料使用thulac标注过的汉语文本。1.导入thulac模块,对文件Leipzig10ksents.txt进行分词并标注。import thulacthu = thulac.thulac()thu.cut_f('/Users/chenqiutong/U盘备份/Qam...
2018-04-03 17:25:00
2272
原创 《机器学习实战》读书笔记-1
《机器学习实战》读书笔记-1 #(本人开发工具为PyCharm,Python版本是3.5)第二章 KNN2.1 概述k-紧邻算法的一般流程:收集数据:可以使用任何方法准备数据:距离计算所需要的数值,最好是结构化的数据格式分子数据:可以使用任何方法训练数据:此步骤不适应于k-紧邻算法测试数据:计算错误率使用算法:首先需要输入样...
2018-03-18 21:59:00
1622
原创 Python中的numpy函数的使用ones,zeros,eye
Python中的numpy函数的使用ones,zeros,eye 在看别人写的代码时,看到的不知道的函数,就在这里记下来。原文是这样用的:1 weights = ones((numfeatures,1))在python中help():import numpy as np help(np.ones) 1 Help on fun...
2018-01-28 15:57:00
810
原创 《从Python学编程》第二章 记录
《从Python学编程》第二章 记录 p { margin-bottom: 0.25cm; line-height: 120% }2.3.3 序列序列和词典都是容器型变量; 元祖:元素不可变更序列分为两种...
2017-09-29 21:57:00
192
原创 Python序列内单双引的问题——未解决
Python序列内单双引的问题——未解决 在学习python基础的时候,遇到这样一个问题:tuple=(2,2.3,"yeah",5.6,False)list=[True,5,"smile"]这样输入的结果是:(2, 2.3, 'yeah', 5.6, False)[True, 5, 'smile']我不明白为什么输出...
2017-09-24 16:29:00
174
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅