
机器学习
zhyueln
这个作者很懒,什么都没留下…
展开
-
Python re 模块以及正则表达式
re.compile( ):将正则表达式编译成一个对象,加快速度并可以重复使用。import rere.complie()re.sub() :对字符串做替换处理''' re.sub(pattern, repl, string, count=0, flags=0)'''test = "今天是我的18岁生日,我收到1份价值10万的礼物。"pattren = re.compile(...原创 2018-09-30 21:35:58 · 204 阅读 · 0 评论 -
python 记录几个经常用错的函数
sum 和 np.sum>>> import numpy as np>>> a = np.array([[1,2,3,4],[3,2,1,2]])>>> sum(a)array([4, 4, 4, 6])>>> np.sum(a)18原创 2018-10-04 21:14:39 · 207 阅读 · 0 评论 -
向量空间模型(VSM)与TF-IDF
向量空间模型,可用于计算文本相似度。首先我们希望将文章向量化。可以将一篇文章表示成从该文章抽取的关键词及其权重所构成的向量。==但如何提取文章的关键词和他的权重? e.g. TF-IDF(词频-逆文档频率) ==...原创 2018-09-29 21:42:13 · 4367 阅读 · 0 评论 -
电商平台商品标题短文本分类 - word2vec
测试平台: gome, 训练平台: gomeBOW --> Naive Bayes测试平台商品数:9766,训练平台商品数:57584测试数:9766,全等数:9366,全等率:95.90%测试数:9766,全等数最大值:9766,全等率最大值:100.00%=========================================================原创 2018-10-28 22:31:02 · 2913 阅读 · 4 评论 -
MySQL--数据类型转换(CAST/CONVERT)、拼接(CONCAT)
文章目录数据基础CAST/CONVERT(数据类型转换)CONCAT(数据拼接)数据基础mysql> select * from a;+------+-----------+| id | num |+------+-----------+| 1 | 100 || 2 | 200 || 3 | 300 ||...原创 2019-06-27 18:09:21 · 33398 阅读 · 0 评论 -
MySQL在macOS上的使用——包括几种常用的语法(JOIN、UNION的区别、GROUP BY等)及实践结果
文章目录数据基础join and unioninner join功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入数据基...原创 2019-06-25 01:04:59 · 345 阅读 · 0 评论 -
MySQL进阶排序(窗口函数)----分组并对组内排序后每个组取前N个数据(ORDER BY、ROW_NUMBER)
基本的排序–ORDER BYMysql中对数据的排序的基础方法是使用ORDER BY,升序为ASC,逆序为DESC。mysql> select * from student order by sid asc; //按sid 升序排列+-------------+-----------+----------+-------+-----+| sid | sname ...原创 2019-06-27 23:12:43 · 11437 阅读 · 5 评论