
Python数据分析
文章平均质量分 97
Co_zy
这个作者很懒,什么都没留下…
展开
-
Numpy基础
本文内容源自《利用Python进行数据分析》一书一.NumPy的ndarrayNumPy最重要的一个特点就是其N维数组对象(即ndarray) ,它是一个通用的同构数据多维容器,也就是说,其中的所有元素必须是相同类型的.每个数组都有一个shape(一个表示各维度大小的元组)和一个dtype(一个用于说明数组数据类型的对象)首先创建ndarray>>> import num...原创 2019-01-09 10:00:46 · 741 阅读 · 0 评论 -
在 Django 中使用 pyecharts
官方文档https://pyecharts.org/#/官网的在 Django 中使用 pyecharts教程 :https://pyecharts.org/#/zh-cn/web_django其中配置pyecharts_django_demo/urls.py中,修改如下,可以不用再demo/下创建urls.py(当然这也可能是新版本的标准)from django.conf.urls i...原创 2019-07-29 09:51:38 · 7519 阅读 · 4 评论 -
自然语言处理-文本分析学习记录
TF_IDFTF(term frequency) : 词频统计去掉停用词 : 的、是、在《中国蜜蜂养殖》这篇文章中,出现最多的是中国,蜜蜂养殖,但中国不是关键词,我们怎么让蜜蜂养殖成为主体的,此时就需要IDFIDF(Inverse Document Frequency)如果某个词比较少见,但是它在这篇文章中多次出现,那么它很可能就反应了这篇文章的特性正是我们所需要的关键词.TF_IDF...原创 2019-07-29 10:14:50 · 922 阅读 · 0 评论 -
Elasticsearch学习记录
什么是Elasticsearch分布式高性能高可用可伸缩的的搜索和分析系统1.什么是搜索垂直搜索(站内搜索)互联网的搜索:电商网站,招聘网站新闻网站各种APPIT系统的搜索:OA软件,办公自动化软件,会议管理,日程管理,项目管理,员工管理2.如果用数据库做搜索会怎么样(1)每条记录的指定字段的文本,可能会很长,比如"商品描述"字段的长度,这时如果每次都要对每条记录的所有文本进行扫描,...原创 2019-07-29 10:43:09 · 703 阅读 · 0 评论