
机器学习
HelenLee01
通俗易懂
展开
-
【机器学习】sklearn库的安装教程,python
sklearn库的简介sklearn库 sklearn是scikit-learn的简称,是一个基于Python的第三方模块。sk...转载 2020-03-04 11:42:29 · 1836 阅读 · 1 评论 -
【机器学习】读取txt文本内容计算TF-IDF值,算法,python
Sklearn库的学习之TF-IDF算法:# coding:utf-8import jiebaimport jieba.posseg as psegimport osimport sysfrom sklearn import feature_extractionfrom sklearn.feature_extraction.text import TfidfTransformer...原创 2020-03-04 11:26:42 · 1707 阅读 · 0 评论 -
【机器学习】sklearn库的学习之TF-IDF算法,python,超简单!
Sklearn库的学习之TF-IDF算法:# coding:utf-8import jiebaimport jieba.posseg as psegimport osimport sysfrom sklearn import feature_extractionfrom sklearn.feature_extraction.text import TfidfTransformer...原创 2020-03-04 11:14:10 · 1085 阅读 · 1 评论 -
【机器学习】sklearn鸢尾花识别,python
python使用sklearn鸢尾花识别,代码传送门:# 引入数据集,sklearn包含众多数据集from sklearn import datasets# 将数据分为测试集和训练集from sklearn.model_selection import train_test_split# 利用邻近点方式训练数据from sklearn.neighbors import KNeigh...原创 2020-03-04 10:53:41 · 2861 阅读 · 0 评论 -
【机器学习】使用sklearn.datasets.make_gaussian生成数据,python
python使用sklearn.datasets.make_gaussian生成数据,代码传送门:import matplotlib.pyplot as plt from sklearn.datasets import make_classificationfrom sklearn.datasets import make_blobsfrom sklearn.datasets im...原创 2020-03-04 10:48:41 · 1233 阅读 · 0 评论 -
【机器学习】使用sklearn.datasets.make_blobs来生成数据,python
python使用sklearn.datasets.make_blobs来生成数据,代码传送门:from sklearn.datasets import make_blobsfrom matplotlib import pyplot data,label = make_blobs(n_samples=100,n_features=2,centers=5) # 绘制样本显示pyplo...原创 2020-03-04 10:44:02 · 930 阅读 · 0 评论 -
【机器学习】sklearn之手写数据集,python
python使用sklearn手写数据集,代码传送门:import matplotlib.pyplot as pltfrom sklearn.datasets import load_digits digits = load_digits() plt.matshow(digits.images[0])plt.show()效果图:本文代码系摘取,链接传送门:https...原创 2020-03-03 14:32:35 · 683 阅读 · 0 评论 -
【机器学习】sklearn之生成三类数据用于聚类,python
sklearn之生成三类数据用于聚类,并设置不同方差,代码传送门:import matplotlib.pylab as pltfrom sklearn.datasets import make_blobs # 每个样本有几个属性或者特征n_features = 2 data,target = make_blobs(n_samples=100,n_features=2,center...原创 2020-03-03 14:25:27 · 1063 阅读 · 0 评论 -
【机器学习】K-means文本聚类,简单入门版,python
K-means是一种常用的聚类算法,入门版展示如下,代码传送门:# -*- coding: utf-8 -*-import jieba from sklearn.feature_extraction.text import TfidfVectorizerfrom sklearn.cluster import KMeansfrom sklearn.externals import ...原创 2020-03-02 11:38:43 · 853 阅读 · 0 评论 -
【机器学习】K-means文本聚类,python
K-means是一种常用的聚类算法,展示如下:Created on 2016-01-06 @author: Eastmount代码传送门:# coding=utf-8 """ Created on 2016-01-06 @author: Eastmount """ import time import re import ...原创 2020-03-02 11:52:47 · 803 阅读 · 0 评论 -
【机器学习】K-means聚类,升级版,tf-idf+PCA降维+k-means,python
升级版K-means聚类:tf-idf+PCA降维+k-means,代码传送门:# coding:utf-8 # 2.0 使用jieba进行分词,彻底放弃低效的NLPIR,用TextRank算法赋值权重(实测textrank效果更好)# 2.1 用gensim搞tfidf# 2.2 sklearn做tfidf和kmeans# 2.3 将kmeans改成BIRCH,使用传统tfidf...原创 2020-03-02 12:01:00 · 3311 阅读 · 4 评论 -
【机器学习】K-means三维聚类,进阶版,python
K-means是一种常用的聚类算法,进阶版展示如下,代码传送门:import randomfrom sklearn import datasetsimport numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3D# 正规化数据集 Xdef normalize(X, a...原创 2020-03-02 13:47:01 · 16537 阅读 · 9 评论 -
【机器学习】word2vec词向量,相似词,近义词,k-means文本聚类预处理,python
使用K-means做词聚类需要用到word2vec做词向量化预处理。#@Author : LinYimeng代码传送门:# -*- coding: utf-8 -*-#@Author : LinYimengimport multiprocessingimport gensimfrom gensim.test.utils import common_texts, ge...原创 2020-03-03 11:24:53 · 3281 阅读 · 2 评论 -
【机器学习】gensim.models.Word2Vec()参数的详细解释,python
Gensim的Word2Vec模型中参数的详细解释:model=gensim.models.Word2Vec(sentences,sg=1,size=100,window=5,min_count=2,negative=3,sample=0.001,hs=1,workers=4)#该步骤也可分解为以下三步(但没必要):#model=gensim.model.Word2Vec() 建立一...原创 2020-03-03 11:31:01 · 3653 阅读 · 0 评论 -
【机器学习】sklearn之生成环形和半环型数据,python
python使用sklearn生成环形和半环型数据,代码传送门:from sklearn.datasets import make_circlesfrom sklearn.datasets import make_moonsimport matplotlib.pyplot as pltimport numpy as np fig=plt.figure(1)x1,y1=make_...原创 2020-03-03 14:08:08 · 2039 阅读 · 0 评论 -
【机器学习】sklearn之创建数据集,python
python使用sklearn机器学习之创建数据集:from sklearn.datasets.samples_generator import make_classificationX, y = make_classification(n_samples=6, n_features=5, n_informative=2, n_redundant=2, n_classes=2, n...原创 2020-03-03 14:02:37 · 2080 阅读 · 1 评论