- 博客(29)
- 资源 (17)
- 收藏
- 关注
原创 Windows下某度翻译接口加密问题
问题:1.本人在使用翻译时存在sign不一致问题2.整理了两天,最后发现是execjs包计算方法与js计算方法不同导致。3.不问博主说是需要使用nodejs去解决,奈何对nodejs不是很熟,所以尝试了半天发现做了点无用功。在此写下此文章,赠与有缘人,希望早日脱离我遇到的苦海。(如果有所帮忙谢谢点赞)1.安装nodejs。安装网址:Node.js1.安装步骤请结合Node.js 安装配置 | 菜鸟教程2.安装测试完js运行无误以后,开始下述步骤2.设置js文本(sign加密算
2022-02-09 18:14:18
969
原创 Selenium如何让启动的浏览器和手动启动的浏览器信息一致
最近在做爬虫,主要使用过了selenium包,但是发现selenium包直接调用本地浏览器,启动的是一个全新的(与手动打开的不一致),很多网站可以检测到,为了避免这个坑,给碰到相同问题的同伴提供思路,写下此文,希望对大家有所帮助。1.打开谷歌浏览器;2.在搜索框直接输入chrome://version/,找到“个人资料路径”;注意:不要复制Default。3.代码from selenium import webdriveroption = webdriver.ChromeOpt
2021-03-31 20:34:53
5617
5
原创 Word中MathType不能正常使用解决方法
本人使用的是word2010+MathType,可以正常使用了。首先介绍下,本人首先使用的word2007,然后装mathtype6.9,装上以后发现,公式编号啥的都不能使用(灰色的),然后自己鼓捣半天,废了半天劲,网上找各种解决方法,说把几个文件复制到word的SETUP中,尝试了半天还不行。后来卸了2007,装了2010,发现还是不行,有点奔溃,折腾了半天,后来发现还是不行。后来无意中...
2018-10-21 11:08:54
34736
83
原创 利用鸢尾花数据,解释并不是特征越多越好
#首先导入我们需要的包from sklearn import datasetsimport numpy as npfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import Perceptro...
2018-05-21 18:29:24
1645
原创 Linux常用命令
1.Linux中用户切换命令:su 用户名 回车以后输入用户名对应的密码即可如果先要切换到Root用户可以使用:su - 然后回车即可(需要输入root密码)由root用户到其他用户可以直接su 用户名即可(无需输入密码)2.常用命令:...
2018-04-11 14:47:37
176
原创 Python机器学习小案例源码 -- 骨科疾病预测
#内容为实现小象学院的相关代码#数据连接https://www.kaggle.com/uciml/biomechanical-features-of-orthopedic-patientsimport pandas as pdimport numpy as npimport seaborn as snsimport matplotlibimport matplotlib.pyplot as plt...
2018-04-03 16:30:10
1370
2
原创 Anaconda如何安装包
如果安装Anaconda,大家会发现很多包已经安装好了,但是如果我们想要安装新包,我们会发现pip install 包名无法安装,或者安装以后无法使用。接下来,跟上脚步,本人自己亲测:1.找到如图所示的 2.打开Anaconda Prompt,然后在里面输入conda install 包名即可安装。安装完你需要的包以后
2018-01-10 11:01:08
35561
1
原创 python 3.x 结巴(jieba)分词基础知识
# -*- coding: utf-8 -*-from __future__ import unicode_literalsimport syssys.path.append("../")import jiebaimport jieba.possegimport jieba.analyse#分词seg_list = jieba.cut
2017-12-19 15:59:05
1200
原创 python3.x正则表达式的含义及使用
import reimport nltk#正则表达式wordlist = [w for w in nltk.corpus.words.words('en') if w.islower()]print(wordlist)#查找ed结尾的词汇print([w for w in wordlist if re.search('ed$', w)])#匹配:8个字母,第3个
2017-12-13 16:52:51
447
1
原创 python3.x如何从互联网获取想要的文章,及转化为nltk可以处理的文本
from urllib.request import urlopenfrom bs4 import BeautifulSoupfrom nltk import word_tokenizeimport nltk#2种方式解析HTML中的文本url = "http://news.bbc.co.uk/2/hi/health/2284783.stm"html = urlopen(u
2017-12-13 11:12:31
584
原创 python3.X 自然语言处理基础知识
import nltknltk.download()#下载nltk语料库如果没有安装nltk,请在cmd下用批 pip install nltk进行安装from nltk.book import *###搜索文本#搜索单词text1.concordance("monstrous")text2.concordance("affection")text3.
2017-11-22 14:14:57
1243
原创 使用原始的Titanic数据,通过特征筛选,一步步提升性能(特征如何提取)
# coding=gbk#使用Titanic数据集,通过特征筛选的方法一步步提升决策树的预测性能import pandas as pdfrom sklearn.cross_validation import train_test_split , cross_val_scorefrom sklearn.feature_extraction import DictVectorizer
2017-11-09 17:35:18
544
原创 使用CountVectorizer和TfidfVectorizer对fetch_20newsgroups数据进行分类,并对是否使用停用词进行对比(精确度)
from sklearn.datasets import fetch_20newsgroupsfrom sklearn.cross_validation import train_test_splitfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.naive_bayes import Mul
2017-11-09 10:27:07
1514
原创 K-means算法--“肘部”观察法用于粗略的估计合理的类簇个数
'''K-means聚类模型所采用的迭代算法,直观易懂,并且非常实用,但是有俩大缺陷。1,容易收敛到局部最优。2需要预先设定簇的数量(因为开始无法准确的确定簇的数量,可以采用“肘部“观察法去大致估计簇的数量)'''import numpy as npfrom sklearn.cluster import KMeansfrom scipy.spatial.distance imp
2017-11-07 11:19:11
4271
原创 K-Means算法过程及代码实现,并对结果使用ARI进行评估
'''K-means算法过程及代码实现1.首先,随机布置K个特征空间内的点作为初始的聚类中心2.然后,对于根据每个数据的特征向量,从K个聚类中心中寻找距离最近的一个,并且把该数据标记为从属这个聚类中心3.接着,在所有的数据都被标记过聚类中心之后,根据这些数据新分配的类簇,重新对K个聚类中心做计算4.如果一轮下来,所有的数据点从属的聚类中心与上一次的分配的类簇没有变化,那么可以迭代停
2017-11-03 11:24:06
3966
原创 集成模型(回归)对Boston数据进行训练并对数据做出预测
from sklearn.datasets import load_bostonfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.ensemble import RandomForestRegressor,Ex
2017-11-02 16:23:23
2125
原创 利用回归树对Boston房价进行预测,并对结果进行评估
from sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.tree import DecisionTreeRegressorfrom sklearn.metrics import mean_squared_error,
2017-11-02 10:56:40
4425
原创 K近邻回归模型对Boston房价进行预测,同时对性能进行评估(1.使用普通的算术平均法2.考虑距离差异进行加权平均)
from sklearn.datasets import load_bostonfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsRegressorfr
2017-11-02 10:24:07
1185
原创 使用三种不同的核函数(回归)对Boston房价进行预测,同时对测试数据做出预测
from sklearn.datasets import load_bostonfrom sklearn.svm import SVRfrom sklearn.cross_validation import train_test_splitfrom sklearn.metrics import r2_score,mean_squared_error,mean_absolute_erro
2017-11-01 08:48:26
3980
原创 使用线性回归模型LinearRegression和SGDRegression分别对美国波士地区房价进行预测
from sklearn.datasets import load_bostonfrom sklearn.cross_validation import train_test_splitimport numpy as npfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import
2017-10-30 17:26:18
2002
原创 利用随机森林和梯度替身决策树对titanic数据进行分类,并对结果进行分析
import pandas as pdfrom sklearn.cross_validation import train_test_splitfrom sklearn.feature_extraction import DictVectorizerfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.ensembl
2017-10-30 15:45:07
952
原创 集成分类模型简介
集成分类器主要分为俩种:1.利用相同的训练数据同时搭建多个独立的模型,然后通过投票的方式,以少数服从多数的原则作出最终的分类决策。具有代表性的模型有随机森林分类器(Random Forest Classifier),它是在相同的数据上同时搭建多棵决策树(Decision Tree),与普通的决策树不同的是,普通的决策树会根据每个维度对预测结果的影响程度进行排序(通过采用信息熵),进而决定不同特
2017-10-30 10:00:23
2077
原创 利用DecisionTree对titanic数据进行分类
import pandas as pdfrom sklearn.cross_validation import train_test_splitfrom sklearn.feature_extraction import DictVectorizerfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.metrics
2017-10-26 19:45:38
509
原创 利用KNC对iris数据进行分裂及预测
from sklearn.datasets import load_irisfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsClassifierfro
2017-10-26 14:30:33
335
原创 利用贝叶斯分类器对fetch_20newsgroups数据集进行分类
from sklearn.datasets import fetch_20newsgroupsfrom sklearn.cross_validation import train_test_splitfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.naive_bayes import Mu
2017-10-26 08:54:44
3324
原创 利用SVC(Support Vector Classifier)对digits数据进行分类
from sklearn.datasets import load_digitsfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.svm import LinearSVCfrom sklearn.metri
2017-10-25 14:29:03
1349
原创 使用LogisticRegression和SGDClassifier对良/恶性肿瘤进行分类,并计算出准确率召回率和F1的值
# -*- coding: utf-8 -*-"""Created on Tue Oct 24 10:08:40 2017@author: liuyajun"""import pandas as pdimport numpy as npfrom sklearn.cross_validation import train_test_splitfrom
2017-10-24 16:55:01
1614
原创 对良/恶性肿瘤的预测python代码实现
import pandas as pdimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.linear_model import LogisticRegressiondf_train = pd.read_csv(r'E:\BaiduNetdiskDownload\Datasets\Breast-Canc
2017-10-23 17:20:58
3574
3
原创 如何在去掉空数据及如何在matplotlib中显示数据线性拟合
自己自学机器学习用Python实现,希望志同道合的朋友加入我们一起学习一起进步。
2017-10-11 09:04:20
2048
Python自然语言处理书籍大全
2018-06-03
利用Python进行数据分析(高清书籍+代码+数据)
2018-05-15
PyDev安装视频
2017-11-08
机器学习书籍一大波
2017-11-07
PYTHON机器学习及实践_从零开始通往KAGGLE竞赛之路数据
2017-10-20
Deep Learning Book Chinese Translation
2017-10-17
机器学习-Mitchell-中文-清晰版
2017-09-21
GA工具箱,遗传算法
2017-04-20
MATLAB智能算法30个案例分析 源代码.rar
2017-04-20
Deep learning
2017-04-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人