
机器学习
宁静致远wyd
这个作者很懒,什么都没留下…
展开
-
机器学习之线性回归
机器学习之线性回归 基本形式 给定又d个属性描述的示例x=(x1;x2;x3;x4,...;xd)x=(x_1;x_2;x_3;x_4,...;x_d),其中xix_i是xx的第ii属性上的取值,线性模型(linear model)试图学的通过属性的线性组合来进行的预测函数,即: f(x)=w1x1+w2x2+...+wdxd+bf(x)=w_1x_1+w_原创 2016-05-27 21:12:02 · 440 阅读 · 0 评论 -
geopandas 的使用以及相关问题
geopandas 的使用以及相关问题Geoff BoeingMichelle Fullwood%matplotlib inlineimport pandas as pdimport geopandas as gpdfrom geopandas import GeoDataFrame, read_filefrom geopandas.tools import sjoinfrom shap原创 2016-09-27 19:16:23 · 10814 阅读 · 7 评论 -
神经网络
交叉熵代价函数(作用及公式推导): http://blog.youkuaiyun.com/u014313009/article/details/51043064 WILDML:http://www.wildml.com/2015/09/implementing-a-neural-network-from-scratch/原创 2016-09-08 11:18:02 · 338 阅读 · 0 评论 -
theano学习指南1
http://www.cnblogs.com/xueliangliu/archive/2013/04/03/2997437.html转载 2016-08-26 18:16:35 · 469 阅读 · 0 评论 -
文本分析-gensim
from sklearn.feature_extraction.text import CountVectorizer,TfidfVectorizerfrom gensim import corpora,similarities,modelsimport jiebafrom prettyprint import pp读取诛仙文本内容zhuxian=open('zhuxian.txt').re原创 2016-08-24 15:08:48 · 2265 阅读 · 1 评论 -
短文本相似度度量
短文本语义相似度度量基于深度学习的短文的语义相似度计算依存句法分析依存句法分析是一种常用的句子结构的表达方式。在依存句法中,句子的结构是以其谓语为中心,词语之间的相互依存而构成的树形结构。依存句法分析可以获得词语间的修饰关系,有助于分析句子的结构及其所报含的信息。 常用的依存句法分析模型可以分为两个大类基于图模型,比较常见的实现是哈工大的LTP以及MTPParser基于转移模型,具有线性时间复原创 2016-09-01 19:46:54 · 10443 阅读 · 1 评论 -
Python 空间数据处理
Geopy测试GeoCodeing:得出具体的地址from geopy.geocoders import Nominatimgeolocator = Nominatim()location = geolocator.geocode("中国人民大学")print(location.address)中国人民大学, 人民大学北路, 稻香园南社区, 海淀区, 北京市, 100872, 中国经纬度信息原创 2016-09-10 16:32:52 · 4289 阅读 · 0 评论 -
共轭梯度下降
共轭梯度下降:https://en.wikipedia.org/wiki/Conjugate_gradient_method原创 2016-08-27 16:26:20 · 880 阅读 · 0 评论 -
情感分析
情感分析情感分析分析文本中作者对特定主体的情感偏好和观点一件,用于决策支持和舆情分析。情感分析可以用于预测电影票房、改进服务及产品、了解用户的体验等。主题无关的情感分析目前绝大多数针对文本的情感分析都是主题无关的情感分析,即针对一段文本判断其总体的情感极性。情感的对象是真个文本,而不是文本中特定的被描述的对象或者主题。大致分为三类方法: 基于情感字典的方法:主要是将情感词表与人工制定的规则原创 2016-07-27 18:28:08 · 3498 阅读 · 0 评论 -
双色球 python
### 对双色球数据探索**数据准备:**爬取双色球的数据# -*- coding: utf-8 -*-import osimport os.pathimport sysreload(sys)sys.setdefaultencoding("utf-8") #开奖日期中的字符需要引入import urllib2from bs4 import BeautifulSoup# 创建/打原创 2016-06-18 15:44:03 · 4562 阅读 · 0 评论 -
不平衡数据下的机器学习
http://www.jianshu.com/p/3e8b9f2764c8转载 2016-06-15 09:54:14 · 346 阅读 · 0 评论 -
机器学习中的算法——决策树模型组合之随机森林与GBDT
http://www.36dsj.com/archives/21036转载 2016-06-06 22:24:27 · 396 阅读 · 0 评论 -
数据分析流程
数据探索数据质量分析缺失值异常值不一致数据重复数据及含有特有的数据符号 缺失值分析主要从造成缺失的原因和缺失数据所带来的影响 异常值分析(离群点分析)样本中的个别值,其数据明显偏离其余的观测值。 主要分析方法: 简单统计量分析,3σ\sigma原则,箱型图分析 3σ\sigma原则:如果数据符合正太分布,在3σ\sigma原则下,异常值被定义为一组原创 2016-06-06 10:51:32 · 455 阅读 · 0 评论 -
R语言实战之高级数据管理
高级数据管理#数学函数data=read.csv('sample.csv')high=data$high[c(1:20)]abs(high)sqrt(high)#不小于high的最小整数ceiling(high) #不大于high 的最小整数floor(high)#向0方向截取的high整数部分trunc(high)#将high舍入为指定的小数round(high,dig原创 2016-05-30 22:03:58 · 692 阅读 · 0 评论 -
机器学习之极大似然估计
极大似然估计基本思想极大似然估计是在总体类型已知的条件下使用的一种参数估计方法。 首先是德国数学家高斯在1821年提出的,然而这个方法常归功于英国统计学家费歇。 极大似然法的基本思想通过一个例子说明: 一个猎人和一个二逼外出打猎,一只野兔从前方窜过,一声枪响,野兔应声倒下。如果要你推测,是谁打中的?你会如何想? 选择一个参数使得实验结果有最大的概率 (1)若总体X属离散原创 2016-05-28 10:47:40 · 3620 阅读 · 1 评论 -
空间数据聚类 DBSCAN
# 地理空间数据聚类%matplotlib inlineimport numpy as np,pandas as pd,matplotlib.pyplot as pltfrom sklearn.cluster import DBSCANfrom geopy.distance import great_circlefrom shapely.geometry import MultiPo原创 2016-09-27 20:22:05 · 19913 阅读 · 14 评论