- 博客(19)
- 资源 (2)
- 收藏
- 关注
原创 基于财经新闻的LDA主题模型实现:Python
LDA主题模型虽然有时候结果难以解释,但由于其无监督属性还是广泛被用来初步窥看大规模语料(如财经新闻)的主题分布。这篇博客侧重提供一个LDA主题模型python代码的技术实现,不侧重如何分析财经新闻(后面再更)。# -*- coding: utf-8 -*-#import pacakgeimport pandas as pdimport reimport jiebafrom ppr...
2020-01-21 23:01:59
1491
原创 使用Genism进行词向量训练:实践版
使用Genism进行词向量训练:实践版1.语料库准备输入为一行行正常的语句2.Code#!/usr/bin/python# -*- coding: utf-8 -*-import gensim.modelsimport timeimport pandas as pdfrom nltk.tokenize import TweetTokenizertime1 =...
2016-05-13 11:52:45
5309
原创 【python】获取三维图形的某个截面
在数据可视化实践过程中经常需要对三维甚至更高纬度数据进行可视化。由于视线阻挡,人们在看三维物体时并不能观测清楚完全。有时候需要获取三维图形的某个截面来单独分析数据。# -*- coding: utf-8 -*-import numpy as npfrom mpl_toolkits.mplot3d import Axes3Dimport matplotlib...
2016-01-19 20:06:24
9445
4
原创 【python】Logistics模型预测银行贷款违约
Logistics模型预测贷款违约 logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。 Logistics回归模型中因变量只有1-0,两种取值。模型理论重要参考一、模型输入:二、特征选择:特征选择是模型成功的基础性重要工作。一般特征筛选方法有(1)看模型系数...
2016-01-03 15:18:34
11407
3
原创 【python】SIR模型实现
SIR模型python实现SIR模型是传染病模型中最经典的模型,其中S表示易感者,I表示感染者,R表示恢复者。SIR模型中,染病人群为传染的源头,他通过一定的几率把传染病传给易感人群,他自己也有一定的几率/可以被治愈并免疫,或者死亡;易感人群一旦被感染,就又成为了新的传染源。将人群划分为三类,易感染者、已感染者和已恢复者(recovered )。可建立下面的三房室模型:
2016-01-03 11:15:10
37971
17
原创 多重折线图自定义X轴间隔与自定义title名称—R语言
InputDataRcodelibrary(ggplot2)data<-read.csv("D:\\rwork\MSN\\indexbyminutes.csv",header = T)dt<-data.frame(data)head(dt)#mode(dt$ID)#class(dt$ID)#dt$ID2<-dt$as.vector(dt$ID)#class(dt$ID
2015-11-12 23:49:20
6757
原创 3D动态词云—JavaScript
词云效果(动态旋转)数据为JSON格式:{"科技馆":29.153, "统一":29.546}~~代码:<!DOCTYPE html><html><head lang="en"> <meta charset="utf-8"> <title>Winds Tag Ball Demo&l...
2015-09-02 13:48:51
22498
6
原创 基于GARCH模型的股市研究与危机预警——R语言实现
摘要 为防范股票市场上的不确定性和风险,有效地度量股票指数收益率的波动性显得尤为重要。本文运用GARCH族模型拟合了股票指数收益率的波动性方程并实证研究了全球有代表性的上证综指、NASDAQ指数、德国DAX、日本日经指数。结果表明四个国家股票收益率均有聚集性、持续性,股票市场存在着冲击的非对称性。具体而言,美国、德国、日本股票市场对利空消息敏感,而对利好消息保持谨慎。而中国对...
2015-09-02 13:16:25
40521
6
原创 绘制网络分面图—matplotlib,networkx
使用python的matplotlib与networkx绘制网络分面图数据格式:左边两列是网络的ID与name 再右边变是网络的连边了。比如第一行网络的边为(1,2)(3,4)(2,3)(4,5)代码:# coding: utf-8import networkx as nximport matplotlib.pyplot as pltimport cs
2015-06-05 20:05:34
3395
原创 从状态转换概率与股指涨落的散点图看股指涨落规律
原始数据1.股票指数在代码中会对收盘价做对数处理:yi=log2(X_{i+1}/X_i)2.股票状态切换概率(股票状态参考:从时间序列到复杂网络,概率为一阶马尔科夫计算的状态转移矩阵概率)计算代码:# coding: utf-8import matplotlib.pyplot as pltimport pandas as pdimport mathfr
2015-06-05 10:33:27
860
原创 从时间序列到复杂网络:可见图算法
这篇文章实现的算法来源于PNAS杂志:点击打开链接# coding: utf-8from itertools import combinationsimport networkx as nxdef visibility_graph(series): g = nx.Graph() # convert list of magnitudes into list of t
2015-06-01 20:43:29
7946
4
原创 python主成分分析实战案例
PCA主成分分析主要用于数据降维。由一系列特征组成的多维向量,其中某些元素本身没有区分性,或者彼此区分不大。此时,如果用它做特征区分,相似元素贡献会比较少。我们目的是找到那些变化大的元素,即方差较大的维,去除那些变化不大的维度。具体理论参考:http://www.ams.org/samplings/feature-column/fcarc-svd案例示例:#-*- coding
2015-04-29 14:49:18
7770
原创 R语言 向分面数据添加公式与拟合曲线
数据源代码:library(ggplot2)data<-read.csv("D:\\rwork\\tiaocan_xiugai.csv",header = T) #header = Falese的意思dt<-as.data.frame(data)dt2<-dt#函数lm_labels<-function(dat){ count1<-dat$count1 de
2015-04-29 13:14:18
14113
1
原创 R语言 分类数据折线图绘制
代码主要实现当x轴数据为分类数据时,如何指定数据按指定数据排序,以折线图方式展现数据数据library(ggplot2)data<-read.csv("D:\\rwork\\tiaocan_xielvbianhua.csv",header = T) #header = Falese的意思data#绘制斜率变化dt<-datap<-ggplot(dt,aes(x=reor
2015-04-29 13:03:18
16336
原创 R语言 绘制三维散点图的预测曲面
library(rgl)#预测脚本predictgrid<-function(model,xvar,yvar,zvar,res=16,type=NULL){ xrange<-range(model$model[[xvar]]) yrange<-range(model$model[[yvar]]) newdata<-expand.grid(x=seq(xra...
2015-04-29 12:52:31
17352
2
原创 python 同时载入多个数据文件
首先将要载入的文件全放入一个文件夹,比如:D:\Traverse_document然后写入代码:# coding: utf-8import osimport json#给定文件夹路径,获取文件夹下所有文件的文件名称def VisitDir(path): document_file=[] for root,dirs,files in os.walk(path)
2015-04-28 21:31:03
3097
1
原创 使用python scrapy爬虫框架 爬取科学网自然科学基金数据
使用python scrapy爬虫框架 爬取科学网自然科学基金数据fundspider.py文件# -*- coding: utf-8 -*-from scrapy.selector import Selectorfrom fundsort.items import FundItemfrom scrapy.contrib.spiders import CrawlSpider
2015-04-27 16:07:39
5735
1
原创 D3.js制作地图等值线与饼图
使用D3.js在等值线地图上添加饼图。比如:各省颜色深浅可以表示公司在该省投资额,饼图大小代表该省的收入额,饼图各个扇形表示各个收入来源比例。代码效果图:源代码: stage1——changer china university map- var w = 1000; var h = 1000; var svg
2015-04-27 15:20:55
7403
原创 基于sankey图制作的社区变动图
基于sankey图制作了一个社区成员变迁图,矩形与link上的文字均可以经过拖动改变位置。代码运行结果:javascript源码:Sankey Prototype text{ display:block; } .link { fill: none; stroke: #18c0ff;
2015-04-27 14:58:30
2376
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人