- 博客(40)
- 收藏
- 关注
原创 解决 ivreghdfe 回归报错 last estimates not found
解决 ivreghdfe 回归报错 last estimates not found
2025-03-11 00:21:58
445
原创 arcgis 无法运行python代码——需要检查 arcpy 和 arcpy.sa 模块是否正确加载并且可用
arcgis 无法运行python代码——需要检查 arcpy 和 arcpy.sa 模块是否正确加载并且可用
2025-01-06 11:13:09
493
原创 arcgis 计算某点到其他城市的距离,含要素转点(以北京市到各个地级市的距离为例)
arcgis 计算某点到其他城市的距离,含要素转点(以北京市到各个地级市的距离为例)
2024-03-15 23:58:47
1730
原创 arcgis 计算面积(计算经纬度、算数等同理)
选中,右击,选择“打开属性表格”,在打开的属性表格中单击最左边的按钮,选择“添加字段”定义新的字段为浮点型变量,定义变量名为area(这里可以根据需要调整);选中新定义的变量,右击选中“计算几何”另:字段计算器可以做一些其他的辅助计算。先定义一个新的变量,例如:area。弹出对话框,点击“确定”;arcgis 计算面积。
2024-01-27 07:47:32
3916
1
原创 多期DID ,最新双重差分命令(LPDID)
多期DID,解决不同时间接受处理的组之间的处理效应可能存在异质性的方法,lpdid在LP方法的基础上,增加了样本限制,通过设定规则删去部分样本,强制构造“干净控制组”。
2024-01-02 10:54:51
1763
原创 Arcgis根据经纬度匹配地级市,并将数据导出至excel(arcgis定义投影报错的解决办法)
Arcgis中根据经纬度进行数据匹配或汇总计算,并将匹配结果导出至excel
2023-12-27 18:00:41
1344
原创 arcgis 图例变灰无法添加图例的处理方式(同样适用于指北针、比例尺等)
当arcgis图例、指北针等变灰无法操作时,点焦点数据框选项,可进行操作
2023-04-30 19:53:27
19661
1
原创 stata 面板数据
设定面板:xtset stkcd timextreg y x1 x2 x3 i.time i.stkcd # 固定时间、企业xtreg y x1 x2 x3 i.time # 固定时间xtreg y x1 x2 x3 i.stkcd # 固定企业xtreg y x1 x2 x3 i.industry # 固定行业xtreg y x1 x2 x3 ,fe # 固定企业
2021-10-22 15:05:25
2432
原创 stata滞后、前置、异质性
滞后滞后一阶:gen lx=L.x滞后两阶:gen l2x=L2.x前置前置一阶:gen fx=F.x前置两阶:gen f2x=F2.X异质性reg y x if z==1reg y x if z==0
2021-10-13 21:33:35
14114
原创 stata排除自身计算的行业均值
by time industry : egen total_x=total(x)by time industry : egen number=count(x)gen xx=total_x-xgen mean_x=xx/(number-1)x可替换为目标变量名
2021-10-13 21:29:31
7173
4
原创 stata面板数据聚类及数据导入处理、虚拟变量等
stata导入数据import excel using “C:/Users/lenovo/Desktop/竞争0627.xls”, firstrow clearstata定义虚拟变量tab make,gen(m)
2021-08-06 14:55:11
7454
1
原创 R匹配错误原因
可能原因:1,数据格式不对,12-12-30这种无法匹配,最好分列处理一下:2.第二行的中文解释可删除3.表格中除匹配列外含有完全相同的变量名
2021-06-13 10:40:56
423
原创 excel多条件if语句
在C2输入公式:=IF(AND(A2=“A”,B2>210),“Y”,"")知识点说明:AND()函数语法是这样的,AND(条件1=标准1,条件2=标准2……),每个条件和标准都去判断是否相等,如果等于返回TRUE,否则返回FALSE。只有所有的条件和判断均返回TRUE,也就是所有条件都满足时AND()函数才会返回TRUE。https://jingyan.baidu.com/article/22a299b51c13d69e19376a3e.html在C2单元格输入公式:=IF(OR(A2=
2021-04-17 10:40:04
984
原创 amos不显示路径系数原因
amos每个潜变量对应至少三个显变量amos不显示路径系数原因至少一个显变量对应因子载荷为1设定方式:点击箭头或显变量,设定regression weight为1
2021-03-28 15:01:30
10965
原创 stata数据格式转换,缩尾
stata转换数据格式gen num3=real(num)encode num, gen(num1)destring num, gen(num2)固定效应出现错误,可能为样本过大添加代码set matsize 5000
2021-03-19 21:27:39
2371
原创 关联分析和聚类
http://c.biancheng.net/view/3703.html关联规则支持度一般要求一定支持度以上,才有分析价值,一般最小支持度不易太低,规则一:支持度大于xx一般地,只需关心那些不被其他频繁项集所包含的所谓最大频繁项集的集合。发现所有的频繁项集是形成关联规则的基础。例外情况,稀有模式挖掘eg:爱马仕和劳力士置信度规则二:置信度(一般分析强关联,保留高置信度)支持度:几个关联的数据在数据集中出现的次数占总数据集的比重置信度:一个数据出现后,另一个数据出现的概率,或者说数
2021-03-19 21:24:38
2392
原创 如何在尾注后插入附录,并将附录分页
1.将原先的尾注转化为脚注2.在文章最后插入分节符3.将需要插入的附录放在文章最后(2.3顺序可换)4,将脚注转化为尾注,设置值格式为节的末尾
2021-02-25 13:05:11
2828
原创 stata格式导出-面板数据
statastata格式变换stata格式变换help outreg找outreg2开头的网址clike here to install‘’’reg y xest store m1#保存结果outreg2 [m1] using test.doc,replaceoutreg2 [m1] using test.xls,replacepwd #查看文件储存位置处理面板数据回归,固定效应encode enddate,gen(time)xtset stkcd timextdesxts
2021-01-16 19:32:37
3217
原创 R语言没有GARCH函数的解决
library(tseries)#拟合GARCH(1,1)模型r.fit<-garch(a$residual,order=c(1,1))summary(r.fit)#绘制波动置信区间r.pred<-predict(r.fit)plot(r.pred)
2020-12-27 23:14:29
2564
原创 numpy3数组操作
数组操作更改形状numpy.ndarray.shape表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即 ndim 属性(秩)。通过修改 shape 属性来改变数组的形状。import numpy as npx = np.array([1, 2, 9, 4, 5, 6, 7, 8])print(x.shape) # (8,)x.shape = [2, 4]#将x矩阵改为两行三列print(x)# [[1 2 9 4]# [5 6 7 8]]x = np.array(
2020-10-25 20:55:34
303
原创 numpy2
索引、切片与迭代-1.numpy.ndarray.copy() 函数创建一个副本。 对副本数据进行修改,不会影响到原始数据,它们物理内存不在同一位置。import numpy as npx = np.array([1, 2, 3, 4, 5, 6, 7, 8])y = xy[0] = -1#第一项乘-1,x原本的被覆盖print(x)#[-1 2 3 4 5 6 7 8]print(y)#[-1 2 3 4 5 6 7 8]x = np.array([1,
2020-10-23 23:45:38
147
原创 2020-10-21
numpy学习1-11.1numpy.nan表示空值。【例】两个 numpy.nan 是不相等的。1. numpy.isnan(x, *args, **kwargs) Test element-wise for NaN and return result as a boolean array.【例】 1.2numpy.inf表示正无穷大。【例】1nan = NaN = NAN import numpy as np print(np.nan == np.nan) # False print
2020-10-23 23:02:42
152
原创 R可视化学习笔记1-数据导入
#import data#导入CSV数据,header=T则首行有列名,heater=FALSE 则首行无列名x<-read.table("D:/Desktop/sj.csv",sep=",",header=T)gdp<-x$gdpg1<-x$g1g2<-x$g2g3<-x$g3#若无行名,进行行名定义data <-read.csv('datafile.csv',header=FALSE)names(data)<-c('Column1','co
2020-09-17 17:26:20
406
原创 ggplot2箱线图+小提琴图
箱线图1槽口1.在geom_boxplot()括号中加入notch=TRUE即可在箱子上生成槽口,即geom_boxplot(notch=TRUE,notchwidth=0.8)#notchwidth越小则越往里凹2.均值标记箱线中的均值标记常以钻石来表示,所以命令为stat_summary(fun.y=“mean”,geom=“point”,shape=23,size=3,fill=“white”)3.加入最大最小值线想要使ggplot2所绘制的箱线图带有最大最小值线,可用stat_b
2020-09-17 14:38:06
4634
原创 ggplot2折线图(时间坐标.坐标轴设置)
1.导入时间数据2.坐标轴间隔#导入数据x<-read.table("D:/Desktop/ten1.csv",sep=",",header=T)CountryName <- factor(x$CountryName)StringencyIndex<-x$StringencyIndexConfirmedCase<-x$ConfirmedCasedate<-as.Date(x$Date)#作为时间序列引入cdata<-data.frame(CountryNa
2020-08-05 17:35:00
4003
原创 从零开始NLP--task6
学习目标• 了解Transformer的原理和基于预训练语言模型(Bert)的词表示• 学会Bert的使用,具体包括pretrain和finetune1.Transformer1.1Transformer的编码部分和解码部分分别是一组编码器或者解码器的堆叠。https://jalammar.github.io/illustrated-transformer/11.2Self-Attention中使用多头机制,使得不同的attention heads所关注的的部分不同1.3编码器结构中每个子层
2020-08-04 23:28:45
250
原创 从零开始nlp-task5
一.通过word2vec学习词向量word2vec是对出现在上下文环境的词进行预测,选取一个上下文窗口和一个中心词,基于中心词预测窗口中其他词出现频率, 因此可以从新增语料中,学到新增词的向量表达。Skip-grams (SG):给定input word预测上下文Continuous Bag of Words (CBOW)̀:给定上下文预测目标单词Hierarchical softmax和 Negative sampling是两种更高效的训练方法。二.文本特征提取1.TEXTCNN 是利用
2020-07-31 19:55:31
139
原创 从零开始nlp-task4及fasttext安装
fasttext安装分类模型用验证集调参1.pip install fasttext失败重启后conda install fasttext失败https://www.lfd.uci.edu/~gohlke/pythonlibs/#fasttext找到自己python对应的版本,我的是python3.7,所以下载的是fasttext-0.9.2-cp37-cp37m-win_amd64.whl2.分类模型import pandas as pdfrom sklearn.metrics im
2020-07-27 23:04:40
165
原创 nlp-task3
首先安装sklearncmd: pip install -U scikit-learn一、文本表示方法1.One-hot我:[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]爱:[0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0]…海:[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1]2.Bag of Words(Count Vectors)句⼦1:我 爱 北 京 天 安 ⻔转换为 [1, 1, 1, 1, 1, 1, 1, 0, 0,
2020-07-23 23:20:38
182
原创 从零开始NLP-task2
%pylab inline是matplotlib的代码,但只有jupyter notbook,要用到plt未定义,用import matplotlib.pyplot as plt#定义pltimport pandas as pdtrain_df = pd.read_csv('F:/NLP/train_set.csv', sep='\t', nrows=100)train_df.head()#句子长度分析train_df['text_len'] = train_df['text'].app
2020-07-22 23:12:17
254
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人