
科研狗
科研小助手
Data_Designer
热衷于数据分析,大数据处理,机器学习等领域,天津大学,硕士学位,希望在编码和科研的过程中积累自己一点微不足道的经验,以后希望从事的工作方向为推荐系统和数据分析等领域,目前在网易伏羲Lab算法工程师实习。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Attention
老是看到下面的公式,以前没想过咋实现,现在原创 2021-06-17 13:19:05 · 219 阅读 · 0 评论 -
强化学习-从MDP说到PPO
原创 2021-05-19 18:56:55 · 326 阅读 · 0 评论 -
好的paper阅读网站
https://paperswithcode.com/sotahttps://www.zhuanzhi.ai/https://paperswithcode.com/https://www.mendeley.com/?interaction_required=truehttps://www.aminer.cn/topic?channel=5ee095aa9fced0a24b3c4046&page=1原创 2021-05-08 21:48:56 · 346 阅读 · 0 评论 -
注意力机制小结
详情:写的比较好Global AttentionGeneral效果一般较好Local Attention两种:第一种直接选择源序列中的第t个为中心p,然后取两侧window-size大小的词作为context;第二种,先根据目标序列决定位置p,然后再按高斯分布对window内单词进行加权。Hierarchy Attention:感觉没啥创新,就是层级概念的提出Multi-Dimensional Attention:不再产生一个scaler,而是..原创 2021-05-07 17:44:10 · 219 阅读 · 0 评论 -
工作中常用的数学-自查
极大似然:一文搞懂极大似然;大数定理;中心极限定理:中心极限定理;人话;人话2贝叶斯概率:猴子数学期望:就这一个高斯过程:人话;推导各种分布:解释原创 2021-04-27 18:51:24 · 219 阅读 · 0 评论 -
UTD24-拿走不谢
The Accounting ReviewJournal of Accounting and EconomicsJournal of Accounting ResearchJournal of FinanceJournal of Financial EconomicsThe Review of Financial StudiesInformation Systems ResearchJournal on ComputingMIS QuarterlyJournal of Consumer R原创 2021-04-02 11:01:26 · 2248 阅读 · 0 评论 -
RNN的迷迷糊糊
最近不在状态感觉,很多原本清晰的概念突然模糊,但是坐一会突然又懂了,算了,防止以后再迷糊,记录一下。RNN单步预测:没啥好说的,用最后一个Hidden进行预测。RNN多步预测:一次全部输出或者Seq_to_Seq架构,可以使用滑动窗口进行预测(其实这玩意也是单步预测)。几个图很清楚,LSTM多步。Transformer时序预测大多都是使用Encoder架构而不涉及Decoder架构,很多时候是在Encoder的Self-attention上嵌套一个RNN用于整合历史记忆,然后进行预测,这里和Teac原创 2021-03-30 15:48:54 · 208 阅读 · 1 评论 -
Transformer及其变种
TransformerRNN无法并行计算-》Self Attention,每一个输出都保证看过所有的输入。Attention: 吃两个向量,吐出这两个向量匹配的分数attention(q&k)=a。为什么容易实现并行化(parallel)Mutihead Attention:每个head都关注不同的地方但是,截至到目前为止,并没有考虑到输入序列顺序(位置参数)的问题!!!为什么位置编码是直接加上而不是concatenate的呢??见下图!这个Wp是谷歌自己用式子算出来的,原创 2020-10-09 14:24:33 · 1055 阅读 · 0 评论 -
深度学习-理论学习关键示意图
最近敲代码总感觉有点迷,很多东西直接使用Tensorflow或者Pytorch封装好的模块总感觉不得劲儿,算了还是恶补一下李老师的课吧,把该弄懂的东西都搞清楚。正则化:为了减小噪声数据带来的预测偏差,λ越大,曲线越趋向于平滑(水平)。Bias and Variance:没瞄准和打不准偏差过大:redesign model方差大:collect data(数据变换)、regularizationCross validation:保证public testing set 与 private Te原创 2020-10-03 14:24:38 · 1258 阅读 · 0 评论 -
Gurobi基础教程(Python版)-系列教程2
参数和属性Parameter:控制优化器的行为,需要在优化启动前进行设置常见参数:# 参数的设置方法model.setParam('TimeLimit',600)model.Params.TimeLimit = 600model.setParam(GRB.Param.TimeLimit,600)# Use parameters that are associated with a model.## A MIP is solved for a few seconds with diff原创 2020-09-26 11:13:48 · 3034 阅读 · 0 评论 -
Gurobi系列教程(Python版)-基础操作教程1
Gurobi建模参数介绍Parameter(参数)控制优化器的行为,需要在优化启动前设置Attributes(属性)控制模型(包括模型、变量、约束、目标等对象)的特性Environment 包含模型和全局参数的一个容器,也是许可控制的节点tuplelistfrom gurobipy import *cities = [('A','B'),('A','C'),('B','C'),('B','D')]Routes = tuplelist(cities)# tuplelist增加了快速sele原创 2020-09-25 10:57:56 · 3444 阅读 · 0 评论 -
从头学计量-中介效应理论介绍
中介效应理论Process插件没有检验总效应的Bootstrap,可以在用回归中的自助抽样进行检验。解释流程多重中介效应链式中介原创 2020-06-25 09:14:20 · 2243 阅读 · 0 评论 -
从头学计量-SPSS实操回归分析
目录一元回归分析回归前可以先进行数据预处理多元回归二次项回归分类变量回归(自变量为分类变量)一元回归分析回归前可以先进行数据预处理数据的标准化不会影响实验的显著性数据中心化 = 原始数据-均值多元回归共线性诊断:多元回归分析中的VIF<3或者5新增变量对解释因变量的贡献程度看R方的变化,建议使用分层回归:在回归模型选择变量的时候点击下一个即可。二次项回归分类变量回归(自变量为分类变量)...原创 2020-06-24 12:14:53 · 2070 阅读 · 0 评论 -
从头学计量-T检验和方差检验
T检验t检验的价值:需要有固定又客观的标准用以判断两个群体的数值是否有差异,而不是主观題断。独立样本t检验的前提条件sig = 0.000拒绝原假设,所以有差别,又小于0.001,所以显著方差分析:可以同时比较多个组协变量也可以称作控制变量,要去除其对因变量的影响。(控制变量>协变量)。因素=自变量(IV),元=因变量(DV),控制变量也是自变量。效果量的计算两因素方差分析交互作用...原创 2020-06-24 09:19:28 · 2567 阅读 · 0 评论 -
从头学计量-SPSS攻克常见信度检验1
目录频次分析数据标准化皮尔森相关系数内部一致性信度Cronbach α检验组合信度,CR共同方法偏差CMB频次分析注意结果的导出:excel中排版,再复制到word中数据标准化皮尔森相关系数相关系数的结果解释内部一致性信度Cronbach α检验公式报告修正α即项间相关性的0.3的题目需要删除,项总相关性小于0.5的需要删掉,但是一次只删一个题目...原创 2020-06-23 17:19:12 · 4462 阅读 · 0 评论 -
从头学计量-SPSS基础操作
目录一、数据转换二、选择数据三、数据排序(右键)四、查找缺失值五、数据计算六、个案选择七、数据合并一、数据转换二、选择数据shift+ 鼠标多选三、数据排序(右键)四、查找缺失值缺失值填补:删除、赋值、不改变,算法校正、插补五、数据计算六、个案选择条件约束选择选择样本比例七、数据合并横向合并(一个人填了多份问卷)纵向合并(多个人填了同一份问卷)注意:配对功能是用来标识相...原创 2020-06-23 15:24:29 · 1148 阅读 · 0 评论 -
从头学计量-了解统计学常见概念
个案: 每一个个体|记录变量: 属性误差:随机误差(找不到原因) 系统误差(有规律)信度: 同样方法重复测量同一对象结果一致性效度: 与真实结果的相似性。不同点研究对象不同信度:答卷者 效度:组卷人研究角度不同信度:测量的质量效度:问卷的质量数值大小不同问卷效度<问卷信度效度的最大值≤信度的平方根效度高,信度一定高;信度高,效度不一定高正态分布M± 1SD: 68%M± 1.96SD: 95%M± 2.58SD: 99%偏度: 数据的倾斜原创 2020-06-23 13:01:04 · 1773 阅读 · 0 评论 -
手把手-AMOS全流程实操教程
一、界面解释常见工具解释二、导入数据选择你需要的文件名,最好是excel或者spss数据集的格式三、关联数据和节点点击完成出现数据框后,将对应名称拉至观测变量上。四、为潜变量、残差变量命名注意:新版命名中不能有空格,否则会报错!!!潜变量命名较为简单,双击节点即可残差项命名,新版旧版不一样,旧版在Tools选项卡里五、建模分析分析属性设置模型结果查看(View Text工具,见第一步)...原创 2020-06-23 10:24:44 · 46143 阅读 · 5 评论 -
刷刷刷!-数据分析必刷文档整理
有用的官方中文文档(持续更新)Python中文教程:Python中文教程numpy中文文档:Numpy中文文档matplotlib中文文档:matplotlib中文文档pandas中文文档:pandas中文文档sklearn中文文档:sklearn中文文档强化学习:强化学习中文文档Tensorflow学习指南:sklearn与Tensorflow学习指南;Tensorflow中文版教程Latex入门文档:一份其实很短的 LaTeX 入门文档;从零开始 LaTeX 快速入门..原创 2020-06-14 09:49:43 · 725 阅读 · 0 评论 -
NoteExpress中PDF批量自定义重命名
有了Endnotes还需要NoteExoress吗?以前的我也觉得不需要,后来当我忘记每下一篇文献就从CNKI导出对应的Endnotes格式的时候,我知道,不得不下了。因为Endnotes不会对中文文献的PDF进行自动更新补全。下面介绍NoteExpress的几个骚操作。一、导入PDF文件,并在线更新信息二、NoteExpress只能修改PDF附件名为标题等单个指标,而不能自定义输...原创 2020-05-08 12:20:35 · 4319 阅读 · 0 评论 -
Python-批量修改文件名-文献重命名
In [47]: import reIn [48]: import sysIn [49]: import osIn [50]: cur = os.getcwd()In [51]: curOut[51]: 'F:\\天津大学实验室工作\\生物安全\\pdf'In [52]: os.chdir("F:\\天津大学实验室工作\\生物安全\\pdf") #这里之前转 .....原创 2020-05-06 23:27:12 · 2514 阅读 · 0 评论 -
综述的参考文献导入Endnote
看到了一篇极好的综述性文章,如何将其参考文献导入Endnote进行管理呢,由于英文综述文章更好操作(省略cnki这个工具),我们以中文综述为例,你需要三个工具,WOS,Google Scholar,Endnote。步骤如下:一、首先在WOS中搜寻对应文献二、拉至下方参考文献处三、批量导入(会有部分缺失)这个时候你会发现导出的数量和参考文献数量不一致,原因如下(部分引文和...原创 2020-05-06 20:47:48 · 4139 阅读 · 0 评论 -
眼动追踪-NeuroIS-基础知识总结
原创 2020-05-05 14:08:24 · 2285 阅读 · 0 评论 -
美团机器学习实践-思维导图总结
后面深度学习和并行计算部分就没总结了,个人技术深度还不够,留到以后吧原创 2020-04-14 14:13:02 · 2275 阅读 · 0 评论 -
从小白到大神-一文教你如何使用Git和Github
目录前言Git教程Git安装(Windows环境)理论基础实战教程初始化Git查看当前状态回到过去版本对比修改最后一次提交、删除文件和重命名文件创建和切换分支合并和删除分支Github教程创建仓库分支分支的含义创建一个分支提交修改发起Pull request操作前言作为一个程序员!怎么能Github也不认识呢!没错...原创 2020-04-03 15:48:36 · 1875 阅读 · 0 评论 -
Linux安装Spark-详细步骤及常见报错
目录一、前期环境配置Hadoop单机环境搭建Java环境搭建二、Spark安装及相关配置三、Hadoop及Spark安装报错一、前期环境配置Hadoop单机环境搭建创建新用户hadoopsudo useradd -m hadoop -s /bin/bashsudo passwd hadoop #设置密码sudo adduser hadoop sudo #增...原创 2020-03-24 12:19:01 · 5299 阅读 · 1 评论 -
Latex踩坑笔记
第一次以独立身份“中稿”,啥事都得自己来,但是编辑部要求用CCT软件排版我就很纳闷,后来发现模板语法有点像Latex。坑一、Texstudio乱码解决办法:编辑-设置-调整编码为GB2312坑二、Texstudio+texlive报错这里报的错就特多了,尤其是一个cctart的错误File `cctart.cls' not found.百度了一圈说texlive没...原创 2020-03-13 08:56:52 · 11182 阅读 · 5 评论 -
Ubuntu 18.0虚拟机安装-VirtualBox和VMware哪家强
一、吐槽不要用VirtualBox,不要用VirtualBox,谁用谁傻子!!!!用VirtualBox安装了一下午,都是这个界面试了网上所有的办法,毫无卵用。听懂了吗,毫无乱用,别去试了。下面VM-Ware傻瓜式安装结果,只用一次就成功了!!!二、VMware安装步骤及相关修改下面是下载安装VMware步骤-Workstation Pro(这个网站好像需要先注册)...原创 2020-03-09 18:32:25 · 5831 阅读 · 0 评论 -
保研夏令营-南大、哈工、天大、中山、北理
应学校老师之邀,还是写一下自己的保研经历保研好比打怪,打怪你得有装备,赤膊上阵肯定是不行的。这些装备不需要氪金但是需要刷时间,无论是一张“充实”的简历,一份流利的自我中英文自我介绍还是联系导师的“套磁”邮件,都需要你用心的,慢慢的去做。我的打怪经历相比一些广撒网的同学来说并不是很丰富。保研之初我便明确了自己保研的方向和地域,东部沿海或发达城市的管理科学与工程(信息系统方向)或者大数据方向的...原创 2020-03-06 12:11:47 · 4060 阅读 · 0 评论 -
Windows环境配置Charles抓包
一、确认本机IP,cmd窗口输入ipconfig二、Charles下载三、安装windows证书四、iPhone手机与电脑置于相同网络下,选择配置代理,输入本机IP和端口号8888五、Charles弹窗选择Allow六、IPhone安装Charles证书(Safari浏览器打开chls.pro/ssl),安装证书七、点击描述文件安装-然后进入证书进行信任...原创 2020-03-06 10:35:34 · 4053 阅读 · 0 评论 -
信度检验-Krippendorff's alpha检验
1.整理数据至Excel表2.SPSS读取数据3.修改对应数据格式4.下载macro文件5.运行相关语法.sps文件6.安装spd文件对话框7.新建语法窗口,输入相关指令kalpha judges = obs1 obs2 obs3/level =2/detail = 1/boot = 10000.并运行8.输出结果9.相关含义解释...原创 2020-02-24 11:34:33 · 19084 阅读 · 8 评论 -
删除Excel单元格中空行
使用clean函数,将结果以值的形式粘贴回源数据原创 2020-02-19 10:06:29 · 1946 阅读 · 0 评论 -
调用百度API-获取地图Json数据
先按下列网址注册百度开发者-自备身份证-控制台原创 2020-02-06 16:39:53 · 2897 阅读 · 0 评论 -
期刊调研-作者的简介,期刊编委
1.Google scholar直接搜索题目,点击作者2.查找期刊信息及编委原创 2019-11-16 10:07:23 · 1439 阅读 · 0 评论 -
Tableau自用笔记
维度:字符串度量:数值,二者可以在表中拖拽直方图,查看数据分布情况条形图,查看数据大小排序度量值-标签,可以在图上进行标注在标记一栏可以设置显示标注格式筛选器可以用于筛选,直接拖拽环形图,使用最小记录数基本表,凸显表要使用颜色高级选项树形图,三者关系气泡图,三者关系,动态气泡图要把时间放入页面框中,是否选择轨迹词云图,将气泡图形状改成文本标靶图,选择...原创 2019-11-07 09:25:17 · 1334 阅读 · 0 评论 -
CiteSpace作者合作网络分析-web of science文献
一 、安装环境Citespace下载网址:citespace官方下载网址,需要提前安装jdk环境(官网也提供)二、web of science 导出数据三、citespace操作将output文件夹中文件复制到data文件夹中,并在主界面指定相对应文件夹直到屏幕变白为止。...原创 2019-10-26 10:55:09 · 27095 阅读 · 6 评论 -
常用论文写作句式
The expression of ... can be expanded as: ......的表达式可扩展为...A is exponentially smaller than B,so it can be neglected.A对B来说呈指数级减小,所以可以忽略不计。Equation (1) is reduced to:方程(1)化简为:Substitute the ...原创 2019-09-09 07:20:24 · 2232 阅读 · 0 评论 -
Chrome技巧-如何精准搜索
菜鸟搜索1.只用搜索框进行搜索2.在某站点内进行注册搜索初步搜索:1.使用搜索工具或者分类栏对其进行初步限定2.使用谷歌Settings的Advanced Search或者百度的高级搜索(搜索可得)高级搜索:+ 强制搜索由于Google会忽略和过滤一些常用词(称为stop words / common words),如and、how等。使用+可以让搜索引...原创 2019-09-15 17:57:54 · 2856 阅读 · 0 评论 -
学生报告-大学生活经验
大家好,我是16级一个步入大四的老学长。下面我将以学长的身份给大家分享一下我大学的一些经验和体会。作为一名大学生,首要的任务还是学习。大学的学习生活和高中是很不一样的,它的考试分数是由平时分加考试成绩构成的,平时分的重要性甚至能够决定你是否及格。所以你得和老师有一个良好的师生关系。学长平时不喜欢坐第一排,也不会向老师主动提问题,这些都是很不好的学习习惯,所以平时成绩并不是很出色,大家可千万不要...原创 2019-09-05 14:02:59 · 1251 阅读 · 0 评论 -
学习回顾与展望
时光匆匆,大学已经过去一半了。大二下的新征程之路也即将开始。在过去的三个学期里,自己虽然说没有尽自己最大的努力,但也做到了一步一个脚印。自己在书本的学习中有一些死板,仅跟着老师的步伐走,没有想到在书本的基础上拓展延伸,实战经验还是不足,同专业的几个同学对编程的兴趣和热爱都值得我去学习。作为计算机专业的一份子,确实应该自主去学一些新的语言和技术,能够用手头的技术去解决实际问题,而不是和试卷上的一道道...原创 2018-02-25 11:25:06 · 3108 阅读 · 2 评论