自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 资源 (4)
  • 收藏
  • 关注

原创 # 杂谈偶感 × 基于QFD方法的质量屋构建

今天开始看师姐的论文,涉及一个QFD相关的知识点。当我们需要购买一台电脑时,我们可能需要思考和电脑相关的一些属性那么现在我们站在企业的角度,上述消费者提出的需求,也正好是企业需要满足消费者的点(这也是为什么说QFD是以顾客为导向的)那基本上就了解了一下什么是QFD,接着就回到师姐的论文,看看进阶版是怎么样的~

2022-09-16 16:16:32 2041

原创 # 杂谈偶感 × 如何引用参考文献

引用参考文献按理说应该早就是家常便饭了,但是自己好像一直还是手动调整的(实在是太菜了555)稍微了解(听说)一点点就是 endnote,但是自己也从来没有试过。今天问了师姐了解到还有一款软件叫Zotero,浅尝了一下发现确实上手简单而且好用,现将基础操作总结如下方便日后查阅。很不错滴~解决了困扰我许久的一个问题,一级棒!

2022-09-12 16:45:44 385 2

原创 # 研究杂感 × 多元线性回归

最近看Xu 工作室的论文,涉及到一个多元线性回归的的内容,正好 “回归” 这一块一直都是不太懂的(当然自身对于这个名词也比较抵触),那就趁着这个机会好好学习一下下吧!以上就是多元线性回归的内容,接下来还是继续啃文献⑧~

2022-09-09 15:44:28 3421

原创 # 杂谈偶感 × Pycharm环境配置问题

又要开始每天学习一点点了,唉加油吧加油!httpshttpshttps。

2022-07-25 21:40:59 508

原创 # 研究杂感 × DEA-Malmquist

之前也用过DEA-Malmquist来写过小论文(当然小论文的发刊也遥遥无期,下一篇小论文又怼过来了),之前学习的知识也基本忘得差不多了,现在重新学学看看,还是把知识点整理一下,方便日后查阅。在DEA的处理中,产出一定要放在投入的前面,第二是所有的时期数需要排列在一起但是,DEAP软件是无法处理excel文件,需要将其转换成txt文件才行(粘贴的过程中只粘贴其中的数据部分)值得一提的是,DEAP软件无需下载,直接就是这样就可以用了接着需要对eg1-ins文件进行修改打开DEAP软件,将内容e

2022-07-04 15:37:13 3013 2

原创 # 研究杂感 × PCA分析

写在前面主成分分析(Principal Component Analysis,PCA)已经多次听到过了,最近在看论文时也用了一些奇奇怪怪的降维方法,一下子搜还不容易搜到相关的介绍,那就将其替换为PCA试试看吧(反正应该也差不多 )PS:个人认为(如果不是请大佬们打醒我)PCA、LDA、LSA、CFS、Word2vec等都可以用来进行降维后的特征选择,在未来研究中其实可以尝试那还是先把喜闻乐见的PCA学习一下吧~感觉以后也能用得上正餐开始1. PCA的实现过程PCA是一种数据降维技术,它主要应

2022-05-05 18:56:27 852

原创 # 研究杂感 × 一点 Excel 小感悟

写在前面今天在尝试一个课题内容时,出现了个问题,感觉还是很常见的叭,在这里浅浅地记录一下(绝对没有什么拿五一专属纪念章这种想法哦 )以后应该也会用得到(毕竟Python也没见得玩得多6 )正餐开始先浅浅地说一下使用情况(遇到的状况)我搜集了2017—2021年度的各城市CO2排放数据,但是在输入到自己构建的表时便出现了一个问题:自己的地区排布顺序和已获取的CO2数据源的地区排布顺序是不一致的,如果一个一个地进行输入,仅长三角地区就将有2652=260次 tab 切换,更别说还有其他城市群了,一

2022-05-03 20:45:25 680

原创 # Voronoi × Tableau

写在前面贴一个自己很喜欢用的图,之前在笔记本里有过记录,现在在优快云里记录一下方便自己以后查阅,在毕设里浅尝一下叭~正餐开始数据准备首先是数据集,整理成Excel格式:接着将Excel另存为.csv格式,需要注意的是,如果数据中有中文,则需要另存为CSV UTF-8,避免出现乱码:Voronoi Diagram(维诺图)制作网站其次,打开网址,进入国外大神创建的工具页面,上传CSV数据文件调整好后点选下载即可,在这里由于我需要进行对比分析,选用的是三角形上述下载的图形无后缀,需

2022-04-10 13:03:56 502

原创 # SOM-算法原理

写在前面近期看到一篇论文,其中有一个无监督聚类方法叫做SOM(self-organizing maps,自组织映射)

2022-04-01 13:05:23 2955 1

原创 # 研究杂感 × Gephi探秘飞升(第三辑)

写在前面现在是2022年03月26日,周六晚20:35前段时间准备将ROST CM6 绘制的图像转用 Gephi 软件来进行替代也学习了一些前人的经验,但据我个人总结,Gephi具有以下2个硬伤:1、绘制的线条过多过乱2、无法直接选择节点大小当然在之前也给出了一些解决方法,如通过筛选控制线条数目,采用导入文件的形式控制节点 Size 等,但我个人觉得依然不是一个很好的方法。于是我就尝试了一下 Gephi 第一辑中我脑海中一闪而过的念头,事实证明,这确实或者说应该是对于大量无规则语义内容最为

2022-03-26 21:55:56 1579

原创 # 研究杂感 × Gephi(第一辑)

写在前面之前用过ROST CM6 来进行毕设中有关景区整体的感知,但是ROST CM6似乎已经是2010年的产品了,用在2022年毕设有点稍旧(当然Gephi似乎是2009年的产品 )不管怎么说,Gephi不管是从名字上还是内容上似乎好像也许可能比 ROST CM6 高端辣么一点点,现在学习一下绘制过程和方法,将毕设部分进行调整和改进。正餐开始其实利用Gephi来进行相关分析和LDA差不多LDA所做的内容主题是割裂的,无法得知各主题间的相关关系,丢失了词语和句子之间的联系,常常导致我们无法给主题进行

2022-03-26 20:45:54 2247

原创 # 研究杂感 × 改进文本共现分析 PMI-Gephi(第二辑)

写在前面理论介绍其中,分子是两个词语共同出现的概率,分母是两个词语分别出现的概率的乘积在数学中,我们认为,理论上分子等于分母:分子中的P(W1,W2) ,它指的是这两个词语在语料中的实际贡献概率分母中的P(W1) 和 P(W2) ,它指的是两个词语实际出现的概率从理论上推导这两个词语共同出现的概率,也就是说分母相当于一个期望值,分子是一个实际出现的概率,如果说实际贡献的概率比上期出现的...

2022-03-26 20:17:52 918 1

原创 佛系计算机二级 & 第十二弹

写在前面11弹有点难,先跳一跳,又好久没有学这个了呜呜呜Python Round-12左对齐控制输出num = input().split(",")for i in num: print("{:<10}".format(i),end="")Pow函数scale = 0.0001 # 成就值增量def calv(base, day): val = base * pow(1+scale,day*11) return valprint('5年后的成就值是{}

2022-03-24 10:53:03 549

原创 # 啃书计划《利用 Python 进行数据分析》

第4章NumPy基础:数组与向量化计算Numpy,是Numerical Python 的简称,它是目前Python数值计算中最为重要的基础包。虽然 numpy 提供了数值数据操作的计算基础,但大多数读者还是想把 pandas 作为统计分析的基石,尤其是针对表格数据。pandas提供了更多的针对特定场景的函数功能,例如时间序列操作等numpy等并不包含的功能。numpy之所以如此重要,其中一个原因就是它的设计对于含有大量数组的数据非常有效。Numpy ndarray:多维数组对象Numpy的核心

2022-03-20 19:49:25 145

原创 # 啃书计划《利用 Python 进行数据分析》

写在前面之前明明说要好好学习吴恩达的机器学习的,最后还是因为某些原因准备搁置一段时间(果然又是摆烂了呢 ),但是相关的书该啃还是要啃的(嗯,flag立起来了 )加油⑧~

2022-03-18 11:06:07 374

原创 佛系计算机二级 & 第十弹

写在前面不知不觉已经进行到第十弹了(555),加油!Python Round⑩求最大值data = eval(input("请输入一组数据,以逗号分隔:"))print(max(data))结巴分词import jiebas = "一件事情没有做过,就没有资格对此事发表看法"ls = jieba.lcut(s)print(ls)输出时间import timet = time.localtime()print(time.strftime("%Y年%m月%d日%H时%M分%S秒"

2022-03-18 09:42:45 155

原创 # Python 数据分析三剑客 numpy / pandas / matplotlib (numpy篇②)

接着上一讲切片是引用切片在内存中使用的是引用机制。引用机制意味着,Python并没有为b分配新的空间来存储它的值,而是让b指向了a所分配的内存空间,因此,改变b会改变a的值:a = np.array([0,1,2,3,4,5])b = a[2:4]# b = array([2, 3])b[1] = 40a# a = [ 0 1 2 40 4 5]而这种现象在列表中并不会出现:a = [0,1,2,3,4,5]b = a[1:3]# b = [1, 2]b[1] =

2022-03-15 19:06:18 2021

原创 # Python 数据分析三剑客 numpy / pandas / matplotlib (numpy篇①)

写在前面本来想直接入坑 matplotlib 的,但是因为看了看网友们说的基本都是入门 pandas 和 numpy 开始,还是循序渐进吧,急不得急不得…正餐开始本部分采用的编译环境是 jupyter notebook ,之前虽然有简单使用过(还能回想起当时初入门都花了好长时间)不管怎么说,现在再和着视频学习吧~老师和同学们都要寻求转型呢之前一直忽略了 Edit 这个部分(也无怪,之前都是自己一个人摸索呜呜呜 ),甚至删掉 Cell 都是用小剪刀(那可真是黑历史了(擦汗) )选中绿色部分是对代码

2022-03-15 10:00:04 1067

原创 佛系计算机二级 & 第九弹

写在前面机器学习是一个螺旋上升的过程,加强基础也是非常重要,加油Python Round⑨循环识别while True: s = input("请输入信息:") if s == "Y" or s == "y": breakps:其实也没完全达到需求,只能输入单个词,不能对字符里面的 y 或 Y 进行识别Calendarimport calendaryear = int(input("请输入年份:"))table = calendar.calendar(ye

2022-03-15 09:47:44 163

原创 佛系计算机二级 & 第八弹

写在前面第七弹最后一个综合练习部分出了点小问题,为了不影响进度那我先进行第八弹的梳理,之后有机会再把第七弹补上。Python Round⑧倒序animals = ['cow', 'duck', 'cat', 'dog']s = animals[::-1]print(s)另:答案上采用的是另一种方案:animals = ['cow', 'duck', 'cat', 'dog']animals.reverse()print(animals)删除空白格word = " 窗前明

2022-03-13 09:36:15 1281

原创 # 研究杂感 × Citespace(第三辑)

写在前面Citespace的基本操作在前述两辑已经有过介绍,这一辑主要是探讨一下内容解读以及可视化优化。聚类分区前提是要点选(find clusters)点击紫葡萄前的这个即可完成聚类颜色分区该分区形状为十字架(那是相当的难看)尝试了一下似乎也不能变更为圆形,那就将其节点大小调整至最小(而且似乎多点几次K会将其距离拉开(这个比较玄学,还没太搞懂是否真的有效 ))但是确实相较上面那个形状是确实是更分散了…这种类型的图像似乎更适合直线段来连接,点选这个按钮将线段变直同时,针对这些白色的

2022-03-11 17:28:56 780

原创 # 研究杂感 × Citespace(第二辑)

写在前面Citespace 做时区图、关键词突现还挺不错的,其他的真不行~第一辑做了关于CNKI的,这一辑试试看WOS准备工作首先进行WOS数据导出,还是得是 download 来进行命名,记录内容为全记录与引用的参考文献就可:选择 WOS ,其他操作和CNKI导入是一样的,最后RUN一下remove duplicate即可:然后新建项目,保存即可相较于CNKI,WOS框内内容均可以做分析,褐色部分是其特色部分:然后依然是老套路:另:突然发现 WOS 一次只能导出500条信息,

2022-03-11 15:28:06 381

原创 # 研究杂感 × Citespace(第一辑)

Citespce 数据可视化写在前面Citespace 软件在揭示学科的动态发展规律,发现学科的研究前沿上有一定的优势;而对学科主题之间的关系进行清晰的呈现、或者数据量非常大的时候,可以选取 VOSviewer 软件绘制知识图谱。刚学完VOS的文献计量,确实颜色和聚类呈图比Citespace优秀很多,但是做时间的共现分析确实Citespace要略胜一筹,下面就好好研究下Citespace用法。正餐开始点击 StartCiteSpace_Windows 进入下述界面:输入2(代表使用中文进入软件环

2022-03-11 13:16:00 5727

原创 # 研究杂感 × VOSviewer(第六辑)

VOSviewer 数据可视化 ⑥——图片保存与修改标签字体option会有一个百分比选项,当百分比越大的时候,所保存的图片会越清晰设置好后,进行图片保存(.PNG)VOS自带的字体非常少,所以若是想要设置某种字体需要先将图片进行导出,然后导入到其他软件中进行修改。采用这种手段需要将图片保存为PDF格式,然后再导入到AI里面进行调整等,在这里就不细说了,感觉基本用不上。总结至此VOSviewer的相关研究就到这里结束了,收获满满呢!浅尝一下⑧~...

2022-03-10 10:46:51 4057

原创 # 研究杂感 × VOSviewer(第五辑)

VOSviewer 数据可视化 ⑤—— 中国知网CNKI共现~首先勾选CNKI所需文章,然后进行自定义导出需要把导出的文件另存为CNKI导出的文件后缀是 .xls ,需要修改后缀为 .xlsx VOS才能读入。接着用之前的代码来解决CNKI,会生成一个.net 文件按前述进行运行,可得如下图像(记得把最大的检索词去掉):这里很多节点都是灰色的,出现这个问题并不代表他们都同属一个 cluster,而是如左侧所示聚类多达82个。没有如此多的颜色来对图像进行表达,所以就都使用了灰色(题外话

2022-03-10 10:17:15 608

原创 # 研究杂感 × VOSviewer(第四辑)

VOSviewer 数据可视化 ④—— 使用同义词词典合并同义首先绘制一个关键词网络图然后我们尝试将 impact 和 impacts 进行合并,将 efficiency 和 economic growth进行删除。所采用的方法是修改(或者说是导入)VOS里的 thesaurus_terms.txt 文件首先将原有的 thesaurus_terms.txt 文件复制到自己想要导入的路径下然后针对 thesaurus_terms.txt 文件内容进行修改共分为2列,中间用 tab 符号

2022-03-10 09:19:05 1540

原创 #吴恩达· 机器学习笔记(④ 多元梯度下降及正规方程)

DAY 7多特征之前的视频是关于一个特征变量的(房屋面积对应房价)现在除了房屋面积还有诸如卧室数量、楼层数量等一系列的影响因素相较于传统的假设,现在的假设式如下:多元线性回归假设模型:多元梯度下降算法更新后的代码如下:...

2022-03-09 17:11:11 1590

原创 # 研究杂感 × VOSviewer(第三辑)

VOSviewer 数据可视化 ③—— 手动修改节点标签文字本期主要讲的是如何手动修改节点标签,例如国家如何设置首字母大写,Ppeoples R China如何修改为China。在进入WOS导入数据时又发现个小Tip,可以双击两下 “添加到标记结果” 选项,而后可以直接输入自己想要的条目数,非常方便正餐开始要想解决上述问题,首先要将VOS文件进行保存成CSV格式(1个node文件1个edge文件,均为csv格式)。导出之后我们来进行数据的手动修正:首先打开node文件新建1列 lab

2022-03-09 12:43:48 4224 3

原创 # 研究杂感 × VOSviewer(第二辑)

VOSviewer 数据可视化 ②—— Web of Science共线分析首先利用WOS导出文献按理说应该对所选的文献进行一个筛选,首先是时间方面根据自己的研究情况来看,这里我采用的是出版年份所有时间的数据;同时对所检索的数据库也可以做个限定(比如在全部数据库中进行检索),但比如机构、国家这些信息,有的数据库中不会进行显示,而WOS的核心合集中数据就非常齐全,所以以后应该默认也是在WOS核心数据集中进行文献计量分析。选择文献后,点击标记结果列表,可对所标记的文献进行初步筛选下一步将标记结果

2022-03-08 18:47:07 2914 1

原创 # 研究杂感 × VOSviewer(第一辑)

VOSviewer 数据可视化 ①—— 英文论文摘要绘制可视化网络写在前面很小就喜欢画画,对各种漂亮的东西完全没有吸引力,数据可视化完完全全就是我的菜(当然技术很差只能跪着看别人的 )之前大三痴迷 Tableau 了一段时间(然后3分钟热度就结束了 ),现在又打算入坑VOSviewer,希望能够好好走完…...

2022-03-08 15:31:01 3059

原创 佛系计算机二级 & 第六弹

写在前面不知不觉已经第6弹了 jiayouyaPython Round⑥把单词首字母换成大写line = "After fresh rain in mountains bare "print(line.title())计算三角形面积a = float(input("输入三角形第一条直角边长:"))b = float(input("输入三角形第二条直角边长:"))area = 1/2 * a * bprint("直角三角形的面积为:{0}".format(area))由于要求最终值要

2022-03-08 14:10:14 732

原创 佛系计算机二级 & 第五弹

写在前面多练!多练!多练!Round⑤

2022-03-05 18:06:09 389

原创 # Machine Learning — TF-IDF

写在前面在接触LSA的时候第一次接触了TF-IDF,隐隐约约感觉这个也是一个很重要的点,读了几篇论文似乎(我也不确定,太菜了 )好像也许是用了这种方法,先学习吧 可能学完就水落石出了呢TF-IDF介绍up主说很简单,辣就很简单吧。TF-IDF可以做的事情包括但不限于如下:根据TF-IDF值,就可以建立关键词语和文档之间的日历图也可以基于大量文本语料库查找与某个句子最相关的文本文档还可以提取一段文本中的关键词语TF-IDF简介TF-IDF(term frequency - inverse

2022-03-05 09:38:53 497

原创 #吴恩达 ·机器学习笔记(③ 线性代数的相关知识)

DAY 5矩阵的维数应该写作矩阵的行数×列数如何表达矩阵的某个项?什么是向量?(大写字母表示矩阵,小写字母表示向量)向量是只有1列的矩阵

2022-03-04 09:29:42 541

原创 佛系计算机二级 & 第四弹

写在前面不知不觉已经是第四弹了,希望自己能继续坚持下去!!勿忘组会流血!!加油!!Python Round④两点距离(保留一位小数)ntxt = input("请输入4个数字(空格分隔):")nls = ntxt.split(" ")x0 = eval(nls[0])y0 = eval(nls[1])x1 = eval(nls[2])y1 = eval(nls[3])r = pow(pow(x1-x0, 2) + pow(y1-y0, 2),0.5) print("{:.1f}".fo

2022-03-03 21:59:12 412

原创 SPSS + AMOS 结构方程模型(SEM)

写在前面抽空学习了一下结构方程模型,主要运用的软件是SPSS+AMOS,感觉之后能用得上,现将整体思路结构梳理如下,方便日后查阅。问卷采取 Likert 五级量表,1-5依次代表“非常不同意”到“非常同意”。信度效度检验问卷设计好后必不可少的一环,将Excel数据整理如下,并导入SPSS中。不同颜色代表问卷的不同子主题,将其导入SPSS中,分子主题进行信度效度检验。可以用打靶来说明信度和效度信度——所检测的东西是不是稳定的;效度——测度到了想测度的部分(是否打到了靶心)① 信度检验——克

2022-03-03 18:02:16 56417 12

原创 #吴恩达 · 机器学习笔记(② 线性回归与梯度下降)

DAY 2单变量线性回归模型通过给定数据集,预测实际值。(因为是单一变量,故称单变量线性回归)代价函数代价函数有助于弄清楚如何把最有可能的直线与我们的数据进行拟合。我们这里要聊的就是如何选择不同的参数 θ0 和 θ1 的值。通过设置不同的θ0 和 θ1 的值,我们可以得到不同的回归模型:在线性回归中,最开始会给定一个训练集(如红X所示),我们要做的就是得出θ0 和 θ1 的值,来让假设函数表示的直线,尽量与这些数据点很好的拟合。那么如何得出θ0 和 θ1 的值呢?想法是针对h(x)模型

2022-03-03 17:15:33 970

原创 # 吴恩达 · 机器学习笔记(① Introduction to Machine Learning)

写在前面在学习Python的时候同步进行吴恩达的机器学习,就像啃书一样,有些视频也需要啃下来。为了之后更好的烟酒生活,为了更舒服地融入新的环境中,那就加油吧!吴恩达机器学习共112章,按一天2节的进度,56天可以学完,余之游将至此始,恶能无记?壬寅三月也。DAY 1什么是机器学习?计算机程序从经验 E 中学习解决某个任务 T,进行某一性能度量 P,通过 P 测定在 T 上的表现因 E 而提高。(重要的三元素:任务T + 经验E + 性能P)最主要的两类机器学习算法:监督学习: 简单来说,就是我

2022-02-28 17:33:39 1416

原创 佛系计算机二级 & 第三弹

写在前面代码总是学了写,写了忘,这个抗遗忘的工作做起也恼火,要是人人都像AI一样学了就不会忘就好了,话不多说,春宵苦短,少年前进吧~Python Round③左对齐输入str,用@填充空白n = eval(input("请输入正整数:"))print("{:@>30,}".format(n))与之前Round①不同的是里面输入的数字要用 “ , ” 分割,在限定范围后加个逗号即可。计算两列表的值a = [11,3,8]b = eval(input("请输入一个列表:"))s =

2022-02-27 11:55:46 256

原创 # 一点毕设小感悟(SnowNLP+可视化分析)

Snow NLP##查看pycharm库的下载路径

2022-02-25 17:14:47 2451 1

博文 “结构方程模型” 配套数据,内涵一个Excel数据集和SPSS软件适用的sav数据集。由于是自己毕辛苦整理的还是略略收收费

博文 “结构方程模型” 配套数据,内涵一个Excel数据集和SPSS软件适用的sav数据集。由于是自己毕辛苦整理的还是略略收收费

2022-07-02

国内四大城市群相关数据集

内涵京津冀、长三角、粤港澳、成渝绵城市群(城市群里的所有城市)2017-2021年的数据(固定资产投资、年末人员从业数、R&D、能源投入(标碳)、GDP、专利数、人均绿地、绿地面积、CO2排放量)的相关内容(数据来源于各地区统计公报或者年鉴,一个一个的翻来找的,很是麻烦才搞到)

2022-06-29

SnowNLP中文情感分析+可视化分析

内含SnowNLP中文情感分析+可视化分析源代码及旅游评论的positive、negative训练文本,方便有相关需求的小伙伴

2022-02-26

毕设混分小工具(词频统计+可视化分析)

适合毕设混分仔使用,内含Python词频统计+可视化分析代码,帮助快速完成毕设论文部分。(尤其适合经济管理类、旅游管理类、信息管理类学生使用)

2022-02-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除