无喔我-优快云博客

引言今天逛知乎看到这样一个问题和回答，让我瞬间理解局部最优和全局最优在诸如算法导论等书是这样解释的：全局最优是在全局选取一个最佳值，而局部最优是在某一部分选取一个最佳值。每一部分都选取最佳值（即局部最优）最后不一定是全局最优。世俗理解与原理解释局部最优：有一个人，精致的利己主义者，没有深谋远虑只是看重眼前的利益。比如说在日常生活中小偷小摸、损人利己、曲意逢迎等等为自己谋取最大利益。这样的人办不成大事，因为一次两次还好，次数多了身边人都知道他是什么样的人了，要么不带他一起玩，要么防备着他以避免被坑。

2022-02-21 13:09:26 3705

原创 LDA模型，获取所有的文档-主题分布（即得到文档对于每个主题的概率分布）并保存

前言：写小论文用到lda主题模型，需要得到所有的文档-主题分布。现有的只是为文档输出前几个概率大的主题代码：import numpy as npfrom gensim.models import LdaModel#训练lda模型lda = LdaModel(corpus=corpus, id2word=dictionary, num_topics=size_lda ,minimum_probability=0)"""start：文档-主题分布矩阵，使用DocumentTopicMatrix[

2022-02-19 18:15:15 6157 20

原创 LDA模型参数设置，训练效果较好

前言：写小论文用到lda主题模型，在网上找了一圈没有找到训练效果较好的模型参数示例。为了写出小论文做了很多次实验，达到了实验中最好的效果，故贴出代码：from gensim.models import LdaModellda = LdaModel(corpus=corpus, id2word=dictionary, num_topics=size_lda, alpha="auto",eta='auto',passes=20)其中，corpus，id2word，num_topics不多解释，主要是

2022-02-19 17:54:46 8034 14

原创分词及去停用词（可用作科研实验）python

写在前面：毕业要发四区论文，故开始了苦逼看论文写代码之旅，现论文已发出。网上少见对中文文本进行预处理的可以用作科研的代码，故贴出，想要资源的可移步此下载。一、资源结构：1.资源结构如下图：2.把需要分词和去停用词的中文数据放入allData文件夹下的originalData文件夹，依次运行1.cutWord.py和2removeStopWord.py之后，allData文件夹下的afterRemoveStopWordData文件夹就是最终分词且去停用词之后的文件。注意：originalData文件

2022-02-14 13:50:38 1637

原创（二）行转列regexp_split_to_table()与列转行string_agg()—以及postgreSQL中使用特例

1.行转列regexp_split_to_table(input_string, separator)input_string待转的字符串separator是分隔符例子：select regexp_split_to_table(‘aa,bb’, ‘,’) from dual结果：postgreSQL注意：在post库中使用‘+’来分割不行，所以一个解决办法是用replace函数用’,‘来代替‘+’，再用’,'来分割select regexp_split_to_table(replace(

2021-06-23 12:21:10 1442

原创（一） oracle：decode()函数＜--＞postpresql：case when函数

Oracledecode()：select decode(student_name,‘乱七八糟’,null,student_name) from student_info等价于Postgresql:case when：select case when student_name= ‘乱七八糟’ then null else student_name end from student_info附：decode(A,1,11,a,aa,bb)相当于case when A=1 then 11..

2021-06-23 10:56:11 334

原创 datagrip中创建表的外键

描述：student表中有属性：id(主键),name,t_id(外键)teacher表中有属性：id(主键)，nameteacher表中的id是student表中的外键t_id注意： student表中t_id的数据类型和长度最好和teacher表中的id保持一致步骤：1创建表：.鼠标移到数据库上——>鼠标右键——>new——>table2.创建teacher表：table处写入表名teacher，最左边“+”加号创建表的属性——>最后点击下方的"execute"执

2020-10-12 10:51:47 7020

原创 springboot框架简述（一）——小白文，简单易懂

1.前言因为实习所以开始学习springboot了，在此不简述springboot的原理，只是介绍springboot框架下建的包的结构及其作用2.springboot框架

2020-10-03 12:28:33 2203

原创（超小白的错误）跨云服务器（比如说阿里云服务器远程连接腾讯云服务器）远程连接出现Permission denied, please try again.

刚在跨云配置Hadoop。使用阿里云做Namenode，腾讯云做DataNode，在阿里云服务器上使用： ssh xxx.xx.xx.xx(此网址为腾讯云服务器的外网ip) 远程连接腾讯云服务器时出现：Permission denied, please try again.百度了很久，有的解决办法是：修改密码而我修改了之后还是提示Permission denied, please try again，折磨了很久之后，抱着试一试的心态，我登录了腾讯云服务器然后在阿里云上用ssh远程连接腾讯云服务器竟然成

2020-05-16 19:05:19 996 2

原创 pandas对eccel表的许多详细操作，包括创建新的列、排序、求和、指定列的相关性求解等等

老师给了题目做，但是在网上搜不到现成的，花了心思。做的时候很大部分是可以直接根据pandas的中文API文档上提示就能做出来（小伙伴们要养成习惯看官方文档，可能能事半功倍）题目、源excel数据、代码、结果截屏如有需要可以直接去这儿下载题目：！！！！添加下载链接！！！！！！！！！！！！这是老师给的题目，我后面会根据题目的数量分十三步来依次讲解。有哪一部分的需要就直接跳到那一步就可以了，注意：...

2020-03-26 09:55:14 651

转载 Pandas 中文API文档（转载）

在这个速查手册中，我们使用如下缩写：df：任意的Pandas DataFrame对象s：任意的Pandas Series对象同时我们需要做如下的引入：import pandas as pdimport numpy as np导入数据pd.read_csv(filename)：从CSV文件导入数据pd.read_table(filename)：从限定分隔符的文本文件导入数据pd.r...

2020-03-25 22:37:05 1159

原创条件概率、联合概率、边缘概率的区别及独立事件、古典概型

深入学习机器学习、分布式算法才发现概率与统计，线代都很重要，下面我简单串一下如题目所示的知识第一步：P(A|B)是在条件B发生的情况下A发生的概率，P(AB)是条件A与B同时发生的概率。关于条件概率、联合概率的例子我在最后一步骤举出，如独立事件和古典概型都懂则跳至最后一步看例子记牢靠公式：在这里，可以按照下图来理解：P(AB)等于图中的A交B的部分，而P(A|B)等于A交B的面积与B...

2020-03-13 00:43:05 7147 3

原创 python爬取网站代码（详细步骤讲解）

爬取步骤讲解

2020-02-28 11:44:46 11778 3

原创 python求解质因子（递归和非递归）

题目：任意输入一正整数N，求出它的所有质因子。如：10＝2 5；20＝2 2 51.非递归求解：2.递归求解

2020-02-23 13:23:27 2749

原创算法导论第三版 21.2-3习题答案

21.2-3分析要想做这道题，要先弄懂定理21.1的证明过程。前提;加权合并启发式策略中的UNION()只需要进行指针的更新就可以实现合并操作(重点理解)（1）首先明确UNION()操作的最多执行n-1次（注意：是次数）。因为MAKE-SET（）操作执行了n次，创造了n个对象。（2）加权合并启发式策略是将较短的表拼接到较长的表中，而不是像图21-3所示的简单合并（简单合并就是{A}和{B...

2019-12-08 18:22:26 1403 1

原创算法导论第三版 17.3-6习题答案

17.3-6答案：如10.1-6方法所示：（10.1-6答案）设Ci为第i个操作的代价（假定每个操作的代价为1），每次操作的势能D(i)：定义为s1栈中的元素个数*2。那么有：...

2019-12-02 17:39:05 766

原创算法导论第三版 10.1-6习题答案

10.1-6答案：设定两个栈为s1和s2，那么s1用来ENQUEUE()，s2用来DEQUEUE()，当然s1需要用来为DEQUEUE()操作作过渡，流程如下：（1）首先将入队元素1，2，3依次放进栈s1。此时s1元素从低到高为1，2，3，s2中暂时无元素。（2）然后依次将1，2，3从s1中弹出并且放入s2中。此时s1栈空，s2中元素从低到高依次为3，2，1（3）若此时进行还需要ENQU...

2019-12-02 16:51:51 513

原创算法导论第三版 16.1-5习题答案

16.1-5这题实际是带权的活动求取最大权重的活动选择问题，使用动态规划求解。如果有心学好的动态规划的同学可以去 “ B站上搜 ’ 动态规划（第1讲） ‘，选择作者是：正月点灯笼的视频 ” 看看，他的这个视频讲解的就是这个问题的求解，简单易懂。答案：首先，活动集中的活动已经按照结束时间先后顺序进行了排序；其次，定义两个数组R[1…n]；pre[1…n] （其中，n为活动集的规模）。R[]数...

2019-11-28 15:09:53 3302 4

原创算法导论第三版 17.1-2习题答案

17.1-2分析：如书中所示，increment(A)函数中，A数组来存放二进制，所以increment(A)函数实质是将一个十进制整数用二进制来表示，然后在整数加1的时候，将二进制做相应的变化。那么decrement(A)就可以知道，其实质是将一个十进制整数用二进制来表示，然后在整数减1的时候，将二进制做相应的变化。现在给出几个十进制——二进制对照来讲：十进制表示：123...

2019-11-27 21:31:28 2041

原创算法导论第三版 15.3-4习题答案

15.3-4分析:Capulet教授的观点实质是是在求解一个方案，该方案能使得每个添加的括号处的P[i-1]*P[k]*P[j]数乘次数的和最小。而矩阵链乘实质上求解的是一个方案，该方案能使整体的数乘次数的和最小。所以Capulet教授的观点不能总是得到最优解答案：反例：矩阵A1；A2；A3的规模分别是10 * 20；20 * 30；30 * 40；（1）按照P[i-1]*P[k]*P...

2019-11-26 14:39:13 905

原创算法导论第三版 15.1-3习题答案

15.1-3分析：增加了固定成本c，则在每一次切割后都需要减去一次，此时递归表达式：伪代码：Bottom-Up-Cost-Cut-Rod(p,n) let r[0…n] be a new array &nbs...

2019-11-26 14:00:05 1811

原创算法导论第三版 15.1-2习题答案

15.1-2分析：根据密度（类似于单价）来做切割，只能得到局部最优解，因为按照题目要求是不能对一个长度定了、价值定了的钢条进行拆分的（如20英寸的钢条价值100，则密度为5，但是当待切割的钢条L在切割后只剩下5英寸的时候，不能把密度为5的这根钢条切出来5英寸的价值等同于钢条L最后的5英寸。举的例子有点不恰当，当你们预习一下第十六章贪心算法中的分数背包问题之后，可能能理解这个例子了）解答：反...

2019-11-26 13:45:06 741

原创 python中通过gensim引入word2vec提示：DLL load failed: 找不到指定的模块。有奇效的、简洁的办法！

一、问题：gensim的依赖包有：(1)numpy(2)scipy。在安装好了的gensim，numpy，scipy三个包之后使用from gensim.models import word2vec或者import gensim会提示DLL load failed: 找不到指定的模块。二、思考：明明已经安装好了这三个包仍然报错。这个时候可以考虑三个版本是否想匹配的问题。**三、方法：*...

2019-05-06 00:18:47 4523 2