- 博客(36)
- 资源 (2)
- 收藏
- 关注
原创 tensorflow函数记录
tensorflow函数记录函数类型一tf.stack() axis=0,1新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入函数类型一你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用
2022-02-15 19:48:38
200
转载 句向量的表示(上)—无监督
参考:https://www.cnblogs.com/llhthinker/p/10335164.html目录1)基于词向量的词袋模型 —平均词向量与TFIDF加权平均词向量 —SIF加权平均词向量 发表于2016年的论文A simple but tough-to-beat baseline for sentence embed...
2019-06-05 22:07:39
1560
原创 OOV问题的解决
1)使用subword的方式来解决,可以使用fasttext工具 训练词向量时候会生成subword的词向量的信息[1];2)在训练词向量时候,随机删除一些词,置为unknow,训练得到的unkonw就是OOV的词向量信息;3)skip-thoughts 中有个扩大词库的方法 ;4)未完待续;参考:1)https://blog.youkuaiyun.com/sinat_...
2019-06-05 21:55:00
6996
原创 牛顿迭代法求平方根
求x的平方根,初始化一个值t,允许误差errorx=1234t=xerror=0.01while (t*t-x)>error: t=(x/t+t)/2.0(牛顿迭代法)print t
2018-08-02 09:17:09
470
转载 0-1背包问题
转载:https://blog.youkuaiyun.com/m0_37830950/article/details/7024066101背包问题容量为10的背包,有5种物品,每种物品只有一个,其重量分别为5,4,3,2,1,其价值分别为1,2,3,4,5。 设计算法,实现背包内物品价值最大。 代码如下(输出14)#include <iostream>#include<a...
2018-07-23 16:44:56
214
转载 字符串的全排列
abc的全排列,先用第一个和后面每个交换,再用第二个和后面交换。参考:https://www.cnblogs.com/bakari/archive/2012/08/02/2620826.html
2018-07-18 20:58:09
200
原创 从一个数据流中取出中位数
用两个堆来实现,堆中元素个数相差<=1,class Solution { priority_queue<int, vector<int>, less<int> > p; //大顶堆(存的是一堆小元素) priority_queue<int, vector<int>, g...
2018-07-18 15:12:53
516
原创 旋转矩阵
输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数字,例如,如果输入如下4 X 4矩阵: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7,11,10. 可以模拟魔方逆时针旋转的方法,一直做取出第一行的操作例如 1 2 34 5 67 8 9输出并删除第一行后,再进...
2018-07-18 10:24:40
900
原创 已知先序和中序得出后序
已知前序和中序,求后序遍历:前序:ABDECFG 中序:DBEAFCG思路简单:前序的第一个节点就是根节点, 中序中找到根节点的位置,根节点之前是其左子树,之后是右子树 按此顺序,依次在左子树部分遍历,右子树部分遍历总结性的说:前序负责构建树的节点,中序负责划分左子树和右子树,如果不存在,就是左子树,则表示左节点为空。超级简单的python代码如下:...
2018-07-15 13:19:44
564
原创 数组中最大连续子数组和,最大连续子数组积,最大递增子序列
对数组a, 递推式:curmax=max(a[i],lastmax) 其中lastmax是以i为结尾的最大值,其中每次循环比较curmax和已经保存最大值int maxhe(vector<int>& a){ lastmax=a[0]; result=a[0]; for(int i=1;i<a.size();++i){ curma...
2018-07-14 16:43:52
555
转载 Minimum Window Substring 最小覆盖子串算法
转载:https://blog.youkuaiyun.com/fly_yr/article/details/51134340题目 最小子串覆盖给定一个字符串source和一个目标字符串target,在字符串source中找到包括所有目标字符串字母的子串。 注意事项如果在source中没有这样的子串,返回"",如果有多个这样的子串,返回长度最小的子串。说明在答案的子串中的字母在目标字符串中是否需要具有相同的顺序...
2018-07-12 17:05:36
189
原创 字符串的最长不重复字串
int longestSubstring(string A, int n) { map<char, int> m; //表示字符串中每个字符是否出现,初始化为0,表示未出现 int start = 1,MAX = 0; //遍历该字符串,每遍历一个字母时,利用map去找该字母最近一次出现是什么时候 //中间这一段便是无重复字...
2018-07-12 15:01:57
459
原创 二叉树的公共祖先(递归)
1,方法一,求出根节点到目标节点的路径,然后两条路径找到最近公共祖先2,方法二,递归的去找两个节点,找到后,返回root,后序遍历的思想:class Solution {public: TreeNode* lowestCommonAncestor(TreeNode* root, TreeNode* p, TreeNode* q) { if (!root) return ...
2018-07-11 10:26:08
777
原创 一个数组分成两部分,让两部分的差最小
题目意思差最小,就是其中一部分最接近sum/2,另外一部分也就最接近sum/2a[i][j] 表示前i件物品和j最接近的累加值a[i][j]=max(a[i-1][j],a[i-1][j-vec[i]]+vec[i])一部分:min(a[:][sum/2]) 另外一部分:sum-min(a[:][sum/2])...
2018-07-10 01:37:42
4348
原创 一个数的二进制中有多少个1
int bit(unsigned int x){ int c = 0; while( x ) { c++; x = (x & (x - 1)); } return c;}
2018-07-07 14:03:06
588
原创 LR的并行化
并行LR的实现由逻辑回归问题的求解方法中可以看出,无论是梯度下降法、牛顿法、拟牛顿法,计算梯度都是其最基本的步骤,并且L-BFGS通过两步循环计算牛顿方向的方法,避免了计算海森矩阵。因此逻辑回归的并行化最主要的就是对目标函数梯度计算的并行化。可以看出,目标函数的梯度向量计算中只需要进行向量间的点乘和相加,可以很容易将每个迭代过程拆分成相互独立的计算步骤,由不同的节点进行独立计算,然后归并计算结果。...
2018-07-05 21:16:01
1289
原创 二叉排序树转双向链表
找到左子树的最右边节点,需要和后边节点连接起来找到右子树的最左边节点,需要和前边节点连接起来 //二叉树转换成双向链表 public void InvertToLinkedlist(Node head ){ if(head.left!=null){ InvertToLinkedlist(head.left); ...
2018-07-05 20:49:10
306
原创 合唱团算法(DP问题)
题目:有 n 个学生站成一排,每个学生有一个能力值,牛牛想从这 n 个学生中按照顺序选取 k 名学生,要求相邻两个学生的位置编号的差不超过 d,使得这 k 个学生的能力值的乘积最大,你能返回最大的乘积吗?类似于前面写到的LSI最长递增子序列, 只不过这里控制了选取K个,所以这里定义了一个最大数据结构fm[i][j] 其中表示选取了i+1个学生,以j结束(选取了j为结尾)最大值 这里数组...
2018-07-03 21:49:05
380
原创 信息学奥赛一本通 题解目录
刷题 很全的知识体系转载:https://blog.youkuaiyun.com/u011815404/article/details/79324003第一部分 C++语言第一章 C++语言入门 T1001 Hello,World! 点击这里 T1002 输出第二个整数 点击这里 T1003 对齐输出 点击这里 T1004 字符三角形 点击这里 T...
2018-07-03 21:27:00
136090
6
原创 怎么判断两颗二叉树相等
bool pd(st *p, st *q){ if(p==NULL && q==NULL) return true; else if(p==NULL || q==NULL) return false; else return p->data==q->data && pd(p->l,q->l) && pd(p-...
2018-07-03 17:30:53
375
原创 leetcode-卡车加气走环
解析: a1 a2 a3 a4 a5 a6 如果a1到a3总的加气-用气<0,那么a1,a2都不能用作起点,a3作为起点//复杂度O(n)class Solution {public: int canCompleteCircuit(vector<int> &gas, vector<int> &cost) { //tota...
2018-07-03 10:40:22
233
原创 机器学习常见损失函数
0-1损失函数: 预测值不等于真实值,为1,否则为0对数损失函数(交叉熵): L(Y,P(Y|X))=−logP(Y|X)平方损失函数指数损失函数 L(Y|f(X))=exp[−yf(x)]Hinge损失函数 (SVM的损失函数) L(y)=max(0,1−ty) y是预测值,在-1到+1之间,t为目标值(-1或+1)。其含义为,y的值在-1和+1之间就可以了,并不鼓...
2018-07-01 21:11:13
322
原创 RF和GBDT和Xgboost的异同总结,加上lightgbm
相同点(照顾标题): 都用到了Bootstrap思想,Bootstrap是一种有放回的抽样方法思想不同点: 基类器: RF用的回归树或者分类树,GBDT和xgboost用的是CART(回归树) 分裂节点: RF:根据选择的树类型来选择是熵或者信息增益或GiNi指数; GBDT:在回归使用的是最小均方差,分类使用的是...
2018-07-01 20:43:38
1002
原创 在nlog(n)时间里对单链表排序
两个思路: 快速排序(逻辑是自顶向下)。先划分排序(一次确定一个位置),再对左边右边分别排序,一直到最小粒度; 归并排序(逻辑自下而上) 先一直到最小粒度,然后两两合并排序,最合合成排序好的链表;1,快速排序 1)根据划分位置将链表 分成两部分(左边小于,右边大于),递归:QuickSort(head,end),时间复杂度logn void ...
2018-06-23 18:08:30
436
1
原创 LCS-最大公共子序列(DP问题)
对两个字符串求最大公共子序列,子序列意味着不是连续的序列。 子问题:LCS(s1,s2)表示最大公共子序列 首先基于一个判断, 1)s1和s2有相同的结尾x,那么x一定在最大公共子序列中, LCS(s1,s2)=LCS(s1[:-1],s2[:-1])+1 2)s1和s2没有相同结尾,那么LCS(s1,s2)=max{ LCS(s1[:-1],s2),...
2018-06-21 22:12:16
182
原创 LSI最长递增子序列(DP问题)
子问题:序列a,L[i]表示前i个字符的最大递增子序列的长度 对L[i+1],遍历前i个:a[0],,,a[i-1],max{L[i],L[j]+1} if a[j]<a[i]) 0<=j<i 简单的python L[i+1]=max(L[i]+[L[j]+1 for j in range(i) if ...
2018-06-21 21:12:44
195
原创 word-break 对一个字符串根据给出的字典判断是否可以根据字典切分(DP问题)
思路:定义labels[i]表示前i个字符可以拆分成字典中的词,很显然有 labels[i]=1 if labels[j] && s[j+1,i] in dict else 0 其中(0<j<=i) bool fun(String s,unordered_set<string> &dict){ bool ...
2018-06-21 17:20:11
371
原创 word break II 对字符串根据已知字典 分解出所有可能组合
采用暴力法(brute force 简称BF,普通模式匹配): 代码如下: public class Solution { public List<string> wordBreak(String s, Set<string> dict) { List<string> rsList = new ArrayList<st...
2018-06-21 10:53:18
194
转载 TF-IDF
TF-IDF词频 (term frequency, TF) 指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被归一化(分子一般小于分母 区别于IDF),以防止它偏向长的文件。逆向文件频率 (inverse document frequency, IDF) 是一个词语普遍重要性的度量。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到。...
2018-03-28 15:07:29
274
转载 Python 和 R 数据分析/挖掘工具互查
转载:https://segmentfault.com/a/1190000005041649?utm_source=tuicool&utm_medium=referral
2016-12-23 17:32:33
377
原创 机器学习和数据挖掘推荐书单及简介
机器学习和数据挖掘推荐书单有了这些书,再也不愁下了班没妹纸该咋办了。慢慢来,认真学,揭开机器学习和数据挖掘这一神秘的面纱吧!《机器学习实战》:本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CAR
2016-12-09 21:41:12
913
原创 LateX在windows中运用MiKTeX
LateX是一个很好的排版系统,是基于Tex,可以生成pdf,你所看到的一些美丽的论文说不定就是用LateX来排版的。 在Windows下使用的是MiKTeX软件,资源可以在官网上下载https://miktex.org/download,在其中找到TeXworks用来编辑Tex,编辑好后保存为Tex格式的文件,运行时选择pdfLatex即可,注:在第一次运行的时候会弹出窗口让你安装一些包,这个
2016-12-06 19:49:56
3019
原创 Logistic Regression 之 Sigmoid
逻辑回归(Logistic Regression, LR)模型也是一个二分类模型,属于广义线性模型,它还有个名字叫做二项逻辑斯蒂(谛)回归(不知为什么加个斯蒂(谛)),虽然叫XX回归,但却不属于回归模型。
2016-10-16 17:20:13
1460
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人