- 博客(31)
- 收藏
- 关注
原创 word2vec 原理与代码解析
已经看了很久的word2vec,但是发现了很多不同版本的解释,再加上原始论文没有提到太多的细节,所以打算直接看一遍源码,一方面可以加深自己理解;另一方面,以后也可以做适当的改进! 先给出源码中执行的流程图,按照流程图对代码进行详细的解读,流程图如下: 训练部分的流程图如下: 讲解将会按照这个训练过程来!(一)训练参数注意,这些参数都是全局参数,包括以下参数:...
2018-12-24 11:41:55
493
1
原创 基于Tensorflow实现DeepFM
基于Tensorflow实现DeepFM前言DeepFM,Ctr预估中的大杀器,哈工大与华为诺亚方舟实验室荣耀出品,算法工程师面试高频考题,有效的结合了神经网络与因子分解机在特征学习中的优点:同时提取到低阶组合特征与高阶组合特征,这样的称号我可以写几十条出来,这也说明了DeepFM确实是一个非常值得手动撸一边的算法。当然,早就有一票人写了一车封装好的deepFM的模型,大家随便搜...
2018-11-19 18:49:25
635
原创 git pack has bad object at offset xxx: inflate returned -5
git clone 时出现错误,git 版本 git version 1.7.1,在git 版本(git version 1.7.11 )不存在此问题,这是git 的一个bug,升级git 后解决问题 git clone xxxInitialized empty Git repository in /data1/xxx.git/remote: Counting objects:
2017-11-23 16:46:01
7117
3
原创 使用sklearn 做分类试验(有附图)
#-*-coding:utf-8-*-"""CreatedonSunApr1908:57:132017@author: sishuyong"""print(__doc__)importnumpyasnpfromscipyimportinterpimportmatplotlib.pyplota
2017-10-18 14:17:11
1033
转载 vim 配置成IDE
我的vim IDE界面: 1、安装Vim和Vim基本插件首先安装好Vim和Vim的基本插件。这些使用apt-get安装即可:lingd@ubuntu:~/arm$sudo apt-get install vim vim-scripts vim-doc其中vim-scripts是vim的一些基本插件,包括语法高亮的支持、缩进等等。vim中文帮助文档tar包下载地址:
2016-09-06 14:37:33
637
1
原创 linux 系统监控、诊断工具之 lsof 用法简介
目录:[ -]1、lsof 简介2、lsof 常用用法2.1 监控打开的文件、设备2.2 监控文件系统2.3 监控进程2.4 监控网络3、更多使用技巧3.1 监控用戶3.2 监控应用程序4、命令模式技巧4.1 组合逻辑查询条件4.2 lsof 命令的重复执行模式:5、最后的技巧6、refer: 1、lsof 简介
2016-08-23 15:26:22
1133
原创 各大推荐引擎 整理
最近在做一个推荐的任务,头绪繁多,回头看看同行的工作,希望能有些帮助。零零碎碎看过好多资料,有些已经忘记了,会慢慢补全。欢迎大家留言补充。也欢迎同行加我微博进行交流。(最近发现各家推荐技术进步很快,这里整理的可能已经是过去时了,不过最近不搞这个,没有精力补充了。)视频类Netflix:很多方法的融合,策略可以参考我翻译的blog,架构参考小鱼儿师
2016-07-12 10:47:37
2827
原创 linux load 监控,负载监控 ,shell 监控cpu,memory,load average,记录到log
linux load 监控,负载监控 。shell 监控cpu,memory,load average,记录到log,当负载压力时,发电邮通知管理员。
2016-04-19 14:45:02
4954
2
转载 linux常用命令大全(转)
linux常用命令大全(转)由于记忆力有限,把平时常用的Linux命令整理出来,以便随时查阅: linux 基本命令 ls (list 显示当前目录下文件和目录 ls -l 详细显示 =ll ) [root@linux ~]# ls [-aAdfFhilRS] 目录名称 [root@linux ~]# ls [--color={non
2014-08-26 16:54:12
1011
1
转载 开源机器学习软件
今天给大家介绍一下经典的开源机器学习软件:编程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和C/C++,这样组合既可搞研究,也可搞商业开发,易用性不比matlab差,功能组合更为强大,个人认为,当然R和java也不错.1.机器学习开源软件网(收录了各种机器学习的各种编程语言学术与商业的开源
2014-07-23 16:47:44
1142
转载 C/C++ 内存分配情况
一、C语言中的内存地址分配模型如 内存分配情况" title="C/C++ 内存分配情况" style="margin:0px; padding:0px; border:0px; list-style:none; width:509px; height:427px">1、程序代码区:存放函数体的二进制代码。 2、全局区数据区:全局数据区划分为三个区域。
2014-07-15 21:47:13
988
转载 C语言中内存分布及程序运行中(BSS段、数据段、代码段、堆栈)
C语言中内存分布及程序运行中(BSS段、数据段、代码段、堆栈)BSS段:(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。数据段 :数据段(data segment)通常是指用来存放程序中 已初始化 的 全局变量 的一块内存区域。数据段属于静态内存分配
2014-06-18 22:22:26
1830
1
原创 C++ 字符串问题
字符串在面试中经常会问到比如说1,一个字符串中重复出现的最长的子字符串 2,两个字符串求最长公共子串对第一个问题,本文写了自己实现的版本,功能实现了(但是不能保证时间复杂度),关键在于求一个字符串的全部 子字符串!1 找出 一个字符串中 重复出现的最长的 子字符串 void find_long_same_substr(){ string str,tep; c
2014-02-28 22:46:50
1343
1
原创 C++ 折半查找
1,C++实现折半查找v 中元素假设是有序的void binary_search(vector v,int x){ int low=0; int high=v.size()-1; int mid=(low+high)/2; while(high>=low) { if(v[mid]==x) { cout<<"最终的找到位置是 "<< mid; break;
2014-02-28 17:03:27
1033
原创 C++ 排序算法总结 堆排序 快速排序
1,堆排序思路// lianxi.cpp : 定义控制台应用程序的入口点。//自己实现的堆排序,主要在于堆的调整,以及边界控制条件#include "stdafx.h"#include #include using namespace std;int _tmain(int argc, _TCHAR* argv[]){ int a[11]={12,2,35,65,5,52
2014-02-28 15:43:12
1022
原创 常见面试题 总结
1 ,约瑟夫问题约瑟夫问题是个有名的问题:N个人围成一圈,从第一个开始报数,第M个将被杀掉,最后剩下一个,其余人都将被杀掉。例如N=6,M=5,被杀掉的人的序号为5,4,6,2,3。最后剩下1号void Josephus(int x,int m){ //x代表总共的节点数,m为从头开始数到m ,删除掉m 后,从m的下一个位置开始从1计数 node *p=new node(); p
2014-02-27 21:56:58
809
原创 C++ 单链表的 就地逆置 ,以及基本操作
#include "stdafx.h"#define sub(a,b) a-b //没用#include using namespace std;struct node{ int a; node * next;};int _tmain(int argc, _TCHAR* argv[]){ //int x=sub(3,8); node * createList
2014-02-26 09:13:35
2988
原创 判断点是否在三点围成的三角形内
#include "stdafx.h"#include #include#include using namespace std;struct point{double x,y;};//求边长void Compute(point A,point B,point C,double &a,double &b,double&c){a=sqrt( pow(A
2013-12-30 22:31:08
1275
原创 互联网世界的“人工智能”——探秘“深度学习”的前世今生
互联网世界的“人工智能”——探秘“深度学习”的前世今生编者按:本文来自“流浪汉”投稿(@ZhangLumin),一个在硅谷工作的码农,有机器学习背景,平常对产品方面很有兴趣。最近一段时间里,Facebook、Google、Yahoo!、百度等各大公司都在尝试将深度学习(deep learning)算法运用到产品开发中,以期使产品更智能化,提升用户体验。在深度
2013-12-19 23:41:42
1042
转载 FP-Tree思想与实现
在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支,韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。支持度和置信度严格地说Apriori和FP-Tree都是寻找频繁项集的算法,频繁项集就是所谓的“支持度”比较高的项集,下面解释一下支持度和置信度的概念。设事务数据库为:
2013-12-07 19:12:52
1340
转载 常见面试之机器学习算法思想简单梳理
常见面试之机器学习算法思想简单梳理前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。
2013-12-03 16:21:44
1235
原创 EM算法 自己整理(有待扩展)
EM写的很好的文章: http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html
2013-12-01 21:43:19
1120
转载 深度学习简介
查看最新论文Yoshua Bengio, Learning Deep Architectures for AI, Foundations and Trends in Machine Learning, 2(1), 2009深度(Depth)从一个输入中产生一个输出所涉及的计算可以通过一个流向图(flow graph)来表示:流向图是一种能够表示计算的图,在这种图中每一个
2013-11-30 20:21:26
1223
原创 最重要的一些算法 (数学与计算机领域)
今天在微博上无意间发现了好心人翻译的中文版,好东西贴过来奥地利符号计算研究所(Research Institute for Symbolic Computation,简称RISC)的Christoph Koutschan博士在自己的页面上发布了一篇文章,提到他做了一个调查,参与者大多数是计算机科学家,他请这些科学家投票选出最重要的算法,以下是这次调查的结果,按照英文名称
2013-11-27 21:04:32
1304
原创 vs2010 c++ 链接mysql
第一步 建立连接前的配置来源是mysql的官网配置文件 :http://dev.mysql.com/doc/refman/5.6/en/connector-cpp-apps-windows-visual-studio.html(1)在c++项目->属性-> 配置属性->c/c++->常规->附加包含目录 包括进 C:\Program Files\MySQL\MySQL Server
2013-11-27 13:17:24
1195
转载 大数据应用之个性化推荐的十大挑战
源地址 : http://www.kddchina.com/article-49-1.html个性化推荐很多人都知道,但其中不乏认识上的误区。有的人觉得个性化推荐就是细分市场和精准营销,实际上细分市场和精准营销往往是把潜在的用户分成很多群体,这固然相比基于全体的统计有了长足的进步,但是距离“给每一个用户量身定做的信息服务”
2013-11-24 22:29:12
1768
转载 Trie树 的理论与实现
性质它有3个基本性质:根节点不包含字符,除根节点外每一个节点都只包含一个字符; 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串; 每个节点的所有子节点包含的字符都不相同。2基本操作其基本操作有:查找、插入和删除,当然删除操作比较少见。我在这里只是实现了对整个树的删除操作,至于单个word的删除操作也很简单。3实现方法搜索字典项目的
2013-11-24 14:34:36
1082
原创 数据挖掘 fp-growth 算法 频繁模式挖掘
class treeNode: def __init__(self, nameValue, numOccur, parentNode): self.name = nameValue self.count = numOccur self.nodeLink = None self.parent = parentNode
2013-11-10 21:30:47
3194
原创 分类
// new_keyword_extract1.0.cpp : 定义控制台应用程序的入口点。//#include "stdafx.h"//boost库的静态链接问题//#include #include #include #include #include #include #include #include
2013-11-04 21:33:49
830
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人