- 博客(36)
- 资源 (4)
- 收藏
- 关注
原创 名词解释
站点本地性(http):初始化了对某服务器HTTP请求的应用程序很可能会在不久的将来对那台服务器发起更多的请求幂等:在编程中一个幂等操作的特点是其任意多次执行所产生的影响均与一次执行的影响相同。(http的get、delete、put是幂等的,post是非幂等的)
2017-10-18 14:04:38
690
原创 http协议
1.uri(统一资源标识符):url(统一资源定位符)、urn(统一资源名)url语法:://:@:/;?#方案 用户名密码 主机 端口 路径 参数 查询 片段
2017-10-16 18:32:25
502
原创 正则表达式
1.正则表达式组成单位1.1原子普通字符:如a~z、A~Z、0~9一些特殊字符和元字符:\"、\*、\+等非打印字符:如\t、\n、\r、\f通用字符类型:\d、\D、\s、\S、\w、\W使用[]自定义原子表:如[aeiou]1.2元字符限定符:*、+、?、{n}、{n,}、{n,m}边界限制:^(或\A)、$(或\Z)句点(.):模式选择符( | ):匹配多
2017-09-20 20:27:49
524
原创 PHP 知识点
常见的魔术方法 void __set(string name, mixed value):为私有属性赋值时自动调用 mixed __get(string name):获取私有属性的值自动调用 bool __isset(string name):测定私有属性是否存在时,由isset()自动调用 void __unset(string name):删除私有属性时
2017-09-09 16:37:50
318
原创 Java笔记
一.Java存储区寄存器堆栈堆常量存储非RAM存储二.在构造器中调用构造器在构造器中可以用this调用另一个构造器,但不能调用两个,且构造器调用必须位于起始处。三.名称屏蔽如果Java的基类拥有某个已被多次重载的方法名称,那么在导出类中重新定义该方法名称并不会屏蔽其在基类中的任何版本。四.其它1.protect具有包内访问权限2.类中所有的p
2017-07-11 16:23:36
324
原创 Hadoop之HDFS工作原理
HDFS特点HDFS(Hadoop Distributed File System )Hadoop分布式文件系统。HDFS有如下特点:保存多个副本,且提供容错机制,副本丢失或宕机自动恢复。默认存3份。运行在廉价的机器上。适合大数据的处理。HDFS默认会将文件分割成block,64M为1个block。然后将block按键值对存储在HDFS上,并将键值对的映射存到内存中。如果小
2017-06-20 14:19:41
831
原创 深度学习概述
1.特征表示(图1)如图1(参考[理学和计算机的手段研究视觉问题(1995,Bruno Olshausen和 David Field)])所示,图片特征的提取过程可以如下:收集黑白照片->提取400个小碎片Si->随机提取另一个碎片->目标:Si合成T。过程如下1)选择一组 S[k],然后调整 a[k],使得Sum_k (a[k] * S[k]) 最接近 T。2)固定住 a
2017-06-06 10:06:54
531
原创 shell知识点
1.标准输出输入及标准错误输出0表示标准输入,1表示标准输出,2表示标准错误输出>默认为标准输出重定向,与 1> 相同2>&1 把标准错误输出重定向到标准输出&>file 把标准输出和标准错误输出都重定向到文件file中2. shell变量$#,$@,$0,$1,$2的含义解释$$ : Shell本身的PID(ProcessID) $! : Shell最后运行的
2017-05-24 19:35:59
288
原创 Python知识点
1.基础_xxx 不能用’from module import *’导入__xxx__ 系统定义名字__xxx 类中的私有变量名核心风格:避免用下划线作为变量名的开始“单下划线” 开始的成员变量叫做保护变量,意思是只有类对象和子类对象自
2017-05-23 11:15:50
516
原创 工作tips
linux:1.设置定时任务:crontab -e2.发送邮件:mail -s "test" user@sohu.com <content.txt 其中-s后面的是邮件标题,user@sohu.com是收件人地址,content.txt里面是邮件正文3.发送带附件邮件:echo "this is content" | mutt -s "this is subject" -a /p...
2015-06-11 18:36:40
821
原创 图像特征提取方法:Bag-of-words
Bag-of-words简介最最初的Bag-of-words ,也叫做“词袋”,在信息检索中,Bag-of-words model假定对于一个文本,忽略其词序和语法,句法,将其仅仅看做是一个词集合,或者说是词的一个组合,文本中每个词的出现都是独立的,不依赖于其他词是否出现。应用于文本的BoW简单实例John likes to watch movies. Mary likes t
2014-07-20 20:35:20
4220
原创 Java:子类调用超类方法的一种特殊情况
在Java的子类中,可以通过super来明确调用超类(也即父类)的方法。但当所调用的超类的方法(1)中又调用了其它的方法(2)时,由于Java默认动态绑定,所以方法(2)调用的是子类中的方法。如下,示例(1)是一般的子类调用超类方法(即所调用的超类中的方法不再调用其它的需要动态绑定的方法),示例(2)是特殊的子类调用超类方法。示例(1):package MyTest;import jav
2014-05-05 10:02:56
3742
1
原创 Java与C++的差异
在Java中,整形的范围与运行Java代码的机器无关 | C和C++程序需要针对不同的处理器选择最为有效的整型Java没有任何无符号类型Java不使用逗号运算符,但可以在for语句中使用逗号分隔表达式String类型没有提供用于修改字符串的方法,但可以重新替换赋值Java的String类没有重载==运算符,可以使用Java的compareTo方法 | C++的string类重载了==运算符,C可以
2014-05-01 19:14:20
628
原创 DLL头文件与源文件的基本编写格式
****************************************Module:Mylib.h****************************************#ifdef MYLIBAPI//MYLIBAPI应该在所有的DLL源文件包含Mylib.h之前定义//此时所有的由MYLIBAPI前缀定义的函数、C++类或变量将定义为导出
2014-03-17 10:56:09
2562
原创 线程同步
用户模式下的线程同步:1.线程同步机制:Volatile,InterLocked,关键段,SRWLock(共享模式、独占模式),互斥量。2.使用旋转锁时(spinlock)是,必须确保锁变量和锁所保护的数据位于不同的高速缓存中。如果锁变量和数据共享同一高速缓存行,那么使用资源的CPU就会与任何试图访问资源的CPU发生争夺,而这会影响性能。3.使用锁的几个技巧:1)以原子方式操作一组对象
2014-02-22 20:48:42
707
原创 进程、线程调度、优先级与关联性
1.载入线程上下文、让线程运行、保存上下文并重复的操作在系统启动的时候就开始,然后这样的操作会不断重复,直至系统关闭。2.一个线程实际上有两个上下文:用户模式和内核模式。GetThreadContext只能返回线程的用户模式上下文,调用该函数前应该先调用SuspendThread,否则,系统可能正好获得调度此线程,这样一来,线程的上下文与所获取的信息就不一致了。3.动态优先级范围:系统只提
2014-02-20 22:07:23
1231
转载 堆和栈的区别 (转贴)
堆和栈的区别一、预备知识—程序的内存分配一个由c/C++编译的程序占用的内存分为以下几个部分1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。2、堆区(heap) — 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表,呵呵。3、全局区(静态
2014-02-20 19:12:19
702
原创 不完全总结
二十几个春秋,远远的走了,又似乎在眼前。虽然并不想过多的回首,但我又怎能让你静悄悄地就走了呢!鉴于过往,成于未来。本命年之际,以此总结交自己一份答卷,作未来之参考。我之自由初见: “时间限制了我们,习惯限制了我们,谣言般的舆论让我们陷入实际,让我们在白昼的魔法中闭目塞听不敢妄为。白昼是一种魔法,一种符咒,让僵死的规则畅行无阻,让实际消磨掉神奇。所有的人都在白昼的魔法之下演着
2014-02-17 11:32:39
753
原创 支持向量机(SVM)推导过程
支持向量机将向量映射到一个高维的空间中,并在这个高维空间中建立一个最大间隔超平面,使得观察到的数据能够根据其类别最好地划分开。分布在分类超平面的间隔区边缘的样本点即为支持向量机所对应的支持向量。
2013-12-30 20:50:52
2190
原创 matlab做实验时,节省计算时间的办法
在matlab下做实验时,尽量使用matlab自带的矩阵或向量运算,这样可以极大的节省计算时间。特别是在处理文本数据是(几万维的数据),用矩阵或向量运算代替循环运算,效果非常明显,如下面的两个例子所示:L1:用 DocumentFrequence 计算一个词在同类文章中的重要性:【一个词在同类文章中的重要性】=【该词在该类文章中出现的次数】/【该类文章总
2013-12-22 16:39:37
1884
原创 文本分析中使用isalpha出现的问题
最近,在做文本分析时,使用isalpha()或isupper()等(,win7,VS2012)函数来判断一个字符是不是英文字母时,偶尔出错(File:f:\dd\vctools\crt_bld\self_x86\crt\src\isctype.c),如下图所示:在网上找了半天,也没找到解决的办法。如是换了一种方法来做字母判断:#define LETTER(ch) ((ch>65&&ch97
2013-12-10 19:13:41
1492
原创 主线程的入口点函数(_tmain,_tWinMain )
C++(VS2012)中主要线程的入口点函数有四种:处理ANSI字符和字符串的CUI应用程序:_tmain "tchar.h"中的定义:#define _tmain main处理Unicode字符和字符串的CUI应用程序:_tmain "tchar.h"中的定义:#define _tmain wmain
2013-12-08 21:22:01
1953
原创 将进程加入一个作业中所涉及的几个函数(C++)
HANDLE CreateJobObject( LPSECURITY_ATTRIBUTES lpJobAttributes, // SD LPCTSTR lpName // job name ); //创建一个作业对象 BOOL SetInform
2013-11-30 21:51:16
823
原创 KL距离
约定 0*log(0/q(x))=0;p(x)*log(p(x)/0)=infinity;用KL距离可以判断两个数据集或者分布的相似程度
2013-11-24 15:30:46
1205
原创 LSA学习笔记
1.LSA简介 LSA(latent semantic analysis)潜在语义分析,也被称为LSI(latent semantic index),是Scott Deerwester, Susan T. Dumais 等人在1990 年提出来的一种新的索引和检索方法。该方法和传统向量空间模型(vector space model)一样使用向量来表示词(terms)和文档(doc
2013-11-23 16:53:41
1778
转载 矩阵的内涵! 对于逆矩阵的物理含义有帮助!
如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,这就带来了教学上的困难。”* 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二
2013-11-20 19:23:29
7829
8
转载 LDA整体流程
LDA整体流程先定义一些字母的含义:文档集合D,topic集合TD中每个文档d看作一个单词序列,wi表示第i个单词,设d有n个单词。(LDA里面称之为word bag,实际上每个单词的出现位置对LDA算法无影响)D中涉及的所有不同单词组成一个大集合VOCABULARY(简称VOC)LDA以文档集合D作为输入(会有切词,去停用词,取词干等常见的预处理,略去不表),希望训练出的两个结果
2013-11-19 14:35:12
2167
原创 与进程的环境变量相关的函数
GetEnvironmentStrings 获取完整的环境块GetEnvironmentVariable 获取一个环境变量值ExpandEnvironmentStrings 替换环境字符串SetEnvironmentVariable 添加、删除、修改一个变量的值
2013-11-17 21:30:50
571
原创 PCTSTR与PTSTR
VC2012中PCTSTR与PTSTR分别定义如下typedef LPCWSTR PCTSTR, LPCTSTR;typedef _Null_terminated_ CONST WCHAR *LPCWSTR, *PCWSTR;typedef wchar_t WCHAR; typedef LPWSTR PTSTR, LPTSTR;typedef _Null_terminate
2013-11-17 20:26:01
3820
转载 EM算法的通俗理解
EM算法,即最大期望算法,分为两个步骤:E步骤:估计未知参数的期望值,给出当前的参数估计。M步骤:重新估计分布参数,以使得数据的似然性最大,给出未知变量的期望估计。可以有一些比较形象的比喻说法把这个算法讲清楚。比如说食堂的大师傅炒了一份菜,要等分成两份给两个人吃,显然没有必要拿来天平一点一点的精确的去称分量,最简单的办法是先随意的把菜分到两个碗中,然后观察是否一样多,把比较多的那一份取
2013-11-13 10:23:22
1186
原创 DuplicateHandle的应用
假设一个进程拥有对一个文件映射对象的读写权限,在程序中的某个位置,我们要调用一个函数,并希望它对文件映射对象进行只读访问。为了使应用程序变得更健壮,可以使用DuplicateHandle为现有的对象创建一个新句柄,并确保这个新句柄有只读权限。然后,把这个只读句柄传给函数。采取这种方式,函数中的代码绝对不会对文件映射对象执行意外的写入操作。代码示例如下:int WINAPI _tWinMain(
2013-11-09 21:15:02
1459
转载 头文件string与string.h的区别
在C++中,#include与#include的区别,前者要使用更新的编译器(其实大部分编译器多比较前卫了,出了有些搞嵌入式的用变态的编译器)。喔,原来iostream是C++的头文件,iostream.h是C的头文件,即标准的C++头文件没有.h扩展名,将以前的C的头文件转化为C++的头文件后,有时加上c的前缀表示来自于c,例如cmath就是由math.h变来的。using namesp
2013-09-24 20:53:07
736
转载 DLL入门浅析(1)——如何建立DLL
动态链接库(DLL)是从C语言函数库和Pascal库单元的概念发展而来的。所有的C语言标准库函数都存放在某一函数库中。在链接应用程序的过程中,链接器从库文件中拷贝程序调用的函数代码,并把这些函数代码添加到可执行文件中。这种方法同只把函数储存在已编译的OBJ文件中相比更有利于代码的重用。但随着Windows这样的多任务环境的出现,函数库的方法显得过于累赘。如果为了完成屏幕输出、消息处理、内存管理、对
2013-09-24 20:27:49
672
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人