- 博客(108)
- 资源 (3)
- 收藏
- 关注
转载 c++ move关键字
终于写完了。这篇文章断断续续写了三周,期间也查了大量的资料。但毕竟是基于自己的理解,毕竟有理解不到位的地方,可以留言或者加好友,直接沟通。好了,今天的文章就到这,我们下期见!
2023-08-14 20:46:48
151
转载 一段很简单的搜索引擎代码
# -*- coding: utf-8 -*-"""Created on Fri Aug 18 15:58:13 2017@author: JClian"""import reimport bs4import urllib.requestfrom bs4 import BeautifulSoupimport urllib.parseimport syssearch_ite...
2019-01-07 22:02:44
1579
1
转载 朴素贝叶斯模型下的新闻分类
贝叶斯理论简单回顾在我们有一大堆样本(包含特征和类别)的时候,我们非常容易通过统计得到 p(特征|类别) .大家又都很熟悉下述公式:p(x)p(y|x)=p(y)p(x|y) 所以做一个小小的变换p(特征)p(类别|特征)=p(类别)p(特征|类别) p(类别|特征)=p(类别)p(特征|类别)p(特征) 独立假设看起来很简单,但实际上,你的特征可能是很多维的p(...
2018-11-25 22:47:04
934
原创 gensim源码分析
# -*- coding:utf-8 -*-from collections import Mapping, defaultdictimport sysimport loggingimport itertoolsimport jiebaimport jsonfrom gensim import utilsfrom six import PY3, iteritems, ite...
2018-11-22 20:04:27
699
转载 一段比较好的生成自动摘要代码
#!/user/bin/python# coding:utf-8import nltkimport numpyimport jiebaimport codecsimport osclass SummaryTxt: def __init__(self,stopwordspath): # 单词数量 self.N = 100 #...
2018-10-12 16:07:03
3178
转载 HMM与分词、词性标注、命名实体识别
HMM(隐马尔可夫模型)是用来描述隐含未知参数的统计模型,举一个经典的例子:一个东京的朋友每天根据天气{下雨,天晴}决定当天的活动{公园散步,购物,清理房间}中的一种,我每天只能在twitter上看到她发的推“啊,我前天公园散步、昨天购物、今天清理房间了!”,那么我可以根据她发的推特推断东京这三天的天气。在这个例子里,显状态是活动,隐状态是天气。2014年11月23日更新:我已利用HMM...
2018-09-22 21:42:40
721
转载 logistic回归
最近感觉时间越来越宝贵,越来越不够用。不过还是抽空看了点书,然后整理到博客来。加快点节奏,废话少说。Keep calm & carry on.-------------------------------------------------------------------------------------这次要介绍的内容是Logistic Regression(LR,...
2018-09-16 23:32:38
382
原创 遍历文件目录并上传服务器
工作中用到这一点,当时赶时间,直接写死的文件路径,上传后得到fileid,其实这样就不太好了,如果今后有了业务变化,就要不断的该,修改后的通用代码如下调用格式如下,cluster代表集群名称,index代表主页面,attachment代表附属目录put_file_msg.py --cluster 集群名称 --title "" --index index1.html --attachment...
2018-05-24 11:24:49
914
转载 python入门(@property,@*.setter)
@property可以将python定义的函数“当做”属性访问,从而提供更加友好访问方式,但是有时候setter/deleter也是需要的。1、只有@property表示只读。2、同时有@property和@*.setter表示可读可写。3、同时有@property和@*.setter和@*.deleter表示可读可写可删除。代码:[python] view plain copy 1 #codin...
2018-04-24 14:10:39
663
转载 mongodb 添加用户报错TypeError:db.addUser is not a function (mongodb3.4.1)
1:问题如下:原因是 新版的MongoDB已经不支持addUser方法了。 改成createUser了。 使用方法如下 2:具体解释一下db.createUser()方法的用法定义:创建一个数据库新用户用db.createUser()方法,如果用户存在则返回一个用户重复错误。语法:db.createUser(user, writeConcern) user这个文档创建关于用户的身份认证和访问...
2018-04-18 21:05:38
930
转载 内存管理之伙伴算法
通常情况下,一个高级操作系统必须要给进程提供基本的、能够在任意时刻申请和释放任意大小内存的功能,就像malloc 函数那样,然而,实现malloc 函数并不简单,由于进程申请内存的大小是任意的,如果操作系统对malloc 函数的实现方法不对,将直接导致一个不可避免的问题,那就是内存碎片。内存碎片就是内存被分割成很小很小的一些块,这些块虽然是空闲的,但是却小到无法使用。随着申请和释放次数的增加,内存...
2018-03-24 22:54:49
852
转载 Mysql数据库表分区深入详解
0、mysql数据库分区的由来?1)传统不分区数据库痛点mysql数据库中的数据是以文件的形势存在磁盘上的,默认放在/mysql/data下面(可以通过my.cnf中的datadir来查看), 一张表主要对应着三个文件,一个是frm存放表结构的,一个是myd存放表数据的,一个是myi存表索引的。[root@laoyang test]# ls -al总用量 1811444drwx------ 2...
2018-03-23 11:27:32
247
转载 CodeBlocks链接时报未找到错误 undefined reference to
编写带有头文件的类和其实现分别放在不同的文件中,在VC++中正常编译链接执行, 而在CodeBlocks中出现如下错误: ||=== xz, Debug ===| obj\Debug\main.o||In function main':| F:\demo\CodeBlocks\xz\main.cpp|7|undefined reference toLinkedList::LinkedList()’...
2018-03-23 10:08:28
494
转载 一个比较经典的生产者消费者模型(Linux C++实现)
学习了几天Linux多线程,大多是看的别人的博客,并试着写了个小例子,现在也把学到的一些东西记录下来,供以后查阅,属于初级入门的范围,望共勉。 进程是系统中程序执行和分配资源的基本单位,每个进程都有自己独立的数据段,代码段和堆栈段。而线程是系统中独立运行的最小单位,可以说操作系统分配CPU时间的最小单位,可以叫轻型的进程。一个进程可以有多个线程,在多进程情况下,每个进程都有着自己的地址空间,消...
2018-03-22 12:47:41
6959
转载 Redis内存回收:LRU算法
http://www.cnblogs.com/WJ5888/p/4371647.htmlRedis:https://github.com/zwjlpeng/Redis_Deep_ReadRedis中采用两种算法进行内存回收,引用计数算法以及LRU算法,在操作系统内存管理一节中,我们都学习过LRU算法(最近最久未使用算法),那么什么是LRU算法呢LRU算法作为内存管理的一种有效算法,其含义是在内存有...
2018-03-21 23:15:00
634
转载 mysql索引的使用及优化方法
MySQL性能优化优化MySQL数据库是数据库管理员和数据库开发人员的必备技能。优化MySQL,一方面是找出系统的瓶颈,提高MySQL数据库整体的性能;另一方面是合理设计结构和调整参数,以提高用户操作响应的速度。同时还要尽可能节省系统资源,以便系统可以提供更大负荷的服务。MySQL数据库优化是多方面的,原则是减少系统的瓶颈,减少资源的占用,提高系统的反应速度。例如,通过优化文件系统,提高磁盘的读写...
2018-03-19 10:41:05
1281
原创 字典树与模糊搜索
字典树是一种存储字符串的树形结构,假设有如下场景,给出一堆字符串,然后让你求出以某个字符串为前缀的字符串的个数比如给你abcd,abce,然后让你求以abc为前缀的字符串的个数 代码如下:#include <iostream>#include <string>using namespace std;typedef struct _Node{ int ...
2018-02-23 17:27:10
1092
原创 条件变量的if与while
此文是linux c++的一个程序,该程序要求是给定一个缓冲区,一个生产者,一个消费者,然后要求使用条件变量,互斥量来解决读写问题,其中有个重要的知识点就是,使用信号量的时候,如何保证线程安全,如果有一个生产者,多个消费者,这种情况下,条件变量wait地方就应该使用while,而非if,如果是单生产单消费,则可以用if。具体解释见代码注释/* ex7-4.c */#include
2018-01-23 17:13:41
1469
原创 搭建thrift的几个jar包
https://wenku.baidu.com/view/55ddd03af46527d3240ce084.html
2017-11-29 19:42:11
1383
转载 C++中智能指针的设计和使用
转载请标明出处,原文地址:http://blog.youkuaiyun.com/hackbuteer1/article/details/7561235 智能指针(smart pointer)是存储指向动态分配(堆)对象指针的类,用于生存期控制,能够确保自动正确的销毁动态分配的对象,防止内存泄露。它的一种通用实现技术是使用引用计数(reference count)。智能指针类将一个计数器与类指向的对
2017-03-19 14:56:18
510
原创 遗传算法求解二元函数极值源码
网上看到了一个比较不错的讲解遗传算法的帖子,链接如下http://blog.youkuaiyun.com/b2b160/article/details/4680853但是却没有贴源代码,正好最近闲来无事,就尝试写了下代码实现,测试了几次,寻优结果都能达到了二元函数最大值98,如下所示#include #include #include #include #include #inclu
2016-11-20 15:04:42
8865
转载 孤儿进程和僵尸进程
1、前言 之前在看《unix环境高级编程》第八章进程时候,提到孤儿进程和僵尸进程,一直对这两个概念比较模糊。今天被人问到什么是孤儿进程和僵尸进程,会带来什么问题,怎么解决,我只停留在概念上面,没有深入,倍感惭愧。晚上回来google了一下,再次参考APUE,认真总结一下,加深理解。2、基本概念 我们知道在unix/linux中,正常情况下,子进程是通过父进程创建的,子进
2016-07-18 17:43:11
376
原创 windows内核情景分析读书笔记-----HYPERSPACE
主要介绍HYPERSPACE的创建映射函数赏光看我这一系列文章的朋友最好结合毛德操老师的书来看,具体的细节我这里就不阐述了简单说下这个函数功能Windows内核有时候需要把某些物理页面临时映射到内核的虚存空间,用做临时的用途#define HYPERSPACE (Ke386Pae?0x c080 0000:0x c040 0000)区间大小为0x0040 0000 也就是
2016-04-06 23:10:36
1241
原创 windows内核情景分析笔记---虚存向物理页面的映射
既然懂了虚存和物理存储的管理,下面谈谈虚存向物理存储的映射首先看第一个函数NTSTATUSNTAPIMmCreateVirtualMapping(PEPROCESS Process, PVOID Address, ULONG flProtect,
2016-04-04 14:00:25
1674
原创 windows内核情景分析笔记------内核对于物理页面的管理
内核中有四个物理页面队列static LIST_ENTRY FreeZeroedPageListHeads;static LIST_ENTRY FreeUnzeroedPageListHeads;static LIST_ENTRY BiosPageListHeads;static LIST_ENTRY UsedPageListHeads[MC_MAXIMUM];MC_MAXIM
2016-03-31 23:02:33
806
转载 <学习笔记>Windows驱动开发技术详解__Windows内存管理
作为开发Windows驱动程序的程序员,需要比普通程序员更多了解Windows内部的内存管理机制,并在驱动程序中有效地使用内存。在驱动程序的编写中,分配和管理内存不能使用熟知的Win32 API函数,取而代之的是DDK提供的高效内核函数。C语言和C++中大多数关于内存操作的运行时函数,大多在内核模式下是无法使用的。例如,C语言中的malloc函数和C++中的new操作符等。 内存管
2016-03-31 20:29:00
929
转载 白话粒子群算法
简介 上次在自话遗传算法中提到后期会写两篇关于粒子群算法和蚁群算法的博文,所以这次给大家带来的是我对粒子群的一些理解,并附带一个相当简单的实例去描述这个算法,我会尽力通俗易懂的把整个算法描述一遍,其实粒子群算法的思想也挺简单的,希望我不要反而写复杂了,下面同样引用百度百科的摘要结束简介部分。 粒子群优化算法(PSO)是一种进化计算技术(evolutionary comp
2016-02-27 16:48:21
1233
转载 判断一个树是否是另外一个树的子树
很简单,假如说判断B是否为A的一个子树,则首先对A进行遍历,然后如果遍历时候节点的值等于B的根节点,则进入判断函数进行判断,如果完全一样,则该函数返回true,否则返回false,在后面递归判断时候,要判断前面函数返回的是true还是false,如果是true,则它的子树就不用再判断了,直接返回那个bool值,如果是false,则要对后面的左右子树依旧进行判断。接下来讨论那个比较两棵树的函数,
2016-02-18 00:01:47
1586
转载 合并两个顺序链表
使用递归#include using namespace std;typedef struct _Node{ int data; struct _Node *next;}Node,*PNode;PNode BuildList(){ int data; int i=0; PNode head,p,pfront; cin>>data; w
2016-02-17 15:55:08
510
转载 打印1到最大的n位数
#include using namespace std;#define MAXSIZE 10010 char arr[MAXSIZE]; bool Increse(int n) { int i; bool overflow=false; bool takeover=false; for(i=n-1;i>=0;i--) { int num=arr
2016-02-17 12:11:45
396
转载 数值的整数次方
计算的时候,如果指数是负数,则先计算他的正数,然后求结果,再最后求这个结果的倒数,就是最终答案考虑一个特殊情况,那就是如果底数是0,指数是负数,这样按照上面办法的话,最后一步,分母会变成0,这样是非法的代码如下#include using namespace std;bool gInvalid=false;double PowWithUnsignedExponent(double
2016-02-14 23:33:38
336
转载 寻找旋转有序数组的最小值
#include using namespace std;int a[]={3,4,5,0,2};//原数组为0 2 3 4 5,旋转后就成了这个int Partition(int start,int end){ swap(a[7],a[end]); int i; int record=a[end]; int leftregion=start; for(i=start;i<end
2016-01-29 14:25:19
542
转载 两个栈模拟队列
删除元素: stack2为空,这时候,元素都压入了栈1,我们要删除元素,肯定是删除栈底的元素,这时候把1的元素全部压入栈2,然后2的顶部就是1的栈底,然后我们就可以移除栈2顶部元素了 如果stack2不为空,则直接删除栈顶元素插入元素: 元素直接插入栈1即可#include #include using namespace std;template c
2016-01-28 15:48:39
355
转载 N!结尾0的个数
求末尾0的个数:至于末尾有多少个0,这个简单,0的个数为(其中的“/”是取整除法):例子:(1000的阶乘末尾0的个数) 1000 / 5 + 1000 / 25 + 1000 / 125 + 1000 / 625 = 200 + 40 + 8 + 1 =
2016-01-24 12:24:45
596
转载 数组的区间调整
给定一个数组,比如{1,2,2,2,3,3,4,5,6,6,7,7,8,8,8,9};要求进行区间调整,该数组为有序数组,令左半部分为增序,右半部分可以无序比如这个数组,排序后左半部分就是 1 2 3 4 5 6 7 8 9,右半部分则是否增序无所谓。 思路: 设置两个变量 u 和i u初始为0 i初始为1 我们假定a【0】到a【u】为左半区间,a【u+1】到a【i】
2016-01-23 19:38:13
1038
转载 数组中子数组的最大累乘积
这个思路其实和计算数组的大于k的最长子数组长度一样的,先求的所有以a[i]为结尾的最大累乘积的子数组,a【i】从a[0]变化到a[N-1] 在分析以a【i】为结尾的子数组时候,有三种情况 比如数组 3 4 5,a【i】为5,这时候,a[i]前面的子数组中的最大累乘积,12,乘以5,也就是60,所以这是max*a[i] 如果是数组 -3 4 -5,a[i]为-5,这时候,-3*
2016-01-23 15:30:51
1013
转载 最大子矩阵
意思很简单,求矩阵里的最大子矩阵 比如 -90 48 78 64 -40 64 -81 -7 66最大子矩阵就是第二列 第三列,和为209我们可以根据数组中求最大和的方法,从左到右遍历,找累加和,如果累加和小于0,则sum归于0,然后重新累加,并且维持一个max这个矩阵也是,双重循环,进行矩阵遍历,并且建立辅助累加和数组,数组中求
2016-01-22 22:09:41
364
转载 自然数组的排序
题目描述: 给定一个长度为N的数组,其中有N个互相不等的自然数,1-N,请实现排序,不要把数组依次赋值为1-N 要求时间复杂度O(n),空间复杂度O(1) 分析: 有数组{1,2,5,3,4} 两个办法 1 遍历到1,2时候,是没问题的,遍历到5的时候,发现3位置竟然不是3,是5,于是我们就找位置为5的元素,发现是4,于是就把5付给4,这样呢,5位置就是正
2016-01-22 01:00:38
863
转载 未排序数组中累加和小于给定值的最长子数组长度
本体和本博客里另外一个文章,累加和等于给定值的最长子数组,非常类似,但是上一个题目来说,为了节省时间,使用了哈希表,但是那个题目是,等于,所以哈希表里有,就直接拿,没有,就跳过了,但是本题目是要求,小于或者等于,没办法直接查找,难道要遍历哈希表吗,这样时间复杂度又上去了,所以这里给出了一个新的数组,用作辅助 一定要找到他俩的共同点,都是求所有的以a【i】为结尾的数组中,累加和小于给定值的
2016-01-21 23:40:57
1559
thrift要引入的四个jar包
2017-11-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人