- 博客(194)
- 资源 (138)
- 收藏
- 关注
原创 Python Tkinter+py2exe
最近写小工具,用了pyhon的Tkinter,mark一下,省的到处去找。。。第一波:标签Label,文本框Entry,按钮Button,Text文本域#coding:utf-8from Tkinter import *root = Tk() #创建主窗口label = Label(master=root,text="这是一个标签")label.grid(row=0,c
2015-11-05 23:31:52
2651
原创 R语言igraph作社团挖掘结果图
利用R语言的igraph作社团挖掘的图输入:网络拓扑文件(边);社区划分结果文件(顶点 社区号)输出:社区划分的结果图代码:######测试代码######if(T){ library(igraph) library(grDevices) rm(list=ls()) network=read.csv("./dataset/data/karate.txt",sep
2015-01-15 11:23:05
9855
2
原创 内存配置器
stl中内存配置器分为两级:第一级配置对象超过128B的内存,第二级配置对象小于128B的内存,stl默认采用第二级内存配置器,因为如果对象大于128B,则第二级内存配置器会自动调用第一级内存配置器。 重新整理了《STL源码剖析》上的代码注释,如下:#include#include#include#include#include#include#include#inclu
2014-08-01 23:54:46
1719
原创 GraphX笔记
val graph=GraphLoader.edgeListFile(sc,"/home/spark/spark/graphx/data/followers.txt")//加载边时顶点是边上出现的点,定点默认数据是1val users = sc.textFile("/home/spark/spark/graphx/data/users.txt").map { line=> val field
2014-08-01 20:11:26
2741
原创 spark报错java.lang.OutOfMemoryError: Java heap space
spark报错:java.lang.OutOfMemoryError: Java heap space解决飞
2014-08-01 20:08:36
28469
原创 reserve和resize
void reserve (size_type n);Request a change in capacityRequests that the vector capacity be at least enough to contain n elements.If n is greater than the current vector capacity, the func
2014-08-01 20:07:40
1416
原创 Ubuntu 12.04 64位安装qq2013
1 sudo apt-get install ia32-libs2 下载longene qq2013包,地址:
2014-07-28 10:31:35
1205
原创 第一个GraphX程序
程序功能:收集顶点指向的邻居中所在地/* * 找出每个顶点所指向的邻居中所在的地区 */import org.apache.spark.SparkContextimport org.apache.spark.SparkContext._import org.apache.spark.SparkConfimport scala.collection.mutable.Mapimpor
2014-07-16 14:03:44
3727
1
原创 GraphX编译报错
[error] /home/spark/spark/apps/sina/src/main/scala/test.scala:6: object graphx is not a member of package org.apache.spark[error] import org.apache.spark.graphx._[error] ^
2014-07-16 11:33:43
4608
原创 spark的独立模式集群部署
spark有三种集群部署方式:1、独立部署模式standalone,spark自身有一套完整的资源管理方式2、架构于hadoop之上的spark集群3、架构于mesos之上的spark集群 尝试了下搭建第一种独立部署模式集群,将安装方式记录如下:环境ubuntu 12.04 (两台),部署方式是和hadoop类似,先在一台机器上部署成功后直接将文件打包拷贝到其他机
2014-07-08 20:09:12
3033
翻译 Copy constructor拷贝构造函数
翻译的是wikipedia关于copy constructor,地址:http://en.wikipedia.org/wiki/Copy_constructor
2014-07-03 14:12:09
2600
原创 python scikit-learn计算tf-idf词语权重
python的scikit-learn包下有计算tf-idf的api,研究了下做个笔记1 安装scikit-learn包sudo pip install scikit-learn2 中文分词采用的jieba分词,安装jieba分词包sudo pip install jieba3 关于jieba分词的使用非常简单,参考这里,关键的语句就是(这里简单试水,不追求效
2014-06-16 12:55:54
71723
5
原创 Python调用微博API
上面叫通过微博ID获取用户发布过的历史微博内容,于是研究了下新浪微博提供的API 1 首先在微博开放中心下“创建应用”创建一个应用,应用信息那些随便填,填写完毕后,不需要提交审核,需要的只是那个app-key和app-secret 2 在“微博开放平台”的“管理中心”找到刚才创建的应用,点开这个应用,点开左边“应用信息”栏,会看见“App key”和“App Secret”的字样,
2014-06-11 12:53:13
3910
1
原创 C++内存分配new
new表达式在内存生存周期内创建并初始化对象(两阶段:1、调用operator new创建内存,2、调用构造函数构造对象)也就是说,动态创建的对象其生命周期可能超出其创建的作用域。new的语法为: ::(optional) new (placement_params)(optional) (type) initializer(optional) // 1) ::(opti
2014-05-23 14:09:31
3828
原创 Dpark的安装测试
dpakr是豆瓣克隆的spark的高效分布式框架,安装测试了下,做个笔记1 下载:git clone https://github.com/douban/dpark.git 2 进入dpark目录运行:python setup.py install3 测试代码,使用蒙特卡洛模拟计算π值:#coding:utf-8import sysimport randomfrom dpar
2014-05-20 14:08:42
2534
原创 socketpair
int socketpair(int domain, int type, int protocol, int sockfd[2]); //创建未命名的全双工管道 domain只能为AF_UNIX,也就是限制在本地使用 type可以是SOCK_STREAM或SOCK_DGRAM,SOCK_STREAM相当于创建了双向流管道,管道的每一端都可以write或read,并且两端的数据流
2014-05-18 16:54:02
2848
原创 sigsuspend
int sigsuspend(const sigset_t *mask);//挂起进程直至信号发生man手册的解释: sigsuspend() temporarily replaces the signal mask of the calling process with the mask given by mask and then suspends the proces
2014-05-18 11:07:36
1698
原创 write的多进程/线程安全性
write系统调用将指定的内容写入文件中,但是当多个进程/线程同时write一个文件时是会出现写覆盖的情形。每个进程都有自己的缓冲区,write首先写入该缓冲区,系统flush后才将缓冲区内容写入文件,从而导致了多个进程之间的写操作是互不可见的,可能出现写覆盖。程序验证:#include#include#include#include#include#include#inc
2014-04-13 11:46:51
15657
原创 C++并发实战:面试题6:线程一次性同步
是否熟悉POSIX多线程编程技术?如熟悉,编写程序完成如下功能:1)有一int型全局变量g_Flag初始值为0;2) 在主线称中起动线程1,打印“this is thread1”,并将g_Flag设置为13) 在主线称中启动线程2,打印“this is thread2”,并将g_Flag设置为24) 线程序1需要在线程2退出后才能退出5) 主线程在检测到g_
2014-03-27 16:44:58
6791
原创 C++并发实战:面试题5:读者写者问题copy on write
读者写者问题这也是一个非常经典的多线程题目,题目大意如下:有一个写者很多读者,多个读者可以同时读文件,但写者在写文件时不允许有读者在读文件,同样有读者读时写者也不能写。这里采用copy on write(写时拷贝)实现,主要要理解智能指针std::shared_ptr的用法,用访问vector替代题目中的文件,代码如下:#include#include#
2014-03-27 14:51:59
6126
原创 C++并发实战:面试题4:生产者消费者试题blocking queue
生产者消费者问题这是一个非常经典的多线程题目,题目大意如下:有一个生产者在生产产品,这些产品将提供给若干个消费者去消费,为了使生产者和消费者能并发执行,在两者之间设置一个有多个缓冲区的缓冲池,生产者将它生产的产品放入一个缓冲区中,消费者可以从缓冲区中取走产品进行消费,所有生产者和消费者都是异步方式运行的,但它们必须保持同步,即不允许消费者到一个空的缓冲区中取产品,也不允许生产者向一个已经装
2014-03-27 13:19:15
6015
原创 C++并发实战:面试题3:一道google笔试题
题目:有四个线程1、2、3、4。线程1的功能就是输出1,线程2的功能就是输出2,以此类推.........现在有四个文件ABCD。初始都为空。现要让四个文件呈如下格式:A:1 2 3 4 1 2....B:2 3 4 1 2 3....C:3 4 1 2 3 4....D:4 1 2 3 4 1....c++11代码:#include#include#include
2014-03-25 22:27:12
5091
原创 C++并发实战:面试题2:一道迅雷笔试题
题目:编写一个程序,开启3个线程,这3个线程的ID分别为A、B、C,每个线程将自己的ID在屏幕上打印10遍,要求输出结果必须按ABC的顺序显示;如:ABCABC….依次递推。采用C++11实现:#include#include#include#includeusing namespace std;mutex m;condition_variable cond;int LO
2014-03-25 14:35:01
4930
原创 C++并发实战:面试题1:一道多线程笔试题
题目:子线程循环 10 次,接着主线程循环 100 次,接着又回到子线程循环 10 次,接着再回到主线程又循环 100 次,如此循环50次,试写出代码。#include#include#include#includeusing namespace std;mutex m;condition_variable cond;int flag=10;void fun(int num
2014-03-24 18:17:27
8845
2
原创 Python核心编程笔记
Python解释器从头到尾一行接一行执行脚本# -*- coding: UTF-8 -*- //字符编码不区分单引号和双引号,x=’hello’,x[0],x[-1]指最后一个字符,x[2:4]取子串,‘’’hello’’’ #hello三引号会保留文本输入时的换行符制表符等不需要转义,用于多行原样输入保存‘hello’+’world’ #字符串拼接,’hello’*2 #字
2014-03-19 14:14:49
2894
1
原创 nginx笔记:红黑树
看代码前请先通过这里下载一份wikipedia关于红黑树的介绍,我做了一些批注,结合上面的内容看nginx实现的红黑树要简单一些,不然直接看源码有点头痛。nginx实现的红黑树源码我做了一些注释,希望对您有点帮助:ngx_rbtree.h/* * Copyright (C) Igor Sysoev * Copyright (C) Nginx, Inc. */#ifndef
2014-03-17 23:55:31
4005
原创 gedit和vim中文支持
编辑~/.vimrc文件,加上如下几行: set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936 set termencoding=utf-8 set encoding=utf-8gedit支持中文,在终端下运行:gsettings set org.gnome.gedit.prefe
2014-03-09 09:08:39
1199
原创 机器学习实战笔记:KNN
1 KNN算法: 优点:精度高,对异常值不敏感,无数据输入假定 缺点:计算复杂度高,空间复杂度高 适用数据范围:数值型和标称型 算法原理:先给定训练集A,当一个测试集样本t,选择t与A中距离最近的k个训练样本(k通常不大于20),选择这些训练样本中出现次数最多的标签作为t的新标签。
2014-01-09 18:08:09
2896
原创 Python学习笔记(Ubuntu)
1 安装numpy: sudo apt-get install python-numpy2 退出:quit()3 numpy练习:from numpy import*random.rand(4,4)#生成一个数组randMat=mat(random.rand(4,4))#矩阵randMat.I#逆矩阵eye(4)#单位矩阵4 查看并改变工作目录import osos
2014-01-06 15:12:09
1722
原创 C++模板实战9:标签和策略类
1 在设计矩阵与矩阵相乘时后有三种情形:矩阵×矩阵,向量×矩阵,矩阵×向量。如果采用模板设计矩阵乘法并不能通过模板参数特化区分出三种情形,因为模板参数本身没有任何约束,导致无法区分重载。可以采用标签的方式分辨重载,标签是一个空类,其目的是为声明一种独特的类型用于分辨重载,不同的标签之间可以继承。在模板实例化时首先提取标签类型,根据标签类型调用具体的模板。实例如下:// 矩阵与向量标签stru
2014-01-03 21:41:19
1948
原创 C++模板实战8:矩阵乘法
矩阵乘法采用迭代器实现,矩阵采用行优先方式存储,其关键操作是“行×列”,该操作分成三部分:行由一个迭代器完成移动,列有一个列迭代器完成移动,乘法采用transform完成其中需要一个累加操作有累加迭代器完成1 矩阵乘法中涉及到行×列,若矩阵采用行优先方式存储,那么行的移动相对简单,列的移动相对复杂一点,针对列移动采用一个迭代器实现,如下:// 文件名:skip_iterator.hpp#
2014-01-03 15:39:35
2618
原创 C++模板实战7:标准库算法
标准库算法是函数模板,在这里列举部分库算法:1 搜索算法都是成功时返回第一个满足条件的位置,失败时返回末端迭代器。1) find(i,j,v)//搜索[i,j)中第一个等于val的位置2) find_if(i,j,pred)//搜索序列[i,j)中第一个使pred为true的元素位置3) find_if_not(i,j,pred)//搜索序列[i,j)中第一个使pred
2014-01-03 11:14:24
1592
原创 C++模板实战6:迭代器
1 迭代器的类型: 输入迭代器 、前向迭代器、双向迭代器、跳转迭代器以及输出迭代器。这五种迭代器的限制条件从左至右越来越强。2 输入迭代器需满足的条件:X u(a);X可复制构造u=a;可赋值u==a;可比较相等u!=a;可比较不相等*u;可去引用,且若有u==a,*u==*a
2014-01-02 17:26:31
2679
原创 C++模板实战5: 迭代器与容器
一份带有迭代器的双向链表实现:#include#include_Pragma ("once")template class List;templateclass Iterator{ public: using value_type=typename N::value_type; using reference_type=typename N::
2013-12-31 09:38:08
1351
ggplot2 -- Elegant Graphics for Data Analysis.PDF
2013-07-13
MySQL技术内幕Innodb存储引擎.xmind
2020-07-11
Desinging Data-Intensive Applications-2.xmind
2020-07-11
Desinging Data-Intensive Applications.xmind
2020-07-11
Machine Learning-A Probabilistic Perspective.pdf
2013-09-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人