- 博客(24)
- 资源 (19)
- 收藏
- 关注
原创 spark streaming 自定义kafka读取topic的offset(python)
使用createDirectStream 来自定义设置读取的offset。
2017-05-07 20:03:49
5135
1
原创 spark处理mongodb数据(python版)
mongodb是一种文档型数据库,作为一个适用于敏捷开发的数据库,mongodb的数据模式可以随着应用程序的发展而灵活地更新。但是mongodb适合一次查询的需求,对于统计、分析(尤其是在需要跨表、跨库的情况下)并不是太方便,我们可以用spark来处理mongodb数据。
2016-12-03 21:48:43
11347
原创 tungsten replicator 代码的修改
Tungsten Replicator是一种MySQL复制引擎,支持跨数据库系统的复制,可以把mysql的数据同步到mongodb、oracle、hdfs等。我主要用tungsten replicator同步数据到mongodb,在使用的过程中遇到一些问题,根据这些问题对代码进行了修改。
2016-11-26 12:24:13
1472
原创 tungsten-replicator问题与解决方法
最近使用tungsten-replicator同步mysql的数据到mongodb,期间遇到不少错误,记录一下解决方法。tungsten-replicator在执行tpm install时默认会打日志在/tmp/tungsten-configure.log,如果安装时出问题可以查看这个日志。
2016-07-14 21:46:19
2365
原创 百度实习面试
前段时间找实习,投了百度几个部门,最终终于收到录用的通知,总结一下面试题目。一、语言1、C++STL里map与hash_map的区别hash_map的用法和map是一样的,提供了 insert,size,count等操作,并且里面的元素也是以pair类型来存贮的。虽然对外部提供的函数和数据类型是一致的,但是其底层实现是完全不同的,map底层的数据结构是rb_tree而,hans
2014-11-16 13:21:44
1635
原创 Tesseract识别指定字符范围的字符
可以通过配置Tesseract来使用Tesseract进行OCR,opencv和opencv的C#版本Emgu都集成了Tesseract这个工具。但是在使用时经常会出现误判,比如把“s”识别成“5”,把“1”识别成“l”或“i”。可以设置相应的参数来识别指定范围的字符。
2014-09-22 16:26:23
18410
5
原创 LeetCode——Candy
题目:There are N children standing in a line. Each child is assigned a rating value.You are giving candies to these children subjected to the following requirements:Each child must have at lea
2014-09-17 20:30:38
1260
原创 刷机中遇到的问题解决方法及一些感悟
刷机中遇到的问题解决方法及一些感悟之前我基本上没用过安卓手机,更没刷过机,又加上我比较粗心的性格,刷了N天才刷好,耽误了几天的工作。就在刚才终于刷成功了,兴奋之情难以言表。期间遇到了各种问题,走了很多弯路,现在想想,有时候的做法和想法真是可笑,不过期间也感悟到一些道理。这里总结一下,也许你能用到。
2014-08-17 02:20:50
10044
原创 “无法启动程序,因为计算机中丢失MSVCP100D.dll”的解决方案
用VS2012安装OpenCV时出现这个错误,在网上搜索了很多解决方案,最终解决了问题。现在把这些解决方案汇总一下。方案一:下载MSVCP100D.dll1、复制文件“msvcr100d.dll”到系统目录下。2、系统目录一般为:C:\WINNT\System32 64位系统为C:\Windows\SysWOW64。3、最后点击开始菜单-->运行-->输入regsvr32
2014-07-22 23:25:28
32102
3
原创 图像处理——灰度化、二值化、膨胀算法、腐蚀算法以及开运算和闭运算
图像处理——灰度化、二值化、膨胀算法、腐蚀算法以及开运算和闭运算的的C#代码实现
2014-07-19 00:40:57
40577
1
原创 VS中生成、清理项目、调试、开始执行(不调试)、Debug 和 Release等之间的区别
VS中生成、清理项目、调试、开始执行(不调试)、Debug 和 Release等之间的区别
2014-06-29 18:57:42
6331
原创 LeetCode——Reverse Words in a String
#include #include #include using namespace std; void reverseWords(string &s) { vector vec; string rs; int start=0; int end=0; string temp; for(int i=0;i<s.siz
2014-06-19 10:00:12
881
原创 LeetCode——Max Points on a Line
#include //#include #include #include using namespace std;/** * Definition for a point. * struct Point { * int x; * int y; * Point() : x(0), y(0) {} * Poi
2014-06-16 16:00:41
964
转载 字符串中有汉字的处理方法集合
1、str="aaa是"; re=/[\u4e00-\u9fa5]/g if(re.test(str)) { alert("有汉字") }2、简单汉字判断 private static int isCharacter(String word){
2014-06-14 19:04:03
1191
原创 网易游戏面试题——打怪按概率掉装备
你在游戏里面打怪的时候,怪死了会掉装备,然后一个怪有很多装备,掉哪个是随机的,但是每个装备都一个掉下的概率,现在让你设计算法,在一个怪死的时候随机掉一个装备,这个掉装备的过程满足装备的各自概率,比如,装备A掉下的可能为0.3,B为0.4,那么你的算法的结果中,比如掉下100000次,A和B掉下的比例必须接近3:4,一个数组a[NUM]存储题目中给定的概率,申请一个新的和他等
2014-06-11 22:43:50
9986
转载 Java:对象的强、软、弱和虚引用(转载)
本文介绍对象的强、软、弱和虚引用的概念、应用及其在UML中的表示。author: ZJ 07-12-1Blog: [url]http://zhangjunhd.blog.51cto.com/[/url]1.对象的强、软、弱和虚引用在JDK 1.2以前的版本中,若一个对象不被任何变量引用,那么程序就无法再使用这个对象。也就是说,只有对象处于可触及(reachable)状态,程序才能使
2014-05-07 21:32:32
708
原创 内存分析
前几天收到英特尔公司的电话面试,程序执行过程exe执行的时候直接放到操作系统执行class执行要放到虚拟机里面比如,硬盘中有一个小程序,运行时load到装载到内存区域。操作系统找到程序的起点执行一般在执行过程中的内存分成四部分。不同的操作系统不同,但基础的是这四部分:code segment代码区,data segment数据区,stack栈,heap堆
2014-04-03 19:09:41
910
转载 C#实现透明WinForm控件
public partial class tspControl : UserControl { public tspControl() { InitializeComponent(); SetStyle(ControlStyles.SupportsTransparentBackColor
2014-04-01 18:40:45
926
转载 fatal error LNK1123: 转换到 COFF 期间失败: 文件无效或损坏的解决方法
VS2010在经历一些更新后,建立Win32 Console Project时会出“error LNK1123” 错误,解决方案为将 项目|项目属性|配置属性|清单工具|输入和输出|嵌入清单 “是”改为“否”即可,但是没新建一个项目都要这样设置一次。在建立VS2010 Win32 Project项目时,按照上面解决方案依然发生了“error LNK1123”错误,经过上网查资料,解决方案为:
2014-04-01 18:30:04
696
mysql-linux-general-64
2017-10-16
go-mysql-mongodb
2017-06-27
org.mongodb.spark:mongo-spark-connector_2.11:1.1.0
2016-11-30
com.stratio.datasource:spark-mongodb_2.10:0.11.2
2016-11-30
能量扩散模型的实现
2014-06-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人