- 博客(187)
- 资源 (105)
- 收藏
- 关注
原创 数据中台建设思考及参考资料
数据中台建设思考及参考资料数据中台建设思考及参考资料参考资料最新中台架构PPT,一起欣赏6位互联网大佬的架构图只需六步,看透数据中台架构数据中台架构图数据中台建设思考及参考资料参考资料最新中台架构PPT,一起欣赏6位互联网大佬的架构图只需六步,看透数据中台架构数据中台架构图...
2020-10-02 10:19:32
366
原创 Python解析HTML实例
# coding:utf-8import urllib.requestimport reimport xlwtimport timefrom xlwt import Workbookfrom html.parser import HTMLParserfrom tempfile import TemporaryFileinfo = ''zhPattern = re.compile(u
2016-11-14 21:27:14
2037
原创 Python获取高德地图POI
# -*- encoding: utf-8 -*-# coding:utf-8from xlwt import Workbookfrom tempfile import TemporaryFileimport urllib.requestimport xml.dom.minidom as minidomimport xlwt#结果目录inforst = '/home/yuhz/Pycha
2016-08-28 20:28:59
9805
原创 BosonNLP试用
wget https://bootstrap.pypa.io/get-pip.py --no-check-certificatesudo python get-pip.py
2016-07-16 10:47:08
6716
3
转载 中文分词词性对照表
汉语词性对照表[北大标准/中科院标准] 词性编码词性名称注 解Ag形语素形容词性语素。形容词代码为 a,语素代码g前面置以A。a形容词取英语形容词 adjective的第1个字母。ad副形词直接作状语的形容词。形容词代码
2016-07-10 17:32:27
904
转载 对Python中文分词模块结巴分词算法过程的理解和分析
结巴分词是国内程序员用Python开发的一个中文分词模块, 源码已托管在github, 地址在: https://github.com/fxsjy/jieba作者的文档写的不是很全, 只写了怎么用, 有一些细节的文档没有写.以下是作者说明文件中提到的结巴分词用到的算法:基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG)采用了
2016-06-27 22:27:49
1491
原创 网络爬虫随笔
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2016-06-04 14:52:08
498
原创 Ubuntu下安装Pycharm
前提条件:安装jdk 1.1. 从java官方网站获取适应的jdk版本 1.2. 解压文件sudo tar zxvf jdk-8u91-linux-i586.tar.gz -C /home/yuhz/program/jvm1.3.重命名(可跳过) sudo mv jdk1.8.0_91 java1.4.设置环境变量vi ~/.bashrc在vim里修改文件,增加如下几句export JAVA_
2016-05-21 22:13:04
1332
转载 Ubuntu下安装Python3.5
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2016-05-21 14:14:55
15518
转载 Oracle索引块分裂split信息汇总
转自:http://www.oracledatabase12g.com/archives/index-split.html索引块分裂概念介绍 索引中的数据块 按照其作用分为:root block 根块、branch block 枝块、leaf block 叶块。 root block根块: 根块是索引的入口对于一个索
2015-03-07 22:18:00
1735
转载 如何通过跟踪一个客户端程序发出的sql的方法来优化SQL
概括介绍,跟踪一个客户程序发出的SQL主要分成下面几步:1. 识别要跟踪的客户端程序到数据库的连接(后面都用session代替),主要找出能唯一识别一个session的sid与serial#。2. 设定相应的参数,如打开时间开关(可以知道一个sql执行了多长时间),存放跟踪数据的文件的位置、最大值。3. 启动跟踪功能。4. 让系统运行一段时间,以便可以收集到跟踪数据
2015-03-07 22:12:58
1960
转载 Oracle的Filter,Nest loop,Merge sort join和Hash join
转自:http://czmmiao.iteye.com/blog/1807571Merge Sort Join按照Merge Sort Join连接的两表地位完全相同。这种算法会把每个表按照连接列进行排序,生成两个排序集。然后对两个排序集进行一次遍历便可以得到最终结果集。这个算法的特点是,每个表都需要排序,排序后都需要遍历一次。以下面的例子说明,Merge Sort Joi
2015-03-05 21:52:16
792
1
转载 哈希连接(hash join) 原理
访问次数:驱动表和被驱动表都只会访问0次或1次。驱动表是否有顺序:有。是否要排序:否。应用场景: 1. 一个大表,一个小表的关联;2. 表上没有索引;3. 返回结果集比较大。原理我们说的简单一点,先把驱动表的关联字段hash到PGA中(当然rowid也在PGA中),然后扫描被驱动表,取第一条数据,将关联的字段hash 一下探测PGA中的小表,如果匹配则关联,再取第二
2015-03-04 21:49:53
4695
转载 嵌套循环连接(nested loops join)原理
访问次数:驱动表返回几条,被驱动表访问多少次。驱动表是否有顺序:有。是否要排序:否。应用场景: 1.关联中有一个表比较小;2.被关联表的关联字段上有索引;3.索引的键值不应该重复率很高。如果你做过开发,就把它看成两层嵌套的for循环。下面我们来做个实验:SQL> create table test1 as select * from dba_objects
2015-03-04 21:48:34
950
转载 排序合并连接(sort merge join)的原理
访问次数:两张表都只会访问0次或1次。驱动表是否有顺序:无。是否要排序:是。应用场景:当结果集已经排过序。排序合并连接原理:如果A表的数据为(2,1,4,5,2),B表的数据为(2,2,1,3,1) ,首先将A表和B表全扫描后排序,如下:A B1 12 12 24 25 3因为没有驱动表,所以oracle会随机选择一张
2015-03-04 21:42:58
2045
转载 Oracle执行计划详解
Oracle执行计划详解---作者:TTT BLOG本文地址:http://blog.chinaunix.net/u3/107265/showart_2192657.html---简介: 本文全面详细介绍oracle执行计划的相关的概念,访问数据的存取方法,表之间的连接等内容。 并有总结和概述,便于理解与记忆!+++
2014-03-20 22:09:15
842
原创 2010.9-2013.3 总结
1、论文方面因为学校要求必须有一篇论文才能毕业,因此论文的压力要时刻有。研一上学期要好好看论文,要学会做笔记和总结、学会带着批判的态度去看论文,千万不能论文说啥就是啥,一定要思考!争取在研一上学期能精读20篇以上的论文。研一下学期开始要对自己的研究方向有一个宏观的把握,给自己定一个可以深挖的方向,有针对性的去看论文,学会模拟论文实验,在研一暑假之前就应该有自己的想法,在暑假期间写自己的第一
2013-04-01 16:13:01
934
转载 Eclipse.ini说明
Eclipse的启动由$ECLIPSE_HOME/eclipse.ini控制,如果$ECLIPSE_HOME 没有被定义,则Eclipse安装目录下的默认eclipse.ini会生效。eclipse.ini是一个文本文件,其内容相当于在Eclipse运行时添加到 Eclipse.exe之后的命令行参数。格式要求1、所有的选项及其相关的参数必须在单独的一行之内2、所有在-vmargs
2013-03-13 15:47:52
1898
转载 程序员技术练级攻略
转自:http://blogread.cn/it/article/4015?f=sa月光博客6月12日发表了《写给新手程序员的一封信》,翻译自《An open letter to those who want to start programming》,我的朋友(他在本站的id是Mailper)告诉我,他希望在酷壳上看到一篇更具操作性的文章。因为他也是喜欢编程和技术的家伙,于是,我让他把他的一
2013-03-07 13:04:37
785
转载 JUnit的各种断言
转自:http://dongbiying.iteye.com/blog/1002188JUnit为我们提供了一些辅助函数,他们用来帮助我们确定被测试的方法是否按照预期的效果正常工作,通常,把这些辅助函数称为断言。下面我们来介绍一下JUnit的各种断言。 1、assertEquals 函数原型1:assertEquals([String message],expected,
2013-02-20 16:19:10
553
转载 TCP的状态兼谈Close_Wait和Time_Wait的状态
转自:http://www.2cto.com/net/201208/147485.html一 TCP的状态:1)、LISTEN:首先服务端需要打开一个socket进行监听,状态为LISTEN. /* The socket is listening for incoming connections. 侦听来自远方TCP端口的连接请求 */2)、SYN_SENT:客户端通过应用程序调用co
2012-10-22 16:21:32
898
转载 说说Java线程池
线程池的作用线程池作用就是限制系统中执行线程的数量。根据系统的环境情况,可以自动或手动设置线程数量,达到运行的最佳效果;如果线程少了会浪费系统资源,多了又会造成系统拥挤效率不高。用线程池控制线程数量,使得其他线程排队等候。一个任务执行完毕,再从队列的中取最前面的任务开始执行。若队列中没有任务等待进程,则线程池中的线程处于等待。为什么要用线程池减少了创建和销毁线程的次数,每个工作线程
2012-10-12 19:42:21
876
转载 java中多种方式读文件
一、多种方式读文件内容。 1、按字节读取文件内容 2、按字符读取文件内容 3、按行读取文件内容 4、随机读取文件内容 import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.FileReader; import java.io.I
2012-10-11 15:37:26
790
原创 Java中的hashCode()与equals()
equals()和hashcode()这两个方法都是从object类中继承过来的equals()方法equals()方法在object类中定义如下: public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较(即比较引用是否相同)。但是我们必需清楚,当String 、Math、
2012-10-08 13:45:29
628
原创 Hibernate面试题集锦(附解析)
感谢原博主的辛勤劳动:http://www.cnblogs.com/myhe-blog/archive/2011/12/24/hibernate.html本文只是对原文进行了完善和补充。一,选择题:(1)一般情况下,关系数据模型与对象模型之间有哪些匹配关系(多选)A)表对应类B)记录对应对象C)表的字段对应类的属性D)表之间的参考关系对应类之间的依赖关系解析
2012-10-04 16:00:22
1015
转载 对Hibernate进行优化的方案
初用HIBERNATE的人也许都遇到过性能问题,实现同一功能,用HIBERNATE与用JDBC性能相差十几倍很正常,如果不及早调整,很可能影响整个项目的进度。 大体上,对于HIBERNATE性能调优的主要考虑点如下: * 数据库设计调整 * HQL优化 * API的正确使用(如根据不同的业务类型选用不同的集合及查询API) * 主配置参数(日志,查询缓存,fetch_
2012-10-03 16:30:10
782
转载 hibernate 如何实现延迟加载
延迟加载机制是为了避免一些无谓的性能开销而提出来的,所谓延迟加载就是当在真正需要数据的时候,才真正执行数据加载操作。在Hibernate中提供了对实体对象的延迟加载以及对集合的延迟加载,另外在Hibernate3中还提供了对属性的延迟加载。下面我们就分别介绍这些种类的延迟加载的细节。 A、实体对象的延迟加载 如果想对实体对象使用延迟加载,必须要在实体的映射配置文件中进
2012-10-02 20:59:19
673
原创 Offer之路
1、题目:求 1+2+ … +n ,要求不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句( A?B:C )。方法1:针对循环可以用递归来替代。(用了if)整个代码:int add(int n){if(n==1) return n;else{return n+add(n-1);}}方法2:利
2012-10-02 16:37:25
693
转载 工厂方法模式与抽象工厂模式
一、引子 话说十年前,有一个暴发户,他家有三辆汽车——Benz奔驰、Bmw宝马、Audi奥迪,还雇了司机为他开车。不过,暴发户坐车时总是怪怪的:上Benz车后跟司机说“开奔驰车!”,坐上Bmw后他说“开宝马车!”,坐上Audi说“开奥迪车!”。你一定说:这人有病!直接说开车不就行了?! 而当把这个暴发户的行为放到我们程序设计中来时,会发现这是一个普遍存在的现象。幸运
2012-10-02 15:13:17
855
转载 Catalan数
卡特兰数又称卡塔兰数,是组合数学中一个常出现在各种计数问题中出现的数列。由以比利时的数学家欧仁·查理·卡塔兰 (1814–1894)命名。原理令h(0)=1,h(1)=1,catalan数满足递推式[1]:h(n)= h(0)*h(n-1)+h(1)*h(n-2) + ... + h(n-1)h(0) (n>=2)例如:h(2)=h(0)*h(1)+h(1)*h(0)=1*1+1*
2012-10-01 21:16:48
919
转载 java动态代理(JDK和cglib)
JAVA的动态代理 代理模式 代理模式是常用的java设计模式,他的特征是代理类与委托类有同样的接口,代理类主要负责为委托类预处理消息、过滤消息、把消息转发给委托类,以及事后处理消息等。代理类与委托类之间通常会存在关联关系,一个代理类的对象与一个委托类的对象关联,代理类的对象本身并不真正实现服务,而是通过调用委托类的对象的相关方法,来提供特定的服务。 按照代理的创建时期,代理类可以分为
2012-09-29 14:40:22
543
转载 Java序列化的机制和原理
有关Java对象的序列化和反序列化也算是Java基础的一部分,下面对Java序列化的机制和原理进行一些介绍。Java序列化算法透析Serialization(序列化)是一种将对象以一连串的字节描述的过程;反序列化deserialization是一种将这些字节重建成一个对象的过程。Java序列化API提供一种处理对象序列化的标准机制。在这里你能学到如何序列化一个对象,什么时候需要序列
2012-09-29 09:09:26
611
转载 Java:使用wait()与notify()实现线程间协作
转自:http://zhangjunhd.blog.51cto.com/113473/71387使用wait()与notify()/notifyAll()可以使得多个任务之间彼此协作。1. wait()与notify()/notifyAll()调用sleep()和yield()的时候锁并没有被释放,而调用wait()将释放锁。这样另一个任务(线程)可以获得当前对象的锁,从而进入它的
2012-09-28 15:37:37
742
原创 大唐电信JAVA笔试题(不知道是哪一年滴)
1. 描述一下public,protected,private,final关键字在Java中的用法作用域 当前类 同一package 子孙类 其他packagepublic √ √ √ √protected √ √
2012-09-27 22:37:23
3581
1
转载 session和cookie的区别
http://www.chinahtml.com/1007/128010707619425.htmlsession和cookie是网站浏览中较为常见的两个概念,也是比较难以辨析的两个概念,但它们在点击流及基于用户浏览行为的网站分析中却相当关键。基于网上一些文章和资料的参阅,及作者个人的应用体会,对这两个概念做一个简单的阐述和辨析,希望能与大家共同探讨下。 session和co
2012-09-27 18:19:51
826
原创 再议Static
1、静态变量与静态方法(1)静态变量(方法)存放在方法区,与类信息共处;成员变量(方法)存放在堆中,只有通过对象实例化后引用(2)静态调用非静态,需要实例化对象,通过实例引用;非静态调用静态,只需要类名调用即可2、静态语句块java 静态代码块 静态方法区别一般情况下,如果有些代码必须在项目启动的时候就执行的时候,需要使用静态代码块,这种代码是主动执行的;需要在项目启动的时候就
2012-09-27 10:51:04
604
原创 搜人2013笔试题(java)
今天应该又不少同学去ZD参加搜狗的笔试,由于时间冲突,我选择了去三星。回来看看搜狗的笔试题,总体上感觉还好,不是很“难”(纯粹马后炮)。现奉上题(只关注java部分和DS部分)。字符串问题分析:A:s1==s2为false,前者定义是对象的引用,"abc"存储在堆内存中,而s2中的“abc”存储在常量池中,用s1的栈内存地址和“abc”比较自然是否。B:String是fin
2012-09-23 20:45:56
2495
原创 Session 相关
Session tracking会话与会话追踪Internet通信协议可以分为两大类:有连接协议和无连接协议,两者的最大差别在于客户端和服务器端之间维持联机上的不同。session的引入: 鉴于http是无状态的协议,当完成客户端和服务器的传递信息后,就断开之间的联系,这样就造成了怎么样在几个页面之间传递信息的问题. 我们Jsp程序中很多参数需要从数据库中读取,有的参数实际读取一次
2012-09-20 13:55:25
1091
转载 Servlet简明教程
转自:http://www.blogjava.net/jlin/articles/62523.htmlServlet程序的基本结构//Servlet 基本结构import java.io.*;import javax.servlet.*;import javax.servlet.http.*;public class SomeServlet extend
2012-09-18 14:16:52
1122
原创 Servlet相关知识
什么是Servlet?Servlet是一种服务器端的Java应用程序,具有独立于平台和协议的特性,可以生成动态的Web页面。 它担当客户请求(Web浏览器或其他HTTP客户程序)与服务器响应(HTTP服务器上的数据库或应用程序)的中间层。 Servlet是位于Web 服务器内部的服务器端的Java应用程序,与传统的Servlet是对支持Java的服务器的一般扩充。它最常见的用途是扩展Web服务
2012-09-18 14:02:19
775
【债券深度报告】标准化票据系列之二:解析供应链票据新格局-20210129-华创证券-24页_1mb.pdf
2021-04-09
标准化票据系列报告之一:“标准化票据”投资基础手册-20200822-华创证券-25页_1019kb.pdf
2021-04-09
Junit4.10下载
2013-02-20
Java23种设计模式(总结)
2012-09-28
NetsparkerSetup2.3专业版 破解版本
2012-09-17
SSH实例——在线考试系统
2012-08-30
java内存解析(讲的很清楚的视频)
2012-08-21
2012阿里巴巴ADC嘉年华ppt全集——part 02
2012-07-26
2012阿里巴巴ADC嘉年华ppt全集——part 01
2012-07-26
Java_EE面试题集(修正版)
2011-11-18
Hibernate入门讲义,理解ORM概念
2011-11-18
Struts 2权威指南--基于WebWork核心的MVC开发PDF版(3)
2011-11-09
Struts 2权威指南--基于WebWork核心的MVC开发PDF版(2)
2011-11-09
Struts 2权威指南--基于WebWork核心的MVC开发PDF版(1)
2011-11-09
《Java完全自学手册》源代码
2011-10-27
ArcGIS Desktop9.3安装补丁、安装方法与汉化
2011-10-23
数据结构的超强教学软件
2011-10-21
算法导论中文版
2011-10-21
程序员面试宝典 (第二版)
2011-10-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人