- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 Python操作Excel(一) 读写
Python操作Excel 本文主要介绍使用Python扩展包xlwt,xlrd对Excel进行读写操作: 遍历目录,找到Excel 用os包的walk可以遍历目录下的所有文件: for dirName, subdirList, fileList in os.walk(path): for fname in fileList: fpath = dirNa...
2018-06-06 18:59:41
177
原创 JVM内存
JVM内存 标签: java 1.线程私有 线程私有,生命周期和线程相同。 1.1 程序计数器 一个较小的内存空间,不会有内存溢出 是当前线程所执行的字节码的行号指示器,每个线程都有一个独立的程序计数器,互不影响 线程私有内存区,编译时确定内存大小,随线程产生和消亡,不需要过多考虑垃圾回收 1.2 虚拟机栈 描述的是java方法执行的内存模...
2018-04-10 09:53:26
122
原创 KAFKA原理简介
一个topic为一类消息,被分成多个分区,每个分区一append方式存储文件,每条消息在文件中的位置成为offset(偏移量),offset为long型数字。 kafka,即使消息被消费,仍不会立即删除,根据broker配置,保留一定时间。过后无论是否被消费,都会被清楚。 consumer保存消费信息的offset。 kafka通过partition将日志内容分散到多个s...
2018-03-21 14:39:03
185
原创 hive_查询分组排序
hql 实现分组排序功能 hql是hive的查询语言,十分类似mysql的,分组排序也是通过row_number() over(partition by )实现的。 创建如下表 hive> desc ods_pss_product_price_history; OK id bigint
2017-04-18 18:54:48
579
原创 python_性能分析profile
如果希望对程序进行优化,那么性能分析是必不可少的。标准库中包含了一个叫profile的模块,使用起来非常简单 import profile, my_math profile.run('my_math.square(100)') 只需要运行该模块的run方法,(需要注意的是参数为字符串。)即可得到如下结果: 4 function calls in 0.001 seconds
2015-05-01 21:09:58
454
原创 python_unittest
unittest可以编写结构化的大型且周详的测试集。例如: import unittest,my_math class ProductTestCase(unittest.TestCase): def testIntegers(self): for x in xrange(-10, 10): for y in xrange(
2015-04-30 21:34:55
356
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人