- 博客(3)
- 收藏
- 关注
原创 特征工程:机器学习中的特征与标签nlp化
这是一篇关于机器自然语言应用和特征工程结合的文章,目的在于探讨在企业或科研场景中,特征工程的另一种可能性——解决特征稀疏或数据和模型异构场景下一种通用的解决方案。一种大大降低模型开发及数仓建设人力成本,同时提高模型精度的解决方案。
2017-09-10 17:56:51
5803
原创 Hbase Region still in transition修复
问题背景hbase内出现部分region挂空的现象。在界面上发现某个表的regionserver无法点击进入鼠标移至该rs上的链接本应端口号为60030,但却指向为60010。此时所有对该region的访问都将失败。原因分析该情况意味着该region正处于transition状态,但在transition时的目标rs却因为以外重启或失效,这些region即出现了该不
2016-02-19 15:33:04
4063
原创 hbase批量导入之bulkloader使用实战
HBase大量导入数据时,使用client方式将会导致大量网络IO以及损耗集群计算资源,Hbase官方的bulkloader可以很好解决这个场景。bulkloader支持将写成HFile格式的数据直接放入HBase,这个过程分为:1.准备HFile格式的文件于HDFS中:本样例代码场景为读取另一个HBase表中的数据,写为HFile格式。其中写入方式可以通过MR任务
2015-11-19 17:04:01
2540
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人