
大数据
yueguanghaidao
这个作者很懒,什么都没留下…
展开
-
Apache Druid源码导读--Google guice DI框架
缘起在大数据应用组件中,有两款OLAP引擎应用广泛,一款是偏离线处理的Kylin,另一个是偏实时的Druid。Kylin是一款国人开源的优秀离线OLAP引擎,基本上是Hadoop领域离线OLAP事实标准,在离线报表,指标分析领域应用广泛。而Apache Druid则在实时OLAP领域独领风骚,优异的性能、高可用、易扩展。Kylin的实现细节网上资料很多,而Druid很少,最近打算研究下源码,写几...原创 2019-10-13 15:08:55 · 4087 阅读 · 1 评论 -
sklearn2pmml xgboost缺失值(missing)处理的坑
sklearn2pmml xgboost缺失值(missing)如何处理今天同事在部署xgboost pmml模型时遇到了大坑,线上spark预测和本地python预测结果怎么都不对应,记录一下处理过程。看了下同事的代码,貌似也没有问题from sklearn2pmml import PMMLPipelinefrom sklearn2pmml import sklearn2pmmlfro...原创 2019-06-13 20:27:32 · 8586 阅读 · 2 评论