- 博客(9)
- 收藏
- 关注
原创 集成学习Ensemble Learning整理
目录集成学习序列化方法 & 并行化方法Random ForestGBDTRF与GBDT区别XGBOOST(极端梯度提升)XGBoost优缺点LightGBMXGBoost调参LightGBM调参集成学习集成学习的核心思想是使用弱学习器(线性模型,决策树等)进行加权求和,从而产生性能较为强大的强学习器。RF,GBDT,XGB 与 LGBM都属于集成学习,首先对集成学习做一个初步的介绍。集成学习(Ensemble Learning)的目的是通过结合多个基本学习器的预测结果来改善基本学习器的泛化能力和
2020-11-16 19:06:36
694
原创 pandas 1.0翻译与部分理解
CONTENTAbstractPandas 1.0.0 What's New?New Deprecation PolicyEnhancementsUsing Numba in rolling.apply and expanding.applyDefining custom windows for rolling operationsConverting to MarkdownExperimental New FeaturesExperimental NA scalar to denote missing v
2020-07-16 11:36:15
884
原创 Intel MTK FATAL ERROR解决方法
装TensorFlow和Sci-Kit Learn的时候碰到了numpy的版本问题,导致了如下ERROR,于是去搜索了一下具体原因和解决方法如下图anaconda文档描述,MKL全称是Math Kernel Library,是用来处理计算的。受影响的packages有Numpy, NumExpr, SciPy, Sci-Kit Learn。但是呢,如果电脑上没有装Intel MKL这个东西的话,就无法使用MKL,而相关的python packages当然也无法使用啦。网上查到的普遍方法如下:con
2020-07-13 14:05:37
399
原创 L1 and L2 Regularization正则化损失函数
In mathematics, statistics, and computer science, particularly in machine learning and inverse problems, regularization is the process of adding information in order to solve an ill-posed problem or to prevent overfitting.[1]
2020-07-09 16:54:43
1519
原创 初窥Shapley Values
Table of ContentIntroShapley Additive ExplanationsDefinitionShapley ValuesDefinitionExample for General IdeaAxioms of Shapley ValueSymmetryDummy Players(free rider)AdditivityTheorem of Shapley Value(and Calculation)Interpretation of the formulaIntro从同事那里
2020-06-17 20:00:08
1375
原创 Python鸭子类型 duck typing
鸭子类型鸭子类型(Duck Typing)定义代码样例code & expected outputCriticismHow to Handle it in Python?LBYL(Look Before You Leap)EAFP(Easier to Ask for Forgiveness than Permission)两类原则对比代码效率代码易读性代码风险两种风格存在的必要结论协议(让Python这种动态类型语言实现多态的方式)鸭子类型(Duck Typing)在翻看fluent pytho
2020-06-10 15:55:40
578
原创 zsh 安装后尝试使用conda command 返回 zsh: command not found: conda
最近厌烦了mac OS自带的terminal之后开始使用iTerm2 + oh my zsh, 安装完之后尝试在其中使用conda command,但返回结果zsh: command not found: conda于是在网上查找后发现如下方法最为快捷:1. 打开 oh my zsh, 输入如下command 打开 .zshrc fileopen .zshrc2. 在打开后的 .zshr...
2019-07-02 01:42:36
1800
原创 群体稳定度指标PSI
群体稳定性指标PSI(Population Stability Index)是衡量模型的预测值与实际值偏差大小的指标。PSI = sum((实际占比-预期占比)* ln(实际占比/预期占比))举例:比如训练一个logistic回归模型,预测时候会有个概率输出p。测试集上的输出设定为p1吧,将它从小到大排序后10等分,如0-0.1,0.1-0.2,…。现在用这个模型去对新的样本进行预测,预...
2019-06-19 17:05:08
2692
原创 如何解决Sublime 运行python的编码问题
如何解决Sublime 运行python的编码问题问题描述:在sublime中运行python的爬虫脚本时会遇到某些网页的编码问题例如UnicodeError解决方法:同样的代码在Google的colab上可以流畅运行,没有遇到编码问题,并且在terminal中直接运行 .py file也没遇到编码问题。那么究其原因可能是在sublime中配置python环境时遗漏了编码。在sublim...
2019-06-19 03:03:08
654
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人