- 博客(37)
- 资源 (12)
- 收藏
- 关注
原创 开源k-v Tair
@淘宝 Tair 开源小组https://www.cnblogs.com/lengfo/p/4171655.html欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了...
2019-09-11 17:02:58
297
原创 python re
正则表达式,向前,向后匹配,向前向后不匹配1 import re2 def testPrevPostMatch():3 # post match: (?=xxx)4 # post non-match: (?!xxx)5 # prev match: (?<=xxx)6 # prev non-match: (?<!...
2019-04-23 11:12:21
339
转载 机器学习之模型融合 Stacking
https://zhuanlan.zhihu.com/p/26890738写文章Kaggle机器学习之模型融合(stacking)心得关注他501 人赞同了该文章此文道出了本人学习Stacking入门级应用的心路历程。在经过了几天漫长的查询资料和整理,脑子不好,理解顿悟花了不少时间。在学习过程中感谢@贝尔塔的模型融合方法,以及这篇文章(作者是章凌豪)。对于两位提供的信息,感激不尽。同时还有Ka...
2019-04-08 20:51:24
377
1
转载 intro neuron and neural network
intro to neuron and neural-networkhttps://victorzhou.com/blog/intro-to-neural-networks/Machine Learning for Beginners: An Introduction to Neural NetworksA simple explanation of how they work and how...
2019-03-27 19:48:03
452
原创 conda 设置python运行 虚拟环境
conda 设置虚拟环境在机器上可以设置多套 虚拟 python 运行环境,在不同的运行环境安装不同版本,或者不同的依赖包。查看已经创建好的环境conda info --envs创建虚拟环境conda create --name bf-predict-env python=3.6.3 pystan=2.14.0.0选定环境,并安装包source activate bf-pr...
2019-03-14 20:13:58
4809
原创 python 代码片段备忘
数组扩展predictors=[‘x’]if power>=2:predictors.extend([‘x_%d’%i for i in range(2,power+1)])
2019-01-11 10:25:04
265
转载 Going Deeper into Regression Analysis with Assumptions, Plots & Solutions
摘自 ANALYTICS VIDHYA CONTENT TEAM https://www.analyticsvidhya.com/blog/2016/07/deeper-regression-analysis-assumptions-plots-solutions/ Business AnalyticsMachine LearningGoing Dee...
2019-01-07 21:27:54
1008
转载 实战经验分享-少量数据NLP场景下进行深度学习训练的建议
摘自 lqfarmer 深度学习与NLPhttps://mp.weixin.qq.com/s/bGglLWd6dHcwXnX6Jqd3IA 作为数据科学家,最重要的技能之一应该是为你的问题选择正确的建模技术和算法。 几个月前,我试图解决文本分类问题,即分类哪些新闻文章与我的客户相关。 我只...
2019-01-06 10:50:19
1305
转载 a comprehensive guide for linear ridge and lasso regression
https://www.analyticsvidhya.com/blog/2017/06/a-comprehensive-guide-for-linear-ridge-and-lasso-regression/
2019-01-04 20:16:46
238
转载 谈谈 Bias-Variance Tradeoff
摘自 始终 谈谈 Bias-Variance Tradeoff <span itemprop="articleBody"><blockquote>准确是两个概念。准是 bias 小,确是 variance 小。准确是相对概念,因为 bias-variance tradeoff。——Liam Huang在机器学习领域,人们总是希望使自己的模型尽可能准...
2019-01-03 14:07:52
725
原创 如何处理小数据集线性回归问题
特征选择- 数据探查,分位数回归分析- Quantile Regression,传统统计分析数据与目标的关联; 结合业务理解,选取特征去除 异常点,和噪声限制模型的复杂度,防止过拟合,规则化L1, L2平滑化-模型多次运算结果取平均值或中值...
2019-01-03 10:02:17
1349
转载 NLP的巨人肩膀
NLP的巨人肩膀 (上)许维https://mp.weixin.qq.com/s/Rd3-ypRYiJObi-e2JDeOjQNLP的巨人肩膀 (下)许维https://mp.weixin.qq.com/s/7imMQ3GkD52xP7N4fqNPog
2018-12-29 15:50:43
302
原创 AI 资源及 blog
推荐一些比较优秀的AI资源:神经网络游乐场:https://playground.tensorflow.org/Gal Yona,在这个领域非常棒的博主之一。她的帖子包括从核心技术的解释到半哲学的评论。核心技术的解释:https://towardsdatascience.com/do-gans-really-model-the-true-data-distribution-or-are-...
2018-12-28 09:40:51
971
转载 DataFrame行列取数操作
摘自 http://bbs.fishc.com/thread-79821-1-1.htmlimport numpy as npimport pandas as pdfrom pandas import Sereis, DataFrameser = Series(np.arange(3.))data = DataFrame(np.arange(16).reshape(4,4),index=...
2018-12-27 13:55:30
757
转载 10 Exciting Ideas of 2018 in NLP
10 Exciting Ideas of 2018 in NLPSebastian Ruderhttp://ruder.io/10-exciting-ideas-of-2018-in-nlp/中文翻译 机器之心编辑从想法到实干,2018年13项NLP绝美新研究https://mp.weixin.qq.com/s/HPN7RzmnvExCkcLUXCfr2g...
2018-12-26 17:37:24
390
原创 Prophet 时间序列预测
Prophethttps://facebook.github.io/prophet/docs/contributing.html中文https://blog.youkuaiyun.com/anshuai_aw1/article/details/83412058
2018-12-25 10:59:24
1105
转载 换过很多工作,却依然无法在技术公司过好一生
技术人在职场需要的技术之外的技巧摘自 boxi TGO鲲鹏会https://mp.weixin.qq.com/s/iRRxvLaKUyG3FvI4l23lpw
2018-12-21 09:49:16
187
原创 树叶子过河 全靠那股子浪劲-代码参考
HKUST-KnowComphttps://github.com/HKUST-KnowComphttps://github.com/HKUST-KnowComp/R-Nethttps://github.com/HKUST-KnowComp/MnemonicReaderberthttps://github.com/google-research/bertAn open-source NL...
2018-12-21 09:37:40
733
转载 机器学习之特征工程-数据预处理
摘自 jacksu在简书 机器学习之特征工程-数据预处理https://www.jianshu.com/p/23b493d38b5b 通过特征提取,我们能得到未经处理的特征,这时的特征可能有以下问题:不属于同一量纲:即特征的规格不一样,不能够放在一起比较。无量纲化可以解决这一问题。信息冗余:对于某些定量特征,其包含的有效信息为区间划分,例如学...
2018-12-20 14:18:51
423
转载 stackingRegressor
stackingRegressorhttps://rasbt.github.io/mlxtend/user_guide/regressor/StackingRegressor/ &lt;div class="col-md-3"&gt;&lt;div class="bs-sidebar hidden-print affix well" role="complem
2018-12-19 16:02:54
1743
转载 StackingClassifier
摘自 mlxtendhttps://rasbt.github.io/mlxtend/user_guide/classifier/StackingClassifier/ <div class="col-md-3"><div class="bs-sidebar hidden-print affix well" role="complementary"><ul...
2018-12-19 15:57:24
1232
转载 机器学习面试之Attention
摘自 milterhttps://www.jianshu.com/p/c94909b835d61 RNN做机器翻译的经典思路 encoder-decoder用RNN做机器翻译时,通常需要两个RNN网络,一个用来将接收待翻译语句,对其进行编码,最后输出一个vector,这个网络叫encoder。然后,该vector会作为输入,传给另一个RNN网络,该网络用来根据vector产生目标语言的翻译语...
2018-12-18 17:21:28
929
转载 The Annotated Transformer
The Annotated Transformer&lt;/a href=http://nlp.seas.harvard.edu/2018/04/03/attention.html &gt;&lt;header class="site-header"&gt; &lt;span&gt;&lt;img width="30px&
2018-12-18 14:16:10
2545
转载 The Illustrated Transformer
摘自 Jay Alammar https://jalammar.github.io/illustrated-transformer/ The Illustrated Transformer In the previous post, we looked at Attention – a ubiquitous method in modern deep learni...
2018-12-18 14:12:29
1028
转载 深度学习中的注意力模型(2017版)
摘自 张俊林 https://zhuanlan.zhihu.com/p/37601161注意力模型最近几年在深度学习各个领域被广泛使用,无论是图像处理、语音识别还是自然语言处理的各种不同类型的任务中,都很容易遇到注意力模型的身影。所以,了解注意力机制的工作原理对于关注深度学习技术发展的技术人员来说有很大的必要。人类的视觉注意力从注意力模型的命名方式看,很明显其借鉴了人类的注意力机制,因此,我们首...
2018-12-18 14:09:54
1125
转载 ValueError: Input contains NaN, infinity or a value too large for dtype('float64')
摘自 Joy-comhttps://blog.youkuaiyun.com/u013764485/article/details/53012978问题:pandas在处理数据时出现以下错误ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’).解决方法:1、检查数据中是否有缺失值例如,读取...
2018-12-17 15:05:46
1316
转载 BERT相关论文、文章和代码资源汇总
摘自 我爱自然语言处理 http://www.52nlp.cn/bert-paper-%E8%AE%BA%E6%96%87-%E6%96%87%E7%AB%A0-%E4%BB%A3%E7%A0%81%E8%B5%84%E6%BA%90%E6%B1%87%E6%80%BBBERT最近太火,蹭个热点,整理一下相关的资源,包括Paper, 代码和文章解读。1、Google官方:1) BERT: ...
2018-12-16 21:14:27
492
转载 天空之城:拉马努金式思维训练法
摘自 张俊林 https://zhuanlan.zhihu.com/p/51934140本文较长,我知道大概率你没有耐心读完,但是看完可能会让你在今后的日子里多年受益,所以还请保持一些耐心。如果只对机器学习技术方面感兴趣,可以直接跳到第四部分“空中建筑师:机器学习中的拉马努金式思维训练法”。如果你选择直接跳到了第四部分开始阅读,那么从这个行为推断,你肯定是典型的算法工程师,其实第五部分“出埃及记...
2018-12-14 10:58:10
2403
转载 XGBRegressor 参数调优
摘自 大黄有故事 https://yq.aliyun.com/articles/572590这一篇博客的内容是在上一篇博客Scikit中的特征选择,XGboost进行回归预测,模型优化的实战的基础上进行调参优化的,所以在阅读本篇博客之前,请先移步看一下上一篇文章。我前面所做的工作基本都是关于特征选择的,这里我想写的是关于XGBoost参数调整的一些小经验。之前我在网站上也看到很多相关的内容,...
2018-12-12 20:17:12
52317
9
转载 LabelEncoder & OneHotEncoder
<摘自 http://biggyani.blogspot.com/2014/08/using-onehot-with-categorical.html>Using OneHot,LabelEncoder with categorical features/columns on a pandas dataframe, for feature selection and predicti...
2018-12-12 14:48:51
361
转载 SKlearn回归模型调包练习
摘自 一只咸狗https://blog.youkuaiyun.com/u013982164/article/details/80364500 看了录播后照着代码敲了一遍 sklearn常用分类回归算法简介 对能了解SKlearn常规套路,但模型具体的参数需要进一步了解。# 引入必要的第三方包from skl...
2018-12-11 15:47:36
796
1
转载 几个常用算法的适应场景及其优缺点
转 几个常用算法的适应场景及其优缺点(非常好)https://blog.youkuaiyun.com/u010159842/article/details/52918815 2016年10月25日 10:03:58 mishidemudong 阅读数:32162 ...
2018-12-11 13:54:03
953
转载 使用回归分析,样本过少时不妨好先看看散点图
摘自 刘重杰 https://cosx.org/2009/01/regression-with-graphics## 使用回归分析,样本过少时不妨好先看看散点图回归分析往往是学统计、学计量课程时接触的第一个统计模型了,甚至不少人可能认为回归分析理所当然成为计量的绝大部分内容——毕竟很多教材中提到统计模型的时候,往往就一个 OLS 为主的讲法。回归分析的内容当然很广泛,也在学科中占据相对基础的...
2018-12-11 10:05:48
6607
转载 如何解决过拟合 与欠拟合
转载自 谷海燕 https://blog.youkuaiyun.com/zhuanzhe117/article/details/82595958 下面这张经典的图展示了欠拟合(第一个)与过拟合(第三个)。 欠拟合模型在训练集上学习的不够好,经验误差大,称为欠拟合。模...
2018-12-08 13:57:56
286
转载 使用sklearn做单机特征工程
使用sklearn做单机特征工程 使用sklearn做单机特征工程 目录1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特...
2018-12-08 11:28:31
229
1
bmp 目录 icon
2009-08-29
CHM目录图标,html help自定义图标设置方法,修改hhc文件
2009-08-29
word论文排版技巧
2008-12-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人