
机器学习
乐观的溯
1.有很强的自学能力,自学的Java、C++、Python、机器学习、深度学习、NLP基础知识<br>2.有上进心,团结协作能力强,有很好的团队合作意识,在工作中能与同事之间相互协助、友好交流,更高效的完成工作<br>3.在程序开发的同时,还担任公司产品展厅的讲解员,可独立进行项目投标,部分文档的撰写<br>4.在掌握专业技能的同时,还具有很强的工作沟通能力,可以很好的与客户进行沟通,了解客户需求
展开
-
模型建立流程
数据预处理:当接收到数据以后,我们应该使用print(pdData.describe())观察数据,是否有缺失值,使用pdData.head()方法,去查看有哪些特征值进行数值转换,将字符串变成0,1。数据缺失:数值型采用均值填充,字符串型采用众数填充。pdData["Age"].fillna(pdData["Age"].median()); 数值转换:pdData.loc(pdDa原创 2018-01-31 09:16:55 · 2018 阅读 · 0 评论 -
Eclipse4.5+pyDev4.4.0+python3.6.0
学习初期使用Anaconda进行编程,好处是对数据处理以后可以及时查看结果,但是后来看工程都是使用Eclipse,自己尝试在原有的Eclipse安装pyDev插件,安装后总是提示错误,说Eclipse版本太老,选择更高的版本或者低版本的pyDev,但是并不知道具体的版本对应。下面为大家提供一种实现方式,亲测有效,同时提供软件下载链接:使用的版本:JDK1.8 + Eclipse4.5+pyDev4...原创 2018-02-09 15:43:44 · 964 阅读 · 0 评论 -
贝叶斯算法
与决策树分类和k近邻分类算法不同,贝叶斯分类主要借助概率论的知识来通过比较提供的数据属于每个类型的条件概率, 将他们分别计算出来然后预测具有最大条件概率的那个类别是最后的类别。当然样本越多我们统计的不同类型的特征值分布就越准确,使用此分布进行预测则会更加准确。贝叶斯准则朴素贝叶斯分类器中最核心的便是贝叶斯准则,他用如下的公式表示: 此公式表示两个互换的条件概率之间的关系,他们通过联合概率关联起来,...转载 2018-03-12 17:24:13 · 397 阅读 · 0 评论 -
sklearn库常用方法总结
引言对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。加载数据(Data Loading)我们假设输入时一个特征矩阵或者csv文件。首先,数据应该被载入内存中。scikit-learn的实现使用了...转载 2018-03-05 21:34:02 · 2564 阅读 · 0 评论 -
卷积函数
卷积卷积神经网络的结构其中,input为输入,conv为卷积层,由卷积核构成,pool为池层,由池化函数构成最后是全连接层与输出层,其负责对卷积层提取的特征进行处理以获得我们需要的结果卷积函数卷积函数是本篇文章要讲解的内容,在TensorFlow中卷积函数输入的参数其输入参数 主要有input, filter, strides, padding, use_cudnn_on_gpu=None,dat...转载 2018-04-03 10:38:03 · 1988 阅读 · 0 评论 -
极大似然估计
说的通俗一点啊,最大似然估计,就是利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值(模型已知,参数未知)。基本思想当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大,而不是像最小二乘估计法旨在得到使得模型能最好地拟合样本数据的参数估计量。似然函数对数似然函数 当样本为独立同分布时,似然函数可简写为L(α)=Πp(xi;α),牵涉到...转载 2018-04-25 16:56:12 · 413 阅读 · 0 评论 -
LSTM
经常接触LSTM,GRU,RNN这些模型,对于LSTM的印象只是知道它用来解决梯度消失梯度爆炸问题,对于长距离的句子的学习效果不好的问题,而且大概知道里面是加了一些参数,加了门单元来选择忘记和记住一些信息。但是具体公式没有推过,所以理解的不够深。但是上面这篇长博文,作者真心花了很多心血来创作,写的详细,易懂,对于学习lstm有很大的帮助。读完后我觉得要理解几个门的作用,文中作者提到的三个例子恰到好...转载 2018-04-27 22:20:35 · 537 阅读 · 0 评论