
机器学习有关
小小小北漂
自学能力强, 对新技术敏感度高, 能够很快的将新技术运用到实际开发中
性格开朗,参与过多个项目的开发,熟悉常见业务处理,具有较强的团队合作意识,能快速融入团队
能够承受在一定压力下进行开发,能接受集体加班和非长期(一年及以内)出差,安分守己,踏实敲代码
具有良好的英语阅读能力,能阅读英文资料、技术文档等
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用python+机器学习方法进行情感分析(详细步骤)
不是有词典匹配的方法了吗?怎么还搞多个机器学习方法。因为词典方法和机器学习方法各有千秋。机器学习的方法精确度更高,因为词典匹配会由于语义表达的丰富性而出现很大误差,而机器学习方法不会。而且它可使用的场景更多样。无论是主客观分类还是正负面情感分类,机器学习都可以完成任务。而无需像词典匹配那样要深入到词语、句子、语法这些层面。回复此公众号“web”获取源转载 2017-09-15 10:58:51 · 1818 阅读 · 1 评论 -
Gensim源代码详解——utils(持续更新中)
#!/usr/bin/env python# -*- coding: utf-8 -*-## Copyright (C) 2010 Radim Rehurek # Licensed under the GNU LGPL v2.1 - http://www.gnu.org/licenses/lgpl.html"""这个模块包含各种通用实用函数。"""from __future__原创 2017-09-20 14:10:43 · 4478 阅读 · 3 评论 -
机器学习总章
聚类机器学习算法(一):聚类算法 - tuqinag的专栏 - 博客频道 - youkuaiyun.com距离距离计算方法总结 - Bin的专栏 - 博客园 各种距离算法汇总 - mousever的专栏 - 博客频道 - youkuaiyun.com 几种常见距离算法小结 - 数据挖掘专栏 - 博客频道 - youkuaiyun.com 18种和“距离(distance)”、“相似度(similarity)”转载 2017-09-11 10:55:38 · 349 阅读 · 0 评论 -
Gensim官方教程翻译(七)——分布式潜在语义分析案例(Distributed Latent Semantic Analysis)
仅供个人学习之用,如有纰漏,敬请指正。原文地址阅读《分布式计算》教程来了解gensim中的分布式计算。设置一个集群我们将会通过一个案例展示如何运行分布式潜在语义分析。让我们假设我们有5个计算机,所有的电脑都在一个网段(网络广播可达)。为了开始,首先安装gensim并在每台电脑上设置Pyro():$ sudo easy_install gensim[distr转载 2017-09-11 10:53:34 · 667 阅读 · 0 评论 -
Gensim官方教程翻译(六)——分布式计算(Distributed Computing)
为何要分布式计算?需要构建一个百万文档级语料库的语义代表,却耗时太~~长?手上有几个可用的闲置计算机?分布式计算力争通过将给定的任务切分为几个小型任务,并将这些任务指派给几台平行的计算机完成来实现加速计算。 在这里提到的计算节点是指通过其IP地址/端口识别的计算机,并通过TCP/IP协议完成通讯。所有可用的计算机作为一个整体,称为集群(cluster)。分布式是非常粗粒度的(没有太多实转载 2017-09-11 10:52:49 · 595 阅读 · 0 评论 -
Gensim官方教程翻译(五)——英文维基百科的实验
仅供个人学习之用,如有错误,敬请指正。原文地址为了测试gensim的性能,我们在维基百科英文版上运行了一些实验。 这个页面描述了获取与处理维基百科的过程,以便任何人都能再现这个结果。本教程要求已经正确安装了gensim。译者注:维基百科的内容在不断更新,因此本文的结果仅供参考,可能与实际情况有出入。准备语料库首先,从 http://download.转载 2017-09-11 10:51:14 · 1073 阅读 · 1 评论 -
Gensim官方教程翻译(四)——相似度查询(Similarity Queries)
仅供个人学习之用,如有错误,敬请指正。原文地址如果想要开启日志,别忘记设置:>>> import logging>>> logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)12相似度接口在之前的教程《语料库与向量空间》和《主题与转换》中转载 2017-09-11 10:50:20 · 1116 阅读 · 0 评论 -
Gensim官方教程翻译(三)——主题与转换(Topics and Transformations)
为了我自己学习方便,翻译了gensim的官方教程。如有错误,请指正。原文地址如果想要开启日志,别忘记设置:>>> import logging>>> logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)12转换接口在之前的教程《语料库与转载 2017-09-11 10:48:39 · 434 阅读 · 0 评论 -
Gensim官方教程翻译(二)——语料库与向量空间(Corpora and Vector Spaces)
仅供我自己学习方便,翻译了原教程,原文地址:http://radimrehurek.com/gensim/tut2.html====================正==========文====================如果你想记录日志,请不要忘记设置:>>> import logging>>> logging.basicConfig(format='%(as转载 2017-09-07 22:37:26 · 375 阅读 · 0 评论 -
Gensim官方介绍翻译(一)
为了方便自己学习,翻译一下。原文地址:http://radimrehurek.com/gensim/intro.html。Gensim是一个免费的Python库,它可以用来从文档中自动提取语义主题,并且尽可能地做到轻松(对人)高效(对电脑)。Gensim致力于处理原始的、非结构化的数字文本(普通文本)。Gensim中用到的算法,如潜在语义分析(Latent Semantic A转载 2017-09-07 22:30:23 · 327 阅读 · 0 评论 -
Gensim源代码详解——dictionary(持续更新中)
#!/usr/bin/env python# -*- coding: utf-8 -*-## Copyright (C) 2010 Radim Rehurek # Licensed under the GNU LGPL v2.1 - http://www.gnu.org/licenses/lgpl.html"""这个模块实现了字典的概念—单词之间的映射他们的整数id。字典可以原创 2017-09-19 20:45:03 · 2239 阅读 · 0 评论