
人工智能
Lucky_JimSir
人生最终的价值在于觉醒和思考的能力,而不只在于生存。—— 亚里士多德
展开
-
如何学习算法或者模型?(持续更新中)
面对一个陌生算法的时候,一开始无法深入地进行理解,如同在一个门缝里面看一个宫殿的内部构造,一时之间是无法看清看全的,这个时候就要考虑如何才能完全了解这座宫殿呢?从过去学习的经历,我总结出了下面一些方法:1、透过算法的名称,来对该算法有一个直观的理解;2、通过一些算法的结构图,从宏观的角度来看这个算法的构成;3、结合一些公式来对局部的结构节点作进一步的观察;4、去阅读动手用代码实现该算法,...原创 2019-08-27 20:21:47 · 978 阅读 · 0 评论 -
深度学习与神经网络的关系
从广义上说深度学习的网络结构也是多层神经网络的一种。传统意义上的多层神经网络是只有输入层、隐藏层、输出层。其中隐藏层的层数根据需要而定,没有明确的理论推导来说明到底多少层合适。而深度学习中最著名的卷积神经网络CNN,在原来多层神经网络的基础上,加入了特征学习部分,这部分是模仿人脑对信号处理上的分级的。具体操作就是在原来的全连接的层前面加入了部分连接的卷积层与降维层,而且加入的是一个层级。输入...原创 2019-06-02 22:22:33 · 9959 阅读 · 1 评论 -
Python wordcloud 绘制词云
词云绘制六步走:1、准备文本2、文本预处理3、中文分词4、词频统计5、配置并生成词云6、绘制词云一个简单的词云绘制项目:import reimport collections # 词频统计库import numpy as np # numpy数据处理库import jieba # 结巴分词import wordcloud # 词云展示库from PIL impor...原创 2019-05-29 16:01:19 · 1446 阅读 · 0 评论 -
知识图谱的概念篇
随着互联网的发展,网络数据内容呈现爆炸式增长的态势。由于互联网内容的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。知识图谱(Knowledge Graph) 以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。最近,大规模知识图谱库的研究和应用在学术界和工业界引起了足够的注意力。知识图谱旨在描述现实世界中存在的实体以及实体之间的关系。知...原创 2019-05-29 13:41:11 · 1043 阅读 · 0 评论 -
人工智能学习资料汇总
1、算法/深度学习/NLP面试笔记:网址:https://github.com/imhuay/Algorithm_Interview_Notes-Chinese主要内容如下:⚽️ 机器学习原创 2019-05-31 16:31:12 · 165 阅读 · 0 评论 -
Python数据分析中 DataFrame axis=0与axis=1的理解
python中的axis究竟是如何定义的呢?他们究竟代表是DataFrame的行还是列? 直接上代码people=DataFrame(np.random.randn(5,5), columns=['a','b','c','d','e'], index=['Joe','Steve','Wes','Jim','Travis'])#...转载 2019-05-23 11:39:47 · 6095 阅读 · 1 评论 -
世界上最好用报表,竟然是它……
评价报表的好坏,我推荐这三个指标:重视度:业务部门不敢不看这个报表打开率:业务部门经常看这个报表有用性:业务部门看了很清晰知道要干什么做报表是为了在业务中发挥作用的,不是给数据分析师自嗨的。而往往同学们做报表最头疼的问题,就是:辛苦做的报表没人看,需要数据时又跑来临时性取数,搞得人烦不胜烦。所以报表不在花里胡哨,业务部门想用、能用、有用就最好了。按这个标准评价的话,我们隆重推出当今世界最...转载 2019-05-27 10:42:23 · 243 阅读 · 0 评论 -
Pandas学习笔记
Pandas简介Pandas基本数据结构Series简介pandas 是一个开源的,BSD许可的库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具。官网:http://pandas.pydata.org/Pandas基本数据结构主要有两个数据结构:Series 、DataFrameSeriesSeries 是一种类似于一维数组的对象,它由一组数据以及一组与之相关...原创 2019-05-21 14:23:31 · 516 阅读 · 0 评论 -
如何成为人工智能+大数据应用开发工程师?
如何成为一个合格的人工智能+大数据应用开发工程师呢?其晋升之路,大致上分为五个层次:代码级、应用级、工程级、算法级、专家级,下面我就针对这五个层次,做一些介绍,包括每个层次主要的内容是什么,是一个什么样的水平等。阶段一:代码级内容Python语言及数据分析包水平具备人工智能必备的基本编码能力阶段二:应用级内容机器学习的算法的基础了解,算法的Python代码实现...原创 2019-05-15 13:17:14 · 952 阅读 · 0 评论 -
Scipy -- 使用总结
Scipy 是世界上著名的Python开源科学计算库,建立在Numpy之上。它增加的功能包括数值积分、最优化、统计和一些专用函数。Scipy函数库在Numpy的基础上增加了众多的数学、科学以及工程计算中常用的库函数。例如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等等。Scipy.io进行mat文件的写入与读取from scipy import ioio.savemat(...原创 2019-05-07 19:51:09 · 4555 阅读 · 0 评论 -
概率分布 ---- 指数分布
转载自:https://blog.youkuaiyun.com/ccnt_2012/article/details/89875865原创 2019-05-07 11:24:37 · 2016 阅读 · 0 评论 -
神经网络的学习
简单概括一下一些神经网络的概念,对神经网络有一个形象化的认识:神经网络 --> 层(输入层、隐藏层、输出层) --> 神经元 --> 激活值原创 2019-06-02 22:29:49 · 155 阅读 · 0 评论 -
如何写数据分析项目?
写数据分析项目的主要流程以及用到的工具如下:提需求爬虫2.1 抓取网页文本urllib requests scrapy selenium2.2 提取内容正则 beautifulsoup xpath selenium2.3 存储txt csv excel mysql mongodb数据清洗与分析 + 绘图numpy pandas matplotlib pyechart...原创 2019-06-03 14:55:12 · 2031 阅读 · 0 评论 -
什么是人工智能?
在计算机科学领域中,人工智能是一种机器表现的行为,这种行为能以与人类智能相似的方式对环境做出反应并尽可能提高自己达成目的的概率。人工智能大体上可以分为 3 类:弱人工智能、强人工智能和超人工智能。01 弱人工智能弱人工智能(Weak AI)也被称为狭隘人工智能(Narrow AI)或应用人工智能(Applied AI),指的是只能完成某一项特定任务或者解决某一特定问题的人工智能。苹果公司的...转载 2019-08-22 10:26:58 · 1762 阅读 · 0 评论 -
判别式模型 vs. 生成式模型
1. 简介生成式模型(generative model)会对x和y的联合分布p(x,y)进行建模,然后通过贝叶斯公式来求得p(y|x), 最后选取使得p(y|x)最大的yi. 具体地,判别式模型(discriminative model)则会直接对p(y|x)进行建模.关于二者之间的优劣有大量的讨论. SVM的发明者Vapnik声称"one should solve the (classi...原创 2019-08-19 19:43:00 · 333 阅读 · 0 评论 -
预测模型评估
一、模型的偏差与方差所描述的事情本质上就是过拟合和欠拟合。偏差描述的是模型预测准不准,低偏差就是表示模型预测能力是不错的,就像图中的点都在靶心附近。方差描述的是模型稳不稳定,就像图中高方差的那些点,它们很分散,说明射击的成绩不稳定,波动很大。二、用学习曲线与验证曲线诊断模型...原创 2019-07-22 16:11:14 · 4318 阅读 · 0 评论 -
k-means聚类算法
https://www.cnblogs.com/zhizhan/p/4083654.html原创 2019-07-21 14:49:47 · 174 阅读 · 0 评论 -
模型融合
目录一、 融合框架1、 bagging 融合框架2、 boosting 融合框架3、 bagging 和 boosting 的区别二、Adaboost 算法基本原理一、 融合框架1、 bagging 融合框架2、 boosting 融合框架3、 bagging 和 boosting 的区别Bagging 融合是一种并行方法(同时并行处理K个子模型),而Boosting融合是一种迭代的方法...原创 2019-07-18 21:11:09 · 4172 阅读 · 0 评论 -
机器学习一般用来解决哪些方面的问题?
随着互联网的不断发展,程序员在学习编程语言的种类上也开始偏向于人工智能AI技术方面的知识学习了,下面我们就一起来了解一下,关于机器学习我们都需要解决哪些问题。机器学习一般用来解决哪些方面的问题?要问机器学习主要能解决什么问题,抛开各式各样的机器学习流派和层出不穷的算法模型不谈,机器学习主要解决的是两类问题:监督学习和无监督学习。掌握机器学习,主要就是学习这两类问题,掌握解决这两类问题的基本思路...原创 2019-07-13 00:56:21 · 6977 阅读 · 0 评论 -
过来人告诉你,怎样才能成为年薪百万的IT同学
有点标题党了哈,大家不用纠结百万年薪。百万不是一个确定的数字,就是高薪的意思。说回正题,上一篇《给转型做技术的同学的一些建议》发出后,有不少同学过来咨询。说程序员年龄的坎,让他感到焦虑,担心自己是不是跨不过30-35岁这个坎。在一些论坛上,看到一些同学也在焦虑,焦虑目前技术更新太快,一下这个热点,那个热点,感觉学的好累,要跟不上了。后来我想了下,这应该都是没有明白或积累够足的核心能力导致的。核...原创 2019-06-18 13:57:23 · 2371 阅读 · 1 评论 -
AI项目流程
AI项目流程:一、读取数据1、获取数据爬虫、数据库导出2、存储数据csv、excel、json、mysql二、数据清洗和数据预处理单变量探索多变量探索缺失值处理:删除或填充构造特征变量特征工程:从已有的数据中构造出对目标变量有强影响力的特征变量标准化和归一化:无量纲化独热编码:将类别变量进行拆分分箱:数值型变量转为类别变量,或连续性变量变为离散型变量数值变量和类别变量...原创 2019-06-25 23:27:07 · 2431 阅读 · 0 评论 -
概率分布 ---- 泊松分布
1 、甜在心馒头店公司楼下有家馒头店:每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):均值为:按道理讲均值是不错的选择(参见如何理解最小二乘法?),但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖, 的时间不够卖:你“甜在心馒头店”又不是小米,搞什么饥饿营...原创 2019-05-07 11:24:04 · 3240 阅读 · 1 评论 -
概率分布 ---- beta分布
相信大家学过统计学的都对 正态分布 二项分布 均匀分布 等等很熟悉了,但是却鲜少有人去介绍beta分布的。用一句话来说,beta分布可以看作一个概率的概率分布,当你不知道一个东西的具体概率是多少时,它可以给出了所有概率出现的可能性大小。举一个简单的例子,熟悉棒球运动的都知道有一个指标就是棒球击球率(batting average),就是用一个运动员击中的球数除以击球的总数,我们一般认为0.26...原创 2019-05-07 11:08:25 · 1538 阅读 · 0 评论 -
python数据分析----Numpy (一)
一、导入模块import numpy as np二、创建 ndarray 对象,以及一些基本操作1、使用 numpy.arange 创建np.arange(start,end,step,dtype)2、使用numpy.array 创建np.array(list,dtype)3、获取数组的维度和数据类型3.1、返回一个元组,存放对象每一个维度上的大小 array.shap...原创 2019-04-23 11:07:25 · 344 阅读 · 0 评论 -
逃离数学焦虑、算法选择,思考做好机器学习项目的3个核心问题
机器学习是目前人工智能最令人激动的研究方向之一。我们可能更关注机器学习算法的实现细节,沉浸于机器学习所需要的数学功底,但对于机器学习从业者来说,如何更好更快速的实现一个机器学习项目更值得关注。正如吴恩达在《机器学习》这门课中所说,他将花费更多的时间来教授机器学习、人工智能的最佳实践以及如何让它们工作。好的工具,在会用和不会用的人之间存在着鸿沟。当我们做一个机器学习项目时,不纠结于各个模型算法的...原创 2019-04-18 11:24:58 · 320 阅读 · 0 评论 -
如何构建一个完整的机器学习项目
一个完整的机器学习项目过程的主要步骤:项目概述。获取数据。发现并可视化数据,发现规律为机器学习算法准备数据。选择模型,进行训练。微调模型。给出解决方案。部署、监控、维护系统参考资料:微信公众号“人工智能爱好者社区”...原创 2019-04-18 11:15:33 · 508 阅读 · 0 评论 -
优秀的视频学习教程
1、数学之美:3Blue1Brown原创 2019-04-18 11:12:07 · 156 阅读 · 0 评论 -
学习人工智能需要哪些必备的数学基础?
问题一:学习人工智能需要哪些必备的数学基础?对于大多数的新手来说,如何入手人工智能其实都是一头雾水,比如到底需要哪些数学基础、是否要有工程经验、对于深度学习框架应该关注什么等等?因为现在AI火了,很多产品经理/程序员都想转入AI领域。那么对于产品经理来说,针对于AI,我们需要了解些什么呢?AI PM很大程度上不同于互联网领域的产品经理,它涉及到更深的底层逻辑,对个人综合能力要求会更高一...原创 2019-04-18 11:04:19 · 6361 阅读 · 0 评论 -
剖析|推荐算法是今日头条的核心竞争力吗?
【导读】推荐算法是个很大的话题,实际工程中也是很多策略交织在一起。本文主要是尽量通俗易懂的讲清楚推荐算法是个什么东西,不追求深入、全面和绝对的精确。以下内容分三部分:算法的核心;算法有多大用;实际工程中算法怎么工作的。算法的核心是什么推荐算法的核心是基于历史信息寻找被推荐的东西(可能是人、物、信息)与用户的一种关联性,进而去预测你下一步可能喜欢什么,本质上还是基于统计学的一种推测(谷歌...原创 2019-04-18 10:30:12 · 525 阅读 · 0 评论 -
机器学习第一步,从向量和矩阵开始!
全文共1466字,预计阅读时长2分钟熟练掌握C语言却总是在转型机器学习算法的道路上屡屡跌倒?懂得AI模型的逻辑却在每次伪代码修改后都被报错?你的绊脚石或许不仅仅是对于Python语法的陌生,还有对于数据集的处理摸不着头脑。这时候,就需要我们回归基本概念——从向量、矩阵开始,读懂机器学习语言。不同在何处?在一般性C语言编程中,对于数据的处理主要利用指针。熟悉它的同学们都知道,所谓内存...原创 2019-04-18 10:21:15 · 427 阅读 · 0 评论 -
sklearn与分类算法
【导读】众所周知,Scikit-learn(以前称为 scikits.learn)是一个用于 Python编程语言的免费软件机器学习库。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度增强,k-means 和 DBSCAN,旨在与Python 数值和科学库NumPy和SciPy互操作。本文将带你入门常见的机器学习分类算法——逻辑回归、朴素贝叶斯、KNN、SVM、决策树。01...原创 2019-04-18 10:11:11 · 1050 阅读 · 0 评论 -
如何为回归问题,选择最合适的机器学习方法?
在目前的机器学习领域中,最常见的三种任务就是:回归分析、分类分析、聚类分析。那么什么是回归呢?回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。回归分析在机器学习领域应用非常广泛,例如,商品的销量预测问题,交通流量预测问题。那么,如何为这些回归问题选择最合适的机器学习算法呢?01常用回归算法这里介绍一些回归问题中常用的机器学习方法,sklea...原创 2019-04-18 10:02:23 · 576 阅读 · 0 评论 -
2019 年最精彩 AI 论战:李飞飞VS《未来简史》作者赫拉利!
硅谷时间 4月22日晚,在斯坦福可容纳约2000人的超级大演讲厅,以这两本畅销书享誉全球的以色列著名历史学家尤瓦尔•赫拉利(Yuval Noah Harari),与斯坦福一个多月前神秘成立的 “以人为本” AI研究院领导者李飞飞,展开了一场以人工智能为主题的对话。(活动现场:左为赫拉利,中为李飞飞,图自赫拉利 Twitter)如果 AI +生物科技入侵你的大脑,你还是你吗?赫拉利用他在 2...原创 2019-04-26 19:30:07 · 497 阅读 · 0 评论 -
一位医疗 AI 创业者的自述:这个行业到底需要什么样的产品?
医疗AI行业的“游戏规则”本身还没有制定好,企业拿证的局面恐怕还要一段时间才能见到。文 | 李雨晨“今年,将会有很多玩概念的AI创业公司死掉,”张京雷在接受雷锋网采访时表示,“这并不意外。医疗AI行业也将面临这个情况。”张京雷是一名医疗行业的老兵。2017年,张京雷加入医疗AI公司Airdoc担任市场部副总裁,主要负责制定市场战略、渠道开拓等工作。此前他在小苹果儿科医生集团担任市场和运营副...原创 2019-04-24 10:10:29 · 394 阅读 · 0 评论 -
Numpy array数组的操作
布尔索引# 创建一个随机整数数组arr2 = np.random.randint(0,50,20)# 打印结果array([17, 42, 35, 3, 38, 1, 34, 12, 24, 39, 30, 33, 46, 0, 30, 0, 32, 28, 16, 0])# 获取布尔索引arr2%2 == 0# 打印结果array([False, ...原创 2019-05-05 14:42:12 · 558 阅读 · 0 评论 -
概率分布 ---- 二项分布
二项分布就是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验称为n重伯努利实验,当试验次数为1时,二项分布服从0–1分布。...原创 2019-05-07 10:57:42 · 759 阅读 · 0 评论 -
概率分布 ---- 正态分布
简介正态分布(Normal distribution),也称“常态分布”,又名高斯分布。正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。若随机变量X服从一个数学期望为μ、方差为σ^ 2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ=0,σ=1时的正态分布是标准正态分布。...原创 2019-05-07 10:51:57 · 1895 阅读 · 0 评论 -
概率分布 ---- 均匀分布
简介在概率论和统计学中,均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)。...原创 2019-05-07 10:46:20 · 5851 阅读 · 0 评论 -
Matplotlib 图表学习笔记
目标一、掌握Python数据可视化分析库的安装与开发环境配置目标二、熟练绘制常见图形如:散点图,折线图,条形图,直方图,饼状图,箱形图目标三、掌握绘图的三大系统:pyplot,pylab(不推荐),面向对象目标四、了解坐标轴的调整,添加文字注释,区域填充,及特殊图形patches的使用目标五、了解第三方可视化库:pyecharts一、Matplotlib 新手入门篇1.1 Matp...原创 2019-05-13 23:34:05 · 700 阅读 · 0 评论 -
Numpy ---- 简单使用
1. 简介Numeric Python的简称,是几乎所有python科学计算工具的基础。主要功能:ndarray: 一个具有矢量运算和复杂广播能力的快速并且节省空间的多维数组面向数组的运算: 对于数组进行快速运算的标准数学函数磁盘读写、内存映射线性代数、随机数、傅里叶变换NumPy本身并没有提供什么高级的数据分析能力,但是理解NumPy数组以及面向数组的计算将有利于使用pandas...转载 2019-04-30 17:07:09 · 376 阅读 · 0 评论