一些关于人工智能,机器学习,机器学习算法的零碎知识点

人工智能企业中的大佬们会干点啥

算法 -函数

这个有点悬
读论文&实现之

工程

这个我还能干一丢丢

    机器学习工程师(或调参工程师)
    运行已有算法,训练业务数据,获得工作模型。
    将数据 ->算法(函数) -> θ的值
        调用API(调用某个类中的方法) ,调整不同的参数,获取更好的 θ值
    如何获取算法(函数)中参数的值,最为关键
        当一个算法中参数已经获取到之后,次数算法(函数)编程模型
        算法和模型最大的区别:有参数就是模型
    通过数据(训练模型数据)对算法进行计算得到参数
数据

这个没问题
数据标注

机器学习

训练数据 ->算法(函数:没有系数) ->模型(函数)->预测(测试数据)->评估(预测结果与真实值的比较)

E(经验:数据的表示) -> T (任务)-》P(性能)

机器学习的类别

监督学习算法

		数据集:特征值(Features) + 目标值(标签label)
		预测值:使用算法得到模型,进行预测的值
		-分类(classification)算法
			target目标值:离散型数值
				是一个类别
				案例:是不是拦截邮件,
					  推荐给你的广告点击还是不点
				      判定还是什么性格
			支持的算法
				SVM,逻辑回归,决策树分类,朴素贝叶斯
		-回归(Regression)算法
			target目标值:连续性数值
				预测的结果是一个值
			案例:
				预测天气温度,预测房价
			支持的算法	
				线性回归,决策树回归
				
		集成学习算法:多个算法混合在一起
			随机森林算法
			梯度提升决策树

无监督学习算法

		只有特征值,没有目标值
		算法:
			聚合算法

推荐算法

			协同过滤算法
				交替最小二乘法(ALS)

机器学习使用算法

决策树DesicionTree

	依据特征性构建一棵树,每个节点(特征性)
	每次运行构建的数都是不一样的,选择的特征是不一样的
	如何判断一颗树的好与坏
		熵(香农熵)

随机森林RandomfForest

	N 棵数
	模型:N棵数
	预测的时候:N棵数同时预测
		分类:分类多就是预测值
		回顾:所有预测值的平均值
	属于集成学习算法
		bagging算法
sparkMLlib中决策树的底层是随机森林,
	设置树 的数量是1而已

对于类别特征值数据处理

常见 :1-of -k
性别:
	sex ->male\female\unknow
使用向量表示
	Array(0.0,   0.0,		0.0)
			|	  |			|
		  male female		unknow
案例:
	小明:男性
		Array(1.0,   0.0,	0.0)
	小明:女性
		Array(0.0,   1.0,	0.0)
	某妖
		Array(0.0,   0.0,	1.0)

无论 训练数据 还是测试数据,所有的值(特征性和目标值)都必须是double类型的值

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

无名一小卒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值