讨论
基础的机器学习中,总会涉及示例向量和标记值
,如何理解这些向量是一个非常有趣的问题
先从简单的开始讨论
先从我们常见的男女分类来看,如果你不能将一个人和另外一个人分开,则内卷
地加入高矮、胖瘦、美丑、学历、籍贯、家世等不同的属性,直至足够多的属性加入,总可以将其区分开来。
男 | 女 | 身高 | 体重 | 美丑 | 学历 | 籍贯 | 家世 |
---|
这些属性之间可能并不完全独立,但都含有信息量,都可以贡献出它们的区分价值。
如果从根源来讲,在哲学上认为世界上没有两片相同的树叶,你总可以发现一些不同,将其区分开来!
我们可以认为,以上的男女属性数据组成了一个特别的向量数据。
古怪的向量数据
向量数据的形成
- 可以用已有通用知识和领域知识进行采样,然后形成向量数据
使用决策树、支持向量机等机器学习技术将其分类或回归
- 仅可以获得全信息量的图片信息,但图片中包含的信息不能够充分描述
可以使用深度学习的机器学习技术进行暴力求解,进行黑盒式机器学习
机器学习的幸运
我们面临的世界是可以被理解的。
即使对于混