CS231N

最新推荐文章于 2022-12-13 22:49:02 发布

Cristal_yin

最新推荐文章于 2022-12-13 22:49:02 发布

阅读量410

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：计算机视觉

本文链接：https://blog.youkuaiyun.com/Cristal_yin/article/details/78402254

机器学习专栏收录该内容

30 篇文章

订阅专栏

本文介绍了计算机视觉的基本概念及其在多个领域的应用，包括从原始进化到现代技术的发展历程，并详细阐述了图像分类的重要进展及使用卷积神经网络作为关键技术工具的方法。此外，还提供了用Python实现图像分类的示例代码。

Lecture 1

涉及到的领域

计算机视觉涉及到我们生活中很多的领域，其中包括生物学、物理学、数学、机器学….

history

原始的进化（物种的出现就有了视觉的出现）

最早的照相机出现（根据哺乳动物的视觉神经创作的）

David Marr理论：建造3D模型的具体步骤

物体辨别

图像分类

在2012年图像分类迈出了重要的一步

卷积神经网络变成了重要的工具

Lecture 2

安装python and Numpy

图像分类

在做图像分类的时候要做两个函数

训练函数，将图像和标签当做输入值，返回模型

def train(images, labels):

# Machine learning 

return model

预测函数，将模型和测试图像当做输入，返回标签

def predict (model, test_images):

# Use model to predict labels

return test_labels

比较两幅图像

将两股图片的像素矩阵相减，最后得到的矩阵的所有数之和为两个图像的差值

$d(I_1,I_2) = \sum_p \mid I_1^p-I_2^p \mid$

import numpy as np

class NearestNeighbor:
    def __init__(self):
        pass

    def train(self, X, y):
        self.Xtr = X
        self.ytr = y

    def predict(self, X):
        num_test = X.shape[0]
        Ypred = np.zeros(num_test, dtype= self.ytr.dtype)

    for i in xrange(num_test): # python3版本中改为range
        distances = np.sum(np.abs(self.Xtr - X[i,:]),axis = 1)
        # axis=0表示列  axis=1表示行
        min_index = np.argmin(distances)#等同于min求最小值
        Ypred[i] = self.ytr[min_index]

    return Ypred