CS231N

本文介绍了计算机视觉的基本概念及其在多个领域的应用,包括从原始进化到现代技术的发展历程,并详细阐述了图像分类的重要进展及使用卷积神经网络作为关键技术工具的方法。此外,还提供了用Python实现图像分类的示例代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Lecture 1

涉及到的领域

计算机视觉涉及到我们生活中很多的领域,其中包括生物学、物理学、数学、机器学….

history

原始的进化 (物种的出现就有了视觉的出现)

最早的照相机出现(根据哺乳动物的视觉神经创作的)

David Marr理论:建造3D模型的具体步骤

物体辨别

图像分类

在2012年图像分类迈出了重要的一步

卷积神经网络变成了重要的工具

Lecture 2

安装python and Numpy

图像分类

在做图像分类的时候要做两个函数

训练函数,将图像和标签当做输入值,返回模型

  • def train(images, labels):
    
    # Machine learning 
    
    return model

    预测函数,将模型和测试图像当做输入,返回标签

  • def predict (model, test_images):
    
    # Use model to predict labels
    
    return test_labels

比较两幅图像

将两股图片的像素矩阵相减,最后得到的矩阵的所有数之和为两个图像的差值

d(I1,I2)=pIp1Ip2

import numpy as np

class NearestNeighbor:
    def __init__(self):
        pass

    def train(self, X, y):
        self.Xtr = X
        self.ytr = y

    def predict(self, X):
        num_test = X.shape[0]
        Ypred = np.zeros(num_test, dtype= self.ytr.dtype)

    for i in xrange(num_test): # python3版本中改为range
        distances = np.sum(np.abs(self.Xtr - X[i,:]),axis = 1)
        # axis=0表示列  axis=1表示行
        min_index = np.argmin(distances)#等同于min求最小值
        Ypred[i] = self.ytr[min_index]

    return Ypred

train函数为训练函数,先将数据进行训练,得到训练值

predict预测,给定X作为输入数据(X为矩阵)

先让y跟X的row数相同,确保对应输出数量相同

将X每一行数据按照上述公式求和,取最小值,参照测试组数据,得出相对应的y值,即输出值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值