
计算机视觉
文章平均质量分 73
计算机视觉
_企鹅_
这个作者很懒,什么都没留下…
展开
-
Sora时代,我们的AI应该何去何从?——关于Sora大模型的思考
而Sora的影响,不难想象。影视行业的演员道具等成本将会下降,而最为明显的影响,是影视特效。作为一位AI视频生成领域的爱好者,我始终坚信:对于AI技术的快速更迭,无论是相关传统领域的从业者还是AI技术领域的研究者,都需要秉承 朝临烟霞而暮栖苍梧 的开放思想,不能限于一地而终老此生。的确,大量的AI绘画侵占了市场,对于绘画市场产生了很大的冲击。因为Sora的生成能力和真实的渲染影视生成水平还是有一定差距,对于很多复杂的细节,并不能够有效地处理。一是对于传统的影视业,绘画业,模型业等产生大的冲击。原创 2024-02-16 21:50:25 · 1007 阅读 · 0 评论 -
SORA:OpenAI最新文本驱动视频生成大模型技术报告解读
LLM有文本标记,而Sora有视觉补丁。我们将Sora与我们的模型的一个版本进行比较,该版本将所有训练视频裁剪为正方形,这是训练生成模型时的常见做法。在推理时,我们可以通过在适当大小的网格中排列随机初始化的补丁来控制生成的视频的大小。因此,四个视频中的每个视频的开头都与其他视频不同,但所有四个视频的结局都相同。在下面的示例中,中心的视频在左侧和右侧的相应视频之间进行插值。我们相信,Sora今天的能力表明,视频模型的持续扩展是开发物理和数字世界以及生活在其中的物体、动物和人的强大模拟器的一条很有前途的道路。原创 2024-02-16 21:02:09 · 2128 阅读 · 0 评论 -
计算机视觉(六)图像分类
没有池化过程变得很深先降维再升维亮点在采用了残差的机制。原创 2023-08-01 15:54:57 · 827 阅读 · 0 评论 -
计算机视觉(五)深度学习基础
通道数没变,尺度大小变了。原创 2023-07-31 01:04:59 · 509 阅读 · 0 评论 -
计算机视觉(四)神经网络与典型的机器学习步骤
每个神经元都是一个结构相似的独立单位,接受前一层传来的数据,并将这些数据的加权和输入非线性作用函数中,最后将非线性作用函数的输出结果传递给后一层。一种有监督学习算法。根据神经元的实际输出与期望输出差别来调整连接权。神经网络:大量神经元节点按一定体系架构连接成的网状结构——大脑结构。人工神经网络的一种,无反馈,可用一个有向无环图表示。深度学习是对神经网络模型的拓展。原创 2023-07-28 22:51:22 · 934 阅读 · 0 评论 -
计算机视觉(三)未有深度学习之前
基于边缘:边界线上连续的像素点集合,是图像局部特征不连续性的反映。体现灰度、颜色、纹理等图像特征的突变。基于阈值:基于图像灰度特征计算一个或多个灰度阈值。将灰度值与阈值比较,最后将比较结果分到合适的类别中。原创 2023-07-25 11:51:02 · 1055 阅读 · 0 评论 -
计算机视觉(二)图像特征提取
像素值函数快速变化的区域->一阶导数的极值区域。原创 2023-07-24 12:50:15 · 751 阅读 · 1 评论 -
计算机视觉(一)图像预处理
加和必须为0。原创 2023-07-21 15:34:37 · 696 阅读 · 0 评论