
计算机视觉
文章平均质量分 82
计算机视觉相关
舔甜歌姬的EGUMI LEGACY
你好,你想度過怎樣的一段人生?
因爲興趣,所以喜歡。
展开
-
【YOLO11实战】NEU-DET,钢材缺陷识别实战
手动把Annotation和images划分成train数据集和valid数据集,我的valid数据集是 随机选的一些数据。使用的python版本是3.8.10。运行后,labels里面得到。然后新建一个train.py。验证集通过模型识别到的。原创 2025-04-15 01:13:52 · 378 阅读 · 0 评论 -
【pdf翻译中文】免费自用日语pdf转中文、韩语pdf转中文(也可以转英文)或者其他小语种法语、德语pdf转中文
【pdf翻译】免费自用日语pdf转中文、韩语pdf转中文(也可以转英文)或者其他小语种法语、德语pdf转中文不是很精确、有点慢,但是也够用,胜在免费free。原创 2022-11-27 14:39:25 · 3662 阅读 · 2 评论 -
Image caption领域的研究现状及分析
一个学校的作业,这里我用自己的话解释了一下这个领域的一些工作,是一个简单的总结,给对这个领域不是很了解,但是有一定机器学习基础的读者。说了很多方法,这些方法都是有据可依的,引用自下面的论文,可以自己查询后去跑一下对应的程序。Image caption领域的研究现状及分析从hinton提出浅层神经网络开始,机器学习和人工智能的研究方向就从原本的潜能学习,传统机器学习,转向了深度神经网络……尽管...原创 2019-12-22 18:55:48 · 4586 阅读 · 8 评论 -
如图HMM模型,请列出所有可能输出序列的状态转移序列,计算由每一个状态转移序列输出观察序列V 的概率,计算最有可能输出观察序列V 的状态转移序列
如图HMM模型,初始概率:1,请列出所有可能输出序列的状态转移序列。2,分别计算由每一个状态转移序列输出观察序列V 的概率3,计算最有可能输出观察序列V 的状态转移序列解析:不合理之处还请批评指正,小弟谢过^0<第一题:首先,V=v2 v4 v4 v1 表示一个看到的现象,那么这个现象是由于什么原因导致的呢?我们的任务就是去找这背后的“幕后主使”。从图中可以知道,w2...原创 2019-04-17 23:38:43 · 2325 阅读 · 0 评论 -
视听觉信号与处理·实验一
一.帧时长计算通俗的讲采样频率是指计算机每秒钟采集多少个信号样本,比如声音信号,此时采样频率可以是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的样本数据就越多,对信号波形的表示也越精确。采样频率与原始信号频率之间有一定的关系,根据奈奎斯特理论,只有采样频率高于原始信号最高频率的两倍时,才能把数字信号表示的信号还原成为原来信...原创 2018-10-20 01:40:06 · 1168 阅读 · 0 评论 -
图像和音频格式解析一览
1.PNG,JPEG,BMP,JIF图片格式详解及其对比bmp:2.BMP文件格式详解(BMP file format) 3.BMP格式介绍(一) 4.bmp图像压缩算法详细解析 5.关于BMP文件格式的详解wmv关于WMV格式文件的解析MP4MP4封装格式详解RMVBrmvb 文件格式解析aviAVI格式详细解析...转载 2018-09-16 23:58:58 · 369 阅读 · 0 评论 -
【图像处理·实验三】matlab 去除人脸图像中的雀斑,人脸美白
以下内容均有参考,非原作者允许,请勿用于商业用途!!!仅供大家学习交流所用!!一、 实验内容1. 去除人脸图像中的雀斑2. 去除图像中的背景和水印的去除。二、 实验目的1. 综合运用图像处理的知识解决实际问题。 2. 了解颜色空间在图像处理中的用途。 3. 了解常见滤波在图像处理中的用途。 4. 了解图像修复(Image Inpainting)的常见方法。综述代码在最后!...原创 2019-01-24 15:17:07 · 9387 阅读 · 3 评论 -
【颜色空间转换大集合】RGB到YIQ,RGB到HSI和HSI到RGB,RGB到YcbCr,RGB到XYZ颜色转换matlab代码的Demo,含详细的解释
废话不说,先上图,实现方式:matlab实现功能:实验目标了解图像颜色空间的转换关系。了解图像的文件结构。实验内容完成如下颜色空间的转换。(4 Points)RGB -&amp;gt; YIQRGB -&amp;gt; HSIRGB -&amp;gt; YCbCrRGB -&amp;gt; XYZ选做:自己实现对 BMP 文件头的读取,并解析 BMP 图像文件。 (2.5原创 2018-12-08 23:03:24 · 5268 阅读 · 0 评论 -
【卷积神经网络】构建对CIFAR-100数据集中的图像进行分类的CNN
参考:Cifar100 TensorFlow高精度调参记录cifar算法动物园(各类网络解决cifar分类)pytorch实现cifar100的 各类网络结构前言: CIFAR-100数据集的网络 网上的版本很多,有些跑起来也还可以,但是大多数都只能到40-50%左右的正确率。 有大佬做了各种网络,调好了参数,能达到80%左右的正确率。但是这里只是个小作业,希望用不要太复杂,不要太深的网络,最好在一小时内就能看到结果的,所以参照大佬的作品写了简化版本,能在50个epoch内达到60%左右正确原创 2021-01-09 23:50:07 · 10495 阅读 · 2 评论 -
【代码实现和训练】OCR技术——引入了Attention机制的crnn的印刷体汉字识别
前言这里先是参考了这个代码:加入attention的crnn印刷体识别,on pytorch然后我训练了大概3个小时,loss从72出发稍微下降后维持在62.xxx 左右,就很迷。测试效果全部识别为“的的的的的的”,不过看到他的训练结果,感觉也并不是很感人,他的训练大概得到88%左右的正确率,loss 大约2.xx可能加入数据集去训练或者是增加迭代次数和修改学习率以及网络的optimizer可以达到想要的95%以上效果。这里有个解释和分析了上述代码的博客,但是也没放出训练效果,估计这个代码还是原创 2020-05-31 10:31:36 · 1978 阅读 · 2 评论 -
【总结】cnn+bilstm+lstm 训练的一些技巧
预处理:BLSTM 分为两类,第一类不支持变长输入,第二类支持变长输入. 显然,由于我们的手写体文本行的长度都是不固定的,所以采用的是支持变长输入的BLSTM. 这里的变长 不是指任意长度,而是多个固定长宽。根据CASIA-HWDB2.0-2. 2 数据集中文本行图片的大小,采取的固定长宽分别为:[240,130]、[400,180]、[560,180]、[640,180]、[800,180]、[950,200]、[1030,200]、[1210,180]、[1290,200 ]、[1370, 200原创 2020-05-25 18:12:47 · 4908 阅读 · 0 评论 -
【转载】crnn的一些训练技巧
建议看原文,我是怕原文挂了,才做一个转载备份一下。。。博主总结得很好,就是博客园有时候真的搜不到啊原文链接: Recurrent Neural Network[CTC]ctc可以看作一种对字符识别过程中,一整句话的自动切分。CTC是看似和HMM有些联系,然后也采用DP来进行求解,将CTC结构图中<RNN输出,CTC层>单独拿出来,得到如下形式:上图如CTC结构图, 最开始只能以(-)或者标签序列中第一个字符开始,即这里的t=1时,是{(-),(C)}; 在结尾也只能以(−)(-转载 2020-05-25 18:09:06 · 3807 阅读 · 7 评论 -
【论文阅读】Attention 机制在脱机中文手写体文本行识别中的应用
论文信息:作者: 王馨悦,董兰芳( 中国科学技术大学计算机科学与技术学院,合肥230027)E-mail: wxy66@ mail. ustc. edu. cn该方法在针对具有语义信息的CASIA-HWDB2.0-2. 2 数据集上字符准确率达到了95. 76%,比传统的encoder-decoder 框架提升了12.83%.关键词: 文本行识别; 脱机中文手写体; Attention 机制; LSTM中图分类号: TP391 文献标识码: A 文章编号: 1000-1220( 2019)原创 2020-06-18 16:15:35 · 2218 阅读 · 0 评论 -
完全卷积剩余网络(CNN)的深度预测相关的一些项目和问题
depth-from-single image ConvNets :这个仓库包含了用于从单个RGB图像进行完全卷积剩余网络的深度预测的CNN模型。所提供的模型是用于获取报告中的基准数据集for和Make3D的室内和室外场景的结果。 此外,提供的代码可以用于任意图像的推断 。【1】 中文库和解释链接【2】论文网址:Deeper Depth Prediction with Fully Convolutional Residual Networks 2016 9月【3】中文论文阅读网址:(论文阅读)Deep原创 2020-05-25 17:33:38 · 1228 阅读 · 0 评论 -
【一文读懂】Contours Hierarchy ——opencv边界的继承结构,表格的提取,表格孔洞处理,空心形状结构的提取
【参考】opencv文档Contours Hierarchy关于边界的继承结构,例如边界的父子结构使用 cv2.findContours(),我们需要选择边界回溯模式,例如:cv2.RETR_LIST 或者 cv2.RETR_TREE函数得到的三个数组,第一个是图片,第二个是边界,第三个是继承结构 hierarchy,一般我们都只用后面两个。形式如:python:contours, hierarchy = cv2.findContours(img, cv2.RET原创 2020-05-22 02:15:14 · 8454 阅读 · 0 评论