- 博客(344)
- 资源 (50)
- 问答 (2)
- 收藏
- 关注

原创 数字人对话系统 Linly-Talker(已加入Qwen和GeminiPro加强对话+上传任意图片的数字人)
Linly-Talker是一个将大型语言模型与视觉模型相结合的智能AI系统,创建了一种全新的人机交互方式。它集成了各种技术,例如Whisper、Linly、微软语音服务和SadTalker会说话的生成系统。该系统部署在Gradio上,允许用户通过提供图像与AI助手进行交谈。用户可以根据自己的喜好进行自由的对话或内容生成。
2024-01-04 11:43:23
1627

原创 数字人知识库:Awesome-Talking-Head-Synthesis
这份资源库整理了与生成对抗网络(GAN)和神经光辐场(NeRF)相关的论文、代码和资源,重点关注基于图像和音频的虚拟讲话头合成论文及已发布代码。论文合集及发布代码整理。✍️大多数论文链接到“arXiv”或学术会议/期刊的PDF。但是,一些论文可能需要学术许可才能查看。这个Awesome Talking Head Synthesis项目将持续更新 - 欢迎Pull Request。如果您有任何论文缺失、新增论文、关键研究人员或错别字建议,请编辑提交PR。您也可以打开Issue或直接通过电子邮件联系我。
2023-12-07 17:13:58
1791

原创 Pytorch CIFAR10图像分类 Swin Transformer篇
微软亚洲研究院提出的的Swin Transformer解决了这两个问题,并且在分类,检测,分割任务上都取得了SOTA的效果,同时获得了ICCV2021的best paper。Swin Transformer的最大贡献是提出了一个可以广泛应用到所有计算机视觉领域的backbone,并且大多数在CNN网络中常见的超参数在Swin Transformer中也是可以人工调整的,例如可以调整的网络块数,每一块的层数,输入图像的大小等等。该网络架构的设计非常巧妙,是一个非常精彩的将Transformer应用到图像领域的
2023-12-04 11:54:30
2694
1

原创 基于计算机视觉手势识别控制系统YoloGesture (利用YOLO实现) 有详细代码+部署+在线服务器尝试+开源可复现
Streamlit在线服务器体验网址: https://kedreamix-yologesture.streamlit.app/HuggingFace在线服务器体验网址:https://huggingface.co/spaces/Kedreamix/YoloGesture1、 了解项目研究的背景以及其意义,学习其中的创新点和科研价值。2、 使用python语言对项目中的代码进行编写。研究项目源代码,理解项目工程的代码结构、原理及其功能。3、 学习深度学习算法。理解卷积神经网络的相关概念
2023-04-21 19:43:13
4826
29

原创 基于CIFAR数据集 进行 MAE实现及预训练可视化 (CIFAR for MAE,代码权重日志全部开源,自取)
基于CIFAR数据集 进行 MAE实现及预训练可视化 (CIFAR for MAE,代码权重日志全部开源,自取)MAE for CIFAR,由于可用资源有限,我们仅在 cifar10 上测试模型。我们主要想重现这样的结果:使用 MAE 预训练 ViT 可以比直接使用标签进行监督学习训练获得更好的结果。这应该是自我监督学习比监督学习更有效的数据的证据。
2023-04-21 14:27:20
5922
22

原创 Pytorch&Keras CIFAR10图像分类(详情介绍以及汇总所有博客)
一开始写这个专栏的初衷是,有时候有些代码找的太繁琐了,并且找到了还运行不出来,或者运行了,但是没有一个很好的理解,所以基于此,我写了这个CIFAR10图像分类的专栏,借此希望,大家都能通过我这个专栏,找到自己想要的模型或者学习深度学习的代码。由于现在深度学习也在热度中,很多时候我们难免需要遇见深度学习的时候,在一些课程和项目的要求下,我们会发现,一个好的代码和一个好的可视化和清晰解释是能够节省特别特别多的时间的,基于此,我写出了这个专栏,这个专栏下的所有项目,都是**可运行无差错的。
2022-11-15 09:13:38
1848
4

原创 GAN Step By Step (一步一步学习GAN)
GSBS,顾名思义,我希望我自己能够一步一步的学习GAN。GAN 又名 生成对抗网络,是最近几年很热门的一种无监督算法,他能生成出非常逼真的照片,图像甚至视频。GAN是一个图像的全新的领域,从2014的GAN的发展现在,在计算机视觉中扮演这越来越重要的角色,并且到每年都能产出各色各样的东西,GAN的理论和发展都蛮多的。我感觉最近有很多人都在学习GAN,但是国内可能缺少比较多的GAN的理论及其实现,所以我也想着和大家一起学习,并且提供主流框架下 pytorch,tensorflow,keras 的一些实现教学
2022-09-28 09:20:21
814
1

原创 【论文泛读】 Deep Learning 论文合集
【论文泛读】 Deep Learning 论文合集文章目录【论文泛读】 Deep Learning 论文合集Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate ShiftImageNet Classification with Deep Convolutional Neural NetworksVery Deep Convolutional Networks for Large-Sca
2021-10-12 00:00:00
5385

原创 Pytorch Note 快乐星球
Pytorch Note这是我的Pytoch学习笔记,下面会慢慢的更新我的学习笔记Note1 Pytorch介绍Note2 Pytorch环境配置
2021-06-11 13:24:18
11424
16

原创 机器学习之路 The Road To Machine Learning
The Road to Machine LearningThe Road to Machine Learning吴恩达机器学习课程练习 Exercise机器学习实战项目 Project学习心得 Note吴恩达机器学习课程练习 Exerciseex1 Linear Regressionex2 Logistic Regressionex3 Multi-class Classfication and Neural Networks机器学习实战项目 Project泰坦尼克号生存预测 Titan
2021-03-11 14:18:22
19367
8
原创 2024-12-08 数字人最新论文更新(MEMO, INFP, IF-MDM, SINGER, One Shot, One Talk, FLOAT等)
汇总一下最近一个星期的一些数字人论文的更新,我觉得比较有意思的一些文章比如SINGER,用Diffusion来做sing的talking head,确实是一个不错的文章,已经开源了,大概可能还是类似于复旦的Hallo工作;比较有意思的是类似于INFP这样的工作,做了一个双人交互,我大概看了一下Project,觉得还是很不错的;除此之外,类似于One Shot,One Talk这样的3D点工作也是非常有趣,后续会对一些有意思的文章做一些解读和学习,更多的详细内容会在我的知识星球更新 ,欢迎大家关注哈!
2024-12-08 22:23:04
1487
原创 EMO: Emote Portrait Alive - 阿里HumanAIGC
最近这一个星期,也就是2月28日的时候,阿里巴巴的HumanAIGC团队发布了一款全新的生成式AI模型EMO(Emote Portrait Alive)。EMO仅需一张人物肖像照片和音频,就可以让照片中的人物按照音频内容“张嘴”唱歌、说话,且口型基本一致,面部表情和头部姿态非常自然,发布的视频效果非常好,好的几乎难以置信,特别是蔡徐坤唱rap的第一段,效果非常好。
2024-03-04 11:21:34
2513
原创 数字人的未来:数字人对话系统 Linly-Talker + 克隆语音 GPT-SoVITS
📆📆📆在最近一段时间,我在尝试探索,如何克隆声音,因为在数字人对话系统中,虽然可能能够重建特定的人,但是还是存在一个问题:声音是用固定的人声生成的,导致没有真实性,如果我们能够去克隆出对应的声音,并且结合特定的数字人,那是否就完成了一个数字人的完整复刻。于是我就研究了一段时间,后面发现了两个非常有意思的项目,分别是GPT-SoVITS和XTTS两个开源项目,我认为这两个算是现在最好的两个开源项目了,像OpenVoice之类的效果还是比较差,火山效果不错,但是没有开源。
2024-02-25 17:21:02
2577
1
原创 探索元宇宙的未来:数字人对话系统 - Linly-Talker —— “数字人交互,与虚拟的自己互动”
最后说一下我想做什么吧,其实我一直把这个数字对话系统趋于实时化,最近也看到相关的项目有做音频和视频流式的东西,我也在不断的学习中,希望也不断的学习,不断的超越自己。最后也提一下,我做了一个个人博客,后续也会放出来我博客的笔记,和知乎同步更新应该哈哈,大家也可以多关注一下,一起学习交流。Kedreamix:“数字人交互,与虚拟的自己互动”——用PaddleAvatar打造数字分身,探索人机交互的未来2 赞同 · 3 评论文章。
2024-01-27 21:36:43
1545
原创 FastAPI 快速教程: 从零开始构建你的第一个API项目
FastAPI 是一个用于构建 API 的现代、快速(高性能)的 web 框架,使用 Python 3.8+ 并基于标准的 Python 类型提示。文档源码快速:可与NodeJS和Go并肩的极高性能(归功于 Starlette 和 Pydantic)。最快的 Python web 框架之一。高效编码:提高功能开发速度约 200% 至 300%。更少 bug:减少约 40% 的人为(开发者)导致错误。智能:极佳的编辑器支持。处处皆可自动补全,减少调试时间。简单:设计的易于使用和学习,阅读文档的时间更短。
2024-01-18 02:02:17
6847
4
原创 VS Code Server 离线安装(解决超时,XHR Failed等问题)
在设置远程开发环境时,我们首先需要获取并安装 VS Code Server 程序。由于不同的服务器版本和环境,不一定会事先预装 VS Code Server,那么我们需要手动进行下载安装。有时候安裝等半天,有时候还报错,为了防止这样的情况,我还是记录一下解决方法,免得每次都需要找好多资料,但是找不到一个很有效的。如果服务器是连接外网的,就根本不用有这个烦恼,因为下载很快,有时候主要是因为离线安装这里我就介绍一种方法,我觉得最有效的方法,其他可能太麻烦而且不一定有效
2024-01-03 13:33:58
3268
5
原创 Tailscale:随时随地远程和使用服务器
即使我的笔记本在公司内网,无法直接连接到家里的台式机,通过Tailscale的relay功能,它们依然能够直接连接,实现畅通无阻的通信。连接成功后即可远程办公了,比如我在家里,我们可以设置公司的电脑的ssh,后续我们就可以连接公司的电脑后对其进行操作,这样就比较的方便,当然,也可以对其进行远程,比如todesk等远程工具,这个可以见仁见智,我觉得都可以,有时候我只使用终端,我觉得都还好。无论身在何处,只需使用分配给设备的IP地址,就能连接到该设备,从而实现远程办公的功能,例如连接到服务器等。
2024-01-03 13:28:38
12755
1
原创 ChatPaperFree GeminiPro 一分钟读论文
实际上,这个项目是在ChatPaper的基础上进行的更新,采用了最近由Google开源的Gemini Pro大模型。这样一来,我们可以免费使用ChatPaper,并且未来我还计划加入对论文图片的读取以提取摘要(测试结果是OK的),大家可以关注一下目前,我们能够对用户输入的论文进行自动总结。未来,我还计划加入对论文图片/表格/公式的识别 extraction,从而生成更全面而易读的总结。如果在对话中chatbot能提供更优质的服务,我还会尝试进行更深层次的模型fine-tuning。
2023-12-17 16:38:56
1444
原创 数字人对话系统 Linly-Talker
Linly-Talker是一个将大型语言模型与视觉模型相结合的智能AI系统,创建了一种全新的人机交互方式。它集成了各种技术,例如Whisper、Linly、微软语音服务和SadTalker会说话的生成系统。该系统部署在Gradio上,允许用户通过提供图像与AI助手进行交谈。用户可以根据自己的喜好进行自由的对话或内容生成。
2023-12-07 21:20:26
1929
原创 Pytorch CIFAR10图像分类 ShuffleNetv2篇
ShuffleNetv2是ECCV2018的文章,也是来源于旷视和清华研究组,它的效果同时是比ShuffleNetv1更好的。并且在同等复杂度下,ShuffleNetv2比ShuffleNet和MobileNetv2更准确。该论文最大的贡献在于看到了 GPU 访存带宽(内存访问代价 MAC)对于模型推理时间的影响,而不仅仅是模型复杂度,也就是 FLOPs 和参数量 Params 对于推理时间的影响,使用直接指标(如速度)而非间接指标(如FLOPs),并由此提出了4个轻量级网络设计的原则和一个新颖的 卷积。
2023-12-03 09:00:00
1332
原创 Coggle 30 Days of ML(23年7月)任务十:使用Bert在比赛数据集中完成预训练
Coggle 30 Days of ML(23年7月)任务十:使用Bert在比赛数据集中完成预训练。准备比赛数据集和预训练参数。使用Bert模型对比赛数据集进行预训练,提取文本特征。定义数据集和训练函数。训练模型并验证,保存准确率最高的模型。加载最佳模型进行预测并保存结果为CSV文件。
2023-07-11 20:00:00
996
原创 Coggle 30 Days of ML(23年7月)任务九:学会Bert基础,transformer库基础使用
BERT模型是一种基于Transformer架构的深度学习模型,它使用了维基百科等大规模无标签的语料库数据进行无监督的预训练。BERT通过两个任务来训练模型:Masked Language Modeling和Next Sentence Prediction。Masked Language Modeling是通过在输入句子中遮盖一些词并让模型预测被遮盖的词来训练模型。Next Sentence Prediction是判断一个句子B是否是句子A的下一句。BERT模型可用于各种下游任务,如文本分类、问答和序列标注
2023-07-11 13:39:12
1128
原创 Coggle 30 Days of ML(23年7月)任务八:训练BILSTM模型
Coggle 30天ML任务8: 使用Word2Vec词向量训练和预测BILSTM模型。 BILSTM模型结合了前向和后向LSTM,用于文本分类。通过准备Word2Vec词向量模型和训练数据集。构建BILSTM模型,包括嵌入层、BILSTM层和全连接层,将词向量应用到模型中。使用训练数据对BILSTM进行训练。然后使用训练好的模型对测试数据集进行预测。 BILSTM模型对于捕捉长距离的依赖关系非常有效,尤其适用于情感分类等任务。最终,将预测结果保存到提交文件中。
2023-07-11 13:09:26
397
原创 Coggle 30 Days of ML(23年7月)任务七:训练TextCNN模型
任务七:使用Word2Vec词向量,搭建TextCNN模型进行文本分类的训练和预测。准备Word2Vec词向量模型和训练数据集。构建TextCNN模型,包括卷积层、池化层、全连接层等。将Word2Vec词向量应用到模型中。使用训练数据集对TextCNN模型进行训练。使用训练好的TextCNN模型对测试数据集进行预测,导入训练好的Word2Vec模型。准备词向量模型和训练数据集。获取词向量的维度并转换训练和测试数据集文本为词向量表示。构建TextCNN模型,包括卷积层、池化层、全连接层。训练模型,设置优化器和
2023-07-10 17:25:06
471
原创 Coggle 30 Days of ML(23年7月)任务六:训练FastText、Word2Vec词向量
任务六:学会训练FastText、Word2Vec词向量- 说明:在这个任务中,你将学习如何训练FastText和Word2Vec词向量模型,这些词向量模型可以捕捉文本中的语义信息。- 实践步骤: 1. 准备大规模文本语料库。 2. 使用FastText或gensim库中的Word2Vec类,设置相应的参数(如词向量维度、窗口大小、训练迭代次数等)来构建词向量模型。 3. 使用Word2Vec类的build_vocab()方法,构建词汇表。 4. 使用Word2Vec类的train()
2023-07-10 16:22:58
1360
原创 Coggle 30 Days of ML(23年7月)任务五:XGBoost训练与预测
Coggle 30 Days of ML(23年7月)任务五:使用TFIDF特征和XGBoost完成训练和预测,提升文本分类性能。TFIDF提取特征,训练XGBoost模型,评估模型性能。用模型预测并提交结果文件,得分0.8848。改进后加入交叉验证,使用cross_val_predict()函数评估模型性能和泛化能力。最终得到更好的成绩97.36,继续努力冲99+。XGBoost潜力大,还可以继续提升。
2023-07-09 18:49:11
486
原创 Coggle 30 Days of ML(23年7月)任务四:线性模型训练与预测
Coggle 30 Days of ML(23年7月)任务四:线性模型训练与预测。使用TFIDF特征和线性模型(如逻辑回归)完成训练和预测,评估模型性能,包括准确率、精确率、召回率。调整TfidfVectorizer超参数可提高模型精度。使用Sklearn中的线性模型进行训练,得到不错的结果。评估准确率、精确率和召回率均在95%以上。利用混淆矩阵进行可视化。最后使用模型对测试集进行预测并提交,得分为0.8837,存在过拟合情况,可考虑使用更强大的模型或防止过拟合的方法提高分数。
2023-07-09 18:35:03
330
原创 Coggle 30 Days of ML(23年7月)任务三:使用TFIDF提取文本特征
Coggle 30 Days of ML(23年7月)任务三:使用TFIDF提取文本特征。TFIDF提取器使用Sklearn库的TfidfVectorizer类。通过设置参数如ngram_range和max_features,可以构建TFIDF特征矩阵。TFIDF算法结合Term Frequency(单词频率)和Inverse Document Frequency(逆文档频率)对文本进行表示。TF用于计算查询关键字中单词在文档中出现的次数,而IDF对出现在太多文档中的单词进行“惩罚”。TfidfVector
2023-07-09 18:34:38
530
原创 Coggle 30 Days of ML (23年7月)任务二:数据可视化
Coggle 30 Days of ML (23年7月)任务二:数据可视化使用Pandas库对数据集字符进行可视化,统计标签和字符分布。数据读取后,对字段进行可视化展示,并统计标签和字符的分布情况。主要关注内容字段和标签字段。统计了字符列表长度,大部分为200,少数不是。标签分布呈现不平衡,大部分为0。字符分布统计显示最常出现的数字为3125。对不同标签数据进行分别查看字符分布统计,差异不大。可继续探究和学习。
2023-07-09 16:45:47
1078
原创 Coggle 30 Days of ML(2023年7月)任务一:比赛报名及数据读取
Coggle 30 Days of ML(2023年7月)任务一:报名比赛,下载比赛数据集并完成数据读取比赛报名及数据读取。访问比赛网站并完成报名,下载比赛数据集,并使用Pandas库读取数据。导入Pandas库并使用它来读取训练数据和测试数据。两个数据集包含“name”,“label”和“content”字段。
2023-07-09 16:45:06
272
原创 Coggle 30 Days of ML 打卡任务三:苹果病害模型训练与预测
本次打卡任务是 Coggle 30 Days of ML 中的第三项任务。任务要求参赛选手利用提供的苹果病害数据集构建模型,并进行模型训练和预测。参赛选手可以选择合适的深度学习框架和模型架构,并使用训练集进行模型训练。然后,选手需要利用训练好的模型对测试集中的苹果叶片病害图像进行预测。任务名称难度/分值任务1:两个赛题数据可视化低/1任务2:苹果病害数据加载与数据增强中/2任务3:苹果病害模型训练与预测中/2任务4:苹果病害模型优化与多折训练高/3任务5:建筑物检测数据加载与数据增强。
2023-06-13 10:51:08
717
原创 Coggle 30 Days of ML 打卡任务二:苹果病害数据加载与数据增强
本次打卡任务是 Coggle 30 Days of ML 中的第二项任务,要求完成苹果病害数据加载与数据增强。数据加载阶段,参赛选手需要编写代码来读取和处理提供的图像数据。数据增强阶段,选手可以使用各种图像处理技术和方法,如旋转、缩放、翻转、亮度调整等,来增强数据集的多样性和数量。任务名称难度/分值任务1:两个赛题数据可视化低/1任务2:苹果病害数据加载与数据增强中/2任务3:苹果病害模型训练与预测中/2任务4:苹果病害模型优化与多折训练高/3任务5:建筑物检测数据加载与数据增强。
2023-06-10 08:00:00
551
原创 Coggle 30 Days of ML 打卡任务一:两个赛题数据可视化
本次打卡任务是 Coggle 30 Days of ML 中的第一项任务,要求完成两个赛题的数据可视化。赛题1是苹果叶片病害识别,提供了九类自然环境下苹果叶片的病害图像数据,参赛选手需要展示图像及其标签。赛题2是建筑物变化检测,提供了"吉林一号"高分辨率卫星遥感影像作为数据集,选手需要展示影像中的建筑物变化。任务名称难度/分值任务1:两个赛题数据可视化低/1任务2:苹果病害数据加载与数据增强中/2任务3:苹果病害模型训练与预测中/2任务4:苹果病害模型优化与多折训练高/3。
2023-06-09 18:51:20
1584
原创 Pytorch CIFAR10图像分类 ShuffleNet篇
ShuffleNet是旷视科技提出的一种计算高效的CNN模型,其和MobileNet和SqueezeNet等一样主要是想应用在移动端。所以,ShuffleNet的设计目标也是如何利用有限的计算资源来达到最好的模型精度,这需要很好地在速度和精度之间做平衡。pointwise group convolution和channel shuffle,这在保持精度的同时大大降低了模型的计算量。目前移动端CNN模型主要设计思路主要是两个方面:模型结构设计和模型压缩。
2023-05-30 11:47:44
1236
原创 Pytorch CIFAR10图像分类 SENet篇
我们之前已经学习了 AlexNet,VGGNet,InceptionNet,ResNet,DenseNet等,他们的效果已经被充分验证,而且被广泛的应用在各类计算机视觉任务上。这里我们再学习一个网络(SENet)。Squeeze-and-Excitation Networks(SENet)是由自动驾驶公司Momenta在2017年公布的一种全新的图像识别结构,它通过对特征通道间的相关性进行建模,把重要的特征进行强化来提升准确率。
2023-05-29 22:57:51
982
1
原创 “数字人交互,与虚拟的自己互动”——用PaddleAvatar打造数字分身,探索人机交互的未来
你是否曾经幻想过与自己的虚拟人交互?现在,使用,您可以将自己的图像、音频和视频转化为一个逼真的数字人视频,与其进行人机交互。是一种基于深度学习框架的数字人生成工具,基于Paddle的许多套件,它可以将您的数字图像、音频和视频合成为一个逼真的数字人视频。除此之外,还支持进一步的开发,例如使用自然语言处理技术,将数字人视频转化为一个完整的人机交互系统,使得您能够与虚拟的自己进行真实的对话和互动。使用,您可以将数字人视频用于各种场合,例如游戏、教育、虚拟现实等等。P。
2023-05-12 17:13:43
1773
1
原创 【论文精读】 SadTalker:Stylized Audio-Driven Single Image Talking Face Animation(CVPR2023)
不自然的头部运动扭曲的表情和身份变化。作者认为这些问题主要是因为从耦合的 2D 运动场中学习。另一方面,使用 3D 信息也存在表情僵硬和视频不连贯的问题。因此作者提出SadTalker,生成3DMM的三维(头部姿势、表情)系数,利用三维面部渲染器进行视频生成。为了学习逼真的运动场系数,作者建模音频与不同类别运动场系数之间联系。作者提出ExpNet,蒸馏运动场系数与三维渲染人脸学习准确面部表情。对于头部姿势,作者设计PoseVAE生成不同风格头部动画。
2023-03-24 18:22:25
4888
原创 第十四届蓝桥杯第三期模拟赛 【python】
这样在下一次搜索的时候,如果发现当前的dp数组的值已经被记录过了,那我们就直接返回值即可,就不需要那么多花里胡哨的操作,其实这道题可能也叫树形的DFS,有时候还是会出现的,不过思路还是OK的,就是类似于树形一样不断迭代dfs而已,最后就是还要加上这个递归深度的代码,这样保证自己不会出错!首先简单讲一讲DFS的思路吧,我们会从当前x,y进行不断搜索,然后发现下一个点符合条件,在范围内且严格小于当前点的高度,我们就继续搜索,因为我们要取最长,所以我们要取max,不断取最优的结果,最后都记录到我们的dp数组中。
2023-03-06 21:01:43
14355
20
原创 【虚拟人综述论文】Human-Computer Interaction System: A Survey of Talking-Head Generation
由于人工智能的快速发展,虚拟人被广泛应用于各种行业,包括个人辅助、智能客户服务和在线教育。拟人化的数字人可以快速与人接触,并在人机交互中增强用户体验。因此,我们设计了人机交互系统框架,包括语音识别、文本到语音、对话系统和虚拟人生成。接下来,我们通过虚拟人深度生成框架对Talking-Head Generation视频生成模型进行了分类。同时,我们系统地回顾了过去五年来在有声头部视频生成方面的技术进步和趋势,强调了关键工作并总结了数据集。
2023-03-04 13:31:18
5592
八种最常用的GAN生成式对抗网络代码框架
2022-04-13
【程序员面试必备】动画详解十大经典排序算法(内含代码)
2022-04-13
Coursera-ML-using-matlab-python.rar
2022-04-13
对于吴恩达机器学习的学习笔记
2022-04-13
深度学习中的目标检测YOLOX代码以及权重
2022-03-23
Pytorch对CIFAR10的图像分类全套代码(包含多个模型)
2022-03-23
Kaggle猫狗大战dogs-vs-cats数据集全套以及图像分类代码
2022-03-23
tensorflow-2.3.0-cp38-cp38-win_amd64_cpu_and_gpu.rar
2021-05-13
cifar-10-python.tar
2021-05-13
img_align_celeba2.zip
2021-04-06
img_align_celeba1.zip
2021-04-06
MNIST_data.rar
2021-04-05
AI古诗生成器,唐诗,五言绝句自动生成(包含预训练模型,数据集,全套代码)
2023-05-30
基于CIFAR10 MAE的实现(含模型权重,TensorBoard可视化等)
2022-10-12
口罩目标检测数据集(已标注好,VOC格式)
2022-05-22
CRNN完整源码实现--用PyTorch攻陷文字识别
2022-05-18
Keras对CIFAR10的图像分类全套代码(包含多个模型)
2022-05-17
大数据驱动的深度模型在图像分类中的应用(VGG16+VGG19图像分类,源码结果都可运行)
2022-05-17
GAN探索之数字样本生成(Pytorch实现LeNet网络进行对抗比较)
2022-05-17
Implements of MATAB神经网络30个案例分析
2022-05-15
中文情感分析 Python
2022-05-15
机器学习、NLP面试中常考到的知识点和代码实现
2022-05-15
利用Python opencv进行车牌识别
2022-05-13
Keras和Tensorflow 对CIFAR10的图像分类(包含多个模型)
2022-05-13
快速上手Transfomer全套资料-为 Jax、PyTorch 和 TensorFlow 打造的先进的自然语言处理
2022-05-11
数学公式识别 Math Formula OCR 识别LaTex
2022-05-07
利用CNN进行字符型图片验证码识别
2022-05-06
手写算法实现xgboost(并与库模型进行比较)
2022-05-06
10行代码搞定一个决策树
2022-05-06
Pytorch实现数字对抗样本生成全套代码(GAN)
2022-05-06
利用pytorch对CIFAR数据进行图像分类(包含全套代码和10+个模型的实现)
2022-05-06
DenseNet-Cifar10 基于keras
2022-05-06
pytorch1.10版本训练结果很差
2022-03-26
实现优快云自动登录出现的问题
2021-07-26
TA创建的收藏夹 TA关注的收藏夹
TA关注的人