- 博客(36)
- 收藏
- 关注
原创 4M-21: An Any-to-Any Vision Model for Tens of Tasks and Modalities论文精度
4M-21: An Any-to-Any Vision Model for Tens of Tasks and Modalities
2024-10-02 13:15:38
789
原创 DataComp-LM: In search of the next generation of training sets for language models论文简读
DataComp-LM: In search of the next generation of training sets for language models
2024-07-27 16:27:05
1183
原创 Gemini终于赢了GPT-4o!Jeff Dean连转三次:首个视频多模态基准来了
Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis
2024-06-20 20:22:51
974
原创 Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis阅读笔记
Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis
2024-03-14 16:32:04
1557
原创 BigGait: Learning Gait Representation You Want by Large Vision Models阅读笔记
BigGait: Learning Gait Representation You Want by Large Vision Models
2024-03-14 14:50:34
1079
原创 Empowering Multimodal LLMs with Foresight Minds(Merlin)论文精读
Merlin: Empowering Multimodal LLMs with Foresight Minds论文精读
2024-02-04 17:19:20
824
原创 Specializing Smaller Language Models towards Multi-Step Reasoning论文精读
Specializing Smaller Language Models towards Multi-Step Reasoning
2023-10-26 09:37:00
1026
原创 Graph of Thoughts: Solving Elaborate Problems with Large Language Models论文精读
Graph of Thoughts: Solving Elaborate Problems with Large Language Models
2023-09-20 20:10:24
580
原创 Test Accuracy vs. Generalization Gap:论文简览
Test Accuracy vs. Generalization Gap: Model Selection in NLP without Accessing Training or Testing Data论文简览
2023-09-20 09:42:43
279
原创 SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs精读笔记
SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs
2023-07-24 12:48:28
1180
原创 AIM: ADAPTING IMAGE MODELS FOR EFFICIENT VIDEO ACTION RECOGNITION精读笔记
AIM: ADAPTING IMAGE MODELS FOR EFFICIENT VIDEO ACTION RECOGNITION
2023-07-11 22:42:55
1044
原创 3D点云经典文献集速览(第三弹)
3D点云经典文献集速览:RandLA-Net,Point Transformer,Point Transformer V2
2023-03-27 17:15:59
559
原创 Masked Autoencoders As Spatiotemporal Learners精读笔记
Masked Autoencoders As Spatiotemporal Learners精读笔记
2023-02-08 21:49:04
934
原创 Sequencer: Deep LSTM for Image Classification(NIPS2022)精读笔记
Sequencer: Deep LSTM for Image Classification
2022-12-12 18:09:41
589
原创 动态任务优先级Dynamic Task Prioritization学习笔记
Dynamic Task Prioritization for Multitask Learning
2022-06-06 16:21:49
1320
4
原创 论文How Confident Are You in Your Estimate of a Human Age阅读笔记
How Confident Are You in Your Estimate of a Human Age
2022-05-30 23:53:06
264
原创 GLCNN主干网络复现
Ordinal Distribution Regression for Gait-based Age Estimation
2022-04-15 18:57:23
1110
原创 Mask R-CNN学习笔记
1 概览来源:https://www.bilibili.com/video/BV1qA411w7Zg?p=2&share_source=copy_web参考:一文读懂Faster RCNN - 知乎 (zhihu.com)参考:令人拍案称奇的Mask RCNN - 知乎 (zhihu.com)2 CNN BackBone · 作用:对输入的图像进行初步的特征提取,最终将输出5个不同尺度的特征图 · 采用架构:ResNet + FPN · Why: ① ResNet的
2022-03-19 21:35:14
4217
2
原创 3D-pose学习笔记
3D human pose estimation in video with temporal convolutions and semi-supervised training
2022-03-14 15:02:59
972
原创 UNet++学习笔记(主干网络+代码)
论文1 Abstract 文章提出,UNet主要有以下两大缺陷: ① 网络最优的深度未知,需要通过大量的实验以及集成不同深度的网络,效率低; ② skip connection引入了不必要的限制,即限制仅在相同的尺度进行特征融合。 对此,UNet++进行了以下的优化: ① 利用不同深度UNet的有效集成(这些UNet共享一个编码器),通过监督学习来搜索最优深度; ② 重新设计skip connection,使得解码器的子网络可以聚合不同尺度的特征,更加灵活; ③ 利用
2022-03-06 15:29:52
11556
5
原创 UNet学习笔记(主干网络+代码)
论文1 Introduction 先前研究的一些缺点(sliding-window): ① 运行速度慢 ② 需要权衡定位精度以及对上下文的应用 文章贡献: ① 提出改进的全卷积网络 可以看出,该结构与FCN相似。然而不同的是,FCN在扩张过程中只使用了上采样,而UNet中的扩张过程利用到了卷积操作。同时,卷积操作没有使用padding,特征图会逐渐减小。 其中,上采样可以让包含高级抽象特征低分辨率图片在保留高级抽象特征的同时变为高分辨率特征,再与左边低级表层
2022-03-02 16:28:12
2096
原创 GaitGAN学习笔记
GaitGAN: Invariant Gait Feature Extraction Using Generative Adversarial Networks
2022-02-28 16:33:41
3288
原创 A comprehensive study on gait biometrics using a joint CNN-based method学习笔记(主干网络+代码复现)
A comprehensive study on gait biometrics using a joint CNN-basedmethod
2022-02-21 23:52:47
2410
原创 步态情绪识别:STEP学习
Spatial Temporal Graph Convolutional Networks for Emotion Perception from Gaits
2022-02-20 14:34:56
4220
27
原创 模拟实现银行家算法
#include<iostream>using namespace std;int N = 3; // 资源种类 int M = 5; // 进程数int AllResource[3] = {10,5,7}; // 各资源总数 int Max[5][3] = {{7,5,3},{3,2,2},{9,0,2},{2,2,2},{4,3,3}}; // 最大资源需求量 int Allocation[5][3] = {{0,1,0},{2,0,0},{3,0,2},{2,1,1}
2021-11-09 16:20:10
445
原创 Johnson-Trotter 生成全排列算法
核心五部曲:① 初始化元素数组[1,2,3,4],初始化方向数组[0,0,0,0] (0代表左移,1代表右移)② 找到最大的可移动元素4可移动的两个条件:1. 元素移动后不会越界([4,3,2,1],如果4方向为左,不能移动)2. 即将交换的元素不能比本元素大([3,4,2,1],如果3的方向为右,不能移动)③ 移动一次元素④ 移动后,将元素列表中比移动元素大的所有元素的方向翻转(0-1,1-0)⑤ 如果列表没有可以移动的元素,结束```cpp#include<iostream
2021-09-26 17:23:19
1405
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人