自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(74)
  • 收藏
  • 关注

原创 【强化学习】DeepSeek-R1中GRPO算法和Reward设计

略。

2025-03-31 13:23:05 361

原创 【雨莲】Lec0. 序章

雨莲 Lec0.序章

2025-03-03 12:24:47 111

原创 【Convex Optimization Stanford】Lec8.Geometric Problem

凸优化 几何分析

2025-02-06 17:21:51 137

原创 【Convex Optimization Stanford】Lec7. Statistical estimation

凸优化:包含对于统计分布的估计,以及一些假说检验的知识

2025-02-04 11:41:27 194

原创 [论文学习]Adaptively Perturbed Mirror Descent for Learning in Games

文章链接我们称集合是紧的,则集合满足:1.闭集 2.有界集。在一个紧凑的策略空间中,连续函数总是可以达到其最大值和最小值,这对于证明纳什均衡的存在性是非常有用的。博弈的单调性(Monotonicity):单调性通常指的是博弈的雅可比矩阵(Jacobian matrix)是正定的或半正定的。这意味着当一个玩家增加其策略值时,其他玩家的最优反应不会减少。这种性质确保了博弈的稳定性和解的唯一性。大概意味着,一个玩家的策略调整一定与收益变化的方向一致,即不会出现策略改变导致出现非预期收益。

2025-02-03 17:36:29 1040

原创 【Convex Optimization Stanford】 Lec6. Approximation and Fitting

主要描述了凸优化中的估计和拟合的问题

2025-02-03 11:40:29 393

原创 【博弈论】Chapter2 重复严格优势/可理性化和相关均衡

博弈论中关于重复严格优势和可理性化以及相关均衡

2025-02-02 21:07:07 740

原创 【Convex Optimization Stanford】Lec5. Duality 对偶问题

凸优化中的对偶问题

2025-02-02 16:13:10 654

原创 【Convex Optimization Stanford】Lec4 CVX-opt-promblem

凸优化问题的形式和类型

2025-02-01 19:10:51 615

原创 【博弈论 学习】Chapter1. 策略式博弈与Nash均衡

博弈论与Nash均衡

2025-02-01 15:35:24 825

原创 【Convex Optimization Stanford】Lec3 Function

正定矩阵的充要条件和性质矩阵范数和迹注:关于矩阵范式的计算,见知乎。

2025-01-28 11:28:39 388

原创 【Convex Optimization Stanford】Lec2 Convex Set

本文顾名思义应该是讲凸集的。即只涉及线性scale、平移、旋转。

2025-01-28 02:40:58 340

原创 [Convex Optimization Stanford] Lec0 Intro

项目地址可以从以上github项目中,下载全部的课件和homework。

2025-01-27 18:09:54 214

原创 【北京大学 凸优化】Lec1 凸优化问题定义

马上快要过年了,天气自然寒冷起来,空气中也理所当然的弥漫着越来越浓重的烟火气息,如此看来,确乎是要过年了。或许是时候和过去的自己告别了,过去的一年实在是太疯狂了,保研失败,被谈了4年的女朋友带绿帽子,本研被导师一直嫌弃(这其实是我自己的问题),从零申请国外大学,遇到了很好的毕设老师和学长、学妹,遇到了很好的实习团队。怎么说呢?

2025-01-25 22:16:10 633

原创 【随笔】葬花

一朵一朵的花,送到了吗?《富士山下》中的一句歌词恰如此景,“谁能凭爱意让富士山私有”,从夏天开始,在冬天结束,这也算是一个轮回吧,我知道的,哭泣并不会真的改变什么,文字的力量的有限的,难道说,一篇文章就能决定人的一生吗?他们是那样真实,真实的仿佛让我一瞬间如同置身梦中,我知道梦该醒了,你也这么说,是啊,梦是该醒了,可是梦里的感觉是说散就散的吗?你曾说,或许我们不合适,我总是不以为意,现在看来,我真是一个失败的作者,写着些只能感动自己的小说,除此之外,我什么都做不到,只是你为了我,成全了我的梦想罢了。

2025-01-05 00:16:10 95

原创 【个人随想】我的元旦夜

总是想把一篇文章写成随笔的形式,这种冲动自从高中结业后,确实少有,可能正是爱情使人伟大吧。如此说来,或许我确实是先天被绿圣体呢,不知道我该说些什么,总感觉在这里抱怨也太自私了一点,爱情这种东西,可能每个人有每个人的观点吧,事到如今,关于我对我前女友的情感,真的是爱吗?恐怕我都不敢承认了,如果我真的爱她,我是否应该更加不顾一切一点呢,或许是我不够好吧,可能像我这样的普通的人,本身就是不值得被爱的,关于这一点,自从分手后,我一直在提醒我自己,哈哈,爱情使人崇高正是如此。这种话骗骗他人也就罢了,唯独骗不了自己。

2025-01-01 18:11:57 239

原创 基于Transformers的LLM微调,以及改写模型的一些Tips

这里主要探讨通用的文本生成模型,即指诸如GPT、Bert、Llama等的BaseModel,其最原始的目的为文本生成。

2024-12-22 01:09:24 930

原创 再次重逢,愿遍地繁花

最终幻想7带给我一种五味杂陈的感觉,有日常的轻松,有爱情的甜蜜,有重逢的喜悦,也有离别的伤感。整部剧情,有太多可以说的地方,无论是杰西的命运,亦或的蒂法与克劳德的爱情,可对我而言,最难以忘怀的,确实与爱丽丝的重逢。这游戏第八章的重逢,于我而言,度过了最美好的一段时光,没有那么多紧急的任务,不需要考虑神罗与雪崩的纷争,只需要静静地听着克劳德和爱丽丝斗嘴,安心地陪伴着她,走过一段略显漫长的旅程。直到最后爱丽丝的死亡,幻想最终破碎了,那些美好的曾经,美好的祝福,所有的这一切都是过往烟云,流淌在“生命之流”中了。

2024-09-29 22:30:23 336

原创 【数据库系统概念第七版】学习笔记 第二章 关系模型介绍

表关系:表元组:行属性:列域:属性允许取值的集合原子的:域中的元素被认为不可再分空值:未知的值数据库模式:数据库的逻辑设计数据库实例:给定时刻数据库中数据的快照关系模式:关系模式由一个属性列表和对应的域组成t∣Pt\{t|P(t)\}t∣Pt)}表示使谓词P为真的元组的集合,t为元组变量,P是公式,P由原子公式构成。实际上就是逻辑运算的公式。

2024-09-25 12:00:22 1224

原创 手写的从前

我曾经以为只要我足够优秀,取得够好的成绩,就不会让你离开,如今看来一切还是那么可笑,我总是在想,如果当年高考,我没有选择来到北大,而是选择去浙大,一切会不会有所改变,如今看来都太迟了,山川异域,风月不同天,那些曾经描绘的未来,我要去和谁实现呢?无论是去日本看烟花,去北极看极光,那些描绘的美好,逐渐淡去,如今想来依然让人向往,只可惜我们描绘的画卷中,我身边的人不是你,如果我带着这样的心情去面对下一个女孩,我又怎么对得起她呢?

2024-09-18 20:50:33 318

原创 Windows10 如何配置python IDE

Bing搜索python,往下找,找到一个看上去比较专业的网址。注意python是不收费的,如果你找到一个收费网页,请注意网址,可能是错误的。

2024-09-06 23:26:11 1853 1

原创 其实你知道,烦恼会解决烦恼

我们从来不知道,合照时的游离,山川相隔,时至今日,他的形象越发模糊起来。还会有人让你睡不着吗?还会有某些态度让你担忧吗?其实你知道,烦恼会解决烦恼。然而这新旧之差终究太突然了,你还好吗?或许没什么不好,哭诉在此也无非是一种烦恼。他总是在每一个秋日,看着夕阳西下的背影,等待逐渐暗淡的到来。

2024-09-05 18:35:44 230

原创 Ray Tracing in one Weekend But on CUDA

利用基本的C++代码,造轮子。PathTracing的大致思想为,从相机镜头向幕布处的每个像素发射光线,计算光线进入世界后在不同物体间的折射、反射(镜面、漫反射),并对光照强度进行积分,最终取多条光线的平均值即可。该项目实现了PathTracing的渲染算法,并提供了四种基本材质(朗伯表面、金属表面、玻璃介质、光源介质),一种物体球体,并提供环境光,相机系统和配套的数学运算。需要注意的是,在CUDA编程过程中,需要注意device和host的关系,尤其需要注意内存的位置,以及申请的内存位于哪里?

2024-06-02 16:57:27 718

原创 CS285 2023Fall HW1作业解析

你好!这是你第一次使用Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

2024-04-30 01:31:56 1377 3

原创 Unity2D 学习笔记 1.如何高效切换场景

关于Unity版本,VS Studio版本以及其它相关设置,请移步上一篇Unity2D 学习笔记 0.Unity需要记住的常用知识本节的方法源于Unity中文课程网《Unity麦田物语》。

2024-04-23 00:41:46 908

原创 医学图像处理 利用pytorch实现的可用于反传的Radon变换和逆变换

Computed Tomography(CT,计算机断层成像)技术作为如今医学中重要的辅助诊断手段,也是医学图像研究的重要主题。如今,随着深度学习对CT重建、CT分割的研究逐渐深入,论文开始越来越多的利用CT的每一个环节,来扩充Feature或构造损失函数。但是每到这个时候,一个问题就出现了,如果我要构造损失函数,我势必要保证这个运算中梯度不会断掉,否则起不到优化效果。

2024-04-03 19:33:26 901

原创 Python库使用介绍 LivermorE AI Projector for Computed Tomography LEAP

github开源代码python API文档作为一个纯计算机背景的小白,关于CT的相关工具,专业课是一点没有呀,好不容易找到一个库,网上居然一个教程都没有。所以自己写一个简易的快速上手的教程,希望能帮到同样使用这个库的人。LEAP这个库的好处在于,它利用pytorch.autograd进行实现,也就是他的输入和输出都是tensor,这实际上十分便于神经网络过程中添加一些这样的投影计算,也可以用来计算loss,真的非常棒。库的安装大家可以查看开源代码,或许过几天我会写一个安装教程也说不定。

2024-03-30 13:43:52 914

原创 论文学习 DOLCE:AModel-Based Probabilistic Diffusion Framework for Limited-Angle CT Reconstruction

论文连接代码连接需要格外注意优化去噪模型这一部分,方法太密集了,整篇论文的核心就在其中。

2024-03-28 15:26:14 897 3

原创 论文学习 Generative Modeling by Estimating Gradients of the Data Distribution

个人认为,这篇Song Yang大佬的文章虽然被网上很多人吹,然而我们还是应该避免捧杀,认真了解一下其文章的内容和思想,以及试图理解他是如何想到这种思路的。通过其论文引用,实际上也能发现Song神的学习路径,确实具备非常坚实的数学基础。至于这篇文章与DDPM(扩散模型)的关系,个人认为,这篇文章可以从理论上作为扩散模型有效的证据,或者说,从另一个角度,实现了与扩散模型相同的效果。十分厉害。论文连接。

2024-03-19 03:42:11 530

原创 Physical Based Rendering 第一章 简介

丢个连接。

2024-03-09 18:29:34 998

原创 论文学习 BioNeRF: Biologically Plausible Neural Radiance Fields for View Synthesis

虽然我不应该再看NeRF相关的东西了,但是我还是觉得这个论文的题目很有意思,毕竟我认为神经网络本来就是模拟生物大脑的一个模型,那么我们应该更多的注意一些生物的机制,这些机制如果能得以很好的建模,或许能为神经网络结构下一步的开发提供思路。不同于NeRF依赖神经网络的权重来存储三维信息,BioNeRF利用感知启发的方式来融合多种输入,来改进模型中的记忆模块。并且该模型模拟了视锥细胞的功能,使其专注于纹理信息的提取。因此在这个意义上,记忆模块实际上是对形状信息和纹理信息进行组合。

2024-02-22 12:28:52 975

原创 Debug系列 GroupNorm和BatchNorm出现Nan或inf的情况

在复现别人论文的实验结果时,按照README乖乖做完之后,却发现损失函数的走向十分诡异,具体表现为在cifar10数据集上运行2万步以前,一切风平浪静,祥和美好,但是突然loss就全部变为nan了。令人费解。在Debug两天后,终于发现并修改了问题。令人发指。在此记录,也希望各位以后遇到此类问题,能够快速解决提供参考。如果你也想试试,就看这个论文论文连接。

2024-02-21 21:31:06 1335

原创 图表示学习 Graph Representation Learning chapter2 背景知识和传统方法

需要说明的是,在有向和加权图中,度可以区分为不同的概念。不管怎么说,这个特征在传统机器学习中都是十分重要的。如果我们期望所有的中心度都是正的,我们可以应用Perron-Frobenius Theorem,即对A求解特征向量。具体方式为,枚举所有可能的子图结构,然后统计出现的次数。一种常见的方式是利用特征向量中心度,我们定义每个节点的中心度为周围所有中心度的均值,其中。那么每次迭代后的结果是截至T步时,经过的次数,由此可以得到重要性。基于路径,则是统计类似于最短路之类的。也就是所有的相邻节点构成的集合。

2024-02-17 23:05:37 949

原创 随机过程初级教程 第一章

马尔科夫链:状态空间是有限或可数的马尔可夫过程。不存在非常数的平稳独立增量过程是平稳过程。扩散过程:状态空间是连续的马尔可夫过程。泊松过程和布朗运动都不是平稳的,但增量。称马尔可夫过程有平稳转移概率,如果。有联合密度时,我们可以定义。对任意固定h是平稳随机过程。时,X的条件密度函数为。这蕴含着条件独立性。的联合分布函数相同。特别的对任意时刻t,

2024-02-17 18:36:49 1106

原创 图表示学习 Graph Representation Learning chapter1 引言

虽然我并不研究图神经网络,但是我认为图高效的表示方式还是值得所有人去学一下的,或许将来觉得这个很有意思呢?当然啦,这也作为北京大学 图神经网络这门课的课程笔记吧,希望各位批评指教,也希望大家一起进步。

2024-02-16 21:12:30 1123

原创 Unity2D 学习笔记 0.Unity需要记住的常用知识

Unity2D 学习笔记 0.Unity需要记住的常用知识

2024-02-07 23:30:09 1898

原创 医学CT成像的迭代算法 SART和OS-SART算法

由测量得到的投影数据恢复到真实的CT图像,这一任务目前分为两类算法,第一种就是以反向投影FBP为主的算法,第二类则是迭代的算法(IR),本文所提到的SART和其改进版本OS-SART均为迭代算法,即需要一定的运算时间。对于算法的证明与解析本文并不涉及,只是单纯从下面这篇论文中翻译对应的部分罢了。因为发现网上对于OS-SART的解析甚少。

2024-02-04 22:50:35 3304

原创 北京大学 wlw机器学习2022春季期末试题分析

你好!这是你第一次使用Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

2024-01-10 22:38:04 1247

原创 【论文学习】SOLVING INVERSE PROBLEMS IN MEDICAL IMAGING WITH SCORE-BASED GENERATIVE MODELS

好不容易写完了这么长的一篇,整体看来,这篇文章更像是对去噪过程的一个改进。通过在不同时间步引入对应的条件,来控制图像的生成。文章中所有的译者注中举例都按照从X光复原CT图像这个问题出发,因为导师给的任务是这个。

2023-11-20 21:38:30 550

原创 北京大学 音乐与数学2023学年春季学期 期末笔记

笔记是用Onenote记的,挂在网盘连接里了。希望能对大家有帮助。

2023-06-17 19:36:23 255

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除