- 博客(51)
- 收藏
- 关注
原创 常用性能指标(metrics)
在机器学习中,是衡量一个模型好坏的关键,通过衡量模型输出y_predict 和 y_true之间的某种"距离"得出的。 性能指标往往是我们做模型时的最终目标,如准确率,召回率,敏感度等等,但是性能指标常常因为不可微分,无法作为优化的loss函数,因此采用如cross-entropy, rmse等“距离”可微函数作为优化目标,以期待在loss函数降低的时候,能够。
2025-04-04 19:03:40
446
原创 HNU OS说明
期中和期末的考察大部分都源自于课本,所以需要详细地阅读课本,掌握os的基本原理,这门课对于整个计算机知识结构都非常重要,而且湖大使用的教材《操作系统导论》是非常优秀的一本书,即使你自己阅读也完全没有问题。如果你的英语不错的话,当然也可以直接阅读英文原版。关于os的实验部分,也是当时我们22级学生非常头痛的一件事,我们当时是第一届进行这个实验的,网上完全没有可以借鉴的资料,这个实验是学校课题组精心设计的实验,具有非常不错的学习和参考价值。信号量 。
2025-02-24 15:30:47
319
原创 计算机图形学:实验环境配置
由于OpenGL是一个图形API,并不是一个独立的平台,它需要一个编程语言来工作,在这里我们使用的是C++。在使用c++时需要配置相关的环境,c++相比于python需要自己手动查找对应的库下载,这里推荐使用Visual Studio进行相关配置。我具体介绍两个主要库的配置,
2025-02-22 17:56:59
307
原创 快速下载huggingface模型
有的时候下载huggingface会出现错误,是因为网络连接相关的问题吗,因此有一些快速下载模型来解决这个问题的方法。
2024-12-28 13:32:11
1522
原创 算法设计6_随机化算法
探讨了随机化算法的基本特征、数值随机化算法以及蒙特卡洛算法。文章首先解释了随机化算法的随机性,包括同一实例多次执行可能产生不同结果,以及解的正确性和时间复杂度的随机性。接着,通过案例介绍了如何使用随机数值算法近似计算圆周率和定积分,展示了算法执行时间与解的精确度之间的关系。文章还讨论了蒙特卡洛算法,强调了其在求解准确解问题中的应用,以及获得正确解的概率与算法执行时间的关系。最后,介绍了拉斯维加斯算法和舍伍德算法,这两种算法都能保证找到正确的解,但后者通过加入随机性来消除最坏情况下的性能差异。
2024-12-09 15:51:23
1060
1
原创 算法设计5_分支限界法
介绍了分支限界法的基本概念和应用。分支限界法是一种通过系统地搜索问题的解空间树来找到最优解的算法,它通过广度优先或最小耗费优先的方式修剪不能得到最优解的子树。文章详细阐述了分支限界法的步骤,包括定义解空间、确定解空间的树结构、搜索策略等,并讨论了队列式FIFO分支限界和优先队列分支限界。此外,文章还探讨了0-1背包问题、装载问题和TSP问题在分支限界法中的应用,并比较了回溯法与分支限界法的不同,以及回溯法与穷举法的区别。
2024-12-09 15:47:50
581
原创 算法设计4_回溯
这篇内容主要介绍了回溯法在解决组合优化问题中的应用,包括01背包问题、符号三角形问题、n后问题、图着色问题等,分析了它们的时间复杂度,并提供了相应的回溯算法实现。摘要:文章探讨了回溯法解决多种组合优化问题,分析了时间复杂度,并给出了算法实现。
2024-12-09 15:44:05
1090
原创 算法设计3_贪心
介绍了贪心算法的基本原理和应用。文章通过活动安排、背包问题、最优装载、最优前缀编码树、最小生成树和Dijkstra最短路径等案例,详细阐述了贪心算法的策略选择、子问题解决、可行解构建和最优解证明。每个案例都包括问题定义、算法实现和时间复杂度分析,展示了贪心算法在解决优化问题中的有效性。文章适合对贪心算法感兴趣的读者学习和参考。
2024-12-09 15:39:52
1216
1
原创 算法设计1_分治
文章从递归基础入手,详细阐述了阶乘、Fibonacci数列等递归概念,并通过Ackermann函数、排列问题、整数划分等案例展示了分治策略的威力。文章还涉及了二分搜索、大整数乘法、Strassen矩阵乘法等优化算法,以及棋盘覆盖和循环赛日程表问题。最后,文章分析了合并排序和快速排序的时间复杂度,提供了对分治法的全面理解。
2024-12-09 15:20:46
764
原创 算法设计2_动态规划
这篇文章介绍了动态规划的基本概念和几个经典案例,包括最大字段和、最大公共子序列、01背包问题、矩阵连乘和凸多边形最优三角剖分问题。文章详细阐述了这些问题的最优子结构和递推关系,并提供了相应的动态规划解决方案。同时,还探讨了如何求解具有单调性子序列的问题,如最长单调递增子序列的求解方法,并引入了Dilworth定理来解释相关问题。
2024-12-09 15:19:51
659
原创 HNU CV大作业
这个是湖南大学计算机视觉选修课,我所做的两个实验,此外还附着两个实验的实验报告的部分内容,可以前往github上查看,如果对你有帮助,请帮我点个star吧嘿嘿)除了代码中给出的实现,pdf报告中也运用了其他方法。实现车辆识别和车牌检测。
2024-11-10 14:39:39
170
1
原创 Hopcroft算法划分解释
针对N,字符e可以将q2,q4划分出去,q0和q1在接收e时仍在集合内部,但是q2和q4就会转移到q3,q5,因此得到{q0,q1},{q2,q4},{q3,q5}针对{q0,q1},字符e可以将q1划分出去,q0仍在集合内,q1会转移到{q2,q4},因此可以划分为{q0},{q1}针对这个DFA图,首先将其切分为 N 和 A, N 是 q0, A 是 {q1, q2, q3}。针对字符c,q1,q2,q3都将转到该集合,所以不需要对A进行划分。针对字符b,q1,q2,q3都将转到该集合。
2024-10-01 16:04:00
391
原创 快速下载Imagenet数据集
可惜我想要下载的是ILSVRC2012没有找到单独下载的链接,在看到相关大佬的文章,发现可以直接在服务器上使用wget进行下载,也可以使用wget的并行化版本mwge下载(但是具体没有详细了解),以下是我搜索得到的。使用 `mwget` 工具可以实现多线程下载,从而提高下载速度。可以在这个网站上找多很多相关数据集下载,可以使用aria2c加速下载,基本上是5MB的速度,也可以直接下载或者使用磁力下载。此时 val 目录下是50000张图像,并没有被分类到1000个文件夹下。执行命令,进入3个文件所在的。
2024-09-23 18:56:33
1862
原创 打开vscode后弹出【此应用无法在你的电脑上运行】,而且保持vscode开启状态时,每隔一段时间都会弹出来一次
我的解决方案:把插件(阿里的TONGYI Lingma(通义灵码))删除了之后再打开没有出现弹窗,再次下载之后就会出现弹窗(“此应用无法在你的电脑上运行”),也可以将.vscode内容全部清空后重新下载vscode,可以检查一下是不是有插件导致的出现弹窗。原因:可能是部分插件冲突了,
2024-08-29 17:20:33
587
原创 Streamlit 遇到 AxiosError: Request failed with status code 403 错误
配置文件的方法经常会忘了修改回来,毕竟这个属于安全配置,生产环境忘记启用影响很大。
2024-08-24 22:48:07
444
原创 模糊综合评价
对多因素影响的事务的评价(如人才,方案,成果),有时难以给出影响的确切表达,此时可以采取模糊综合评价的方法。该方法可以对人,事,物进行比较全面而又定量化的评价。多级模糊评价适合 与评价因素过多,而且可能一个因素下有多个因素。确定权系数向量,也就是三个指标的重要程度。
2024-07-17 19:45:16
191
原创 0x08048000(32) 0x00400000(64)为什么起始位置是这两个
0x08048000(32) 0x00400000(64)为什么起始位置是这两个
2024-06-17 23:33:45
485
原创 临床预测模型:KM曲线
这表示在该时间点还未发生事件(如死亡或失访)的受试者数量。3)绘制曲线:以时间为横轴,生存率为纵轴绘制曲线。每当发生事件时,曲线向下跳跃,大小与该时间点发生事件的比例成正比。:KM方法不需要对数据的生存时间分布做出任何假设,使其适用于各种类型的生存时间数据。Kaplan-Meier曲线(KM曲线)是生存分析中常用的一种工具,用于估计在。是一种统计方法,用于预测事件(如死亡、疾病复发等)的发生时间。1)时间排序:首先将所有参与者按照发生事件的时间排序。2)计算生存率:对于每一个独特的时间点,计算生存率。
2024-04-10 00:35:08
3866
原创 临床模型预测:临床影响曲线(CIC)
例如,如果某种新的诊断测试对于检测一种罕见疾病具有较高的敏感性,但同时也有较高的假阳性率,那么在应用这种测试时,虽然可以较少地错过真正的病例,但也可能导致大量健康人被错误地诊断为疾病患者。以上图为例,在x轴上风险阈值为0.2的地方,用我们构建的临床预测模型预测的发生风险的人数大约在600人,而实际发生风险的人数大概在370人。在x轴上风险阈值为0.6的地方,用我们构建的临床预测模型预测的发生风险的人数大约在380人,而实际发生风险的人数大概在300人,优于0.2阈值。的发生结局事件的人数,
2024-04-10 00:21:59
3966
3
原创 临床预测模型:DCA曲线(决策曲线分析)
在DCA图中,通常会包括几条参考线作为比较的基准,最常见的有:“不采取任何行动”(Treat None)的净收益线:假设没有患者被治疗,此时的净收益是零。模型的净收益曲线如果在较宽的阈值概率范围内保持较高的净收益,且变化平稳,可能表明该模型具有较好的泛化能力和一致的性能。4)曲线的交叉点:如果两个模型的决策曲线在某些阈值概率下交叉,这表明不同模型可能在不同的阈值概率范围内各有优势。1)查找净收益最高的曲线:在特定的阈值概率下,净收益最高的模型曲线表示该模型在该阈值下为临床决策提供了最大的益处。
2024-04-10 00:11:13
21289
2
原创 临床预测模型:校准曲线
区分能力反映了模型区别不同结果能力的效果,其核心评价指标包括ROC曲线下面积(AUC)和C指数,校准性则指模型预测的准确度,它通过比较预测结果和实际发生情况之间的吻合程度来衡量。校准曲线是将Hosmer-Lemeshow测试结果可视化的方法,通过对比不同分位数上的预测概率与观察概率,来作为评估预测概率准确性的图形工具,实际上展现的是预测概率与发生概率的对比散点图。S:z和S:p是Spiegelhalter Z-test的Z值和P值,要求P>0.05,说明无差异,说明拟合的线与标准参考线吻合度高。
2024-04-09 23:55:21
2935
2
原创 请看下面这个帖子,你相信2038年是世界末日吗?试分析为什么手机日期设置出现这种怪事。
而32位机器中所能表示的最大整数(有符号数)的值为2^31 -1(二进制表示为011......111),即2147483647,此时如果再增加1,数据就会出现“装不下”的情况,发生溢出,符号位由0变为1,二进制表示就会变成(100......000),其对应的原码为-2^31,即-2147483648。2.使用支持更大时间范围的日期和时间库,直接改变初始时间是不太可行的,需要修改系统的底层实现和许多相关的应用程序和库,很多系统和软件都是基于Unix时间戳的标准来进行时间计算和表示的(千年虫问题)
2024-03-20 09:03:02
601
3
原创 解决linux中执行文件权限不够的情况
这通常用于执行脚本文件,比如 shell 脚本,目的是为了在当前的shell环境中改变变量或者定义函数等。这种方式不会创建新的进程,而是直接在当前的shell进程中执行命令。2.第二种方法可以从根本上解决问题,显示权限不够,实际上是可执行文件的权限存在问题。修改后重新执行文件,./vspm a-inst.txt命令可以正确执行文件。1.可以使用. vspm的命令来运行,可以比较一下两种运行方式的区别。在执行文件的过程中,使用./命令无法正确执行,并显示权限不够的情况。),但没有执行权限(
2024-03-12 20:11:41
10737
2
原创 Ubuntu22.04虚拟机网络标识消失的处理办法
有时,我们经常发现虚拟机的网络连接失败,会出现网络图标消失或者图标上出现问号的情况,处理方法如下:直接在linux终端上输入以上命令,图标将重新出现。
2024-03-01 22:16:11
508
2
原创 自编码和gan
Generator 会根据随机数来生成有意义的数据 , Discriminator 会学习如何判断哪些是真实数据 , 哪些是生成数据, 然后将学习的经验反向传递给 Generator, 让 Generator 能根据随机数生成更像真实数据的数据。而是用来”凭空”捏造结果, 这就是我们要说的生成网络啦. GAN 就是其中的一种形式. 那么 GAN 是怎么做到的呢?当然这里的”凭空”并不是什么都没有的空盒子, 而是一些随机数.GAN 生成对抗网络 Generative Adversarial Nets。
2024-01-12 16:03:36
454
原创 机器学习三种网络
想想我们人类是怎么分析各种事物的关联吧, 最基本的方式,就是记住之前发生的事情. 那我们让神经网络也具备这种记住之前发生的事的能力. 再分析 Data0 的时候, 我们把分析结果存入记忆. 然后当分析 data1的时候, NN会产生新的记忆, 但是新记忆和老记忆是没有联系的. 我们就简单的把老记忆调用过来, 一起分析. 如果继续分析更多的有序数据 , RNN就会把之前的记忆都累积起来, 一起分析.的数, 比如1.1 不断累乘, 则到最后变成了无穷大的数, RNN被这无穷大的数撑死了, 这种情况我们叫做。
2024-01-12 16:01:20
981
原创 机器学习初步知识以及神经网络理解
我想让神经网络学着帮我做这件动动手的事情. 所以我预先准备好非常多吃糖的学习数据, 然后将这些数据一次次放入这套人工神经网络系统中, 糖的信号会通过这套系统传递到手. 然后通过对比这次信号传递后, 手的动作是不是”讨糖”动作, 来修改人工神经网络当中的神经元强度. 这种修改在专业术语中叫做”误差反向传递”, 也可以看作是再一次将传过来的信号传回去, 看看这个负责传递信号神经元对于”讨糖”的动作到底有没有贡献, 让它好好反思与改正, 争取下次做出更好的贡献。通过数据得到最后结果,数学模型或计算机模型。
2024-01-12 15:54:25
385
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人