自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(59)
  • 收藏
  • 关注

原创 【资料分享】清华大学《DeepSeek:从入门到精通》官方指南:解锁AI时代的核心生产力工具

清华大学《DeepSeek:从入门到精通》官方指南:解锁AI时代的核心生产力工具

2025-02-09 18:41:29 19269 24

原创 【KAN】KAN神经网络学习训练营(15)——API 3:样条

KANs(科洛莫哥洛夫-阿诺德网络)的一个重要特点是将样条嵌入到神经网络中。然而,样条仅在已知的有界区域内有效于函数近似,而神经网络中的激活范围可能在训练过程中发生变化。因此,我们必须根据这一情况恰当地更新网格。首先,让我们了解一下我们是如何参数化样条的。

2025-04-01 10:00:00 1318

原创 【KAN】KAN神经网络学习训练营(14)——API 2:绘图

KAN神经网络(Kolmogorov–Arnold Networks)是一种基于Kolmogorov-Arnold表示定理的新型神经网络架构。该定理指出,任何多元连续函数都可以表示为有限个单变量函数的组合。与传统多层感知机(MLP)不同,KAN通过可学习的激活函数和结构化网络设计,在函数逼近效率和可解释性上展现出潜力。

2025-03-31 10:00:00 637

原创 【KAN】KAN神经网络学习训练营(13)——API 1:索引

KAN神经网络(Kolmogorov–Arnold Networks)是一种基于Kolmogorov-Arnold表示定理的新型神经网络架构。该定理指出,任何多元连续函数都可以表示为有限个单变量函数的组合。与传统多层感知机(MLP)不同,KAN通过可学习的激活函数和结构化网络设计,在函数逼近效率和可解释性上展现出潜力。

2025-03-30 10:00:00 1368

原创 【KAN】KAN神经网络学习训练营(12)——utils.py

符号函数库的构建与扩展:不仅定义了基本的符号函数,还提供了奇异性保护机制,并允许用户动态添加新的符号函数。数据集生成与预处理:既支持基于符号公式生成合成数据,也能根据现有数据进行训练/测试划分与归一化。参数拟合:通过网格搜索和线性回归方法拟合非线性函数中的仿射参数。自动求导工具:实现了批量计算雅可比和 Hessian 的方法,为模型敏感性分析和二阶优化提供支持。模型参数管理:提供了将模型参数展平和动态加载的工具,方便在求导时更新模型状态。

2025-03-29 10:00:00 1872

原创 【KAN】KAN神经网络学习训练营(11)——Symbolic_KANLayer.py

该代码实现了一个符号激活神经网络层,其核心特点在于:灵活的激活函数:每条输入-输出连接可以选择不同的激活函数(例如 sin、cos 等),并支持符号表达式版本,便于后续分析和解释。仿射参数拟合:每个连接不仅有激活函数,还通过四个参数 [a, b, c, d] 对输入进行仿射变换,使得激活函数能够更好地适应数据分布。奇异性处理:提供了funs_avoid_singularity 版本来确保在输入接近奇异值时不会出现数值不稳定。模块化设计:方便地对网络结构进行剪枝或重新排列,便于构建和优化模型。

2025-03-28 10:00:00 912

原创 【KAN】KAN神经网络学习训练营(10)——spline.py

这段代码提供了一套完整的B样条处理工具,包括基函数的计算、曲线的生成与评估、以及从曲线恢复系数的功能,适用于需要进行平滑插值或曲线拟合的场景。

2025-03-27 10:00:00 1268

原创 【KAN】KAN神经网络学习训练营(9)——MultKAN.py

该代码实现了一个创新的可解释神经网络架构,主要特点包括:双通道计算:数值样条基函数与符号函数并行计算。动态结构:支持节点剪枝、边修剪、网络扩缩。自适应训练:周期性调整样条网格分布。符号回归:自动发现数学表达式替代数值函数。可视化支持:丰富的网络结构可视化方法。正则化体系:多角度约束模型复杂度。适用于需要模型可解释性的科学计算场景,在保持神经网络拟合能力的同时提供数学可解释性。

2025-03-26 10:00:00 1182

原创 【KAN】KAN神经网络学习训练营(8)——MLP.py

该MLP类不仅实现了标准的神经网络功能,还集成了多种高级特性:灵活的正则化策略:支持基于权重、激活或重要性评分的正则化。结构可视化:直观展示网络权重和连接重要性。自动结构优化:通过交换神经元位置优化网络连接。多种训练选项:支持不同的优化器和训练参数配置。激活分析:保存并分析各层激活值,用于后续处理。

2025-03-25 10:00:00 725

原创 【KAN】KAN神经网络学习训练营(7)——LBFGS.py

该代码实现了一个基于 LBFGS 算法的优化器,其中包含了:利用三次插值计算步长的辅助函数 _cubic_interpolate;实现强 Wolfe 线搜索策略的函数 _strong_wolfe;LBFGS 优化器类LBFGS,该类继承自 PyTorch 的 Optimizer,实现了对参数梯度的聚合、历史信息的存储与更新以及基于二阶信息(有限记忆近似 Hessian)的下降方向计算。整体思路是先利用历史信息来近似计算逆 Hessian,从而获取一个较优的下降方向,再通过线搜索调整步长。

2025-03-24 10:00:00 1946

原创 【KAN】KAN神经网络学习训练营(6)——KANLayer.py

代码实现了一个基于样条函数的自适应非线性层,通过动态更新网格和样条系数,将输入变量进行局部多项式拟合,并结合残差函数增强模型表达能力。各个辅助方法(如网格更新、子集提取和神经元交换)为模型的灵活性和可解释性

2025-03-23 10:00:00 1043

原创 【KAN】KAN神经网络学习训练营(5)——hypothesis.py

整个代码主要围绕模型输入变量间的相互作用、可分性和对称性检测展开,并进一步构建变量组合的层次结构(树形图),以解释模型内部结构及其拟合机制。每个函数都利用数值计算(例如梯度和 Hessian)及聚类或统计方法对模型进行深入分析。

2025-03-22 10:00:00 1107

原创 【KAN】KAN神经网络学习训练营(4)——feynman.py

该代码用于生成不同费曼物理方程对应的符号表达式、PyTorch计算函数及变量取值范围,主要用于符号回归(Symbolic Regression)任务的基准测试。

2025-03-21 10:00:00 883

原创 【KAN】KAN神经网络学习训练营(3)——experiment.py

该代码主要涉及一个名为 KAN 的模型的训练、剪枝和优化过程,同时还包括一个计算帕累托前沿(Pareto Frontier)的辅助函数。

2025-03-20 10:00:00 944

原创 【KAN】KAN神经网络学习训练营(2)——compiler.py

Kolmogorov-Arnold 表示定理Kolmogorov-Arnold 表示定理指出,如果 是有界域上的多元连续函数,那么它可以写为单个变量的连续函数的有限组合,以及加法的二进制运算。更具体地说,对于 光滑其中 和。从某种意义上说,他们表明唯一真正的多元函数是加法,因为所有其他函数都可以使用单变量函数和 sum 来编写。然而,这个 2 层宽度 - Kolmogorov-Arnold 表示可能不是平滑的由于其表达能力有限。我们通过以下方式增强它的表达能力将其推广到任意深度和宽度。

2025-03-19 10:00:00 1327

原创 【KAN】KAN神经网络学习训练营(1)——你好KAN!

KAN神经网络(Kolmogorov–Arnold Networks)是一种基于Kolmogorov-Arnold表示定理的新型神经网络架构。该定理指出,任何多元连续函数都可以表示为有限个单变量函数的组合。与传统多层感知机(MLP)不同,KAN通过可学习的激活函数和结构化网络设计,在函数逼近效率和可解释性上展现出潜力。

2025-03-18 10:00:00 1933

原创 【KAN】Kolmogorov-Arnold Networks (KANs):超越传统MLP的新型神经网络架构摘要

受Kolmogorov-Arnold表示定理的启发,本文提出了Kolmogorov-Arnold网络(KANs)作为多层感知器(MLP)的替代方案.MLP在节点(“神经元”)上具有固定的激活函数,而KAN在边缘(“权重”)上具有可学习的激活函数。KAN根本没有线性权重--每个权重参数都被一个参数化为样条的单变量函数所取代。我们发现,这种看似简单的变化使得KAN在小规模AI +科学任务的准确性和可解释性方面优于MLP。对于精度,较小的KAN可以在函数拟合任务中实现与较大的MLP相当或更好的精度。

2025-03-17 10:00:00 1120

原创 【资料分享】浙江大学2025年DeepSeek行业应用案例集解析

在数字化转型的浪潮中,DeepSeek 以其强大的技术实力和广泛的应用场景,为各行业带来了前所未有的变革与机遇。本报告深入剖析了 DeepSeek 在农业、制造业、交通运输、信息技术、金融业、医疗、教育等关键领域的应用案例,展示其如何助力各行业迈向智能化未来。

2025-03-16 10:00:00 1628

原创 【资料分享】厦门大学林子雨团队:大模型技术解析与应用实践指南

在数字化浪潮席卷全球的今天,大模型技术宛如一颗璀璨新星,照亮了人工智能领域的前行道路。厦门大学大数据教学团队精心打造的《大模型概念、技术与应用实践》报告,为我们全方位解析了大模型技术的奥秘,揭示其在当下及未来社会中的深远影响,成为我们探索人工智能世界的宝贵指南。

2025-03-15 10:00:00 736

原创 【资料分享】北大青鸟AI肖睿团队:DeepSeek提示词工程与落地场景全解析

在人工智能浪潮席卷全球的当下,如何高效驾驭AI工具,释放其潜能,成为各界人士瞩目的焦点。北京大学青鸟人工智能研究院、北大计算机学院元宇宙技术研究所及北大教育学院学习科学实验室联合推出的DeepSeek系列研讨,聚焦提示词工程与产业实践,为大众开启了一扇通往AI高效应用的大门。

2025-03-14 10:00:00 1408

原创 【群智能算法】PSO-TSP 基于粒子群优化算法的旅行商问题求解-MATLAB

旅行商问题(Traveling Salesman Problem,TSP)一直是运筹学与计算智能领域的经典难题:给定若干城市,要求在访问每个城市恰好一次的前提下规划一条最短(或代价最低)的巡回路线。由于TSP具备组合爆炸特性,当城市数量增多时,问题规模呈指数增长,故而在精确算法难以短时间内求解的情况下,群体智能算法与元启发式算法应运而生。粒子群优化(Particle Swarm Optimization,PSO)是一种基于群体协同和个体最优记忆的随机搜索技术,最初应用于连续空间优化,而后逐步衍生出适应离散优

2025-03-13 10:00:00 1018

原创 【机器学习】基于t-SNE的MNIST数据集可视化探索

在机器学习和数据科学领域,高维数据的可视化是一个极具挑战但又至关重要的问题。高维数据难以直观地理解和分析,而有效的可视化方法能够帮助我们发现数据中的潜在结构、模式和关系。本文以经典的MNIST手写数字数据集为例,探讨如何利用t-分布随机邻域嵌入(t-SNE)这一强大的降维技术,将高维的图像数据降维到二维空间,并进行可视化展示。通过本文,我们将深入了解t-SNE的原理、算法步骤,以及如何在Python中实现并应用它,从而更好地理解和探索高维数据的内在特性。

2025-03-12 10:00:00 1235

原创 【爬虫】基于Python爬虫的猫眼电影Top100数据抓取与分析

互联网时代,数据如同金矿,蕴藏着巨大的价值。网络爬虫作为一种自动化的数据采集工具,在数据挖掘、市场分析、舆情监控等领域发挥着越来越重要的作用。本文以猫眼电影Top100榜单为例,详细阐述如何利用Python编写爬虫程序,抓取网页数据并进行存储。我们将深入探讨爬虫的原理、关键技术,并对代码进行逐行解析,最后进行总结与思考,旨在帮助读者掌握爬虫的基本技能,并能将其应用于实际场景中。

2025-03-11 10:00:00 1944

原创 【资料分享】IF=500+!基于鼻咽癌诱导化疗后减容放疗与常规减容放疗比较的研究综述

在鼻咽癌(Nasopharyngeal Carcinoma, NPC)的综合治疗中,诱导化疗(Induction Chemotherapy, IC)可显著缩小肿瘤体积,随后行放射治疗(Radiotherapy, RT)已成为临床常见策略。传统共识通常建议按诱导化疗前(Pre-IC)的肿瘤范围进行常规放疗;然而,减容放疗(Reduced-volume RT)基于诱导化疗后(Post-IC)显著缩小的肿瘤体积进行精准照射,能否在保持局部控制率的同时进一步降低放射性毒性、改善患者生活质量(QoL),一直是临床研究

2025-03-10 10:00:00 636

原创 【爬虫】基于Python的网络爬虫技术原理与实现——以豆瓣电影Top250数据采集为例

本文将介绍一个基于Python语言的简单豆瓣电影Top 250爬虫的实现过程,主要通过使用 requests 库进行网页请求,使用 BeautifulSoup 库进行网页解析,并将结果保存为 CSV 格式供后续分析使用。本文不仅将涉及具体的代码实现,还将详细分析实现过程中所涉及的爬虫原理、数据提取方法和解析步骤,同时结合算法优化的实践探讨,帮助读者更好地理解这一过程。

2025-03-09 10:00:00 1226

原创 【LLM大模型】OpenManus:开启人工智能代理的新篇章

在人工智能的浪潮中,Manus 作为一款备受瞩目的 AI 代理工具,因其强大的功能和独特的设计理念引发了广泛关注。然而,Manus 的访问受到邀请码的限制,这使得许多开发者和爱好者无法直接体验其魅力。正是在这样的背景下,OpenManus 应运而生。它由 MetaGPT 社区的核心贡献者团队开发,仅用 3 小时就完成了初步实现。OpenManus 的出现,不仅打破了邀请码的限制,更以其开放性和灵活性为开发者提供了一个全新的平台,让人们可以自由地探索和实现自己的创意。

2025-03-08 10:00:00 1038

原创 【AI-LLM】全球首款通用Agent产品Manus:颠覆性AI革命已来!

2025年3月6日,中国团队Monica.im正式发布全球首款通用AI Agent(自主智能体)产品——Manus(拉丁语意为“手脑并用”)。与传统的聊天机器人或AI助手不同,Manus能像人类一样独立规划、执行复杂任务并直接交付完整成果,而非仅提供建议或分步指导。        从官方演示视频可见,当用户输入“策划一场东南亚旅行”时,Manus会自动完成机票比价、酒店筛选、景点路线规划等操作,甚至生成包含动态地图的可视化行程表。其核心突破在于**“自主执行闭环”**——通过虚拟环境调用工具(如代码编写

2025-03-07 10:00:00 2060

原创 【资料分享】LLM竞技场风云突变:Grok 3 vs Claude 3.7 vs DeepSeek-R1 vs GPT-4.5

人工智能技术的迅猛发展推动了大语言模型(LLMs)的迭代升级,然而模型性能的评估却面临两大核心挑战:测试集污染(模型通过训练数据记忆答案)和评测维度单一(过度依赖技术指标或主观偏好)。在此背景下,LiveBench与LMSYS两大评测平台应运而生,分别从客观能力验证与用户体验洞察切入,构建了互补的评估体系,成为学术界与产业界的重要参考工具。

2025-03-06 10:00:00 1343

原创 【回归预测】GAM广义加性模型-MATLAB

随着大数据与人工智能技术的发展,回归分析已成为数据科学中的重要工具。它被广泛应用于多个领域,如金融预测、健康监测、工程系统控制等。广义加法模型(Generalized Additive Model, GAM)作为一种灵活的回归方法,能够有效捕捉输入变量与输出变量之间的非线性关系,是对传统线性回归模型的扩展。本文以广义加法模型为基础,通过MATLAB编程实现回归分析,并对其在数据预测中的应用进行详细探讨。文章将逐步分析广义加法模型的原理、算法步骤,并结合具体的代码实现进行详细讲解。

2025-03-05 10:00:00 1316

原创 【自动化】基于Python的PDF批量转换Word工具实现与优化研究

本文将介绍一种基于Python的PDF批量转换Word的工具的设计与实现,重点阐述了如何通过合理的算法和优化策略提高工具的转换效率,并通过多线程和进度条等功能提升用户体验。文章将首先介绍相关原理与算法,然后详细解析实现过程中的每一段代码,最后进行总结与思考,探讨工具优化的可能性。

2025-03-04 10:00:00 796

原创 【资料分享】YOLO 系列十年发展回顾:从 YOLOv1 到 YOLOv12 的进阶与创新

本文将围绕 YOLOv1 到 YOLOv12 的发展历程进行系统梳理,分析每个版本的提出时间、核心创新点、网络结构改进、性能提升以及其在工业界的影响。文末还将对 YOLO 系列在当前趋势下的未来发展做简要讨论,并总结 YOLO 在目标检测领域的整体价值与启示。

2025-03-03 10:00:00 1379

原创 【神经网络】基于连续Hopfield神经网络的旅行商问题优化算法研究

本文旨在探讨利用连续Hopfield神经网络(Continuous Hopfield Neural Network, CHNN)解决TSP问题的优化算法。CHNN是一种具有并行计算能力的神经网络模型,能够有效地搜索问题的可行解空间。本文将详细介绍CHNN的原理、算法步骤,并结合MATLAB代码进行深入分析,旨在为读者提供一个全面理解和应用CHNN解决TSP问题的实践指南。

2025-03-02 00:53:00 798

原创 【神经网络】基于 BP-Adaboost 算法的强预测器构建与应用-MATLAB

在机器学习领域,预测问题一直是一个极为重要的课题,尤其是在许多实际应用中,准确预测具有重要意义。本研究基于BP神经网络(Backpropagation Neural Network)与AdaBoost算法(Adaptive Boosting),设计并实现了一个强预测器模型。通过将多个弱预测器集成成一个强预测器,我们能够有效提升预测精度并降低误差。本文提出一种基于反向传播(BP)神经网络与自适应增强(Adaboost)的集成学习方法,通过动态样本权重调整与弱预测器融合提升预测精度。

2025-03-01 00:51:47 633

原创 【AI大模型】Ollama+WebUI+ChatWise+Chatbox AI+Cherry Studio+MATLAB+DeepSeek-R1本地可视化运行

随着人工智能技术的不断发展,越来越多的企业和开发者开始重视本地大模型的部署与应用。相比云端服务,本地模型在数据隐私、响应速度以及自定义方面具有独特优势。本文将从理论到实战,详细解析如何利用 MATLAB 这一强大计算工具结合 Ollama 构建和部署本地 AI 大模型,带你走进智能应用新时代。

2025-02-28 19:58:31 1823

原创 【神经网络】基于BP神经网络的语音识别系统设计与实现-MATLAB

随着人工智能技术的不断发展,语音识别作为其中一个重要的研究领域,得到了广泛的关注和应用。特别是在语音信号分类和模式识别中,神经网络的应用表现出了巨大的潜力。本文将介绍一种基于反向传播(BP)神经网络的语音识别系统。通过训练神经网络,利用语音信号的特征进行分类,完成不同语音类别的识别任务。本文详细介绍了该系统的设计过程,包括数据预处理、BP神经网络模型的构建、训练过程、分类结果分析等。最终,通过实验结果对该系统的表现进行了总结与思考。

2025-02-28 10:00:00 1299

原创 【爬虫】基于 Selenium 的 Python 淘宝评论爬取

随着电子商务的发展,消费者评论已经成为购买决策中重要的参考因素之一。如何高效地抓取并分析大量的在线评论,成为了数据分析领域的重要课题。本文将探讨如何使用 Selenium 和 Python 自动化工具抓取网页中的评论数据,并结合技术实现分析过程。我们将详细介绍相关的抓取原理,如何利用 Selenium 库编写 Python 程序来实现这一目标,以及每段代码的详细解析。本篇文章不仅适合初学者学习如何使用 Selenium 进行网页抓取,也对有一定编程经验的读者提供了详细的技

2025-02-27 10:00:00 4358 4

原创 【群智能算法】GA-TSP 基于遗传算法的配送路径优化问题-Python

        本文旨在利用遗传算法解决一个简化的配送路径优化问题。该问题描述如下:存在一个起点和若干个配送点,需要找到一条路径,使得从起点出发,经过所有配送点,最终回到起点的总距离最短。本文首先介绍遗传算法的基本原理;然后,详细解释代码的实现过程,包括距离计算、种群初始化、适应度函数、选择、交叉和变异等操作;接着,展示算法的运行结果,并对结果进行可视化;最后,对算法的优缺点进行讨论,并展望未来的研究方向。本文将帮助读者理解遗传算法在解决路径优化问题中的应用,并为读者提供一个可供参考的实现方案。

2025-02-26 10:00:00 1220

原创 【资料分享】Moonlight 模型全面解析,性能吊打DeepSeek?!

Muon作为一种“谱范数”约束下的优化器,为大规模 LLM 训练提供了与 AdamW 不同的思路。它从矩阵正交化出发,通过 Newton-Schulz 迭代来近似实现对梯度矩阵的正交化操作,避免网络在少数特征方向上过度拟合。结合 Weight Decay、更新尺度匹配、分布式实现等改进,论文在大规模场景下证明了 Muon 对 AdamW 的替代潜力。Moonlight模型的实验显示,Muon 在训练效率与最终性能之间取得了优良平衡,对小目标场景与多任务能力都有明显提升。

2025-02-25 10:00:00 1257

原创 【图像处理】传统图像处理技术全景解析

传统图像处理方法是指在计算机视觉和图像处理领域的早期阶段广泛应用的经典技术和方法。

2025-02-24 10:00:00 1775

原创 【资料分享】YOLOv12:注意力驱动的实时目标检测器

YOLOv12 在结构上将CNN 与 Transformer进行了高效融合,既保留了 YOLO 系列快速特征提取与多尺度融合的优点,又通过注意力机制获得了更强的上下文感知能力。注意力机制的硬件友好度:在硬件逐渐支持 FlashAttention 等技术的背景下,注意力机制在实时检测中将占据更重要的位置。分层注意力设计:浅层与深层对注意力的需求不同,论文通过分层嵌入不同注意力模块,值得其他视觉任务(如语义分割、关键点检测)借鉴。

2025-02-23 10:00:00 997

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除