- 博客(101)
- 收藏
- 关注
原创 扩散模型简介
扩散模型通过逆扩散过程生成数据,在图像、文本等领域表现优异,但需权衡生成质量与计算效率。未来研究方向包括模型加速、多模态融合及理论优化。
2025-04-12 19:43:50
142
原创 python示例类
这是一个简单的 Python 类示例,这个类代表一个名为 Person 的对象,具有姓名、年龄属性,并且有自我介绍和增加年龄的方法。在类的外部,创建了一个 Person 类的实例 person1,并调用了 introduce 和 have_birthday 方法。_ 方法:这是类的构造函数,用于初始化对象的属性,也就是姓名和年龄。have_birthday 方法:用于增加对象的年龄并输出相关信息。introduce 方法:用于打印对象的自我介绍信息。
2025-04-02 18:04:12
218
原创 MCP(Model Context Protocol,模型上下文协议)
MCP(Model Context Protocol,模型上下文协议)是大语言模型领域由Anthropic公司于2024年11月推出的开放协议,旨在通过标准化接口实现LLM(大语言模型)与外部数据源、工具及服务的高效安全集成。
2025-03-29 08:48:55
286
原创 Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric
文章聚焦于大语言模型指令调优中数据多样性的度量问题,通过实验分析现有度量方法的不足,提出了新度量指标NovelSum和数据选择策略NovelSelect,为指令调优的数据工程实践提供了有效指导。
2025-03-21 23:10:44
413
原创 DoS攻击防范
实际防御需结合业务场景选择组合策略。例如,中小型网站可采用“CDN+WAF+流量清洗”方案,金融等高安全需求场景推荐“高防IP+集群化部署+实时监控”。
2025-03-13 22:46:18
181
原创 密码学研究热点
开发能够抵抗量子计算机攻击的加密算法,如基于格的密码学(LWE、NTRU)、基于同源的密码学(Isogeny)和基于编码理论的密码学。
2025-03-13 22:07:48
1183
原创 比特币中的相关技术
去中心化:没有中心机构控制。透明可查:所有交易公开,但用匿名地址保护隐私。防篡改:区块链+密码学确保数据安全。抗审查:任何人可自由参与转账和记账。
2025-03-08 19:43:57
917
原创 JavaScript中的主要知识点
变量声明使用 var(函数作用域)、let(块级作用域)和 const(常量)声明变量,理解变量提升与暂时性死区。数据类型分为基本类型(Undefined、Null、Boolean、Number、String、Symbol、BigInt)和引用类型(Object、Array、Function)。注意类型转换规则(如 == 与 === 的区别)。运算符与控制流程包括算术、比较、逻辑运算符,以及 if/else、switch、for/while 循环等流程控制语句。
2025-03-06 11:36:52
319
原创 c++中的主要知识点
封装与访问控制通过 public、private、protected 控制类成员的可见性,隐藏实现细节。继承与多态继承实现代码复用,动态多态通过虚函数(virtual)和纯虚函数(抽象类)实现运行时绑定。静态多态包括函数重载和模板(编译期确定)。类与对象构造函数/析构函数、拷贝构造函数、深浅拷贝问题(需手动管理堆内存)。运算符重载(如 +、=)和友元函数。
2025-03-06 11:33:29
181
原创 java中的主要知识点
基本数据类型:byte、short、int、long、float、double、char、boolean,以及引用类型(类、接口、数组)。运算符与流程控制:算术/逻辑运算符、条件语句(if-else、switch)、循环结构(for、while)。数组与集合数组是固定长度的同类型元素集合,索引从 0 到 length-1,需注意越界异常。集合框架包括 List(如 ArrayList、LinkedList)、Map(如 HashMap)、Set(如 HashSet)等,支持动态扩容。
2025-03-06 10:54:26
244
原创 c语言中的主要知识点
程序结构包含顺序结构、选择结构(if/switch)、循环结构(for/while/do-while)。程序必须包含且仅有一个main函数作为入口。数据类型与变量基本类型:整型(int、long)、浮点型(float、double)、字符型(char)。构造类型:数组(需注意初始化规则)、结构体、共用体。常量与变量:常量需通过const或#define定义;变量需先定义后使用,区分全局变量(作用域整个程序)和局部变量(作用域限于代码块)。运算符与表达式。
2025-03-05 18:32:14
164
原创 python中的主要知识点
变量与数据类型动态类型:无需声明变量类型,支持整数、浮点数、字符串、布尔值等。核心数据类型:列表(可变有序)、元组(不可变有序)、字典(键值对)、集合(无序不重复)。代码结构与规范缩进:用4个空格表示代码块,替代大括号。注释:以#开头,多行注释可用三引号。输入与输出input()获取用户输入,print()输出内容,支持字符串格式化(如f-string)。
2025-03-05 18:28:56
226
原创 计算机视觉领域的研究热点
当前研究呈现两大特点:技术融合:如3D建模与生成模型结合、多模态与大语言模型协同;实用化导向:聚焦实时性(自动驾驶、机器人)、鲁棒性(跨域适应)和可解释性(医学诊断)。
2025-03-05 14:26:37
270
原创 人工智能技术的典型应用场景
以癌症筛查为例,传统的人工诊断可能会因为医生的经验和主观判断存在一定的误差,而AI辅助影像诊断系统可以对影像进行细致入微的分析,发现那些人类肉眼难以察觉的微小病变,大大提高了癌症早期筛查的准确率。例如,在航空发动机的维护中,预测性维护系统可以根据发动机的运行数据,提前发现潜在的故障隐患,避免因发动机故障导致的航班延误或事故。通过自然语言处理技术,人工智能系统可以对学生的作文、简答题等主观题进行准确批改,同时根据学生的答题情况生成详细的学习反馈,指出学生的优点和不足之处,为学生提供有针对性的学习建议。
2025-03-02 19:25:31
972
原创 基于ai技术的视频生成工具
特点:支持数字人播报、文字转视频,提供免费模板和素材库,登录即送5分钟免费时长,每日签到可兑换额外额度。限制:免费版分辨率较低,部分高级功能需付费。
2025-03-01 19:30:46
703
原创 大语言模型的不足与研究热点
大语言模型的不足主要集中在技术局限、数据依赖和应用风险,而研究热点则围绕效率优化、多模态扩展及垂直领域深化展开。未来需结合人类反馈(如伦理审核)与技术创新(如轻量级微调),平衡模型能力与可控性。更多技术细节可参考相关研究。
2025-02-25 11:55:57
700
原创 Accurate predictions on small data with a tabular foundation model
TabPFN 是一种很有前景的表格数据基础模型,它能够实现高精度预测并具有强大的基础模型特性。TabPFN 的提出为开发更高效、更鲁棒的表格数据学习方法开辟了新的途径,并为各种应用场景提供了强大的工具。
2025-02-11 15:53:44
366
1
原创 降维算法概述
线性问题:优先选择PCA或LDA(若有标签)。可视化需求:t-SNE或UMAP(后者更高效)。流形结构数据:Isomap或LLE。深度学习场景:自动编码器。计算资源有限:随机投影或增量PCA。
2025-02-10 21:37:04
692
1
原创 机器学习中常用的数据预处理方法
广告 CTR 预测(构造用户行为组合特征);图像识别(提取边缘特征)。:归一化用于图像像素值处理;标准化用于非均匀分布特征(如年龄、收入)。:医疗数据(缺失较多时用模型填充);电商数据(删除缺失少的特征)。:独热编码用于性别、颜色;标签编码用于有序类别(如学历等级)。:图像数据压缩(PCA);高维聚类可视化(t-SNE)。(如图像/文本)依赖增强与向量化。侧重特征工程与缩放,
2025-02-08 15:47:18
867
原创 机器学习中常用的评价指标
### **一、分类任务常用指标**#### 1. **准确率(Accuracy)**- **定义**:正确预测样本数占总样本数的比例。- **优点**:直观易懂,适用于类别平衡的数据。- **缺点**:对类别不平衡数据敏感(如欺诈检测中99%的负样本)。- **应用场景**:类别分布均匀的简单分类任务(如手写数字识别)。#### 2. **精确率(Precision)与召回率(Recall)**
2025-02-07 11:24:36
1073
1
原创 大语言模型概述
大语言模型正从通用型向专业化、多模态、高效率方向演进,同时伦理安全与用户体验成为关键挑战。未来,技术突破将集中在深度推理、行业定制化及人机协作等领域,推动AI从工具向智能伙伴转型。
2025-02-04 20:29:10
750
1
原创 图算法概述
图算法在机器学习和深度学习领域扮演着重要角色,尤其在处理非欧几里得数据(如社交网络、分子结构、知识图谱)时表现突出。传统图算法侧重手工特征与统计方法,而深度学习(尤其是GNN)通过端到端学习自动捕获复杂模式。实际应用中需根据任务需求(实时性、数据规模、可解释性)选择合适的模型。
2025-02-03 19:37:32
738
1
原创 异常检测概述
异常检测是解决“大海捞针”问题的关键技术,其方法从传统统计模型发展到深度生成模型,应用场景覆盖工业、医疗、金融等核心领域。未来需进一步解决动态环境适应、可解释性及小样本学习等挑战,同时结合因果推理、自监督学习等前沿方向提升鲁棒性。异常检测是机器学习与深度学习中的重要研究课题,旨在识别数据中与大多数样本显著偏离的异常样本(离群点)。
2025-02-02 10:57:48
743
原创 遗传算法概述
遗传算法(Genetic Algorithm, GA)是一种模拟生物进化过程的启发式优化算法,其核心思想是通过模拟自然选择、遗传和变异的机制,逐步优化候选解以解决复杂问题。算法维护一个由多个个体(候选解)组成的种群,每个个体通过编码(如二进制、实数等)表示问题的潜在解。例如单点交叉、多点交叉等。通过适应度函数(目标函数)衡量个体的优劣,适应度越高,个体被保留的概率越大。以一定概率随机改变个体的部分编码,增加种群多样性,避免陷入局部最优。通过多代选择、交叉和变异,种群逐渐进化,最终收敛到近似最优解。
2025-02-02 10:53:22
717
原创 分享求职时遇到的一道面试题
5要求用识别率要达到95%以上【注意:测试结果要有10000个不同的样本,命名规范,xxx原图,xxx选择x角度的结果图,这样方便对应看结果】12您可以评估一个费用【如果您认为需要付款给您,也可以的,但是要达到100%的要求】,这个可以付费测试,但是要达到要求。4用程序拖动正确的距离【至少日志要求10000个不同的图片以上,如果有干扰的类似的图片,不算在10000以内】10要求每个步骤要求有日志,通过日志能看到具体的旋转认证码的图片,拖动距离,拖动后的正确与否的判断。百度的旋转认证码识别。
2025-01-31 15:03:30
281
原创 Efficient anomaly detection in tabular cybersecurity data using large language models
目的:帮助模型快速熟悉关键数据特征和模式。方法:随机选择一个正常样本和一个异常样本,将这些样本转换为JSON格式,便于模型处理和理解数据的结构和属性。效果:增强模型对关键模式的早期识别能力,从而实现更快、更准确的异常检测。
2025-01-27 19:02:18
1373
原创 LightGBM算法
LightGBM(Light Gradient Boosting Machine)是一个基于决策树算法的分布式梯度提升框架。它旨在减小数据对内存的使用、减小通信代价并提升多机并行时的效率,从而在数据计算上实现线性加速,在处理大数据集和高维特征时展现出更高的效率和扩展性,是机器学习领域的重要工具,通常应用于二分类、多分类和排序等场景。
2025-01-22 12:22:20
329
1
原创 UMAP(Uniform Manifold Approximation and Projection)算法
UMAP(Uniform Manifold Approximation and Projection)是一种非线性降维技术,主要用于数据可视化和异常检测。它通过构建数据的拓扑图并优化低维表示,能够在保留数据结构和相对距离的同时,将高维数据映射到低维空间。
2025-01-20 19:27:45
632
原创 Facebook Prophet 模型
Facebook Prophet是由Facebook开源的一个时间序列预测算法,旨在通过分解时间序列并利用机器学习技术进行拟合,从而预测未来的趋势、季节性和节假日效应。该模型特别适用于具有明显内在规律的商业行为数据,能够处理多种人类规模级别的季节性趋势和不定期的节假日事件。
2025-01-13 15:53:01
426
原创 VWAP(Volume Weighted Average Price)算法
VWAP(Volume Weighted Average Price),即成交量加权平均价格算法,是目前市场上较为流行的算法交易策略之一,也是很多其他算法交易模型的原型。
2025-01-09 14:03:36
644
原创 TWAP(Time Weighted Average Price)算法
TWAP(Time - WeightedAveragePrice)算法是一种基于时间的交易算法,其核心思想是将一个大额订单分割成多个小额订单,并根据预定的时间间隔均匀地发送至市场。这样做的目的是为了降低大额订单对市场价格的冲击,避免在单一时间点集中交易导致市场价格的大幅波动,以实现均衡交易。
2025-01-09 13:57:51
511
原创 基于python的随机迷宫游戏
运行代码后,会显示一个随机生成的迷宫和一个红色圆形玩家。使用方向键控制玩家移动,避开墙壁,找到绿色方块表示的出口。到达出口后,游戏会自动生成新的迷宫并重置玩家位置,进入下一局。
2025-01-01 20:49:58
778
2
原创 模拟炒股小游戏
股票价格生成:股票价格通过正弦函数生成,并添加随机噪音,模拟真实市场的波动性。交易操作:玩家可以买入或卖出股票,每次交易会扣除0.5%的手续费。交易日推进:玩家可以手动进入下一个交易日,股票价格会更新,总资产也会随之变化。交易历史记录:游戏会记录最近10笔交易,方便玩家回顾操作。
2024-12-30 13:35:14
385
原创 基于python的ai五子棋游戏
运行代码后,点击"Enable AI Opponent"按钮,AI将作为白棋自动下棋。玩家作为黑棋,点击棋盘落子。AI会根据当前棋盘局势自动选择落子位置。
2024-12-29 14:35:08
511
原创 井字棋游戏
玩家点击棋盘下棋(X)。AI 自动下棋(O)。当有一方获胜或平局时,高亮显示获胜连线,并显示 2 秒的获胜信息。2 秒后自动进入下一局游戏。
2024-12-28 22:19:56
827
原创 强化学习寻宝游戏
# 代码说明## 环境设计:10x10 的网格世界,包含智能体、宝藏、障碍物和陷阱。智能体需要避开障碍物和陷阱,找到宝藏。## 奖励机制:找到宝藏:+10踩到陷阱:-5每移动一步:-0.1## 渲染:使用 tkinter 动态渲染网格世界。智能体为蓝色,宝藏为金色,障碍物为黑色,陷阱为红色。## 训练与渲染:在训练过程中,调用 render_grid 函数实时更新网格世界。使用 time.sleep(0.01) 控制渲染速度。
2024-12-28 10:17:40
506
原创 Deep Q-Networks (DQN)算法
Deep Q-Networks (DQN) 是一种结合了深度学习和强化学习的算法,用于解决 马尔可夫决策过程 (MDP) 问题。它是 Q-Learning 的扩展,通过引入神经网络来近似 Q 值函数,从而能够处理高维状态空间(如图像输入)。DQN 由 DeepMind 在 2013 年提出,并在 2015 年通过改进版本在 Atari 游戏中取得了超越人类的表现。
2024-12-28 10:14:41
493
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人