- 博客(45)
- 收藏
- 关注
原创 YOLOv4(二)
Bag of Specials(BOS)” 是 YOLOv4 的关键技术方向之一,特点是仅增加少量推理时的计算成本,却能显著提升模型精度。它整合了近年 CV 领域的多种优秀技术,比如注意力机制、特征金字塔优化、网络结构改进等,相当于通过一篇 YOLOv4 的研究,就能了解多类前沿技术的应用。
2025-10-21 15:55:53
296
原创 YOLOv3
在 COCO 数据集的 mAP-50(平均精度)和推理时间上,YOLOv3 表现均衡。以不同输入尺寸为例,YOLOv3-320 推理时间 22ms、mAP-50 为 51.5;YOLOv3-608 推理时间 51ms、mAP-50 达 57.9,在速度和精度间取得较好平衡。
2025-10-20 15:35:35
346
原创 目标检测(一)
简单说就是 “认出图片里的物体,还找到它们在哪儿”,要同时完成 “定位置” 和 “辨类别” 两个任务,还会面临物体种类数量多、大小不一、被遮挡或有噪声干扰等难题。
2025-10-15 15:50:21
309
原创 PyTorch 数据处理工具箱
咱们在做深度学习时,得先把数据处理好才能用,PyTorch 专门给了一套 “工具箱” 来干这个,主要包括utils.data这些部分,各自有不同的用处,一起配合就能把数据弄得符合模型训练的要求。
2025-09-25 15:08:19
624
原创 PyTorch 神经网络工具箱:一篇超易懂总结
遇到现成积木不够用?自己造!普通残差块:把输入直接 “绕到” 输出端,和加工后的结果相加,让模型更容易学。下采样残差块:如果输入和输出 “形状不匹配”(比如通道数不一样),就加个 1×1 的卷积层 “调整形状”,再和输出相加。把这两种块组合起来,就能拼出 ResNet18 这样的 “大模型”,专门解决深层网络 “学不会” 的问题~PyTorch 搭建神经网络,本质就是 “用 nn.Module/nn.functional 造零件,用各种容器拼模型,再通过‘训练六步曲’让模型学会干活”。
2025-09-22 16:01:52
458
原创 卷积神经网络(CNN)趣味总结:从 “笨办法” 到图像识别大神
更高效地提取特征,更聪明地减少参数。它靠 “懂图像的规律(平移不变、局部性)”,用 “卷积 + 池化” 的组合拳,解决了传统模型的 “笨办法”,最终成了图像识别、目标检测等领域的 “顶流技术”。现在手机拍照的 “美颜识别”、快递的 “单号扫描”、自动驾驶的 “路况识别”,背后都有 CNN 的身影~
2025-09-19 15:40:10
653
原创 多层感知机:神经网络入门小课堂
从单个感知机(只能画直线),到多层感知机(靠隐藏层和激活函数画曲线),本质是让 AI 从 “处理简单问题” 进化到 “搞定复杂任务”。训练时只要避开欠拟合、过拟合,调对超参数,“神经军团” 就能越来越强~
2025-09-18 15:45:31
283
原创 线性回归与 Softmax 回归总结
梯度下降靠 “反梯度方向” 更新参数,是基础操作;小批量随机梯度下降是深度学习的 “默认选手”,又快又实用;调好学率和批量大小,模型训练能少走很多弯路~线性回归是 “数值预测小能手”,靠公式和梯度下降算准连续值;Softmax 回归是 “分类贴标专家”,用 Softmax 运算把置信度变概率,轻松给事物分类别。两者都是深度学习的 “地基模型”,学好它们,就能解锁更复杂的 AI 技能啦!
2025-09-17 16:10:14
700
原创 深度学习入门 PPT 趣味总结
由 “计算机科学之父” 图灵提出:让测试者通过问答,判断对方是人还是机器。从一个 “啥也不会”(随机初始化参数)的模型开始,拿数据练手,调整参数让它表现更好,反复练,直到它 “达标”数据没有 “答案”(标签),机器自己找规律,比如把相似的东西归为一类(聚类),或者简化数据(主成分分析)机器像 “游戏玩家”,在环境中做动作,根据得到的 “奖励”(比如完成任务给 “加分”)调整策略,不断进步。深度学习是机器学习的 “进阶版”(模型是复杂神经网络),这些年搞出了好多 “大新闻”:。想搞深度学习相关工作。
2025-09-17 16:08:08
693
原创 支持向量机(SVM)趣味总结:机器界的 “最佳分界线画家”
SVM 就是个 “追求极致的分界线画家”:靠少数 “哨兵”(支持向量)定位置,用 “数学套路” 找最稳的线,遇到噪音就 “放宽标准”(软间隔),遇到绕圈数据就 “升维变形”(核变换)—— 最终画出一条又宽又稳的分界线,把不同类样本分得明明白白!
2025-08-27 08:58:45
445
原创 朴素贝叶斯知识大揭秘
公式一算就明白:先算穿长裤的总人数,再用女生穿长裤的人数除以它,最后发现总人数其实没用,直接简化出核心公式 ——假设单词之间没关系(这就是 “朴素” 的关键 —— 特征独立),只需统计垃圾邮件里这些单词出现的频率,再结合 “垃圾邮件在所有邮件里的比例”,就能算出这封邮件是垃圾邮件的概率。:偏爱 “0 和 1 的二值数据”,比如文本里某个单词 “出现(1)” 或 “没出现(0)”。如果说第一份是 “理论课”,这份就是 “工具课”,教咱根据数据类型选对 “贝叶斯工具”,还带 Python 代码,直接能上手!
2025-08-27 08:58:11
409
原创 线性回归算法预测
核心定义:线性回归是通过属性的线性组合进行预测的线性模型,其核心目标是找到一条直线、一个平面或更高维的超平面,使预测值与真实值之间的误差最小化。例如,在房屋价格预测中,可拟合出如f(x)=W0+W1x(其中x为房屋大小,f(x)为价格)的直线。一般形式对于由d个属性描述的示例x=(x1;x2;⋯;xd),线性模型试图学得的预测函数为f(x)=w1x1+w2x2+⋯+wdxd+b。向量形式可写成f(x)=wTx+b,其中w为权重向量,b为偏置项。
2025-08-22 18:03:40
449
原创 机器学习两大门派:聚类与集成算法大揭秘
想象你手里有一堆没贴标签的水果,聚类就是让长得像的水果自动凑成一堆 —— 这就是无监督学习的魅力,不用提前告诉机器 “这是苹果”,它自己就能发现规律。就像考试时问多个学霸比问一个学霸更靠谱,集成学习让多个 “弱学习器” 组队,一起解决问题,效果往往比单个 “强学习器” 更好。CH 值越大越好:值大说明小团体内部很团结(类内紧密),小团体之间离得远(类间分散)。
2025-08-21 19:10:46
515
原创 机器学习数据预处理大揭秘!
标准化:最大最小值标准化:数据标准化:绝对值最大标准化:带离群值数据集标准化:使用分位数信息变换特征:使用幂变换执行到正态分布的映射:正则化:将分类特征转换为分类数:将分类特征转换为分:多标签二值化:独热编码:将连续数据离散化:特征二值化:自定义特征处理函数:创建多项式特征:弥补缺失值。
2025-08-20 17:43:19
283
原创 决策树小课堂:从 “猜答案” 到 “防翻车” 的机器学习指南
它用 “信息增益” 选划分属性,增益越大,划分后数据 “纯度” 越高。但有个小毛病:喜欢选选项多的属性(比如 “编号” 这种万能答案),容易跑偏~为了修正 ID3 的偏爱,它提出 “信息增益率”= 信息增益 ÷ 自身熵,让每个属性公平竞争,再也不怕话痨属性霸场啦!基尼指数越小,数据越纯(随机抽两个样本,类别不同的概率越低)。splitter:选 “best”(全量找最优)还是 “random”(随机找)切分点。α 越小:树越复杂,精准度高,但可能想太多就像给树修枝,既要好看又要结果多~
2025-08-19 18:18:40
374
原创 机器学习(二)
这里的 “距离” 可以用欧式距离(就像两点间直线距离),也可以用曼哈顿距离(像出租车绕街区走的距离)。而且 K 值很关键,比如 K=3 时可能判成一种类型,K=5 时又可能变啦!咱们还用 KNN 给鸢尾花分了类。鸢尾花有 4 个特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度。通过这些特征,KNN 就能分辨出它是山鸢尾、变色鸢尾还是维吉尼亚鸢尾。用 Python 的 sklearn 库实现超方便:加载数据、划分训练集和测试集、选 K=5 用欧式距离训练模型,最后还能算出准确率,看看模型学得怎么样~
2025-08-15 17:53:34
207
原创 机器学习(一)
机器学习是让计算机处理特定任务的技术,它以大量经验数据为基础,通过分析这些数据找到规律,再用评判标准衡量任务完成情况,最终让计算机把任务完成得更好。比如 2016 年阿尔法围棋战胜李世石,就是机器学习的典型成果。
2025-08-14 16:06:02
397
原创 电商双11美妆数据分析实例子(2)
在销量的时间分布上,双 11 当天销量出现大幅下降。因此,商家应将营销重点放在双 11 前夕,通过吸引消费者提前消费提升销量,而非仅聚焦于双 11 当天;在店铺表现方面,客单价较低的店铺,其总销量和销售额普遍超过客单价更高的店铺,这表明价格实惠是消费者购物时的首要考量因素。男士专用商品里,护肤品销量最高,化妆品类则以唇膏为主,且妮维雅在男士专用市场中占据较大份额。从评论与订单的关联来看,相宜本草 “平均每单对应评论数” 这一指标过高,是评论数量最多的悦诗风吟的 4 倍,存在刷单等异常情况的可能性。
2025-08-13 14:21:24
214
原创 爬虫 + 数据分析大冒险:揭秘中国大学排名的小秘密
还能把数据做成饼图,像切披萨一样展示各星级学校的占比,1 星学校占比 31.7%,妥妥的 “大块头”~数据到手后发现小问题 ——“总分” 列有空缺!别慌,pandas 出手相救:可以直接删掉有空值的行,也能用 “暂无分数信息” 填空,还能算个平均分或中位数来补位,就像给数据打补丁一样神奇~首先,咱们的任务是从高三网爬取大学数据,包括学校名称、总分、全国排名、星级排名和办学层级,然后把这些宝贝数据存成 CSV 文件。今天咱们来一场超有趣的 “数据探险”,用爬虫和数据分析解锁中国大学排名的奥秘!
2025-08-11 16:42:36
297
原创 Matplotlib 进阶玩法:图像处理大揭秘
sns.barplot(x='Category',y='Value',data=df)# 使用seaborn绘制柱状图,x轴为Category列,y轴为Value列,数据来源为df。data={'Category':['A','B','C'],'Value':[3,7,5]}# 创建一个字典数据,包含Category和Value两列。sns.lineplot(x='X',y='Y',data=df)# 使用seaborn绘制线图,x轴为X列,y轴为Y列,数据来源为df。画完好看的图像想保存?
2025-08-08 19:34:46
1542
原创 Matplotlib 绘图入门大闯关:从安装到花式可视化
线型选择:实线'-'、破折线'--'、点划线'-.'、虚线':',用linestyle或简写ls设置颜色随心换:红色'r'、绿色'g'、蓝色'b',还有青'c'、品红'm'等,用color或c设置粗细调节linewidth(简写 lw)来控制,数值越大线越粗。
2025-08-07 19:21:01
1323
原创 Pandas 小课堂:数据处理神器入门
想象一下,你有一堆乱糟糟的数据像散落的积木,Pandas 就是能帮你把积木搭成漂亮城堡的魔法工具!它是 Python 的一个超好用类库,能搞定数据分析、处理和可视化,特点是跑起来快、用起来简单,还自带贴心的数据结构。,就像给空座位做标记。相当于一整张 Excel 表,既有行索引又有列索引,每列能装不同类型的数据。就像表格里的一列数据,有自己的 "座位号"(索引)和 "乘客"(数据)。别慌,Pandas 有妙招!想找表格里的特定数据?
2025-08-06 17:39:28
459
原创 NumPy
哪怕一个是 3×3 的二维数组,一个是 1×3 的一维数组,NumPy 也能自动 “广播” 让它们完美运算,就像给小数组 “复制粘贴” 成匹配的形状。函数能把两个字符串数组 “粘” 在一起,比如把 ['hello', 'hi'] 和 [' 小明 ', ' 小红 '] 变成 ['hello 小明 ', 'hi 小红 ']。能擦掉字符串头尾的指定字符,比如把 “aabcda” 的首尾 “a” 擦掉变成 “bcd”。函数能按行、按列排序,甚至能给带字段的数组按 “姓名” 或 “年龄” 排序。
2025-08-05 09:11:21
704
原创 【无标题】
核心主角是 "Ndarray"(N 维数组),就像个整齐的收纳盒,装的都是同类型数据,用 0 开始的下标就能找到它们。6.arange():生成等差数列,比如 1 到 11 步长 2,就得到 [1,3,5,7,9]2.empty():搞个没初始化的 "空盒子",里面是随机数(像没擦干净的黑板)3.zeros()/ones():全 0 或全 1 的数组,强迫症福音。1.rand()/random():搞点 [0,1) 之间的随机数。5.eye():对角线是 1,其他是 0,像个规规矩矩的方阵。
2025-07-31 15:53:44
117
原创 MySQL 数据库基础
包含数据定义语言(DDL,如 CREATE、ALTER 等)、数据操纵语言(DML,如 INSERT、UPDATE 等)、数据查询语言(DQL,如 SELECT)、数据控制语言(DCL,如 GRANT 等),并给出了常见命令示例。区分了关系型数据库(如 MySQL、Oracle 等,用表格存储,靠 SQL 管理)和 NoSQL 数据库(如 Redis、MongoDB 等,非关系模型,更灵活)。:讲解了 CREATE(创建库、表等)、ALTER(添加、修改列等)、DROP(删除表、库等)的具体用法。
2025-07-24 17:25:02
228
原创 静态网页爬取模块-Xpath
就像我们逛网站,有的需要登录后才能看更多内容,这时候 “会话设置” 就派上用场了,它能记住我们的登录信息,不用反复输密码。还有,有些网站可能有安全证书,“SSL 证书验证” 能控制是否检查这个证书,不想检查就可以关掉。另外,要是频繁访问一个网站被限制了,“代理设置” 就像找个中间人帮忙访问,能解决这个问题。它有很多规则,比如从根节点开始找,或者不管位置找所有符合条件的元素,还能通过属性、文本内容来筛选。配合 lxml 库的 etree 模块,就能很方便地解析网页,提取我们需要的信息。
2025-07-23 16:34:52
407
原创 JavaScript 开发基础
历史与关系:由 Netscape 开发,曾用名 LiveScript,与 Java 无实际关系,名字相似是市场营销策略。与 HTML、CSS 的关系:HTML 构建页面骨架,CSS 装饰页面,JavaScript 实现动态页面效果,是在前端浏览器执行的脚本语言。语言特点:基于对象、弱类型、解释执行、简单性、动态性、平台无关性、安全性。帮助文档:可参考 w3school 在线教程(w3school 在线教程)及离线文档。
2025-07-22 18:00:26
427
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅