- 博客(19)
- 资源 (8)
- 收藏
- 关注
原创 基于Flink的电影数据实时统计平台(四):后端项目构建与数据准备
文章目录一、准备数据一、准备数据 首先前往movie-lens官网下载数据集,我们采用movie-lens数据集中的movies.csv初始化我们的电影数据库。
2021-04-26 00:13:14
1389
原创 基于Flink的电影数据实时统计平台(三):前端构建
文章目录一、环境准备二、前端构建2.1 页面绘制2.1.1 网站框架`App.vue`2.1.2 前台观影/电影首页`Movie.vue`2.1.3 前台观影/播放电影`Player.vue`2.1.4 数据查询/电影筛选`MovieQuery.vue`2.1.5 数据查询/评分细查`RatingQuery.vue`2.1.6 数据查询/可视化数据`Charts.vue`三、相关配置3.1 项目配置`main.js`3.2 路由配置`router/index.js`四、相关博客一、环境准备 首先准备好
2021-04-18 15:29:27
1666
原创 基于Flink的电影数据实时统计平台(二):项目结构
文章目录一、开发环境二、相关技术三、系统架构四、分包解释五、相关博客一、开发环境 此项目的开发环境如下:macOS Big Sur(不影响)IntelliJ IDEAjdk 1.8.0_271Maven 3.6.1Flink 1.12.2Kafka 2.0.0MySQL 5.1.49Vue Cli 4.5.12Vue 2.5.2Element-UI 2.15.1二、相关技术 项目以Vue + Spring Boot的形式实现前后端的分离。同时,前端使用Element-UI
2021-04-18 15:03:25
1034
1
原创 如何理解集成学习(Ensemble Learning)
文章目录一、什么是集成学习二、`Boosting`与`Bagging`2.1 `Boosting`2.2 `Bagging` 一些传统的机器学习模型结构十分简单,例如决策树。这类模型虽然容易构建,但是往往也伴随着较差的学习能力。那么是否有一种办法能够将多个简单的机器学习模型结合起来,以发挥出更优秀的性能呢?答案就是本文的主角----集成ensemble学习。一、什么是集成学习 所谓集成ensemble学习,就是将多个简单的基学习器base learner集成起来,根据多个基学习器的预测结果得到
2021-04-09 17:59:04
885
原创 SPP-Net与空间金字塔池化详解
文章目录一、`R-CNN`的不足与改进R-CNN的问世让卷积神经网络在目标检测领域崭露头角,尽管它具有不俗的准确率,但是其检测效率过于低下,以至于很难得到实际的应用。为了提高R-CNN的检测效率,SSP-Net与空间金字塔池化Spatial Pyramid Pooling, SSP应运而生。一、R-CNN的不足与改进 R-CNN模型进行目标检测的效率很低,不仅训练过程十分繁琐,检测过程也是非常的慢。其原因之一就是生成的约2000个候选区域需要一个一个地输入卷积神经网络以进行特征提取,而这一过程则
2021-03-23 20:36:23
717
原创 目标检测模型(一):R-CNN
文章目录一、R-CNN二、生成候选区域三、特征提取四、区域分类R-CNN目标检测模型被称为将卷积神经网络引入目标检测的开山之作,尽管现在看来其性能早已达不到应用的标准,但是它的一些设计思想至今仍具有学习的意义。一、R-CNN R-CNN,全称Region CNN,即区域卷积神经网络。其进行目标检测的主要思想就是生成可能存在目标的候选区域region proposal,然后通过CNN、分类器等手段判断区域中是否存在检测目标,并进行分类。最后再对识别出目标的区域范围进行精细的调整即可。 R-CN
2021-03-21 17:02:21
2746
原创 边框回归(Bounding Box Regression)算法解释
文章目录一、为什么需要边框回归二、边框回归的调整策略三、论文里怎么说一、为什么需要边框回归 假设有如下一种情况,红框为模型预测的检测框region proposal,蓝框为真实的检测框ground truth。可以看见,尽管红框正确地从图像中识别到了飞机,但是却并没有很好地标识出检测框的位置(预测框与真实框IoU过低)。此时,便可以通过边框回归Bounding Box Regression实现一种“微调”的策略,将预测框尽量调整到与真实框近似,以提高模型预测的效果。二、边框回归的调整策略 边
2021-03-19 20:00:35
2882
原创 非极大抑制(NMS)算法原理与Python实现
文章目录一、算法的主要思路二、伪代码三、Python实现3.1 交并比3.2 非极大抑制3.3 完整代码四、测试结果在目标检测任务中,一个检测目标通常会产生多个检测框,为了合理缩减输出检测框数量,往往需要在目标检测模型输出前添加非极大抑制Non-Maximum Suppression, NMS。非极大抑制算法能够删除冗余的检测框,并优先保留可靠性最高的结果。一、算法的主要思路 假设有以下输入det:[[x_center, y_center, width, height, prob, label
2021-03-18 16:56:20
833
原创 选择搜索(Selective Search)算法介绍与Python实现解释
文章目录一、算法的主要思路二、伪代码选择搜索(Selective Search)算法是一种通过分割图像为小块,然后逐步合并这些小块以获取所需要的子块的启发式算法在目标检测的经典模型R-CNN中,选择搜索算法被用于生成模型的候选区域,十分重要一、算法的主要思路 选择搜索算法的思路很简单,就是输入一个图像,然后通过一些图像分割算法将其分割为很多个小块,这些小块组成一个集合R。在R中对所有相邻的块求相似度,得到新的集合S。对集合S中相似度最高的两个块R1, R2进行合并可以得到新的块R_new,从R
2021-03-15 17:24:15
2675
原创 U-Net:大脑MRI海马体语义分割
文章目录Step 01 数据集Step 02 自定义DatasetStep 03 构建U-Net网络Step 04 训练与预测相关技术:Python、Pytorch、U-NetStep 01 数据集 大脑MRI数据集源于Kaggle平台,链接如下:https://www.kaggle.com/sabermalek/mrihs原数据集中包含100个病人的大脑MRI图像,存储在文件夹original中,每张MRI图像对应的海马体分割结果则存储在文件夹label中。 从原数据集中随机抽取1
2021-03-14 21:05:05
5537
42
原创 朴素贝叶斯分类算法详解与Python实现
目录一、贝叶斯决策论一、贝叶斯决策论 对于一个多分类任务,假设有标签y={y1,y2,...,yn}y=\{y_1,y_2,...,y_n\}y={y1,y2,...,yn},记λij\lambda_{ij}λij为将真实标签为yjy_jyj的样本误分类为yiy_iyi的代价,则可以得到将样本误分类为yiy_iyi的期望代价:loss(yi∣x)=∑j=1nλijP(yj∣x)loss(y_i|x)=\sum_{j=1}^{n}{\lambda_{ij}P(y_j|x)}loss(yi
2020-10-27 15:47:01
488
原创 剪枝决策树原理与Python实现
文章目录一、决策树模型二、选择划分2.1 信息熵和信息增益2.2 增益率2.3 基尼指数三、剪枝3.1 预剪枝3.2 后剪枝3.3 剪枝示例3.4 预剪枝和后剪枝对比四、Python实现一、决策树模型 决策树(Decision Tree)是一种常见的机器学习算法,而其核心便是“分而治之”的划分策略。例如,以西瓜为例,需要判断一个西瓜是否是一个好瓜,那么就可以根据经验考虑“西瓜是什么颜色?”,...
2020-02-17 19:20:37
1708
1
原创 线性回归:梯度下降法优化
文章目录一、线性回归二、梯度下降法的数学原理三、梯度下降法优化四、Python实现一、线性回归 关于线性回归的详细介绍可以参见我的上一篇博文《线性回归:最小二乘法优化》。在《线性回归:最小二乘法优化》中已经说明了线性回归模型建立的关键在于求解:(w∗,b∗)=arg min∑i=1m(f(xi)−yi)2(w^*, b^*)=\argmin\sum^{m}_{i=1}{{(f(x_i)-...
2020-02-15 20:08:46
1326
参数高自由度神经网络Python实现
2020-12-09
多层BP神经网络(参数高自由度)Python
2020-02-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人