
python
文章平均质量分 87
浩波的笔记
微信公众号:浩波的笔记
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
kaggle实战—泰坦尼克(三、数据重构)
kaggle实战—泰坦尼克(一、数据分析)kaggle实战—泰坦尼克(二、数据清洗及特征处理)前言相信大家都有队pandas,numpy等数据科学库有一定了解,其中不乏有很多人有专门刷过相关课程或者看多相关书籍,例如《python for data analysis》。但是在实操过程中有很多函数还是得看着官方文档来进行敲写,既费时又费力 。最近刚好datawhale发起一个相关打卡活动——实战,我就报名参加了。(ps:极力推荐这本书,大家可以去网上搜索电子版,或者也可以关注微信公众【浩波的笔记】回.原创 2020-08-23 11:04:04 · 872 阅读 · 0 评论 -
kaggle实战—泰坦尼克(一、数据分析)
数据加载载入数据数据集下载 https://www.kaggle.com/c/titanic/overview任务一:导入numpy和pandas原创 2020-08-19 22:45:59 · 4129 阅读 · 0 评论 -
python-基础回顾
前言:本次复习正好借着基地培训,再系统过一遍知识点,刚学还是大一那会,有点稀里糊涂的。下面的不涉及系统知识点,我是跟着小甲鱼的python教程过的,只整理自己生疏和不会的题目~1>如果你每次想从列表的末尾取出一个元素,并将这个元素插入到列表的最前边,你会怎么做?list.insert(0,list.pop())2>在进行分片的时候,我们知道分片的开始和结束位置需要进行指定,但其实还有另外一个隐藏的设 置:步长。>>> list[::2][1,2,7]3>原创 2020-07-05 23:43:59 · 210 阅读 · 0 评论 -
数据挖掘之方差分析
1 概要方差分析(Analysis of variance, ANOVA) 主要研究分类变量作为自变量时,对因变量的影响是否是显著的。方差分析的方法是由20世纪的统计学家Ronald Aylmer Fisher在1918年到1925年之间提出并陆续完善起来的,该方法刚开始是用于解决田间实验的数据分析问题,因此,方差分析的学习是和实验设计、实验数据的分析密不可分的。实验设计和方差分析都有自己相应的语言。因此,在这里我们通过一个焦虑症治疗的实例,先了解一些术语,并且思考一下,方差分析主要用于解决什么样的问原创 2020-06-30 23:50:43 · 789 阅读 · 0 评论 -
天池-街景字符编码识别5-模型训练与验证
模型集成包括:集成学习方法、深度学习中的集成学习和结果后处理思路。集成学习方法在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stacking、Bagging和Boosting,同时这些集成学习方法与具体验证集划分联系紧密。由于深度学习模型一般需要较长的训练周期,如果硬件设备不允许建议选取留出法,如果需要追求精度可以使用交叉验证的方法。下面假设构建了10折交叉验证,训练得到10个CNN模型。那么在10个CNN模型可以使用如下方式进行集成:对预测的结果的概率值进行平均原创 2020-06-03 14:23:48 · 263 阅读 · 0 评论 -
Personal Rank——个性化推荐召回算法python
慕课推荐系统笔记1、个性化召回算法Personal Rank背景与物理意义1、首先介绍基于图的个性化召回算法—personal rank的背景。(1)用户行为很容易表示为图图这种数据结构有两个基本的概念—顶点和边。在实际的个性化推荐系统中,无论是信息流场景、电商场景或者是O2O场景,用户无论是点击、购买、分享、评论等等的行为都是在user和item两个顶点之间搭起了一条连接边,构成了图的基本要素。实际上这里user与item构成的图是二分图,后面会介绍二分图的概念以及结合具体的例子展示如何将用户原创 2020-06-01 09:56:01 · 908 阅读 · 0 评论 -
LFM算法——推荐系统
在日常生活中,人们实际上经常使用这种方法,如你哪天突然想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,最近有什么好看的电影,而我们一般更倾向于从兴趣或观点相近的朋友那里得到推荐。这就是协同过滤的思想LFM(latent factor model 隐语义模型)算法背景https://www.cnblogs.com/ventlam/p/6296255.html,这里有详细介绍https://blog.youkuaiyun.com/codes_first/article/details/807原创 2020-05-31 22:03:42 · 2871 阅读 · 0 评论 -
天池-街景字符编码识别4-模型训练与验证
4 模型训练与验证构造验证集在机器学习模型(特别是深度学习模型)的训练过程中,模型是非常容易过拟合的。深度学习模型在不断的训练过程中训练误差会逐渐降低,但测试误差的走势则不一定。在模型的训练过程中,模型只能利用训练数据来进行训练,模型并不能接触到测试集上的样本。因此模型如果将训练集学的过好,模型就会记住训练样本的细节,导致模型在测试集的泛化效果较差,这种现象称为过拟合(Overfitting)。与过拟合相对应的是欠拟合(Underfitting),即模型在训练集上的拟合效果较差。如图所示:随着模型复原创 2020-05-30 23:45:50 · 236 阅读 · 0 评论 -
django的视图与模板
一、概述一个视图就是一个页面,通常提供特定的功能,使用特定的模板。例如:在一个博客应用中,你可能会看到下列视图:博客主页:显示最新发布的一些内容每篇博客的详细页面:博客的永久链接基于年的博客页面:显示指定年内的所有博客文章基于月的博客页面:显示指定月内的所有博客文章基于天的博客页面:显示指定日内的所有博客文章发布评论:处理针对某篇博客发布的评论一个视图函数(类),简称视图,是一个简单的Python 函数(类),它接受Web请求并且返回Web响应。响应可以是一张网页的HTML内容,一个重原创 2020-05-26 22:38:47 · 438 阅读 · 0 评论 -
Django--模板语言
一、模板模版是纯文本文件,可以生成任何基于文本的文件格式,比如HTML,XML,CSV等。下面是一个小模版,它展示了一些基本的元素。{% extends "base_generic.html" %}{% block title %}{{ section.title }}{% endblock %}{% block content %}<h1>{{ section.title }}</h1>{% for story in story_list %}<h2&g转载 2020-05-26 11:42:31 · 400 阅读 · 0 评论 -
天池-街景字符编码识别3-字符识别模型
3 字符识别模型3.1常用CNN网络模型LeNet-5——CNN经典网络模型详解(pytorch实现)AlexNet–CNN经典网络模型详解(pytorch实现)VGG——CNN经典网络模型(pytorch实现)GoogLeNet——CNN经典网络模型详解(pytorch实现)ResNet——CNN经典网络模型详解(pytorch实现)DenseNet——CNN经典网络模型详解(pytorch实现)MobileNet(v1、v2)——CNN经典网络模型详解(pytorch实现)3.2原创 2020-05-24 22:34:03 · 657 阅读 · 0 评论 -
天池-街景字符编码识别2-数据读取与数据扩增
本此使用【定长字符识别】思路来构建模型赛题地址零基础入门CV赛事- 街景字符编码识别关于更详细的数据预处理可=可以参考我的另一篇博文:卷积神经网络性能优化(提高准确率)2 数据读取与数据扩增2.2 图像读取由于赛题数据是图像数据,赛题的任务是识别图像中的字符。因此我们首先需要完成对数据的读取操作,在Python中有很多库可以完成数据读取的操作,比较常见的有Pillow和OpenCV。2.2.1 PillowPillow是Python图像处理函式库(PIL)的一个分支。Pillow提供了常见原创 2020-05-22 23:01:58 · 305 阅读 · 0 评论 -
django路由介绍
一、路由系统理解1. 什么是路由在Web开发过程中,经常会遇到『路由』的概念。那么,到底什么是路由?简单来说,路由就是URL到函数的映射。2. router和route的区别route就是一条路由,它将一个URL路径和一个函数进行映射,例如:/users -> getAllUsers()/users/count -> getUsersCount()这就是两条路由,当访问 /users 的时候,会执行 getAllUsers() 函数;当访问 /users/co原创 2020-05-19 21:51:20 · 1705 阅读 · 0 评论 -
WSGI协议
在大家接触到一些WEB框架,例如Django,Flask,Torando等等,在开发过程中,看过一些文档总会介绍生产环境和开发环境服务器的配置问题,服务器又设计web服务器和应用服务器,总而言之,我们碰到最多的,必定是这个词 — WSGI。1 WSGI介绍1.1 什么是WSGI首先介绍几个关于WSGI相关的概念WSGI:全称是Web Server Gateway Interface,WSGI不是服务器,python模块,框架,API或者任何软件,只是一种规范,描述web server如何与web转载 2020-05-19 19:39:59 · 667 阅读 · 0 评论 -
pytorch对卷积神经网络常见操作
pytorch中的Tensor通道排列顺序是:[batch, channel, height, width]我们常用的卷积(Conv2d)在pytorch中对应的函数是:torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros')其中:in_channels参数代表输入特征矩阵的深度即channe原创 2020-05-14 23:15:58 · 929 阅读 · 1 评论 -
使用pytorch查看中间层特征矩阵以及卷积核参数
推荐一个可视化工具:TensorBoard注:本次所使用的为AlexNet与ResNet34俩个网络,关于这俩个网络的详细信息可以在我另外俩篇blog查看ResNet——CNN经典网络模型详解(pytorch实现)AlexNet–CNN经典网络模型详解(pytorch实现)查看中间层特征矩阵AlexNetalexnet_model.pyimport torch.nn as nnimport torchclass AlexNet(nn.Module): def __ini原创 2020-05-14 18:01:48 · 5770 阅读 · 9 评论 -
迁移学习 Transfer Learning—通俗易懂地介绍(常见网络模型pytorch实现)
前言你会发现聪明人都喜欢”偷懒”, 因为这样的偷懒能帮我们节省大量的时间, 提高效率. 还有一种偷懒是 “站在巨人的肩膀上”. 不仅能看得更远, 还能看到更多. 这也用来表达我们要善于学习先辈的经验, 一个人的成功往往还取决于先辈们累积的知识. 这句话, 放在机器学习中, 这就是今天要说的迁移学习了, transfer learning.什么是迁移学习?迁移学习通俗来讲,就是运用已有的知识来学习新的知识,核心是找到已有知识和新知识之间的相似性,用成语来说就是举一反三。由于直接对目标域从头开始学习成本太原创 2020-05-10 18:04:09 · 24601 阅读 · 1 评论 -
MobileNet(v1、v2)——CNN经典网络模型详解(pytorch实现)
在之前的文章中讲的AlexNet、VGG、GoogLeNet以及ResNet网络,它们都是传统卷积神经网络(都是使用的传统卷积层),缺点在于内存需求大、运算量大导致无法在移动设备以及嵌入式设备上运行。而本文要讲的MobileNet网络就是专门为移动端,嵌入式端而设计。MobileNet v1MobileNet网络是由google团队在2017年提出的,专注于移动端或者嵌入式设备中的轻量级CN...原创 2020-05-06 23:53:45 · 4881 阅读 · 1 评论 -
Transform的normalize参数含义
注:在此之前transforms.ToTensor()已经把数据落在0、1区间了比如原来的tensor是三个维度的,值在0到1之间,那么经过以下变换之后就到了-1到1区间。transforms.Normalize((.5,.5,.5),(.5,.5,.5))原本以为第一个参数应该是(0,0,0)才是归一化到均值为0。但是通过transforms的源码发现:input[channel] =...原创 2020-05-05 18:05:19 · 7136 阅读 · 1 评论 -
Python-非关键字参数和关键字参数(*args **kw)
Python的函数具有非常灵活的参数形态,既可以实现简单的调用,又可以传入非常复杂的参数。可变参数和关键字参数的语法:*args是可变参数,args接收的是一个tuple;**kw是关键字参数,kw接收的是一个dict。使用*args和**kw是Python的习惯写法,当然也可以用其他参数名,但最好使用习惯用法。一、可变参数*args定义:可变参数就是传入的参数个数是可变的,可以是...原创 2020-05-04 23:06:27 · 4922 阅读 · 2 评论 -
计算机视觉基础-图像处理(图像分割/二值化)cpp+python
5.1 简介该部分的学习内容是对经典的阈值分割算法进行回顾,图像阈值化分割是一种传统的最常用的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术。它特别适用于目标和背景占据不同灰度级范围的图像。它不仅可以极大的压缩数据量,而且也大大简化了分析和处理步骤,因此在很多情况下,是进行图像分析、特征提取与模式识别之前的必要的图像预处理过程。图像阈值化的目的是要按...原创 2020-04-29 22:54:41 · 1440 阅读 · 0 评论 -
计算机视觉基础-图像处理(图像滤波)cpp+python
4.1 简介图像的实质是一种二维信号,滤波是信号处理中的一个重要概念。在图像处理中,滤波是一种非常常见的技术,它们的原理非常简单,但是其思想却十分值得借鉴,滤波是很多图像算法的前置步骤或基础,掌握图像滤波对理解卷积神经网络也有一定帮助。4.2 学习目标了解图像滤波的分类和基本概念理解均值滤波/方框滤波、高斯滤波的原理掌握OpenCV框架下滤波API的使用4.3 内容介绍1、均值...原创 2020-04-27 23:33:49 · 1100 阅读 · 0 评论 -
Batch Normalization(BN)超详细解析
单层视角神经网络可以看成是上图形式,对于中间的某一层,其前面的层可以看成是对输入的处理,后面的层可以看成是损失函数。一次反向传播过程会同时更新所有层的权重W1,W2,…,WL,前面层权重的更新会改变当前层输入的分布,而跟据反向传播的计算方式,我们知道,对Wk的更新是在假定其输入不变的情况下进行的。如果假定第k层的输入节点只有2个,对第k层的某个输出节点而言,相当于一个线性模型y=w1x1+w2x...原创 2020-04-29 18:33:51 · 67278 阅读 · 10 评论 -
ResNet——CNN经典网络模型详解(pytorch实现)
1、前言ResNet(Residual Neural Network)由微软研究院的Kaiming He等四名华人提出,通过使用ResNet Unit成功训练出了152层的神经网络,并在ILSVRC2015比赛中取得冠军,在top5上的错误率为3.57%,同时参数量比VGGNet低,效果非常突出。ResNet的结构可以极快的加速神经网络的训练,模型的准确率也有比较大的提升。同时ResNet的推广...原创 2020-04-29 17:28:55 · 145863 阅读 · 21 评论 -
GoogLeNet——CNN经典网络模型详解(pytorch实现)
一、前言2014年,GoogLeNet和VGG是当年ImageNet挑战赛(ILSVRC14)的双雄,GoogLeNet获得了第一名、VGG获得了第二名,这两类模型结构的共同特点是层次更深了。VGG继承了LeNet以及AlexNet的一些框架结构,而GoogLeNet则做了更加大胆的网络结构尝试,虽然深度只有22层,但大小却比AlexNet和VGG小很多,GoogleNet参数为500万个,Al...原创 2020-04-29 12:05:39 · 3645 阅读 · 2 评论 -
LeNet-5——CNN经典网络模型详解(pytorch实现)
一、LeNet-5这个是n多年前就有的一个CNN的经典结构,主要是用于手写字体的识别,也是刚入门需要学习熟悉的一个网络。原论文地址输入:32*32的手写字体图片,这些手写字体包含0~9数字,也就是相当于10个类别的图片输出:分类结果,0~9之间的一个数因此我们可以知道,这是一个多分类问题,总共有十个类,因此神经网络的最后输出层必然是SoftMax问题,然后神经元的个数是10个。LeNet...原创 2020-04-27 20:00:15 · 2330 阅读 · 9 评论 -
AlexNet--CNN经典网络模型详解(pytorch实现)
二、AlexNet在imagenet上的图像分类challenge上大神Alex提出的alexnet网络结构模型赢得了2012届的冠军,振奋人心,利用CNN实现了图片分类,别人用传统的机器学习算法调参跳到半死也就那样,Alex利用CNN精度远超传统的网络。1. conv1阶段DFD(data flow diagram):第一层输入数据为原始的2272273的图像,这个图像被11113的卷...原创 2020-04-27 19:58:31 · 18525 阅读 · 13 评论 -
VGG——CNN经典网络模型(pytorch实现)
一、LeNet-5这个是n多年前就有的一个CNN的经典结构,主要是用于手写字体的识别,也是刚入门需要学习熟悉的一个网络。原论文地址输入:32*32的手写字体图片,这些手写字体包含0~9数字,也就是相当于10个类别的图片输出:分类结果,0~9之间的一个数因此我们可以知道,这是一个多分类问题,总共有十个类,因此神经网络的最后输出层必然是SoftMax问题,然后神经元的个数是10个。LeNet...原创 2020-04-23 15:51:22 · 19465 阅读 · 3 评论 -
计算机视觉基础——图像处理(彩色空间互转)cpp+python
3.1 简介图像彩色空间互转在图像处理中应用非常广泛,而且很多算法只对灰度图有效;另外,相比RGB,其他颜色空间(比如HSV、HSI)更具可分离性和可操作性,所以很多图像算法需要将图像从RGB转为其他颜色空间,所以图像彩色互转是十分重要和关键的。3.2 学习目标了解相关颜色空间的基础知识理解彩色空间互转的理论掌握OpenCV框架下颜色空间互转API的使用3.3 内容介绍1.相关颜...原创 2020-04-25 23:02:42 · 1171 阅读 · 1 评论 -
pip与conda简述
1、pip与conda包管理器pip 是最为广泛使用的 Python 包管理器,可以帮助我们获得最新的 Python 包并进行管理。常用命令如下:pip install [package-name] # 安装名为[package-name]的包pip install [package-name]==X.X # 安装名为[package-name]的包...原创 2020-04-23 23:03:20 · 508 阅读 · 0 评论 -
入门讲解:使用numpy实现简单的神经网络(BP算法)
用pytorch跟tensorflow实现神经网络固然爽。但是想要深入学习神经网络,光学会调包是不够的,还是得亲自动手去实现一个神经网络,才能更好去理解。一、问题介绍传说中线性分类器无法解决的异或分类问题。我们就拿它来作为我们神经网络的迷你训练数据。把输入数据拼成一个矩阵X:...原创 2020-04-22 21:56:44 · 6564 阅读 · 5 评论