- 博客(25)
- 资源 (8)
- 收藏
- 关注
原创 第五节、Pandas基础知识
目录一、样本数据student.csv二、Pandas读取文件三、Pandas 查看数据基本信息四、Pandas 基本运算五、pvoit_table函数六、删除确实值七、修改排序后索引八、DataFrame的apply函数九、DataFrame的子结构series一、样本数据student.csvNO Name class age score01 score02 address 1 student01 1
2022-05-01 05:23:54
217
原创 第四节、Numpy基础知识
import numpy as np# genfromtxt读取Txt文本,分隔符逗号,读取数据为str类型world_alcohol = np.genfromtxt("world_alcohol样本集.txt", delimiter=",", dtype=str)# 读取的数据类型为numpy.ndarrayprint(type(world_alcohol),"\n----------")print(world_alcohol,"\n---------")..
2022-04-24 14:19:25
1913
原创 第三节、Python操作Excel
前言 Excel无论是在生活中还是在机器学习中,许多数据都是存储在Excel中,借助Excel的统计分析能力,能让数据清洗和平常繁琐的工作自动化处理。一、使用openpyxl库操作excel1、Excel的读取:二、使用xlrd读写Excel三、使用xlwt读写excel...
2022-04-06 07:51:52
139
原创 第二节、Python快速入门
目录前言一、python变量类型二、python运算:三、List基础四、python循环结构五、python判断结构六、字典七、文件处理八、函数基础总结:前言 主要针对数据处理中常用python语法进行记录,对于原理等内容在Python建模技巧中进行整理。一、python变量类型1、变量定义# Python 中的变量赋值不需要类型声明。# 每个变量在内存中创建,都包括变量的标识,名称和数据这些信息。# 每个变量在使用前都...
2022-03-28 07:18:56
131
原创 第一节、Python基础之环境搭建
Python环境搭建前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、Anaconda安装 官网下载地址: Anaconda | Individual Edition ...
2022-03-22 08:48:46
1499
原创 002_评分卡
随着数据分析工具的发展、量化手段的进步,各大银行机构逐渐使用统计模型将专家的评判标准量化为评分卡模型。如今,风险量化手段早已不局限于银行等传统借贷机构,持牌互联网公司的金融部门、持牌消费金融公司等都具有成本体系的风险量化手段。一、评分卡概念评分卡:是一张刻有分数刻度和相应阈值的表。对于任何一个用户,总能根据其信息找到对应的分数。将不同类别的分数进行汇总,就可以得到用户的总分数。信用评分卡:专门用来评估用户信用的一张刻度表。1、适用客群适用客群即评分卡所适用的贷款群体。从适用客群的角度来定
2021-03-23 15:40:55
1319
1
原创 linux下用telnet检测远程端口是否打开
一、telnet检测某个远端端口是否通畅。测试域名:# telnet baidu.com 80Trying 123.125.114.144...Connected to baidu.com (123.125.114.144). #==>出现Connected表示连通了,说明百度的80端口开放的Escape character is '^]'. #==>按“ctrl+]”退出此地。^]telnet> quitConnection
2020-08-31 17:32:15
1655
原创 Linux查看文件内容的常用方式
目录一、more 指令-分页显示文件内容二、less指令-可以向前或者向后查看文件内容三、head指令-查看文件开头内容四、tail指令 - 显示文件尾部的内容五、cat指令-显示文件内容一、more 指令-分页显示文件内容more指令会以一页一页的形式显示文件内容,按空白键(space)显示下一页内容,按Enter键会显示下一行内容,按b 键就会往回(back)一页显示,其基本用法如下:more file1 查看文件file1的文件内容...
2020-08-31 13:49:42
226
原创 Linux中Grep命令(在文本中搜索指定文本)
Grep(Global regular expression print,全局正则表达式输出)的缩写,他是Linux中最强的的命令之一。grep在一个或多个输入文本中搜索与给定模式匹配的行。并将每条匹配的行写入标准的输出。如果未至定文件,则grep将从标准输入读取,输入通常是另一个命令的输出。一、grep命令语法:grep [OPTIONS] PATTERN [file....]方括号中的项目是可选的:OPTIONS-零个或多个选项,Grep包含许多控制其行为的选项。 PATTERN...
2020-08-31 13:40:00
11170
原创 二、数据挖掘应用的分类
前言:由于数据挖掘能分析出数据中的有用信息,给企业带来显著的经济效益,这使得数据挖掘技术越来越普及。例如在销售数据中发掘客户的消费习惯,并从交易记录中找出顾客偏好的产品组合,其他包括找出流失顾客的特征与突出新产品的时机点等都是零售业常见的实例;利用数据挖掘分析顾客群的消费行为与交易记录,结合基本数据,并依据对品牌价值等级的高低来区隔客户,进而达到差异化营销的目的;制造业对数据挖掘的需求多运用在品质管控方面,从制造过程中找出影响产品品质最重要的因素,已期提高作业流程的效率。近几年、电话公司、信用卡公司
2020-08-08 06:58:27
2569
原创 一、数据挖掘—初识数据挖掘
前言:随着计算机技术、网络技术、通信技术和Internet技术的发展,各行各业的企业内积累了大量业务数据。面对大量的数据,迫使人们寻找新的工具,来对企业的运营规律进行探索,为商业决策提供有价值的信息,是企业获得更高的利润。能满足企业这一迫切需求的有力工具就是数据挖掘。对于且也而言,数据挖掘有助于发展业务的趋势,揭示已知事实,预测未知的结果。1.1 什么是数据挖掘数据挖掘(Data Mining,DM):就是从大量数据中挖掘出隐含的、未知的、对决策又潜在价值的关系、模式和趋势,并用这些知识和规
2020-08-07 14:50:58
838
原创 python+socket 实现网络信息交互及文件传输
前言:以前面试总会被问到Socket编程懂不懂,因为工作一直没涉及加上自己只是上学的时候学过,所以一直都只知道皮毛,现在想专做算法面试又遇到这个问题,疫情在家闲着也是闲着,所以从网查找资料自己也实现以下,现在主要用Python所以就用Python实现,其实Java、C++也都很好实现,只是很长时间没写了,所以用Python实现。TCP协议:我们知道TCP协议(Transmission Control Protocol, 传输控制协议)是一种面向连接的传输层通信协议,它能提供高可靠性通信,像HTT
2020-08-06 15:14:18
11128
2
原创 正则化项L1和L2的区别
一、概括:L1和L2是正则化项,又叫做罚项,是为了限制模型的参数,防止模型过拟合而加在损失函数后面的一项。二、区别: 1.L1是模型各个参数的绝对值之和。 L2是模型各个参数的平方和的开方值。 2.L1会趋向于产生少量的特征,而其他的特征都是0. 因为最优的参数值很大概率出现在坐标轴上,这样就会导致某一维的权重为0 ,产生稀疏权重矩阵 L2会选择更多的特征,这些特征都会接近于0。 最优的参数值很小概率出现在坐标轴上,因此每一...
2020-08-04 14:50:20
1593
原创 随机森林-科比生涯数据集分析与预测
前言最近想学习一下随机森林,从网上找了一些例子,由于sk-learn版本变更,做了些修改才正常跑起来。本文利用随机森林算法训练出一个预测科比投篮模型。主要用了python的numpy,pandas,matplotlib和sklearn库。二、设计思路先来看看这份科比生涯的数据集:这个表格记录了科比30000多个镜头的详细数据,共有25个标签。具体的设计思路是将这25个标签代表的数据进行分析,找出对科比投篮结果有影响的标签,利用机器学习中随机森林的算法训练出可以预测科比是否能够投篮
2020-07-22 15:32:36
2983
原创 朴素贝叶斯原理及解析
目录1、贝叶斯决策轮1.1后验概率1.2贝叶斯定理2、朴素贝叶斯分类算法详解3.例题分析4. 朴素贝叶斯分类的优缺点1、贝叶斯决策轮贝叶斯决策论(Bayesian decision theory)是概率框架下实施决策的基本方法。对于分类任务来说,在所有相关概率都已知的情况下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。1.1后验概率 P{H0|x}是给定观测值x条件下H0出现的概率,统称为后验概率。 ...
2020-07-09 16:25:26
383
原创 深度学习之经典网络架构:VGG16
一、简介 VGG,也叫作VGG-16网络。值得注意的是,VGG-16网络没有那么多超参数,这是一种只需要专注于构建卷积层的简单网络。首先用3×3,步长为1的卷积核构建卷积层,padding参数为same的卷积参数。然后用一个2×2,步幅为2的池化核构建最大池化层。因此VGG网络的一大优点是神经网络结构简单。二、网络结构 vgg16总共有16层,13个卷积层和3个全连接层,整个网络都采用了相同大小的卷积核3*3步长为1*1和最大池化(2*2),第一阶段:通过64个卷积核的两...
2020-07-07 11:59:36
571
1
原创 深度学习之经典网络架构:AlexNet
一、简介 AlexNet是2012年ImageNet竞赛冠军获得者Hinton和他的学生Alex Krizhevsky设计的。也是在那年之后,更多的更深的神经网路被提出,比如优秀的vgg,GoogleLeNet。其官方提供的数据模型,准确率达到57.1%,top 1-5 达到80.2%. 这项对于传统的机器学习分类算法而言,已经相当的出色。二、网络结构 上图所示是alexnet的网络结构,上图采用是两台GPU服务器,所有会看到两个流程图。下边把AlexNet的网络结...
2020-07-06 14:57:38
394
1
原创 One-hot 编码汇总(TensorFlow、Numpy、Scikit-learn)
目录前言Tensorflow代码示例Numpy代码示例scikit-learn代码示例keras代码示例前言 在构建分类算法的时候,标签通常都要求是one_hot编码,实际上标签可能都是整数,所以我们都需要将整数转成one_hot编码,本文主要介绍如何利用TensorFlow、Numpy、SCIkit-learn、keras快速将整数转成one_hot编码。Tensorflow代码示例TensorFlow 的tf.one_hot函数用法:tens...
2020-07-02 15:09:24
343
原创 Tensorflow实现SoftMax Regression (MNIST)手写体数字识别(利用卷积提高识别准确性)
前两篇手写体数字识别都是初学者入门的教程,第一个利用全连接识别,第二个增减隐含层,准确率较第一个有所提升。都是只利用了图像的一维特征。下面使用卷积利用图像二维的特征进行识别,准确率又有所提升。同时利用Dropout保留部分节点,达到降采样的目的,以防止过拟合。from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tfmnist = input_data.read_data_sets...
2020-07-01 15:03:20
257
1
原创 TensorFlow 实现CIFAR-10分类
CIFAR-10数据集 CIFAR-10数据集的官网CIFAR,该数据集包含60000张32323的图片,包含10类常见物体。其中训练集50000张,测试集10000张。由于数据集规模比较适中,很适合初学者练习用。在训练模型的时候,常常会从训练集中抽出一小部分图片作为验证集以便于分析训练过程,防止出现过拟合的情况。官网还包含CIFAR-1OO数据集,有兴趣的可以直接看官网介绍,这里不多赘述。关于数据下载,官网提供了3种版本:python版本、Matlab版本和二进制版本(适用于C语...
2020-07-01 14:37:59
755
原创 Tensorflow实现SoftMax Regression (MNIST)手写体数字识别(增加隐含层提高准确性)
from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tfmnist = input_data.read_data_sets("MNIST_data/", one_hot=True)# 输入节点数和隐含层节点数in_uint = 784hi_uint = 300# 定义输入变量x = tf.placeholder(tf.float32, [None, in_uint])w1 = t.
2020-07-01 11:43:07
209
原创 Tensorflow实现SoftMax Regression (MNIST)手写体数字识别
MNSIT 训练样本有55000个、测试样本5000个from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tf# 数据集mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)print(mnist.train.images.shape, mnist.train.labels.shape)print(mnist..
2020-07-01 11:18:54
179
TensorFlow_CIFAR_cl.rar
2020-07-01
Flex Book Flip Over
2011-12-31
Java3D安装与环境配置
2011-07-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人