自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 Pytorch2

Day2Python对应pytorch数据类型例如表示3,则IntTensor(3) ,dimension为0表示一个矩阵,则dimension为2string例如‘hello’,没有对应的,因为pytorch是处理数值的所以用pytorch处理string类型时,用数字编码表示One-hot例如[1,0]表示dog[0,1]表示cat但是两个单词的相关性无法在one-hot中显示,比如I like和I don’t likeA的ASCII.

2022-03-12 09:18:26 467

原创 Pytorch Day1

Day1深度学习的核心是梯度求解y的最小值梯度:梯度的本意是一个向量(矢量),某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大(为该梯度的模)每一步迭代都是梯度下降每一步:x’的值=当前x的值-x在y函数的导数求x*即loss函数最小值时x的反复迭代学习率(Learning rate):作为监督学习以及深度学习中重要的超参,其决定着目标函数能否收敛到局部最小值以及何时收敛到最小值。合适的学习率能够使.

2022-03-10 22:24:24 521

原创 机器学习Sklearn Day6

2.3 梯度下降:重要参数max_iter逻辑回归的数学目的是求解能够让模型最优化,拟合程度最好的参数θ的值,即求解能够让损失函数J(θ)最小化的θ值。对于二元逻辑回归来说,有多种方法可以用来求解参数θ,最常见的有梯度下降法(GradientDescent),坐标下降法(Coordinate Descent),牛顿法(Newton-Raphson method)等,其中又以梯度下降法最为著名。每种方法都涉及复杂的数学原理,但这些计算在执行的任务其实是类似的。2.3.1 梯度下降求解逻...

2022-03-03 23:15:57 973

原创 机器学习Sklearn Day5

05 sklearn中的逻辑回归1概述1.1名为“回归”的分类器1.2为什么需要逻辑回归1.3sklearn中的逻辑回归2linear_model.LogisticRegression2.1 二元逻辑回归的损失函数2.1.1损失函数的概念与解惑2.1.2【选学】二元逻辑回归损失函数的数学解释,公式推导与解惑2.2重要参数penalty&C2.2.1正则化2.2.2逻辑回归中的特征工程2.3梯度下降:重要参数max_iter2.3.1 梯度下降...

2022-03-01 16:07:20 258

原创 机器学习Sklearn Day4

04 sklearn中的降维算法PCA和SVD1概述 从什么叫“维度”说开来 sklearn中的降维算法 2PCA与SVD2.1降维究竟是怎样实现?2.2 重要参数n_components2.1.1 迷你案例:高维数据的可视化2.1.2 最大似然估计自选超参数2.1.3 按信息量占比选超参数2.3 PCA中的SVD2.3.1 PCA中的SVD哪里来?2.3.2 重要参数svd_solver与 random_state2.3.3 重要属性compon...

2022-02-27 23:19:40 820

原创 机器学习 Sklearn Day3

Day3 sklearn中的数据预处理和特征工程1概述1.1数据预处理与特征工程1.2sklearn中的数据预处理和特征工程 2 数据预处理 Preprocessing&Impute2.1数据无量纲化2.2缺失值2.3处理分类型特征:编码与哑变量2.4处理连续型特征:二值化与分段3特征选择 feature_selection3.1Filter过滤法3.1.1方差过滤3.1.1.1VarianceThreshold3.1.1.2方差过滤...

2022-02-25 13:13:50 513

原创 机器学习 Sklearn Day2

随机森林1 概述1.1 集成算法概述集成学习(ensemblelearning)是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通过在数据上构建多个模型,集成所有模型的建模结果。基本上所有的机器学习领域都可以看到集成学习的身影,在现实中集成学习也有相当大的作用,它可以用来做市场营销模拟的建模,统计客户来源,保留和流失,也可用来预测疾病的风险和病患者的易感性。在现在的各种算法竞赛中,随机森林,梯度提升树(GBDT),Xgboost等集成算法的身影也随处可见,可见其效果之好.

2022-02-21 11:41:12 1202 5

原创 机器学习Sklearn Day1

机器学习sklearnDay1什么是sklearnscikit-learn,又写作sklearn,sklearn是一个开源的基于python语言的机器学习工具包它通过Numpy,SciPy和Matplotlib等python数值计算的库实现高效的算法应用涵盖了几乎所有主流机器学习算法为什么是sklearn友好且有深度;有用但缺乏优秀的解读;是通往数据挖掘工程师的起点什么是Graphviz在开发工作中,为代码添加注释是为了保证代码可维护性的一个重要方面,但是

2022-02-17 17:48:50 1795

原创 机器学习-数据科学库day6

Day6现在我们有2015到2017年25万条911的紧急电话的数据,请统计出出这些数据中不同类型的紧急情况的次数 #coding=utf-8import numpy as npimport pandas as pdfrom matplotlib import pyplot as pltfile_path = "./911.csv"df = pd.read_csv(file_path)# print(df.info())#获取分类(EMS,Fire,Traffic..)# print(df

2022-02-11 12:55:32 1081

原创 机器学习 数据科学库Day5

Day5对于这一组电影数据,如果我们希望统计电影分类(genre)的情况,应该如何处理数据?思路:重新构造一个全为0的数组,列名为分类,如果某一条数据中分类出现过,就让0变为1#set()函数创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交集、差集、并集等。#shape[0]表示行数,shape[1]表示列数【操作】 #coding=utf-8#对于这一组电影数据,如果我们希望统计电影分类(genre)的情况#应该如何处理数据?#思路:重新...

2022-02-06 16:19:58 1041

原创 机器学习 科学数据库Day4

Day4为什么要学习pandas那么问题来了:numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢?numpy能够帮我们处理处理数值型数据,但是这还不够很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等比如:我们通过爬虫获取到了存储在数据库中的数据比如:之前youtube的例子中除了数值之外还有国家的信息,视频分类(tag)信息,标题信息等所以,numpy能够帮助我们处理数值,

2022-02-03 15:38:20 2478

原创 机器学习 科学数据库 Day3

Day3第二部分 numpy学习1.什么是numpy2.numpy基础3.numpy常用方法4.numpy常用统计方法为什么要学习numpy1.快速2.方便3.科学计算的基础库什么是numpy一个在Python中做科学计算的基础库,重在数值计算,也是大部分PYTHON科学计算库的基础库,多用于在大型、多维数组(各种列表形式,例如列表嵌套)上执行数值运算numpy创建数组(矩阵)【示例】 #coding=utf-8impo.

2022-01-29 22:24:46 3195

原创 机器学习 科学数据库Day2

Day2练习:假设大家在30岁的时候,根据自己的实际情况,统计出来了你和你同桌各自从11岁到30岁每年交的女(男)朋友的数量如列表a和b,请在一个图中绘制出该数据的折线图,以便比较自己和同桌20年间的差异,同时分析每年交女(男)朋友的数量走势a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]b = [1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1]要求:y轴表示个数x轴表示岁数,比如11岁,...

2022-01-25 11:09:25 202

原创 机器学习-数据科学库 Day1

Day1课程概要matplotlib:画图numpy:处理数值型数组pandas:处理各种数值类型为什么要学习数据分析希望从大量的数据中寻找规律,价值等方便使用,通过大量的总结和分析寻找结论(例如绘制成如下图) 数据分析:1.有岗位需求(爬虫、Web、机器学习等)2.是python数据科学的基础3.是机器学习课程的基础什么是数据分析数据分析是用适当的方法对收集...

2022-01-19 10:49:05 974

原创 Python基础学习Day11

Day11模块(module)模块化(module)程序设计理念1.1模块和包概念的进化史“量变引起质变”是哲学中一个重要的理论。量变为什么会引起质变呢?本质上理解随着数量的增加,管理方式会发生本质的变化;旧的管理方式完全不适合,必须采用新的管理方式。程序越来越复杂,语句多了,怎么管理?很自然的,我们会将实现同一个功能的语句封装到函数中,统一管理和调用,于是函数诞生了。程序更加复杂,函数和变量多了,怎么管理?同样的思路,“物以类聚”,我们将同一类型对象的“数据和行为”,也就

2022-01-17 12:15:20 511

原创 Python基础学习Day10

Day 10第八章 文件操作(IO技术)一个完整的程序一般都包括数据的存储和读取;我们在前面写的程序数据都没有进行实际的存储,因此python解释器执行完数据就消失了,实际开发中,我们经常需要从外部存储介质(硬盘、光盘、U盘等)读取数据,或者将程序产生的数据存储到文件中,实现“持久化”保存很多软件系统是将数据存储在数据库中;数据库实际也是基于文件形式存储的,本章我们就学习文件的相关操作。文本文件和二进制文件按文件中数据组织形式,我们把文件分为文本文件和二进制文件两大类。1

2022-01-12 11:40:02 498

原创 Python基础学习Day9

Day 9导引问题在实际工作中,我们遇到的情况不可能是非常完美的。比如:你写的某个模块,用户输入不一定符合你的要求;你的程序要打开某个文件,这个文件可能不存在或者文件格式不对;你要读取数据库的数据,数据可能是空的;我们的程序再运行,但是内存或硬盘可能满了等等。软件程序再运行过程中,非常可能遇到刚刚提到的这些问题,我们称之为异常,英文是:Exception,意思是例外。遇到这些例外情况,或者叫异常,我们怎么让写的程序做出合理的处理,而不至于程序崩溃呢?如果我们要拷贝一个文件,在没有异常

2021-12-30 12:18:23 24219

原创 Python基础学习Day8

Day8方法没有重载在其他语言中,可以定义多个重名的方法。(例如java中可以同时定义a方法(x,y);a方法(x,y,z)),只要保证方法签名唯一即可。(能够通过形参列表来区分)方法签名包含3个部分:方法名、参数数量、参数类型Python中,方法的参数没有类型(调用时确定参数的类型),参数的数量也可以由可变参数控制。因此,Python中是没有方法重载的。定义一个方法即可有多种调用方式,相当于实现了其他语言中的方法的重载。如果我们在类体中定义了多个重名的方法,只有最后一个

2021-12-28 18:18:06 402

原创 Python基础学习day7

Day7嵌套函数嵌套函数:在函数内部定义的函数【操作】嵌套函数定义def f1(): print('f1 running...') def f2(): print('f2 running...') f2()f1()结果:f1 running...f2 running...上面程序中,f2()就是定义在f1函数内部的函数。f2()的定义和调用都在f()函数内部一般在什么情况下使用嵌套函数?封装 ...

2021-12-27 00:50:48 245

原创 Python基础学习Day6

Day 6函数也是对象,内存底层分析Python中,“一切皆是对象”。实际上,执行def定义的函数后,系统就创建了相应的函数对象。函数是对象,可以作为参数传递,也可以作为返回值返回我们执行如下程序,然后进行解释:def test01(): print('abcde')test01() #()小括号表示调用的意思c=test01c()print(id(test01)) #test01和c两个id相等,说明指向同一个对象print(id(c))print(ty

2021-12-23 00:42:44 565

原创 Python基础学习Day5

Day 5for 循环通常用于可迭代对象的遍历。for 循环的语法格式如下:for 变量 in 可迭代对象:循环体语句【操作】遍历一个元组或列表 #测试for循环for x in (10,20,30): print(x,end='\t')结果如下:10 20 30可迭代对象Python包含以下几种可迭代对象:序列。包含:字符串、列表、元组 字典 迭代器对象(iteratior) 生成器函数(generator) 文件对象【操作..

2021-12-19 22:30:06 1306

原创 Python基础学习Day4

字典字典是“键值对”的无序可变序列,字典中的每个元素都是一个“键值对”,包含:“键对象”和“值对象”。可以通过“键对象”实现快速获取、删除、更新对应的“值对象”。列表中我们通过“下标数字”找到对应的对象。字典中通过“键对象”找到对应的“值对象”。“键”是任意的不可变数据,比如:整数、浮点数、字符串、元组。但是:列表、字典、集合这些可变对象,不能作为“键”。并且“键”不可重复一个典型的字典的定义形式:(三个“键值对”name是键,zhangsan是值)...

2021-12-19 02:00:53 901

原创 Python基础学习Day3

可变字符串在python中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智能创建新的字符串对象。但是,经常我们确实需要原地修改字符串,可以使用io.StringIO对象或array模块>>>import io>>>s='hello.sxt'>>>sio = io.StringIO(s)>>>sio<_io.StringIO object at 0x000002496F8BE320>

2021-12-16 03:30:22 2952

原创 Python基础学习day2

链式赋值链式复制用于同一个对象赋值给多个变量x=y=123 相当于:x=123;y=123系列解包赋值系列数据赋值给对应相同个数的变量(个数必须保持一致)>>>a,b,c=4,5,6 相当于:a=4;b=5;c=6操作使用系列解包赋值实现变量交换常量Python不支持常量,既没有语法规则限制改变一个常量的值。我们只能约定常量的命名规则,以及在程序的逻辑上不对常量的值做出修改(Java中常量的值不变,Python中可以任意修改)>...

2021-12-15 01:34:47 476

原创 Python基础学习Day1

Python的一些基础知,涉及介绍,安装,海龟绘图,变量与对象相关的知识

2021-12-13 01:20:58 515

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除