- 博客(158)
- 资源 (1)
- 收藏
- 关注
原创 【PyTorch】2.2张量
方法一:由原始数据直接生成张量, 张量类型由原始数据类型决定。方法二:由已有的Numpy数组来生成张量(反过来也可以由张量来生成Numpy数组。方法三:新的张量将继承已有张量的数据属性(结构、类型), 也可以重新指定新的数据类型。方法四:通过指定数据维度来生成张量。shape是元组类型, 用来描述张量的维数, 下面3个函数通过传入shape来指定生成张量的维数。
2023-04-18 18:12:20
256
原创 【PyTorch】2.1环境搭建
Win10+Cuda10.2的Pytorch安装_cuda10.2对应的pytorch_索尼大法好的博客-优快云博客
2023-04-18 17:36:35
282
原创 【环境搭建】cuda安装篇
想要安装GPU版的深度学习框架,首先需要有适配的cuda,好多框架TensorFlow、Pytorch、paddlepaddle不适配高版本的cuda,如果你的cuda是高版本,我们需要卸载掉原来的cuda版本安装中、低版本的cuda。深度学习框架的搭建有两种CPU版本和GPU版本。如果您的电脑没有NVIDIA GPU显卡,那么就安装CPU版本;我们默认安装时,镜像源默认都是国外的,网络比较慢导致安装失败,因此我们可以切换到国内的镜像;
2023-04-12 14:16:45
7603
原创 【实用技巧】如何进入hive
可以直接执行beeline命令进入hive,也可以实用beeline -u jdbc连接。step1:激活搭建hadoop的配置文件环境。step3:执行beeline命令。
2022-11-24 00:24:41
2444
原创 【实用技巧】将本地csv文件导入到hive中
step1:在hive中创建表test01,并使用命令"show create table 表名",得到该表存放的hdfs文件路径(数据入库时需要用到)step3:进入HDFS下的hadoop下的bin目录,并将a.csv文件放在该目录下。命令格式:./hdfs dfs -put 数据存放路径 数据表在hdfs文件路径。step2:使用vim创建文件a.csv,并存入数据。step4:执行命令。
2022-11-24 00:01:18
3263
原创 【深度学习之Tensorflow2.0】函数matmul和函数multiply的用法
函数matmul和函数multiply的用法1.函数matmul2.函数multiply1.函数matmul描述:是矩阵的乘法,矩阵的行和列对应相乘求和。格式:X(mn) Y(nk) = Z(m*k)代码:x=[[[1,2], [3,4]], [[1,2], [3,4]]] # Tensor:又叫张量,就是一个任意维的矩阵m=tf.matmul(x,x) # 乘法print(m)2.函数multiply描述:两个矩阵对应元素相乘,可以是矩阵乘矩阵、可以是矩阵乘向量、
2021-11-03 15:12:05
4523
原创 【数据分析之Excel】创建下拉菜单
选中需要显示在下拉菜单中的条目,按Ctrl+T,将其转换为表格。 在工作表中选中要显示在下拉菜单中的单元格; 在功能区中找到“数据”栏,选择“数据验证” 在弹出的窗口中选择“设置”,验证条件为“序列”,数据源为我们需要显示在菜单栏中的数据; 输入信息:提示内容和标题 出错警告!...
2021-05-25 15:48:23
291
原创 混淆矩阵
混淆矩阵在机器学习领域中又称为错误矩阵或可能性表格。Example:假设有27只小动物:8只猫,6条狗,13只兔子。结果的混淆矩阵如下图:在混淆矩阵中,共有8只猫,其中又3只被预测成了狗;总共有6只够,其中被预测错的有3只;不过兔子预测效果不错。意义:混淆矩阵可以很方面的看出哪里有错误,因为正确的预测都在对角线上。...
2020-12-29 14:08:25
645
原创 【机器学习-基础算法】梯度下降法
俗话说,没有对比就没有伤害,为了体现出Tensorflow2.0,PyTorch等深度学习框架的便捷性,这次我们使用科学计算库Numpy来实现在整个机器学习领域中最重要,也是最基础的迭代优化算法----梯度下降法。话不多说,上菜导包:import numpy as npfrom sklearn import datasetsimport matplotlib.pyplot as plt%matplotlib inline计算误差def total_error_of_calcul
2020-12-09 11:19:57
251
原创 【分析工具】词云统计
词云用于展示各个关键词出现的次数。1.导入必要的数据报import jiebaimport numpy as npfrom wordcloud import WordCloudfrom PIL import Image2.设置背景图
2020-11-03 14:15:46
1298
原创 【机器学习之百面机器学习】第一章:特征工程
本章主要讨论两种常用的数据类型。1、结构化数据:包含数值型和类别型两种基本类型;可认为是数据库中的一张表,每行每列都有清晰的定义,每一行数据都表示一个样本信息。2、非结构化数据:包含文本、图像、音频、视频数据;包含的信息无法用简单的数值表示,也没有清晰的类别定义,并且每条数据的大小各不相同。1.特征归一化为了消除特征之间的量钢化影响,我们需要对特征进行归一化处理,使不同指标之间具有可比性。2.类别型特征3.高维组合特征的处理4.组合特征5.文本表示模型...
2020-09-08 18:04:06
232
原创 【深度学习之基础入门】发展历程与环境搭建
1.win10系统修改下载镜像源1】找到路径:C:\Users\Administrator;2】在该路径下新建文件夹,重命名为pip;3】进入pip目录,在该目录下新建文件pip.ini;文件内容如下:[global]timeout=6000index-url=http://pypi.douban.com/simpletrusted-host=pypi.douban.com修改成功!2.重新认识深度学习深度学习是基于深层神经网络实现的模型和算法2.1基础框架.
2020-09-07 23:56:43
162
原创 【深度学习】学习路线图
从学校到工作,学习了这么长时间,其实方向是很重要的,明确了方向,其次就是学习计划,要制定学习计划,那么学习路线是必不可少的。为此,我总结了深度学习的路线图,该图是自己要学习的几个考量,仅供参考。...
2020-06-19 14:14:55
4020
原创 【数据结构与算法】学习路线
下面是工作中或者面试中经常用到的数据结构与算法相关的知识点,也是我曾经用到过的,如果想要XMind格式的,那就请在下方评论,我会在第一时间回复并发给你,下面是给大家罗列出来的:...
2020-06-18 00:34:35
699
2
原创 【第三方库】tkinter基本用法
目录一.按钮二、文本框三、ListBox四、RadiusButton五、滚动条-scale六、复选框-checkbutton七、画布-canvas八、菜单-menu九、frame十、messagebox注意点:放置部件的三种方式一.按钮import tkinter as tkwindow=tk.Tk() # 窗口对象window.titl...
2020-05-02 16:52:05
1385
原创 【相关文章】使用python将pdf转成word
代码很简单,直接附上代码。import osfrom configparser import ConfigParserfrom io import StringIOfrom io import openfrom concurrent.futures import ProcessPoolExecutorfrom pdfminer.pdfinterp import PDFResourc...
2020-05-02 16:18:24
386
原创 【第三方库】使用Myqr库生成二维码
短地址生成器很简单,下面我直接附上代码。from MyQR import myqrmyqr.run( words='https://blog.youkuaiyun.com/weixin_43797885', # 二维码内容 picture='2.gif', # 二维码背景图片 colorized=True, # 是否为彩色图片)结果展示:我们这里生成的是...
2020-05-02 15:57:40
389
原创 【分析工具】Excel基本使用02
1.IF()函数格式:IF(条件,条件符合时返回的值,条件不符合时返回的值)eg:=IF(A1=7,"旅游","宅在家") =IF(E7<=1000,"低",IF(E7<=10000,"中","高"))2.Lookup()函数功能:格式:lookup(1,1/(索引值=索引值所在列),要查找的列)举例:...
2020-04-26 13:42:26
150
原创 【分析方法】用户生命周期模型
一、用户生命周期模型从用户接触产品到离开产品的全过程。用户的生命周期长短将直接影响产品与企业的营收,因此将用户生命周期科学地量化,在合适地时候做出合适地运营策略,从而延长用户地生命周期。...
2020-04-21 23:06:38
1283
原创 【数据分析】用户流失预警
针对用户增长分析,从用户防流失的角度,基于多点app电商构建用户流失预警模型,找到高潜流失用户。用于定向开展运营激活,从而有效控制用户流失风险,提升大盘用户的留存率和活跃度。(不要便宜羊毛党)留住已有的用户胜过拓展新的客户。用户留存和用户流失是一组相对的概念。获得一个新客户的成本要远远高于保持一个老客户的成本。所以说提升用户的留存减少用户的流失是必不可少的。用户留存依然是反映企业及产品核心...
2020-04-17 22:35:58
1332
原创 【特征工程】数据降维
前几个章节我们将了机器学习的基础知识以及数据预处理和特征选择,本章节我们将讲述数据降维,在次之前,首先我们要明白为什么要进行数据降维操作?加快运算速度 有利于防止过拟合(但防止过拟合最好的方法却是正则化) 减少用来存储数据的空间2.3数据降维当特征选择完成之后,可以直接训练模型,但是可能由于矩阵过大,导致计算量大,训练时间长的问题,因此降低特征矩阵维度也就必不可少了。数据降维可以保证...
2020-04-07 00:33:13
715
原创 【特征工程】特征选择
上一章节我们系统性的讲述了数据预处理,本章我们将讲解特征选择。参看官网,效果更佳!目录2.2特征选择2.2.1过滤法(Filter)2.2.1.1方差选择法2.2.1.2相关系数法2.2.1.3卡方检验2.2.1.4互信息法2.2.2包装法(wrapper)2.2.3嵌入法(Embedded)2.2.3.1基于惩罚项的特征选择2.2.3.2基于树模型的特...
2020-04-05 23:19:28
350
原创 【特征工程】数据预处理
本章节将讲述数据预处理操作,如:缺失值的填充 文本数据的编码 连续数据离散化 数据无状态转换 数据的无量纲化 数据的特征衍生(是一个正好和特征选择相反的操作,有时候我们对数据进行特征衍生之后,往往可以得到更好的结果。)操作官方文档阅读,效果更佳!2.1数据预处理2.1.1缺失值的填充2.1.1.1单变量插补这种方法是根据具体的情况进行的填充,我们可以填充最大值、最小...
2020-04-04 23:36:10
622
原创 【分析工具】Python之Pyecharts01
1.基本概述下载和安装使用文档使用过Python的同胞们,我们都知道matplotlib这款可视化工具,google之后找到了一款国人开发的echarts和python结合的轮子,下面做详细的说明。那pyecharts和matplotlib之间有什么区别尼?就我个人而言,pyecharts适合做一些比较高大上的图。如:地图,地域分布,热力图,热点图等,而matplotlib适合...
2020-03-29 08:58:40
234
原创 【分析工具】Excel之数据透视表
1.数据透视表的应用有大量的数据,使用函数计算比较慢 快速制作,整理和分析各类报表 数据源经常发生变化,并且要经常分析和处理最新的数据 想快速洞察数据背后隐藏的意义2.取消所有合并单元格开始--查找--格式--对齐--勾选合并单元格---全部查找----全选---取消合并后居中3.快速填充选中要填充的列---->Ctri+G---->定位条件(空值)--->...
2020-03-28 23:35:21
257
原创 【分析工具】PowerBI之基本使用
1.基础入门参考文档1.1发展历程Excel:单元,图表,数据透视表,数据透视图四大插件:Power Query Power Povit Power View Power MapPBI=Power BI1.2产品特色(优点)它既可以在桌面呈现,也可以在移动端或者网页端呈现和分享 高颜值,操作简单 多维联动 可扩展性强 钻取:通过点击对应的联动位置,...
2020-03-27 13:24:07
2684
原创 【时间序列】ARIMA模型
1.基础知识应用:根据股票历史数据的增长情况,预测未来的趋势;根据当前降雨量预测未来一周或者一个月的降雨情况.平稳性有规律可循才能进行预测,时间序列数据必须要有惯性,数据的内部有一定的平稳性平稳性要求数据均值和方差不发生明显的变化严平稳和弱平稳严平稳:...
2020-03-24 20:08:41
5109
原创 【分析工具】Tableau之基本使用
1基础入门1.1产品架构Tableau Desktop:数据分析 Tableau Prep:数据清洗工具 Tableau Online:托管在云端的 Tableau Server:自己部署在企业内部,分析结构的共享以及权限的控制1.2数据的功能数据提取和实时:当我们的数据提取比较慢的时候我们采用数据提取的方式。...
2020-03-22 23:57:21
277
原创 【分析工具】SPSS之基本使用
1.1初识SPSS1.1.1数据分析过程数据收集 数据整理 数据分析 结果报告1.1.2优势功能强大 兼容性强 容易上手 扩展性能高1.1.3劣势计算速度相对比较慢 统计模型的纳入上速度比较慢...
2020-03-15 13:44:44
226
超市管理系统.docx
2020-02-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人