
自学
文章平均质量分 68
weixin_44778883
这个作者很懒,什么都没留下…
展开
-
2020.6.8-10-数据库原理与应用:数据库原理与应用Day4
博客一不小心关闭了,后期补上。关系数据库2.1 关系数据库及形式化定义2.1.2 关系模式 关系模式是对关系的描述。关系就是一张二维表,也是一个集合。关系是元组的集合,因此关系模式必须指出这个元组集合的结构,即它由哪些属性构成,这些属性来自哪些域,以及属性与域之间的映像关系。 现实世界的许多已有事实限定了关系模式所有可能的关系必须满足一定的完整性约束。这些约束或者通过对属性取值范围的限定,或者通过属性值间的相互关连反映出来。关系模式应当刻画出这些完整性约束条件。 因此,一个关系模式应当是一原创 2020-06-08 22:04:55 · 514 阅读 · 0 评论 -
2020.5.27-数据库原理与应用:数据库原理与应用Day3
1.3 数据库系统的结构1.3.1 数据库系统模式的概念 从数据库应用开发人员角度看,数据库系统通常采用三级模式结构,是数据库系统内部的系统结构。 从数据库最终用户角度看,数据库系统的结构分为:客户/服务器结构(Client/Server)浏览器/服务器结构(Browser/Server)分布式结构“型”和“值”的概念:型(Type):对某一类数据的结构和属性的说明,说的是这一类数据的共性。值(Value):是型的一个具体赋值。模式(Schema):数据库逻原创 2020-05-28 09:32:03 · 172 阅读 · 0 评论 -
2020.5.25-数据库原理与应用:数据库原理与应用Day2
1.2.1 概念模型1.概念模型的表示方法 实体-联系方法(Entity-Relationship) E-R图实体型:用矩形框表示,实体集名字写在框中。联系:用菱形框表示,联系名写在框中,用无向边与相关实体集连接,并注明联系类型。属性:用椭圆表示,属性名写在椭圆中,如果为码属性,其名字带下划线。用无向边将实体集和它的全部属性连接起来。若联系也有属性,把属性和菱形用无向边连起来。上图表示单个实体集之间的联系。以上表示多个实体集之间的联系。例如某大学选修课程案例。添加上属性后为:1.原创 2020-05-25 21:37:02 · 300 阅读 · 0 评论 -
2020.5.24-数据库原理与应用:数据库原理与应用Day1
1.1 数据库系统概述基本概念:数据(Data)信息(information)我国著名的信息学专家钟义信教授认为“信息是事物存在方式或运动状态,以这种方式或状态直接或间接的表述”。美国信息管理专家霍顿(F.W.Horton)给信息下定义是:“信息是为了满足用户决策的需要而经过加工处理的数据。”简单地说,信息是经过加工的数据,或者说,信息是数据处理的结果。信息和数据是密不可分的。在计算机中:信息是数据经过加工处理后得到的另一种形式的数据,这种数据在某种程度上影响接收者的行为。具有可观真实性、传原创 2020-05-24 09:14:00 · 676 阅读 · 0 评论 -
2020.5.23:time模块的几个用法
无论是机器学习还是深度学习,在拿到数据集的时候经常会遇到关于时间的问题。这里从别人的微信公众号上摘抄过来。1. 使用time模块打印当前时间# 导入时间模块import time# 打印当前时间,注意返回的是浮点数seconds = time.time()# 例如返回的是1590230719.79705742. 浮点数转时间结构体接以上代码,注意返回的是结构化的时间,并不是我们通常理解的2020.5.23.18:49…local_time = time.localtime(seconds)原创 2020-05-23 19:10:41 · 317 阅读 · 0 评论 -
2020.5.23一直停滞后的学习:10个python编程小技巧。
参考自b站1. 变量的交换(Swapping Variables)交换a和b的变量方法一:比较简单及繁琐,可读性也较差。a = 1b = 2temp = a # 定义一个临时变量a = bb = temp方法二:好像仅在python中成立a = 1b = 2a, b = b, a2. 字符串格式化(String Formatting)在程序中组合和拼接字符串,我们一般使用“+”的形式,但是如果字符串较多的话,则会现得代码比较杂乱且可读性大大的降低,而且当我们连接int或者flo原创 2020-05-23 12:13:22 · 150 阅读 · 0 评论 -
2020.4.14,RNN简单学习
循环神经网络(Recurrent Neural Network)注意用来处理序列问题(Sequence)Sequence embedding ==>> [b, seq_len, feature_len] # b个句子,每个句子数量seq_len,每个单词为feature_len的长度。要理解在大文本的数据集中为什么要选用word embedding这种方法,而不是用one-h...原创 2020-04-16 09:04:58 · 182 阅读 · 0 评论 -
2020.4.5:jieba和wordcloud统计聊天信息
微信聊天记录网上教程比较复杂,没有实现,经过询问同学,主要采取人工的方法,将和某人的聊天记录暴力抓取。(ctrl+c ==> ctrl+v)代码实现import jiebaimport wordcloudfrom scipy.misc import imreadwith open('chat.txt', 'r', encoding='utf-8') as f: text = f...原创 2020-04-05 09:23:32 · 142 阅读 · 0 评论 -
关于许久以前的一个面试问题:用python自带的库实现一个矩阵的转置
这是2019年面试四维图新的一道面试题,因为自己是自学的小白,十分渴望与大佬交流学习的机会,就放开胆子参加了一次关于计算机专业的面试,虽然最终没有被录用,但是还是很开心。当时面试官提了几个问题,我都基本回答上来了,就是这个问题,因为时间原因,加上自己紧张,没有及时答上来,最近又想了想,最终实现了一下的方法。虽然勉勉强强,但还好是跑了出来。问题:用python自带的库实现一个矩阵的转置。def...原创 2020-03-31 09:40:49 · 163 阅读 · 0 评论 -
2020.3.29-3.31学习:计划改变学习线程,CNN基础知识
从入门学习python到爬虫,机器学习再到深度学习也有一年多了,感觉现在的自己还是只有一些基础,一直停留在学习API的无止境循环中,效果还不太好,没有一点实战能力,因为API真的是太多了。所以受网上UP主的启发,决定今后一段时间里将CNN和RNN理论搞懂大部分,结合实际项目有针对的学习API,尝试一下新的学习方法。从深度神经网络(DNN)到卷积神经网络(CNN)传统的神经网络结构如下图,而...原创 2020-03-29 13:34:58 · 259 阅读 · 0 评论 -
2020.3.28学习笔记
Tf.data中API使用1.学习预览Dataset基础API使用Dataset读取csv文件Dataset读取和存储tfrecord文件,tensorflow中自带的文件存储格式,更快2.使用API列表Dataset基础使用tf.data.Dataset.from_tensor_slices ==> 用来构建DatasetData构建后的具体使用方法有 ==> ...原创 2020-03-28 17:19:29 · 115 阅读 · 0 评论 -
2020.3.27学习总结:Wide&Deep模型
参考描述Wide&Deep模型是Tensorflow与2016年6月左右发布的一个用于Google Play中的应用推荐模型,其主要用于做分类和回归问题。Wide&Deep模型的主要思想就是结合线性模型的记忆能力和DNN模型的泛化能力。记忆:从历史数据中发现item或者特征之间的相关性,因为用于的是线性模型,主要就是通过权重和偏置来进行组合;泛化:即相关性的传递,主要利用多层...原创 2020-03-27 10:53:00 · 234 阅读 · 0 评论 -
2020.3.26学习笔记:主要是巩固神经网络的实现过程
巩固知识,和之前写的那个代码有点区别,但是思想是一样的,都是构建模型,然后前向传播得出损失函数的值,反向传播算出各个参数的梯度,更新权重,再计算损失函数值,等依次重复。import numpy as npimport matplotlib.pyplot as pltimport tensorflow as tffrom tensorflow import keras from sklea...原创 2020-03-26 21:34:12 · 137 阅读 · 0 评论 -
2020.3.25学习笔记:函数求导,
主要是利用函数近似求导的公式编写代码。def f(x): return 3. * x ** 2 + 2. * x - 1def approximate_derivative(f, x, eps=1e-3): return (f(x + eps) - f(x - eps)) / (2 * eps)print(approximate_derivative(f, 1.))def g(x...原创 2020-03-25 11:15:45 · 339 阅读 · 0 评论 -
利用网页生成决策树
直入主题。先利用sklearn生成‘tree.dot’,然后利用word打开导入网页“http://www.webgraphviz.com”生成即可。期间遇到查看当前程序运行路径的问题。from sklearn import treetreee.export_graphviz(clf, out_file='tree.dot')# clf在此已为模型,略# 查看当前程序运行路径im...原创 2020-03-09 22:11:29 · 859 阅读 · 0 评论 -
np.c_和np.r_的用法
np.c_:是按行连接两个矩阵,就是把两矩阵左右相加,要求行数相等;np.r_:是按列连接两个矩阵,就是把两矩阵上下相加,要求列数相等。但两个API的调用都需用[],参数为需要合并的数据。import numpy as npx = np.arange(9).reshape(3, 3)y = np.ones([3, 3])c = np.r_[x, y]d = np.c_[x, y]x...原创 2019-11-21 19:32:17 · 185 阅读 · 0 评论 -
卷积神经网络对CIFAR100实战
CIFAR100数据分为测试集和训练集,为50k+10k,每张图片大小为32323,共100种分类。正是由于图片小,分类多的特性使得该项目测试难度较大。本次网络共设置13层(2卷积层+2卷积层+2卷积层+2卷积层+2卷积层+3全连接层),所以数据在训练过程中速度会较慢。import tensorflow as tfimport tensorflow.keras import datasets,...原创 2019-11-05 21:36:22 · 2734 阅读 · 2 评论 -
python关闭warnings的方法
方法一:这种方法不知道为什么,有时候会提示‘str’类型的错误,此时可以用方法二。import warningswarnings.filterwarnings('ignore')方法二:import osos.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'os.environ[‘TF_CPP_MIN_LOG_LEVEL’]还四个参数,接下来一一介绍。im...原创 2019-11-03 11:15:58 · 3772 阅读 · 1 评论 -
利用tensorflow深度学习框架做fashionmnist的神经网络分类
import tensorflow as tffrom tensorflow.keras import datasets, layers, optimizers, Sequentialdef preprocess(x, y): x = tf.cast(x, dtype=tf.float32) / 255. y = tf.cast(y, dtype=tf.int32) return ...原创 2019-10-30 19:50:53 · 234 阅读 · 1 评论 -
利用python做三维图可视化
import numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Ddef himmelblau(x): return (x[0]**2 + x[1] - 11)**2 + (x[0] + x[1]**2 - 7)**2x = np.linspace(-6, 6, 200)y...原创 2019-10-30 15:39:07 · 6212 阅读 · 1 评论 -
python利用matplotlib画子图的一种方法
import pandas as pdfrom matplotlib.pyplot as pltfig = plt.figure()ax1 = fig.add_subplot(2, 1, 1)ax2 = fig.add_subplot(2, 1, 2)df.plot('X1', 'Y', kind='scatter', ax=ax1)df.plot('X2', 'Y', kind='s...原创 2019-08-27 16:37:40 · 222 阅读 · 0 评论 -
pandas中apply()函数的应用
apply应用的对象为Series,针对Series每一个样本操作,一般和lambda共用。import pandas as pdimport numpy as npdf = pd.DataFrame(np.arange(20).reshape(4, 5))df[0].apply(lamda x: float(x))...原创 2019-09-11 20:33:19 · 588 阅读 · 0 评论 -
网格搜索参数及其常用代码
利用sklearn中的GridSearchCV对模型最优超参数进行选择,经常与交叉验证共用。参数选择表现如下:0.01 0.1 1.0 10.0 100.01 (0.01, 1) (0.1, 1) (1, 1) (10, 1) (100, 1)2 (0.01, 2) (0.1, 2) (1, 2) (10, 2) (100, 2)3 (...原创 2019-09-12 18:21:24 · 2045 阅读 · 0 评论 -
六级英语考试的一次模拟
同学刚考完六级英语,想到一个概率模型。大家争论不休,于是自己兴趣来潮,用计算机模拟证明了自己的正确性。问题描述及代码如下。问题描述:英语六级作文有三种类型,问三个人选中同一个作文题目的概率。(哎,这种问题都能纠结,就算列出来也可以知道答案,不过大家都死心的认准自己算出的答案)代码如下:(刚开始对shuffle封装了,但是算了,还是直接暴力干吧,毕竟也就那几行。) num = 0 ...原创 2019-06-18 09:29:28 · 175 阅读 · 0 评论 -
python中箱线图的画法小结
箱线图又称盒须图、盒式图或箱型图,是一种用作显示一组数据分散情况资料的统计图,主要用于反映原始树分布的特征,还可以进行多组数据分布特征的比较。箱线图针对numpy和pandas中的数据和列表中的数据画法选择标准不一,如下:import pandas as pdimport matplotlib.pyplot as plt# 针对numpy和pandas数据的画法一样,这里只说pandas...原创 2019-05-10 16:35:22 · 3435 阅读 · 0 评论 -
利用python中的scipy模块做线性规划
为数学建模准备。scipy.optimize.linprog参数选择:linprog(c, A_ub, b_ub, A_ed, b_ed, bounds=None)参数解释—>>> c:价值向量,只规划最小值,若规划最大值需改为-c,但注意得出的结果应再加负号即为所求最大值;A_ub和b_ub:分别对应于不等式约束的向量,注意只取小于等于时的数组,而且A_ub必须为二维...原创 2019-08-15 11:24:12 · 4305 阅读 · 1 评论 -
数学建模中的线性回归
参加数学建模会用到统计学的知识解决单一因素与多变量之间的关系,也多用线性回归的知识,书上讲解主要用matlab去做,但主要还是自己懒,短期内不想再去学习,于是尝试用python中的模块取模拟,但是好像sklearn中不带有置信区间,想用的话得自己实现,反正也不太懂置信区间,就直接干吧。'''线性回归'''import numpy as npimport matplotlib.pyplot...原创 2019-07-16 15:20:32 · 927 阅读 · 0 评论 -
自己在机器学习中利用别人的数据修改创建的数据集
主要用于BP神经网络,曲线分类。原数据集为-0.017612 14.053064 0-1.395634 4.662541 1-0.752157 6.538620 0-1.322371 7.152853 00.423363 11.054677 00.406704 7.067335 10.667394 12.741452 0-2.460150 6.866805 10.569411 ...原创 2019-06-30 17:36:51 · 710 阅读 · 0 评论 -
numpy中arg**方法的应用
numpy中返回对象中最大值,最小值或排序后的索引。arr.argmax() # 返回array对象中最大值所占的索引arr.argmin() # 返回array对象中最小值所在的索引arr.argsort() # 返回array对象中升序排列后的索引上述三个API均可填入参数axis=[0, 1, …]。axis=0,表示按列操作axis=1,表示按行操作注意Ser...原创 2019-05-28 15:43:05 · 211 阅读 · 0 评论 -
将pandas中object类型转换为int类型
计算机在模拟显示类别运算时往往会转换为数字的形式,这里提供将那些文本转换为数字import pandas as pddata = pd.read_csv('iris.data', header=None)y = pd.Categorical(data[4]).codes 虽说是转换为数字了,但每一个数字代表哪个一个类型,还需继续讨论。...原创 2019-05-31 10:23:26 · 26148 阅读 · 3 评论 -
matplotlib子图坐标轴重叠问题
绘制matplotlib多个图形于一张图时往往会出现相邻图坐标轴重叠的现象,此时只须在汇完所有子图后加上以下代码即可。plt.tight_layout()原创 2019-05-28 11:26:37 · 7060 阅读 · 6 评论 -
numpy中的多项式函数API
sklearn中内置了一个将一次项x转换成高次项的API,即将简单的y=k1x1 + …转换成立高次项y=k1x+k2x**2 +…的拟合。具体方法参照numpy中的PolynomialFeatures。这个类有三个参数:1、degree:控制多项式的次数,默认为2、interaction_only:默认为False,如果改为True,那么就不会有特征和自己结合的项3、include_bia...原创 2019-05-28 10:48:44 · 550 阅读 · 0 评论 -
关于matplotlib中无法显示中文、小数点等的小方法
matplotlib中默认是不支持中文显示的,但利用下列代码,也可轻松实现matplotlib中中文的显示。import matplotlibmatplotlib.rcParams['font.family'] = 'Kaiti'这里设置显示的字体是楷体,还要显示其他字体的参数:宋体 SimSun黑体 SimHei微软雅黑 Microsoft YaHei微软正黑体 Microsof...原创 2019-05-12 10:58:37 · 903 阅读 · 0 评论 -
pandas中实现将object数据转换成one-hot编码
在python数据分析和机器学习过程中,需要将一些已进行分类后的原数据转换成数字的类型,这里就需要一些方法将这些类别转换成one-hot编码,以供计算机进行识别运算。# 转换方法一:import pandas as pdimport numpy as npdata = {'animal': ['dog', 'cat', 'bird'], 'age': [1, 2, 1], 'owne...原创 2019-05-07 17:32:45 · 2537 阅读 · 0 评论 -
python读取以空格分开的文件
在查找数据集的时候发现,并不是所有的数据集都是以csv的格式存储,也就是每一列特征数据的分割并不是都以逗号分割,有的数据格式是以空格为分割,例如.data格式,接下来就实现对.data格式数据的读取:(数据来源于Boston房价预测数据集,文件名称为“housing.data”)import pandas as pddata = pd.read_csv('./housing.data', d...原创 2019-05-10 08:19:19 · 8819 阅读 · 0 评论 -
关于python中zip的用法
python中zip是将一个或多个迭代器打包成一个列表,其中列表中每个元素就是被打包的迭代器对应位置的元素所组成的列表,说起来有点抽象,直接上代码演示。打包后的zipped好像是一个生成器,可以使用遍历训练访问其中的元素a = [1,2,3]b = ['a', 'b', 'c']zipped = zip(a, b)# zipped的内容应该是 --->>> [(1, '...原创 2019-05-09 19:03:04 · 297 阅读 · 0 评论 -
关于python中正态化数据和分离数据集的先后顺序问题
python机器学习过程中需要将一些数据正态化,那么是先分离数据集,然后将再将数据集正态化呢,还是反过来执行呢?参考网上别的作者,有如下解释(文章选择链接如下):https://blog.youkuaiyun.com/u012328159/article/details/84669266from sklearn.model_selection import train_test_splitfrom...转载 2019-05-09 17:35:48 · 589 阅读 · 0 评论 -
matplotlib和pandas模块子图绘制总结
在一幅图中绘制多个图案的方法很多,这阶段自学只要学会matplotlib和pandas模块中各自一种绘制图案即可。各自方法如下:(基于python语言编写)import matplotlib.pyplot as pltfrom matplotlib import gridspecimport matplotlibimport numpy as npmatplotlib.rcParam...原创 2019-04-25 17:47:06 · 1377 阅读 · 0 评论 -
python代码中实现加入环境变量的语句
以GraphViz为例:下载安装好的路径名字为C:/Program Files (x86)/Graphviz2.38import osos.environ["PATH"] += os.pathsep + 'C:/Program Files (x86)/Graphviz2.38/bin/' #注意修改你的路径os.environ[‘path’]返回的是所有环境变量的所在的位置,我们这里是...原创 2019-05-31 16:03:41 · 7615 阅读 · 2 评论 -
决策树的可视化
决策树可视化的前提是电脑上装了Graphviz,然后利用python装的第三方库pydotplus将图转换为png或pdf的格式。import pydotplusfrom sklearn.tree import DecisionTreeClassifierfrom sklearn import tree...# 方法一 ,存为dot格式的文件,用Graphviz打开with open...原创 2019-05-31 18:07:21 · 459 阅读 · 4 评论