- 博客(61)
- 收藏
- 关注
原创 MySQL常用知识点记录(自用,不断补充)
一、计算1.计算两日期时间差(两种方式)TimeStampDiff():MySQL本身提供的可以计算两个时间间隔的函数语法为:TimeStampDiff(unit,datetime_expr1,datetime_expr2),返回日期或日期时间表达式datetime_expr1 和datetime_expr2the 之间的整数差。https://www.cnblogs.com/jpfss/p/11155908.htmlunit单位有以下几种:FRAC_SECOND 表示间隔是毫秒SEC
2022-03-11 17:10:07
939
原创 mysql8.0 1067 invalid default value for 字段(datetime)
打开mysql,输入SET sql_mode =’’
2022-03-10 21:28:38
1624
原创 ERROR 1054 (42S22): Unknown column ‘‘root’‘ in ‘where clause‘
select host from user where user=‘root’;# 报错改为:select host from user where user=“root”;
2022-02-16 15:57:36
2769
原创 python_pandas_dataframe导出为excel表格,去掉默认索引
df.to_excel("文件名.xlsx",index = False)
2021-09-14 16:43:42
7906
原创 python_pandas_DataFrame:删除缺失值NaN
df.dropna()函数用于删除dataframe数据中的缺失数据,即 删除NaN数据.删除至少缺少一个元素的行:df.dropna()删除至少缺少一个元素的列:df.dropna(axis = 1)等…参考链接:https://blog.youkuaiyun.com/qq_43188358/article/details/108335776...
2021-09-14 16:29:53
1831
原创 python_pandas_DataFrame_merge()
用于多个DataFrame的合并merge:通过键拼接列,即按照两个dataframe共有的column进行连接,两个dataframe必须具有同名的column。merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'), copy=True, indi
2021-09-14 16:26:46
214
原创 movielens1M数据处理
#coding=gbk# MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。# 分为三个表:评分,用户信息,电影信息。这些数据都是dat文件格式# ,可以通过pandas.read_table将各个表分别读到一个pandas DataFrame对象中import pandas as pdimport time start = time.perf_counter()filename1 =r'ml-1m\users.dat'filename2 = r'ml
2020-12-02 16:14:10
1409
原创 Anaconda查看安装包的位置和源码
import moduleprint(module.__file__)# 两个下划线# 举例import surpriseprint(surprise.__file__)
2020-11-25 19:09:23
8214
原创 python读取csv文件
df=pd.read_csv(filepath,header=None,encoding="gbk",names=["A","B","C","D","E"], skiprows=1,skipfooter=1,usecols=["A","B","C"],index_col=0,engine="python")
2020-11-11 11:12:58
535
原创 【推荐系统】划分数据集:k折交叉验证KFold()函数
from sklearn.model_selection import KFoldkf = KFold(n_splits = 8, shuffle = False)# n_splits = 8: 划分为8份# shuffle = False 输出是有序的for train_index, test_index in kf.split(data1): # data1就是所用的数据集 print('训练集:{}'.format(train_index)) print('测试集:{}'
2020-11-04 16:56:22
1809
原创 批量调整word中mathtype公式大小
步骤一:打开mathtype,找到大小选项里的定义并打开步骤二:在完整里面更改所需数值大小,确认步骤三:依次点击:预置–公式预置–保存到文件步骤四:回到Word环境中,点击“MathType”菜单中的格式化公式命令步骤五:选择之前设定保存的格式文件确认就好了...
2020-10-26 19:23:03
1349
1
原创 【python】对list进行sort排序出现None
错误代码:print(list.sort())# 会输出None正确代码:list.sort()print(list)
2020-10-10 21:55:41
4536
原创 【python】list 嵌套[[[list]]]]
类似于:list = [[1, 2], [2, 3]]或者list = [[[1]]]可以通过这种方法提取:list[0]]
2020-10-10 21:48:14
642
原创 【python】pandas DataFrame数据转为list(‘DataFrame‘ object has no attribute ‘tolist‘)
不可以直接使用tolist(),不然会报错:'DataFrame' object has no attribute 'tolist'正确方式:df.values.tolist()
2020-10-10 18:28:03
11492
原创 【python】pandas.DataFrame选取特定行
>>> df = pd.DataFrame([['GD', 'GX', 'FJ'], ['SD', 'SX', 'BJ'], ['HN', 'HB', 'AH'], ['HEN', 'HEN', 'HLJ'], ['SH', 'TJ', 'CQ']], columns=['p1', 'p2', 'p3'])>>> df p1 p2 p30 GD GX FJ1 SD SX BJ2 HN HB AH3 HEN
2020-10-10 10:36:59
3487
原创 python将相同ID的字符串进行合并
问题描述"""id value1 A1 B1 C2 D2 E2 F变为:id value1 [A,B,C]2 [D,E,F]pandas怎么把上面的结构变为下面的形式?"""解决方案:import pandas as pdimport numpy as npdata = pd.DataFrame({'id':[1,1,1,2,2,2],'value':['A','B','C','D','E','
2020-10-09 22:11:07
1995
原创 word中mathtype公式偏上不对齐问题解决
在网上查阅资料绝大多数都是采用调整段落格式:选中右键当前行->段落->缩进与间距->取消选中“如果定义了文档网格,则与网格对齐”->换行与分页->文本对齐方式:居中对齐但是有第二种情况,就是已经用了第一步的方法之后,原有的公式对齐了,但是新输入的公式又对不齐了:双击公式进入mathtype界面->Ctrl+s更新即可(不用快捷键可以在文件里找到更新选项)...
2020-08-28 11:08:42
19780
4
原创 Anaconda安装texttable
要使用conda安装此软件包,请执行以下操作之一:conda install -c conda-forge texttableconda install -c conda-forge/label/gcc7 texttableconda install -c conda-forge/label/cf201901 texttableconda install -c conda-forge/label/cf202003 texttable官方链接:https://anaconda.org/conda
2020-08-24 12:55:17
1584
原创 ‘tensorboard‘ 不是内部或外部命令,也不是可运行的程序问题解决
需要将tensorboard的路径添加到系统的PATH路径里面1. 首先要的就是找到tensorboard.exe这个程序简单一点,直接到装anaconda的盘里面搜tensorboard找到后进去把路径复制下来2. 添加到系统的环境变量的PATH1、同时按baiWIN+R键,打开du“运行”对话框,输入sysdm.cpl,按回车键打开“系统属性”。2、在系统属性对话框中选择“高级”选项。3、点击“高级”选项卡中的“环境变量 ”。4、点击“新建”添加新的环境变量,点击“编辑”修改环境变量
2020-08-09 22:08:43
3176
原创 Anaconda下安装tensorflow环境与jupyter notebook配置(Win10,亲测有效)
为了安装tensorflow整整折腾了一天,头发都秃了一半,哭死了都,在我锲而不舍的尝试下,终于在jupyter notebook 上成功运行起来了,心疼自己的铁憨憨行为。针对各种报错问题,咱也不懂,大胆猜测原因:没注意到版本匹配问题!!!!!!!!!!下面从头开始(因为我是在云服务器上安装的,所以不方便截图,直接引用了参考文章的图)0. 安装anaconda网址:https://repo.continuum.io/archive/Anaconda3-5.2.0-Windows-x86_64.exe
2020-08-08 16:47:25
1541
1
原创 逻辑回归中的coef
最近看逻辑回归一个线性可分案例的时候看到了如下的代码:coef1 = -theta_final[0, 0] / theta_final[2, 0] coef2 = -theta_final[1, 0] / theta_final[2, 0]然后想了一下,这个两个是决策边界的系数.可以理解为sigmoid函数是原本的一个函数的映射,所以原来函数会有一个决策边界。比如有两个特征X1, X2, 画出来的图如下:这个红线就是决策边界。公式推导:sigmoid:...
2020-07-19 21:34:29
13027
1
原创 【Python】matplotlib新手规范化画图
0. 介绍在matplotlib中,有两种画图方式:plt.figure(): 这是通过matplotlib提供的一个api,这个plt提供了很多基本的function可以让你很快的画出图来,但是如果你想要更细致的精调,就要使用另外一种方法。(虽然教程基本上都是用这种方法,但不适合新手)fig, ax = plt.subplots(): 这个是比较规范的画图方法。指定figure和axes,然后对axes单独操作。下面来介绍这种方法。1. fig,ax = plt.subplots()plt.
2020-07-17 18:37:36
455
原创 Python计算中@的作用
在Python中numpy模块@在矩阵计算中起到乘积的作用。如:from numpy import *a = array([1, 2, 3])b = array([7, 8, 9])b = b.Ta@bOut:50
2020-07-16 09:39:58
454
原创 sqlite3.OperationalError: near “,“: syntax error
检查前面建表语句逗号是否用了中文的气死我了 查了一个多小时的问题
2020-07-06 22:56:57
3557
1
原创 新手试手Python爬虫:豆瓣Top250代码涉及到的知识点以及思路详解(适合新手)
0. 准备工作:进入网址:https://movie.douban.com/top250进入页面之后按F12,出现页面:根据提示Ctrl + R 刷新, 右边页面更新:第一步,鼠标点击最左边开始的地方第二部,点击出现的top250画面更新:将右边拉倒最下面:最下面出现红框的部分等下会用到,复制下来。然后,点击下面的红色方框部分,网页的所有内容都在里面;点击红色箭头的小箭头,可以直接点到自己想要得地方。建议自己摸索下,很简单。后面的代码爬取内容都是从这里找的。1. 代码实现
2020-07-05 21:32:27
1059
2
转载 网络爬虫urllib:parse.urlencode()和request.Request()
https://www.jianshu.com/p/4c3e228940c8
2020-07-02 21:29:10
386
原创 TF-IDF算法原理与示例Python代码详解(Python,推荐算法)
0. 算法原理:1. 代码实现:# TF-IDF算法示例'''框架步骤:0.引入依赖 numpy pandas1.数据处理 分割数据 构建词库2.词数统计 统计文档中每个词出现的词数3.计算词频 TF= 词语在文档出现次数/文档总词数 出现次数/总词数4.计算逆文件频率 IDF = log(文档总数N+1)/(文档包含词语数量+1) 5.计算TF-IDF TF*IDF'''# 0. 引入依赖import numpy
2020-07-01 12:40:18
1694
1
原创 K均值(K-means)聚类算法原理与代码详解
0. 算法原理:上述过程简单描述:a: 初始数据b: 选择质点c: 根据质点划分d: 求均值,更新质心点e: 划分f: 更新质心点1. 代码实现:# K means 教程# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 从sklearn中直接生成聚类数据from sklearn.datasets.samples_generator import make_blobs# 1. 数据加载x, y =
2020-06-30 17:08:17
3229
原创 自动提取所需文本(以邮箱和电话号码为例)Python项目程序(代码详解)
0. 代码实现:# python 3# phoneAndEmail.py - Finds phone numbers and email addresses on the clipboard# pyperclip 模块有 copy()和 paste()函数, 可以向计算机的剪贴板发送文本, 或从它接收文本# re模块 正则表达式是对字符串进行操作,正则表达式是对字符串进行模糊匹配,提取自己需要的字符串部分import pyperclip, re# 0. 为电话号码创建一个正则表达式ph
2020-06-29 10:58:15
1167
原创 决策树Gini指数 心脏病例子(附Python代码实现)
0. 介绍Gini index: CART决策树使用“基尼指数”(Gini index)来选择划分属性。数据集D的纯度可用基尼值来度量:直观来看,Gini(D)反映了从数据集D中随机抽取两个样本,其类别标记不一致的概率(二分类)。因此,Gini(D)越小, 则数据集D的纯度越高。总结:Gini指数越大则表示数据越不纯,Gini越小表示数据相对越纯。属性a的基尼指数定义为:于是,我们在选择划分属性时,选择那个使划分后Gini系数最小的属性作为最优划分属性。1. 心脏病例子:收集数据:
2020-06-28 20:56:25
3867
2
原创 K近邻算法(KNN)原理推导与实例代码实现详解(Python)
原理与推导过程:代码实现(sklearn自带数据集, iris鸢尾花):# k近邻算法# 0. 引入依赖import numpy as npimport pandas as pd#这里直接引入sklearn里的数据集, iris鸢尾花from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_split # 切分数据集为训练集和测试集from sklearn.metr
2020-06-27 22:08:46
1048
原创 sklearn库求解线性回归最小二乘法实例代码(Python,附数据集下载)
代码实现:# 调库求解线性回归最小二乘法# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 1. 导入数据points = np.genfromtxt('D:\学习资料\推荐系统\代码\练习代码\自己手打\data.csv', delimiter = ',')points[0, 0]# 提取points中的两列数据, 分别作为x,yx = points[:, 0]y = points[:, 1]# 用plt
2020-06-27 10:19:00
1269
原创 梯度下降法推导过程与代码实现(Python,一元,附数据集下载)
推导过程:代码实现(以一元为例):# 简单线性回归(梯度下降法)# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 1. 导入数据(data.csv)points = np.genfromtxt('D:\学习资料\推荐系统\代码\练习代码\自己手打\data.csv', delimiter = ',')points[0, 0]# 提取points中的两列数据,分别作为x,yx = points[:, 0]
2020-06-26 19:00:07
637
原创 线性回归最小二乘法求解过程与代码实现(一元,附对应数据下载地址)
求解过程:代码实现:简单线性回归(最小二乘法)# 0. 引入依赖import numpy as npimport matplotlib.pyplot as plt# 1. 导入数据points = np.genfromtxt('D:\学习资料\推荐系统\代码\练习代码\自己手打\data.csv', delimiter = ',') points[0,0]# 提取points中的两列数据,分别作为x,yx = points[:, 0]y = points[:, 1]# 用p
2020-06-26 11:30:02
582
原创 strip() Python
介绍numpy.char.strip() 函数是Python中NumPy字符串函数用法numpy.char.strip() 函数用于移除开头或结尾处的特定字符。示例import numpy as np# 移除开头或结尾处的 a 字符print (np.char.strip('ashok arunooba','a'))# 移除数组元素头尾的 a 字符print (np.char.strip(['arunooba','admin','java'],'a'))运行结果:shok aru
2020-06-21 16:45:44
187
原创 split()函数 splitlines() 函数 Python
介绍:split(),splitlines()是Python中NumPy字符串函数用法:numpy.char.split() :通过指定分隔符对字符串进行分割,并返回数组。默认情况下,分隔符为空格。numpy.char.splitlines():以换行符作为分隔符来分割字符串,并返回数组。示例:numpy.char.split()代码:import numpy as np# 分隔符默认为空格print(np.char.split('I like running?'))# 分隔符为 .
2020-06-21 16:09:12
2392
原创 np.random.rand()与np.random.randn()
np.random.rand()作用:生成[0,1)区间内一个或一组数值,服从均匀分布使用方法:np.random.rand():生成一个[0,1)区间均匀分布的随机数,示例:np.random.rand()Out[7]: 0.7309286434720168np.random.rand(m, n):生成m*n阶矩阵,矩阵内数值为[0,1)区间均匀分布的随机数,示例:np.random.rand(10,1)Out[8]: array([[0.50699708], [
2020-06-20 11:05:10
2237
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人