杂谈
学习中的技术认知。
Hello! The world。
为这个世界做点什么吧!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
虚拟机中的ubuntu16.04如何连接网络?
刚装完ubuntu,接下来就是解决联网问题,然后在解决的过程中误入歧途,把vim和vi给卸载了,后来联网的时候需要使用vi或者vim编辑器打开/etc/network/interfaces文件编辑,此时就傻眼了,因为使用apt-get install vim 时发现没网啊,装个毛线。解决方法:重装虚拟机吧hhh。言归正传,在有vim或者vi的条件下如何给虚拟机联网:一、在VMware的左侧那个栏中自己当前的虚拟机上右击,你会惊奇的发现展开的列表中有一个叫设置的东西,那么打开它吧。图1:图2:二原创 2021-05-08 21:17:00 · 7842 阅读 · 6 评论 -
Linux中如何安装和运行应用程序(以tar.gz为例)
一、linux中应用程序的安装方法这里我们以安装并运行pycharm为例:首先给出linux版本的pycharm下载地址:https://www.jetbrains.com/pycharm/download/#section=linux下载完之后使用:cd Downloads/ 会看到我们下载的pycharm安装包;这里我们在home目录下新建一个software目录用来解压和安装pycharm,具体操作如下:mkdir …/software 注意:我们目前在Downloads目录中;mv原创 2021-01-11 12:13:22 · 7694 阅读 · 0 评论 -
pandas处理文本特征之特殊字符剔除
假设我们有DataFrame数据data,feature_1列为文本数据列,且其中含有特殊字符。首先我们认识两个正则表达式:\w: 用来匹配字母、数字、下划线字符;\W: 用来匹配所有与\w不匹配的字符。可以发现,我们所说的特殊字符就在\W的范围内。import redef clear_characters(text): return re.sub('\W', '', text)data[feature_1] = data[feature_1].apply(clear_characters)原创 2021-01-07 21:10:34 · 9164 阅读 · 1 评论 -
pandas重复值处理之一
假设我们有DataFrame数据data。首先做重复值的统计:按行统计重复值:data.duplicated().sum()按某一列统计重复值(假设我们有特征feature_1):data[feature_1].duplicated().sum()如果少量重复值,就可以查看:display(data[data.duplicated()])删除重复值:data.drop_dupliactes(inplace=True)再次查看,重复值没了:data.duplicated.sum()原创 2021-01-07 20:34:12 · 532 阅读 · 0 评论 -
pandas缺失值填补之一
假设我们有DataFrame数据data。首先查看缺失值:data.isnull().sum()isnull()是按照列统计的,获得的是bool值缺失值的地方是True,再使用sum()进行求和。就可以统计出每一列的缺失值个数。接下来,假设有两个特征feature_1 和 feature_2。feature_1有缺失值,而feature_2没有缺失值。我们把feature_1缺失的值使用同一行的feature_2的值填充。index = data[data[feature_1].isnull()]原创 2021-01-07 20:23:51 · 314 阅读 · 0 评论
分享