- 博客(29)
- 资源 (3)
- 收藏
- 关注
原创 pandas——常见的几种对日期处理的方式(日期转换,时间差,转化为周)
1.将日期列转换为日期时间类型2. 将日期设置为索引3. 判断是否有重复的日期,有为True否则False4. 求时间差解释:先对日期格式进行转换在利用max,min分别求出最大日期与最小日期,进行相减求出差,加一为上映了几天 。5.更改时间格式6.将日期转化为周次days=pd.to_datetime(pd.Series(df.index),format=”%Y%m%d”...
2019-04-30 09:08:29
18685
2
原创 java异常机制
异常机制什么是异常异常(Exception)指程序运行中出现的不期而至的各种状况,如:文件找不到、网络连接失败、非法参数等。异常发生在程序运行期间,它影响了正常的程序执行流程。简单分类三种类型的异常:检查性异常:最具代表的检查性异常是用户错误或问题引起的异常,这是程序员无法预见的。例如要打开一个不存在文件时,一个异常就发生了,这些异常在编译时不能被简单地忽略。运行时异常:运行时异常是可能被程序员避免的异常。与检查性异常相反,运行时异常可以在编译时被忽略。错误ERROR:错
2021-10-06 15:25:21
245
原创 Java面向对象学习
面向对象学习面向过程与面向对象面向过程思想步骤清晰简单,第一步做什么,第二步做什么.……面对过程适合处理一些较为简单的问题面向对象思想物以类聚,分类的思维模式,思考问题首先会解决问题需要哪些分类,然后对这些分类进行单独思考。最后,才对某个分类下的细节进行面向过程的思索。面向对象适合处理复杂的问题,适合处理需要多人协作的问题。对于描述复杂的事物,为了从宏观上把握、从整体上合理分析,我们需要使用面向对象的思路来分析整个系统。但是,具体到微观操作,仍然需要面向过程的思路去处理。什
2021-10-06 12:23:27
220
原创 Java数组
Java数组数组概述数组是相同类型数据的有序集合。数组描述的是相同类型的若干个数据,按照一定的先后次序排列组合而成。其中,每一个数据称作一个数组元素,每个数组元素可以通过一个下标来访问它们。数组声明创建声明数组变量语法:dataType[] arrayRefVar; //首选方法dataType arrayRefVar[]; //效果相同java语言使用new操作符来创建数组:dataType[] arrayRefVar = new dataType[arraySize];
2021-10-05 13:15:50
213
原创 Java方法学习
Java方法什么是方法System.out.println(),是什么:System是类;out是对象;println()是方法Java方法是语句的集合,他们在一起执行一个功能。方法是解决一类问题的步骤的有序组合方法包含于类或对象中方法在程序中被创建,在其他地方被引用设计方法的原则:方法的本意是功能块,就是实现某个功能的语句块的集合。我们设计方法的时候,最好保持方法的原子性,就是一个方法只完成1个功能,利于后期的扩展。public static void main(Strin
2021-10-04 10:29:58
121
原创 Java基础语法第二部分
Java基础语法第二部分Scanner对象Scanner类来获取用户的输入,import java.util.Scanner基本语法Scanner s = new Scanner(System.in);通过Scannery类的next()于nextLine()方法获取输入的字符串,再读取之前一般需要,使用hasNext()于hasNextLine()判断是否还有输入的数据next()一定要读取到有效字符后才可以结束输入。对输入有效字符之前遇到的空白,next()方法会自动
2021-10-03 20:13:19
108
原创 java基础语法学习
java基础语法注释项目结构复杂时,需要进行相关注释,注释不会执行,是给自己和别人看的。写注释是一个非常好的习惯注释分为:单行注释(//),多行注释(/* 中间输入要注释的内容 /),文档注释(avaDoc:文档注释 /* */ 中间可以加参数)修改注释的颜色:file->Settings->Editor->Color Scheme->java->line comment(也可修改其他) 右侧进行修改可以修改颜色字体背景等标识符关键字abstra
2021-10-02 18:53:05
213
原创 DOS常用命令
DOS常用命令打开cmd窗口打开CMD的方式开始+系统+命令提示符win键+R 输入cmd打开控制台在任意的文件夹下面,按住shift+鼠标右键点击,在此处打开命令行窗口资源管理器的地址栏前面加上cmd路径管理员方式运行:选择以管理员方式运行DOS命令#盘符切换 输入要切换的盘符如:E:#查看当前目录下的所有文件 dir#切换目录 cd change directorycd .. #返回上一级#清理屏幕 cls (clear screen)#退出终端 exit#查看电脑ip
2021-10-01 12:03:30
106
原创 Markdown语法学习
Markdown语法学习标题一级标题一个#,二级标题##,以此类推到六级标题字体**引起来的字体表示黑体*引起来的字体表示斜体***引起来的字体表示黑体+斜体!引起来的字体表示删除引用‘>’表示引用,引用了谁的文章分割线分割线可以使用***或者----图片插入图片格式[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mpynUHEm-1633057548029)()]里是路径。超链接 ,[]中是超链接对应的文字,()中
2021-10-01 11:06:32
117
原创 Ubuntu中安装hadoop完整版
1. Ubuntu中vmwa tool没有安装好,没办法进行文件复制。可以安装xftp来进行文件传输。(1) 更新apt: sudo apt-get update。(2) 安装ssh: sudo apt-get install openssh-server。(3) 输入ssh localhost登陆本机,需要输入账户密码。(4) 在windows上安装xftp(5) 利用ifconfig查看自己的IP,输入自己的主机名,用户名,密码点击登陆。成功后就可以传输文件。**2. Ubuntu中Ha
2020-10-12 18:03:48
3740
原创 NameError
if name== ‘main’: main()NameError: name ‘name’ is not defined报错原因:因为_'if _name__== '_main_':这里的下划线是一个改正方法:if __name__== '__main__':把下划线改成两个就可以了
2020-06-26 18:46:47
5245
原创 雷达图pandas——画雷达图详解
数据读取后的样式result = pd.read_csv(‘books.csv’, sep=’,’)数据处理result=result.set_index(‘Unnamed: 0’)3.分别取出特征值:L,R,F,M,C,成员变量:a0,a1,a2,a3,a4,和值labels=result.columns.values #特征值kinds = list(result.index...
2019-06-18 15:57:28
6944
1
原创 pandas 数据分析部分
pandas数据分析部分共8题import pandas as pddf =pd.read_csv("qiancheng.csv")print(df.shape)df = df[~df['work_name'].str.contains('-')]#~取反df = df[~df['work_name'].str.contains('/')]df = df[~df['work_name'...
2019-06-04 20:44:54
1760
原创 机器学习简单描述
机器学习主要用历史数据(含有结果,或者说标签)训练出模型,以便让这个模型对新的数据(不含结果)能够进行预测(要结果)。训练的时候:一般思路都是让误差尽可能地小,但是误差越小的模型,对新的数据进行预测时可能结果并不满意。就是说这个模型对历史数据是适合的,但是对其他新的没见过的数据,它的预测结果不一定好,就是说这个模型的泛化能力下降所以,对训练出来的模型,我们还需要进行评估,看看训练出来的模型的...
2019-05-21 13:54:59
404
原创 spark——scala水仙花数
初学spark的scala整理了一下import scala.collection.mutable._ //导入包object BubbleSort { def main(args: Array[String]) { for(a<-1000 until 10000){ var q=a/1000 var b=a%1000/100 var s...
2019-05-20 19:27:08
4279
原创 python——pandas 阶段小测二
1.从给定的文件 income_new.xlsx 文件中读入数据,并查看前 10 行数据。import pandas as pdimport numpy as npdf= pd.read_excel('income.xlsx',sep=',')print(df.head(10))2.查看数据类型,查看样本总数和特征个数。print(type(df))print(df.shape)...
2019-05-16 13:43:15
379
1
原创 python spark pyspark——朴素贝叶斯习题整理
贝叶斯分类:在做算法时数据不能为负我就将原来数据中的负号去掉导致结果预测失败优点:在数据较少的情况下仍然有效,可以处理多类别问题。缺点:对于输入数据的准备方式较为敏感。 适用数据类型:标称型数据。#1.导包from pyspark.ml.classification import NaiveBayesfrom pyspark.ml.evaluation import Multiclas...
2019-05-06 15:43:16
1323
1
原创 pandas——DataFrame小测
题目在代码中注释数据在这里插入代码片import pandas as pddf= pd.read_csv(r'film_log3.csv',delimiter=';',names=['电影','起始日期','截止日期','公司','导演','主演','类型','票房','地点'])#1.统计信息print(df.shape)#2.获取'电影','起始日期','截止日期'三列df1=...
2019-05-06 10:24:50
268
原创 python spark pyspark——逻辑回归预测习题整理
上一次发的那个回归是线性回归,这次给大家发一下逻辑回归原数据from pyspark.mllib.linalg import Vectors,Vectorfrom pyspark import SparkContextfrom pyspark.ml.regression import LinearRegressionfrom pyspark.ml.feature import Vec...
2019-05-06 09:28:06
1777
原创 python spark pyspark——回归预测习题整理
特征量选区:age,enducation,race,sex。目标值:income。from pyspark.mllib.linalg import Vectors,Vectorfrom pyspark import SparkContextfrom pyspark.ml.regression import LinearRegressionfrom pyspark.ml.feature i...
2019-04-30 15:29:39
1946
3
原创 大数据平台搭建之——storm安装流程
一、 安装storm(1) 解压stormtar -zxvf apache-storm……mv apache-storm…… storm //改短名(2) 配置环境变量export STORM_HOME=/usr/local/stormexport PATH=PATH:PATH:PATH:storm_HOME/bin(3) 使环境变量生效source /etc/profile(4...
2019-04-29 16:02:11
545
原创 put: Cannot create file/test.txt._COPYING_. Name node is in safe mode.
put: Cannot create file/test.txt.COPYING. Name node is in safe mode.一、可能是因为没有离开安全模式利用:hadoop dfsadmin -safemode leave命令离开安全模式如果没有配置hadoop的环境变量需要进入hadoop目录下的bin目录执行上面哪个命令二、是因为你的磁盘已经爆满导致你离开安全模式后依然报...
2019-04-28 11:06:43
7823
原创 pandas——Series小测
一、自己创建一个工资的Series,岗位名称为索引,工资为值,并统计自己建的Series中元素的个数import pandas as pd#字典创建dic={"爬虫工程师":8000,"数据分析师":8000,"java软件工程师":10000,"web前端开发工程师":3000,"大数据工程师":8000,"python软件工程师":4000}job=pd.Series(dic)#列表...
2019-04-27 08:31:24
622
2
原创 Hadoop伪分布式环境搭建
一、创建hadoop用户右键桌面 进入终端首先输入 su回车 输入root密码 #以root用户登录输入 useradd -m hadoop -s /bin/bash #创建新用户hadoop输入 passwd hadoop #为hadoop用户设置密码二、为hadoop用户增加管理员权限输入 visudo 并执行在打开的文件中找到root ALL=(ALL) ALL并在改行下...
2019-04-26 10:19:28
198
原创 pyspark单词统计(python编写)文件在hdfs上
在写代码之前先了解一下代码中一些方法的作用:**sparkContext:**在Spark应用程序的执行过程中起着主导作用,它负责与程序和spark集群进行交互,包括申请集群资源、创建RDD、accumulators及广播变量等。**sc.textFiles(path):**能将path 里的所有文件内容读出,以文件中的每一行作为一条记录的方式,文件的每一行 相当于 List中以 “,”号 隔...
2019-04-24 09:01:37
902
原创 Spark py4j.protocol.Py4JError:与py4j.Py4JException: Method isBarrier([]) does not exist错误
近期在写spark单词统计时一直报下面的错误py4j.protocol.Py4JError: An error occurred while calling o21.isBarrier. Trace:py4j.Py4JException: Method isBarrier([]) does not exist at py4j.reflection.ReflectionEngine.getMe...
2019-04-24 08:49:32
3166
1
原创 python——pandas(切片)
pandas数据提取一、比较loc,iloc,ix与去重1.loc——标签索引,行和列的名称;.loc主要是基于标签(label)的,包括行标签(index)和列标签(columns),即行名称和列名称,可以使用df.loc[index_name,col_name]选择指定位置的数据。#dataframe在加判断条件时可以不通过.loc直接去写效果一样2.iloc——通过行号索引...
2019-04-15 13:56:56
9226
7
原创 Python——Pandas入门学习(读取)
Pandas——Dataframe读取一、文件读取pands可以读取各种文件类型的文件如: CSV,txt,Excel,SQL,JSON等。 pd.read_csv(filename):从CSV文件导入数据 pd.read_table(filename):从限定分隔符的文本文件导入数据 pd.read_excel(filename):从Excel文件导入数据 pd.rea...
2019-04-15 11:29:06
495
原创 python——Pandas入门学习一(介绍与Series)
pandas介绍与Series#什么是pandas我们问什么要选用他我在初学pandas时只知道这是一个做数据处理比较好的一个库,就没有在继续了解概念,当你学到后期你的朋友问你这是一个啥的时候,很难回答感觉很尴尬,所以在这里给大家一个小建议在学任何工具时我都要或多或少的进行一下了解,而不能是为了任务而去学习。1.首先什么是pandas?pandas是基于Numpy的一种工具,主要用来解决数...
2019-04-15 10:46:50
283
医院就诊管理系统SpringBoot后端代码+sql
2022-05-15
医院就诊管理系统Vue+SpringBoot开发完整代码含数据库
2022-05-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅