- 博客(26)
- 资源 (1)
- 收藏
- 关注
原创 python多级目录复制制定类型文件,并保存到对应目录
情景如下:提取result文件夹下的除".txt"文件最终效果:# coding=UTF-8import osimport shutildef get_file(root_path,all_files=[]): ''' 递归函数,遍历该文档目录和子目录下的所有文件,获取其path ''' files = os.listdir(root_path) for file in files: if os.path.isdir
2020-07-30 11:11:39
848
原创 python 实现N级目录创建,且每级目录放置文件
python 实现N级目录创建,且每级目录放置文件# coding=UTF-8import osimport sysimport shutilimport Tkinter, tkFileDialog############每层只有一个文件夹def mkdirwenjian_one(nums_high,rootpath): print rootpath for i in range(nums_high): rootpath = rootpath + '/'
2020-07-27 17:32:00
480
原创 LeetCode算法刷题——python语法笔记
set() 函数创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交集、差集、并集等。给定一个整数数组,判断是否存在重复元素。如果任意一值在数组中出现至少两次,函数返回 true 。如果数组中每个元素都不相同,则返回 false 。class Solution(object): def containsDuplicate(self, nums): """ :type nums: List[int] :rtype: bool .
2020-06-15 15:21:17
533
原创 LeetCode算法刷题——数组篇
算法刷题——数组篇1. 双指针(快慢指针)1. 双指针(快慢指针)简单篇1 给定一个排序数组,你需要在 原地 删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度。不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用 O(1) 额外空间的条件下完成。 def removeDuplicates(self, nums): """ :type nums: List[int] :rtype: int """
2020-06-01 15:44:28
441
原创 ubuntu编译hadoop-2.6.5源码
1.编译流程参考博客https://blog.youkuaiyun.com/xingyyn78/article/details/810432632.问题解决参考博客 linux安装maven https://blog.youkuaiyun.com/xingyyn78/article/details/81043454 protobuf安装 https://blog...
2019-06-16 11:03:10
199
原创 《云计算》 刘鹏 第二版 第三版 PDF
《云计算》 刘鹏 第二版 PDF版主要为了学习有关cloudsim那一章节链接: https://pan.baidu.com/s/1r2lT24dnDNX_uuJfnGM-Tg提取码: hcik另附:《云计算》 刘鹏 第三版链接: https://pan.baidu.com/s/1Ra5S8jNH9hdpNej2h0Grxg提取码: deau...
2019-05-15 10:13:51
7492
12
原创 CloudSIM 配置到eclipse(另加linux下安装cloudSIM并运行)——linux环境下
1.cloudSIM配置到eclipse 一、Jdk,Eclipse的安装与配置。 本人下载的jdk版本是1.8,jdk的相关配置二、cloudsim的下载、安装与配置。 下载cloudsim CloudSim 下载地址 Google的下载地址:http://code.goog...
2019-04-22 17:13:33
729
原创 基于用户的协同过滤电影推荐
基于用户的协同电影推荐代码实现:# -*- coding: UTF-8 -*-'''基于用户的推荐算法'''from math import sqrt,powimport csvimport operatordef read_file(): #disfile = 'F:\download\数据集\电影\ml-latest-small\matings.csv' w...
2019-01-05 14:48:38
1891
1
转载 聚类算法
版权声明:转载自https://blog.youkuaiyun.com/qq_30262201/article/details/78799926 一、聚类的目标使同一类对象的相似度尽可能地大;不同类对象之间的相似度尽可能地小。二、聚类算法分类1.基于划分给定一个有N个元组或...
2018-12-06 17:13:18
743
转载 六大常见聚类方法
版权声明:转载自https://blog.youkuaiyun.com/Katherine_hsr/article/details/79382249 1. K-Means(K均值)聚类算法步骤: (1) 首先我们选择一些类/组,并随机初始化它们各自的中心点。中心点是与每个数据点向量...
2018-12-06 17:03:54
60895
1
转载 K-means聚类算法的三种改进(K-means++,ISODATA,Kernel K-means)介绍与对比
转自:https://www.cnblogs.com/yixuan-xu/p/6272208.html 一、概述 在本篇文章中将对四种聚类算法(K-means,K-means++,ISODATA和Kernel K-means)进行详细介绍,并利用数据集来真实地反映这四种算法之间的区别。 &n...
2018-12-06 16:30:38
796
转载 时间序列相关算法与分析步骤
转载出处:土豆洋芋山药蛋 https://blog.youkuaiyun.com/qq_33414271/article/details/79588126 首先,从时间的角度可以把一个序列基本分为3类:1.纯随机序列(白噪声序列),这时候可以停止分析,因为就像预测下一次硬币哪...
2018-12-02 10:49:57
845
原创 大数据之路——阿里巴巴大数据实践(小白笔记)
第一章 总述1.阿里巴巴大数据系统体系架构分为三大部分数据采集层、数据计算层、数据服务层2.数据采集层 日志采集系统:Aplus.JS是 web端日志采集技术方案;UserTrack是APP端日志采集方案 数据传输:TimeTunnel(TT)体系进行数据传输,既包括数据库的增量数据传输,也包括日志数据的传输,既支持实时流式计算,也支持时间窗口的批量计算 ...
2018-11-12 17:15:23
804
原创 Hadoop学习之HDFS——小白入门笔记
一、分布式文件系统 1.分布式文件系统解决问题:海量数据的高效存储2.分布式文件系统是将文件分布存储到多个计算机节点上。(此处的计算机为普通计算机)3.分布式文件系统的多个节点分为两类: 名称节点(主节点):文件、目录的操作(创建、删除、重命名等),数据节点与文件块的映射关系 数据节点(从节点):数据的读取与存储 二、HDFS概念 1.名称节点:管理分...
2018-10-22 16:04:04
573
转载 hive 本地、hdfs数据导入
1.1导入内部表(1)本地或者hdfs导入: LOAD DATA[LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLEtablename [PARTITION(partcol1=val1, partcol2=val2 ...)] 区别是看有无关键字local,有local表示从本地路径导入,无local表示从hadoop(...
2018-10-14 08:42:06
885
原创 安卓 Plugin with id 'com.android.application' not found
新导入项目报错:Plugin with id 'com.android.application' not foundbuildscript { repositories { jcenter() } dependencies { classpath 'com.android.tools.build:gradle:2.3.3' //这里gr...
2018-10-14 08:38:10
812
原创 python 面向对象笔记
Python 面向对象小结,最近在学习Python,在学习到面向对象时有些记不住,特写此笔记:1.定义类 class People: num = 0 def SayHello(self): print("Hello");2.定义对象 P = People() p.SayHello()3.构造函数__init__(...
2018-09-19 21:38:43
269
原创 java 获取字符串内双引号中内容
最近做项目需要提取字符串内双引号中的内容,因为对java不太了解,写了很久,最后还是问了龙哥,特此记忆。针对:str = this is"Tom" and "Eric";结果:res =[Tom,Eric ]; public class getStr{ public static void main(String[] args) { String st...
2018-09-17 20:06:18
12460
1
转载 python 获取天气接口数据
从微信公众号中看到的代码,以此记录用Python获取中国天气网天气接口数据import urllib.requestimport jsoncode='101160101'url='http://www.weather.com.cn/data/cityinfo/%s.html'% codeprint('url=',url)obj=urllib.request.urlopen(ur...
2018-09-06 10:40:07
1678
原创 PHP获取未来三天天气接口
天气接口免费:http://wthrcdn.etouch.cn/weather_mini?city=城市名字"数据格式:天气接口数据接收为以下样式中的代码/////////////////////////// *//////////////////////////其他代码为根据需求所写的1.根据需求提取出日期与可预测天气求交集2.若是有交集部分则进行格式化提...
2018-08-31 15:25:41
1654
1
转载 Hadoop安装及遇到问题解决——ubuntu : appstreamcli 问题
sudo apt-get update 时候出现错误转自:https://www.cnblogs.com/EasonJim/p/7343892.html报错如下:Reading package lists... DoneE: Problem executing scripts APT::Update::Post-Invoke-Success'if /usr/bin/test -...
2018-08-22 15:04:42
937
转载 Hadoop安装及遇到问题解决——2.Linux 报错:Network error: Connection refused
1、查看SSH服务有没有安装 #rpm -qa | grep ssh 2、查看SSH服务有没有开启 #/etc/init.d/sshd status 安装SSH服务sudo apt-get install openssh-server开启服务ssh localhost此时会有提示(SSH首...
2018-08-22 14:49:36
2302
转载 Hadoop安装及遇到问题解决——1.安装
本人的安装时完全参考林子雨老师的教程,转载自厦门大学数据库实验室 / 给力星一、软件选择Hadoop是基于Java语言开发的,具有很好跨平台的特性。Hadoop的所要求系统环境适用于Windows,Linux,Mac系统,我们推荐选择使用Linux或Mac系统。Mac系统存在于苹果电脑上,由于Mac系统对硬件有定制化要求,没法在Windows上使用虚拟机和双系统来使用Mac系统,我们下面也...
2018-08-22 14:39:51
5632
1
原创 hadoop生态圈(HBase、HDFS、 Pig、Hive、Sqoop)——小白入门笔记
Hadoop生态圈上图为学习视频中一张Hadoop生态圈截图HDFS:分布式文件系统,底层数据存储Hbase:分布式列式数据库,适用实时数据分析,属于NoSql数据库Hive:数据库仓库工具,适用于离线数据分析,可以用于计算趋势或网站日志Pig:数据流语言,用于简化Hadoop任务,对MapReduce进行更高层次的封装,执行效率快,适用于实时分析Sqoop:用于传统数据...
2018-08-22 11:37:30
1777
2
转载 php下载(文档,压缩包)
1.文档类型 <?php function downfile($fileurl){$filename=$fileurl;$file = fopen($filename, "rb"); Header( "Content-type: application/octet-stream "); Header( "Accept-Ranges: bytes "); Header( "C
2016-09-20 16:42:40
260
apache-tomcat-6.0.41.tar.gz.txt
2019-06-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人