- 博客(43)
- 资源 (2)
- 收藏
- 关注
原创 neo4j 快速搭建应用
一、安装neo4j1、从docker hub上面pull下最新的neo4j最新的镜像 docker pull neo4j如下所示:查看镜像docker images2、启动镜像docker run -d --name container_name \ //-d表示容器后台运行 --name指定容器名字-p 7474:7474 -p 7687:7687 \ //映射容器的端口号到宿主机的端口号-v /home/neo4j/data:/data \ //把容器内的数据目
2021-06-28 18:55:56
418
转载 Neo4j的搭建以及后期数据导入
构建容器docker环境下安装:这里说明下,默认将容器的/data,/var/lib/neo4j/import目录映射到宿主机。/data存储的是数据,/var/lib/neo4j/import存储的是你想要导入数据的docker run \ --publish=7474:7474 --publish=7687:7687 \ --volume=/data/neo4j/data:/data \ --volume=/data/neo4j/import:/var/li...
2021-06-22 16:10:19
441
转载 Kettle9.0下载地址
一.相关资源pdi-ce-9.0.0.0-423.zip官网下载地址https://udomain.dl.sourceforge.net/project/pentaho/Pentaho%209.0/client-tools/pdi-ce-9.0.0.0-423.zip百度网盘下载地址https://pan.baidu.com/s/1d1kQdg2FNCTvVVuYKUveLA提取码:ns70jdk1.8.0_211.zip网盘下载地址https://pan.baidu.com/s/1G
2021-04-10 10:06:46
2920
1
原创 23种设计模式 。简单易解。可乃上班装逼必备神器
23种设计模式01 工厂方法追 MM 少不了请吃饭了,麦当劳的鸡翅和肯德基的鸡翅都是 MM 爱吃的东西,虽然口味有所不同,但不管你带 MM 去麦当劳或肯德基,只管向服务员说「来四个鸡翅」就行了。麦当劳和肯德基就是生产鸡翅的 Factory 工厂模式:客户类和工厂类分开。消费者任何时候需...
2021-03-17 09:41:08
141
原创 面试-mysql-索引篇
面试官考点之索引是什么?面试官考点之索引类型面试官考点之为什么选择B+树作索引结构面试官考点之一次索引搜索过程面试官考点之覆盖索引面试官考点之索引失效场景面试官考点之最左前缀面试官考点之索引下推面试官考点之大表添加索引一、面试官考点之索引是什么?索引是一种能提高数据库查询效率的数据结构。它可以比作一本字典的目录,可以帮你快...
2021-02-05 17:53:00
117
转载 面试-mysql -索引篇
面试官考点之索引是什么? 面试官考点之索引类型 面试官考点之为什么选择B+树作索引结构 面试官考点之一次索引搜索过程 面试官考点之覆盖索引 面试官考点之索引失效场景 面试官考点之最左前缀 面试官考点之索引下推 面试官考点之大表添加索引 一、面试官考点之索引是什么? 索引是一种能提高数据库查询效率的数据结构。它可以比作一本字典的目录,可以帮你快速找到对应的记录。 索引一般存储在磁盘的文件中,它是占用物理..
2021-02-05 17:51:25
234
原创 滑动验证码
本文是使用极验滑动验证码的官网做的实验,没有账号的可以先注册一个账号 ,地址 :https://account.geetest.com/login安装环境 chromedriver 下载地址 可以根据自己chrome版本和系统自行下载 地址:http://chromedriver.storage.googleapis.com/index.html 查看chrome版本 和下载chromedriver页面: 将解压好的文件放入/usr/local/bin目录中,由于mac的很多目录都是隐藏.
2020-09-18 16:46:35
977
原创 滑块验证码识别
本文是使用极验滑动验证码的官网做的实验,没有账号的可以先注册一个账号 ,地址 :https://account.geetest.com/login安装环境chromedriver 下载地址 可以根据自己chrome版本和系统自行下载地址:http://chromedriver.storage.googleapis.com/index.html查看chrome版本 和下载chrome...
2020-09-18 16:40:00
716
原创 深度学习xmind思维导图,知道学习深度学习路线
思维导图下载地址:https://download.youkuaiyun.com/download/zhiwei_bian/127415691、神经网络训练流程前项传播 --> 获得输出 --> 获得损失 --> 后向传播 --> 更新参数2、基本元素 1)、激活函数 1、对于多分类的情况,最后一层softmax。 2、其它深度学习层中多用relu。 3、二分类可以用sigmoid。 ...
2020-08-24 11:26:09
1242
转载 KiwenLau 基于Docker搭建Hadoop集群之升级版
转载:https://kiwenlau.com/2016/06/12/160612-hadoop-cluster-docker-update/摘要:kiwenlau/hadoop-cluster-docker是去年参加Docker巨好玩比赛开发的,得了二等奖并赢了一块苹果手表,目前这个项目已经在GitHub上获得了236个Star,DockerHub的镜像下载次数2000+。总之,项目还算很受欢迎吧,这篇博客将介绍项目的升级版。作者:KiwenLau 日期:2016-06-12一. 项目介...
2020-08-12 16:43:23
789
原创 mysql中explain的各个type的含义
导语:很多情况下,有很多人用各种select语句查询到了他们想要的数据后,往往便以为工作圆满结束了。这些事情往往发生在一些学生亦或刚入职场但之前又没有很好数据库基础的小白身上,但所谓闻道有先后,只要我们小白好好学习,天天向上,还是很靠谱的。当一个sql查询语句被写出来之后,其实你的工作只完成了一小半,接下来更重要的工作是评估你自己写的sql的质量与效率。mysql为我们提供了很有用的...
2020-04-28 14:16:00
942
转载 Django 的认识
对Django的认识? #1.Django是走大而全的方向,它最出名的是其全自动化的管理后台:只需要使用起ORM,做简单的对象定义,它就能自动生成数据库结构、以及全功能的管理后台。#2.Django内置的ORM跟框架内的其他模块耦合程度高。#应用程序必须使用Django内置的ORM,否则就不能享受到框架内提供的种种基于其ORM的便利;#理论上可以切换掉其ORM模块,但这就相当于要把...
2019-12-19 17:19:45
275
原创 mac 安装 mysqlclient 踩过的坑
在https://pypi.org/project/mysqlclient/下载的压缩文件解压后进入mysqlclient中setup.py 所在的目录 然后执行下面语句python setup.py cleanpython setup.py buildpython setup.py install发现报错:根据报错信息找到这个报错的文件 mysqlclient...
2019-12-10 16:06:38
397
转载 Mac Ruby 安装 brew
Homebrew简称brew,OSX上的软件包管理工具,在Mac终端可以通过brew安装、更新、卸载软件。首先要安装brew,在 mac 中使用finder 搜索 终端(terminal)打开命令行,brew的安装方法:(由于MAC自带ruby,所以安装起来极其轻松)ruby-e"$(curl-fsSLhttps://raw.githubusercontent.com/H...
2019-12-09 16:49:11
530
原创 python 多种方法实现定时任务
1、while循环中使用sleep缺点:不容易控制,而且是个阻塞函数def timer(n): ''''' 每n秒执行一次 ''' while True: print(time.strftime('%Y-%m-%d %X',time.localtime())) yourTask() # 此...
2019-11-20 10:47:00
417
原创 linux 清屏小技巧
在windows的DOS操作界面里面,清屏的命令是cls,那么在linux 里面的清屏命令是什么呢?下面笔者分享几种在linux下用过的清屏方法。1、clear命令、这个命令将会刷新屏幕,本质上只是让终端显示页向后翻了一页,如果向上滚动屏幕还可以看到之前的操作信息。2、Ctrl+l(小写的L)、这是一个清屏的快捷键,这个是笔者在工作中用得最多的一种清屏方式,清屏效果同clear命...
2019-09-25 15:11:00
170
原创 python下多线程是鸡肋,推荐使用多进程 代码示例
最近在看Python的多线程,经常我们会听到老手说:“python下多线程是鸡肋,推荐使用多进程!”,但是为什么这么说呢?要知其然,更要知其所以然。所以有了下面的深入研究:首先强调背景:1、GIL是什么?GIL的全称是Global Interpreter Lock(全局解释器锁),来源是python设计之初的考虑,为了数据安全所做的决定。2、每个CPU在同一时间只能...
2019-08-15 17:58:00
126
原创 mysql中 replace into ... 和 insert into ... ON DUPLICATE KEY UPDATE ... 有则更新 无则添加...
一、insert into ... ON DUPLICATE KEY UPDATE ... 如果在INSERT语句末尾指定了ON DUPLICATE KEY UPDATE, 并且插入行后会导致在一个UNIQUE索引或PRIMARY KEY中出现重复值,则执行旧行UPDATE; 如果不会导致唯一值列重复的问题,则插入新行。 例如,如果列a被定义为U...
2019-08-06 10:35:00
157
原创 python pandas to_excel 高级玩法
DataFrame.to_excel(self, excel_writer, sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, startrow=0, startc...
2019-07-19 18:09:00
1445
原创 python 发送邮件 email
import osimport smtplibimport loggingfrom report_system.utils import excel_utilfrom report_system.utils import style_utilfrom email import encodersfrom email.header import Headerf...
2019-05-07 16:08:00
136
原创 python 日志 logging
import osimport loggingfrom logging.handlers import RotatingFileHandlerimport platformplatform_ = platform.system()is_win = is_linux = is_mac = Falseif platform_ == "Windows":...
2019-05-07 16:05:00
90
原创 python 判断当前环境是什么系统 platform 模块
import platform# 查看系统类型platform_ = platform.system()is_win = is_linux = is_mac = Falseif platform_ == "Windows": is_win = Trueelif platform_ == "Linux": is_linux = True...
2019-05-07 16:03:00
576
原创 pandas to_excel 添加颜色
import pandas as pdimport numpy as npcolumns = [['A', 'A', 'B', 'B', 'C'], ['a', 'b', 'c', 'd', 'e']]# 创建形状为(10,5) 的DataFrame 并设置二级标题demo_df = pd.DataFrame(np.arange(50).reshape(10, 5),...
2019-05-07 15:57:00
6096
1
原创 Pandas excel 双标题 多级索引 层次化索引 MultiIndex
1 import pandas as pd2 import numpy as np多级索引多级索引(也称层次化索引)是pandas的重要功能,可以在Series、DataFrame对象上拥有2个以及2个以上的索引。实质上,单级索引对应Index对象,多级索引对应MultiIndex对象。一、Series对象的多级索引多级索引Series对象的创建...
2019-02-25 15:39:00
5584
原创 windows10 安装 pyltp python3.6
系统:windows10python版本:python3.6安装pyltp比较复杂,有如下几点需要注意:1.由于pyltp安装时报错,需要Visual C++14.0的编译环境,因此首先电脑中需要先安装VC++14.0,对应的VS版本为VS2015。参考https://blog.youkuaiyun.com/guxiaonuan/article/details/73775519?loca...
2019-01-22 16:13:00
152
原创 Python的内存管理
Python的内存管理语言的内存管理是语言设计的一个重要方面。它是决定语言性能的重要因素。无论是C语言的手工管理,还是Java的垃圾回收,都成为语言最重要的特征。这里以Python语言为例子,说明一门动态类型的、面向对象的语言的内存管理方式。对象的内存使用赋值语句是语言最常见的功能了。但即使是最简单的赋值语句,也可以很有内涵。Python的赋值语句就很值得研究...
2018-12-26 15:41:00
108
原创 pandas 中 DataFramt 改变 列的顺序
col_name = df.columns.tolist()col_name.insert(1,'D')df.reindex(columns=col_name)Out[92]: A D B CNaNNoneNoneNaNNoneNone 或者不用数字索引,直接在某列前面或后面插入,利用 list.index的方法col_name = df.columns.tolist()col_name...
2018-12-18 11:20:00
191
原创 jieba 分词简单应用
关键词抽取就是从文本里面把跟这篇文档意义最相关的一些词抽取出来。这个可以追溯到文献检索初期,当时还不支持全文搜索的时候,关键词就可以作为搜索这篇论文的词语。因此,目前依然可以在论文中看到关键词这一项。除了这些,关键词还可以在文本聚类、分类、自动摘要等领域中有着重要的作用。比如在聚类时将关键词相似的几篇文档看成一个团簇,可以大大提高聚类算法的收敛速度;从某天所有的新闻中提取出这些新闻的...
2018-12-15 17:56:00
208
原创 python—命名规范
文件名全小写,可使用下划线包应该是简短的、小写的名字。如果下划线可以改善可读性可以加入。如mypackage。模块与包的规范同。如mymodule。类总是使用首字母大写单词串。如MyClass。内部类可以使用额外的前导下划线。函数&方法函数名应该为小写,可以用下划线风格单词以增加可读性。如:myfunction,my_example...
2018-12-13 10:27:00
113
原创 mysql json 操作
一、方法罗列:分类 函数 描述创建jsonjson_array 创建json数组json_object 创建json对象json_quote 将json转成json字符串类型查询jsonjson_contains 判断是否包含某个json值json_contains_path 判断某个路径下是否包json值json_extract 提取json值column->path...
2018-12-11 17:33:00
157
原创 mysql 表分区demo 按照日期 PARTITION
CREATE TABLE test.bookorder ( `id` bigint(20) unsigned NOT NULL, recdate date NOT NULL COMMENT '该记录入库时间' ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='订单表'PARTITION BY RANGE (to_days(recdate)...
2018-12-05 20:36:00
343
原创 Pandas DataFrame merge join concat append combin_first 使用demo
merge 合并pandas.merge可根据一个或多个键将不同DataFrame中的行合并起来# 在未指定连接键的情况下,merge会将重叠列的列名当做键pd.merge(left, right)# 指定“on”作为连接键,left和right两个DataFrame必须同时存在“on”列,连接键也可N对N(少用)pd.merge(left, ...
2018-12-05 12:10:00
121
原创 Pandas包对多个数据表(DataFrame)的常用整合功能。
目录mergejoinconcatappendcombin_firstmerge 合并pandas.merge可根据一个或多个键将不同DataFrame中的行合并起来# 在未指定连接键的情况下,merge会将重叠列的列名当做键pd.merge(left, right)# 指定“on”作为连接键,le...
2018-12-05 12:07:00
395
原创 pandas numpy 简单应用 loandata
准备工作首先是准备工作,导入需要使用的库,读取并创建数据表取名为loandata。importnumpy as npimportpandas as pdloandata=pd.DataFrame(pd.read_excel('loan_data.xlsx'))设置索引字段在开始提取数据前,先将member_id列设置为索引字段...
2018-12-05 10:28:00
470
原创 榛果 美团 登录 爬虫 requests session
所有美团方面旗下的登陆都采用重定向来解决登陆问题即利用session 对话来解决登陆问题当然也可以每次都模拟他的cookie来进行登陆我用的代理是阿布云代理 你们也可以选择别代理这次是爬取的美团旗下的榛果民宿 1 import requests 2 from urllib.parse import urlencode 3 import...
2018-08-22 14:14:00
1363
原创 python 日期循环
import datetimestart='2016-06-01'end='2017-01-01' datestart=datetime.datetime.strptime(start,'%Y-%m-%d')dateend=datetime.datetime.strptime(end,'%Y-%m-%d') while datestart<datee...
2018-08-22 09:20:00
346
原创 opencv 验证码 识别
示例图片 :主要应用原理为:11、先识别出图片中每个像素的数量 例如 红色在200左右2、将红色的像素单独提出来 这样起到去除噪点的作用3、分割图片并保存4、识别图片具体代码如下: 1 # coding=utf-8 2 # !/usr/bin/python 3 """ 4 opencv 验证码识别 5 C...
2018-07-31 17:26:00
533
原创 mysql 关于时间整理
/*上个月今天的当前时间*/select date_sub(now(),interval 1 month) ;/*上个月今天的当前时间(时间戳)*/select UNIX_TIMESTAMP(date_sub(now(),interval 1 month)) ;/*上个月的第一天*/select date_sub(date_sub(date_format(...
2018-07-19 15:24:00
191
深度学习笔记.xmind
2020-08-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人