- 博客(32)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注

原创 scala语言http的post和get请求
引子最近公司需要请求数据接口去获取数据,用到了get请求和post请求,总结一下get请求:get请求参数是携带在url里面的,在?后面携带参数,每个参数之间用&隔开,举例:www.baidu?name=lisan&age=18如果参数里面有中文要把中文转成unicode编码,代码很简单:val client = new HttpClient//...
2018-07-09 11:33:48
20650
8
原创 AttributeError: module ‘pyparsing‘ has no attribute ‘downcaseTokens‘
AttributeError: module 'pyparsing' has no attribute 'downcaseTokens'
2022-06-10 14:36:03
943
原创 mysql面试题
Python面试题-mysqlmysql执行顺序from表on过滤添加外部表where过滤group byhaving 过滤select字段distinct子句order by 排序sql执行过程一:把sql交给数据库服务器二:服务器解析sql 1:检查是否有执行计划,有则调用执行计划 2:检查返回数据是否已经存在数据缓存储存区中,有则从缓存中取数据 3:进行语法校验 4:进行语义检验,例如表名是否存在 5:获得对象的解析锁,为了保证数据的一致性,在读
2021-03-29 10:30:08
193
1
原创 linux下python3创建虚拟环境venv
linux下python3创建虚拟环境venv用最简单的方式安装python3,并创建虚拟环境,创建虚拟环境的原因是防止不同版本冲突安装python3yum install python3-pip安装虚拟环境venv1.在要安装虚拟环境的地方创建文件夹,以/home为例mkdir /home/venv2.创建虚拟环境python3 -m venv .3.激活虚拟环境,进入/home/venv目录,注意:命令最前方有个 .. bin/activate...
2020-07-31 14:13:47
3761
原创 More than 4094 XFs (styles)
python报错:More than 4094 XFs (styles)1.在用python xlwt写入excel的时候的时候,遇到了这个错误。2.意思是xlwt最多只能有4094个样式,超出这个样式数量就报错了。解决方法:1.把样式放在for循坏之外。file_style = xlwt.XFStyle()for i in 10000: table.write(self.ta...
2019-11-28 18:43:10
1223
转载 使用 Flask-Docs 自动生成 Api 文档 转载
使用 Flask-Docs 自动生成 Api 文档记录一下flask-docs,转载自:添加链接描述
2019-10-31 18:37:05
1518
原创 scala程序打包放在服务器上,用java -cp命令运行
scala是用java封装得,所以可以打包放在服务器上用java命令运行。打包1.点击Maven Projects2.点击clean3.点击package这样就成功啦上传到服务器运行java -cp 包地址 程序路径 参数java -cp Mark-1.0-SNAPSHOT.jar pan.dataPlatform.Update 北京...
2019-07-01 16:09:47
1167
原创 spark读取、保存.csv文件
用spark实现读取csv文件val conf = new SparkConf() .setAppName("用户标签") .setMaster("local[*]") val sc = new SparkContext(conf) val sqlContext = new SQLContext(sc) val arr = ArrayBuff...
2019-07-01 15:57:55
25484
1
原创 Scala 通过JDBC操作数据库,增删改查
1.改,update//连接信息 val onlineUrl = "jdbc:mysql://" val username = "root" val password = "1234" def getOnlineConnection(): sql.Connection = { DriverManager.getConnection(onlineUrl...
2019-07-01 15:47:11
1736
原创 使用python flask实现写接口供别人调动,并把flask项目部署在Linux服务器上
需求:需要写接口查数据库数据,并返回给前端。思路:这个需求要求是用最快的方式出一个demo,所以选择用python flack编写,它比较轻量级。代码实现,用几个例子说明一下用法1.直接返回字符串,并用json返回#coding:utf-8from flask import Flask, requestimport pymysqlimport jsonapp = Flas...
2019-06-19 11:30:14
6741
原创 python使用OpenCV-Python结合百度图像识别api实现图片中的文字识别
上篇文章写了利用百度api实现图像识别提取图片上的文字,但是发现不是那么准确,所以现在结合OpenCV-Python找出图片上的文字,再把需要的文字切分出来,再调用接口识别,这样就会精确很多,附上参考的资料,多不多说,开干。1.读取文件,并专成灰度图imagePath = "20190610181452.png"img = cv2.imread(imagePath)gray = cv2.c...
2019-06-12 17:32:06
9504
3
原创 python调用百度api,图像识别(百度通用文字识别)
现在百度AI可以调用图像识别,有一些免费的可以玩一下。地址1.需要的库import base64import urllibfrom typing import BinaryIOfrom urllib.parse import urlencodefrom urllib import requestimport requestsfrom urllib.request import ur...
2019-06-12 14:11:58
10988
原创 flink简介
flink优点现在主流的实时处理引擎有storm,sparkstreaming,flink。storm实现了低延迟,但是没有实现高吞吐,也没有能够在出现故障是准确处理计算状态(将数据从一个事件保存到另一个事件)。spark streaming通过微批处理实现了高吞吐,高可用,但是不能做到低延迟,也不能使用窗口(把无限个stream拆分成有限个buckets,就可以在这些buckets上面做计...
2019-02-11 14:56:01
281
原创 无法连接到WMI提供程序,您没有权限或者该服务器无法访问。
无法连接到WMI提供程序,您没有权限或者该服务器无法访问-解决问题描述准备给数据库配置自动备份的时候,安装sql server之后,打开sql server 2017 配置管理器的时候报错!解决历程打开sqlserver报错如下解决方法:1.找到sqlmgmproviderxpsp2up.mof这个文件所在的路径,一般会在“ C:\Program Files\Microso...
2019-01-17 11:54:42
6423
6
原创 mysql通过字符串计算hashcode更新到原表和多表关联优化
mysql通过字符串计算hashcode更新到原表和多表关联优化一. 需求描述现有表a,要求通过每条数据中的三个字段计算hashcode值更新到原表做为shopid.二. 第一种做法最好的方式是通过spark sql计算出来更新,但是spark sql不能update,要想update要设计到改源码。所以就退而求其次选择用JDBC更新,缺点是慢。把主要代码贴一下:result.for...
2018-12-04 16:57:42
5400
原创 mysql case when函数
需求现有美食的标签30个,要按照指定的规则重新打标签。举例如下 汉堡薯条 二级 异国料理-西式快餐 汉堡面包 二级 异国料理-西式快餐 法意牛排 二级 异国料理-西式快餐 炸鸡汉堡 二级 异国料理-西式快餐 炸鸡炸串 二级 异国料理-西式快餐 轻食西餐 二级 异国料理-西式快餐 日料...
2018-09-03 10:57:37
747
原创 把hbase表导出保存到linux服务器,进而保存到windows上
1.把表导出到hdfs上hbase org.apache.hadoop.hbase.mapreduce.Export 表名 数据文件位置 版本 开始时间 结束时间//eg:hbase org.apache.hadoop.hbase.mapreduce.Export test_table /opt/hbase-data-back/test_tabletest_table :表名 /op...
2018-08-22 11:33:38
570
原创 scala报 Exception in thread "main" java.sql.SQLException: No suitable driver
问题描述在程序中用到了从数据库中读数据,在本地测试的时候没有问题。但是提交到spark上运行就会报错: Exception in thread “main” java.sql.SQLException: No suitable driver 就是spark-submit找不到jdbc的驱动解决方法解决方法也很简单,那就是告诉它,让它找到就行了。 在代码中,jdbc配置的地方加上下...
2018-08-03 14:30:41
5243
1
原创 用scala语言,用HttpClient读取数据,存入阿里云服务器上的HBase中
废话少说,直接上代码。 val now: Date = new Date() val gt = now.getTime var time = gt + "" val client: HttpClient = new HttpClient val method: GetMethod = new GetMethod(url) client.exec...
2018-08-02 11:53:51
636
原创 entry.getValue报错:Error:(24, 29) value foreach is not a member of java.util.Set[String]
for (entry <- dataJson.entrySet) { val dataValue = entry.getValue.toString }在scala编程的时候,遍历entrySet报错。解决方法: 因为reducedList是java.util.HashMap, 没有foreach方法, 所以需要将其转换为Scala的集合类型, 因此需要...
2018-08-02 11:48:07
2197
原创 用Scala api访问阿里云服务器hbase问题
api连接阿里云服务器的hbase报错: Exception in thread “main” org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /test at org.apache.zookeeper.KeeperException.creat...
2018-07-25 14:43:45
402
1
原创 mysql从一个表中查询插入另一个表,两个表关联再更新其中一个表
直接上代码mysql从一个表中查询插入另一个表INSERT INTO t_centre_copy ( doc_id, client_name, month_sale_num, address, area_id, call_center, centre_name, distance, cate_name) (...
2018-07-23 21:52:30
2817
原创 Windows用PuTTY远程登录E-MapReduce集群及PuTTY Key生成慢的问题
引子公司买的阿里云的EMR,使用了一个月一直是用它自带的页面运行程序。现在要用更复杂的服务,所以就满足不了需求了,所以现在用远程登录集群来操作。过程下载安装 PuTTY,Puttygen 打开puutygen, 点击generate 生成一个.ppk文件的秘钥文件,点击save private key保存 打开putty,在session中输入你创建的集群的公网IP,注意...
2018-07-20 10:11:07
873
3
原创 mysql 删除表里重复的数据,只留下一条记录
解决思路1.首先判断哪些是重复记录。 2.拿出重复记录中的一条。 3.删除这条记录。思路实现过程及遇到问题1.首先判断哪些是重复记录。SELECT itemID,Id FROM people GROUP BY itemID HAVING ...
2018-07-19 11:18:58
1985
原创 数据库死锁问题,Navicat修改表的时候,数据库中的一张表打不开也关不上
问题描述在修改一张数据库的表的时候,加了一个字段。然后鼠标指针就一直在转圈,Navicat就未响应。解决方法一般表打不开有三种原因: 原因一: 表死锁,会出现这样的情况,锁不释放,无论多久都读取不了数据,一直加载中!原因二: 表里面的数据量太大造成的。 原因三: 网络慢,卡,数据不能传输下面介绍一下死锁:一、 什么是死锁死锁是指两个或两个以上的进程在执行...
2018-07-16 18:31:11
8485
1
原创 判断一个表的一列是否在另一张表的一列存在
引子现有个需求,查询出表A中的a列中的每一条数据是否在B表中的B列存在。解决方案select *from Awhere exists(select 1 from B where A.a = B.b)
2018-07-16 18:17:34
3134
1
原创 mysql 从一个表的一个字段求和,更新到另外一个表及字符串截取、去重、切分
引子现有一个需求:一个订单表,求这个订单表的订单数,然后根据id关联更新到另一个表中,下面说说的做法。解决方法首先查出都多少条订单,并去重一下 SELECT client_id, COUNT(1) as num FROM A GROUP BY ...
2018-07-16 18:13:20
4535
原创 scala语言实现各种加密算法
因子 现在一些接口交互的时候回用到各种加密算法,现在总结一下我遇到的几个算法。1. MD5加密MD5消息摘要算法,属Hash算法一类。MD5算法对输入任意长度的消息进行运行,产生一个128位的消息摘要。以下所描述的消息长度、填充数据都以位(Bit)为单位,字节序为小端字节。算法原理1、数据填充对消息进行数据填充,使消息的长度对512取模得448,设消息长度为X,...
2018-07-09 12:02:51
5752
转载 GeoHash的运用
公司要求把地图表格化,把一个表格里面的每个店铺的销售量聚合在一起,我在网上搜集资料最后选择了运用GeoHash算法。原理附上大神的地址:http://www.cnblogs.com/LBSer/p/3310455.htmlval geoHash = filter.map(x => { val lat = x._1.toDouble val lon = x._2.toDouble...
2018-07-09 11:01:20
1859
原创 普通数据写入mysql
val url = "jdbc:mysql://地址/库名?characterEncoding=utf8"val username = "user"val password = "password"classOf[com.mysql.jdbc.Driver]def getConnection(): sql.Connection = { DriverManager.getConne...
2018-07-09 10:56:53
341
原创 spark-RDD写入数据库
result.foreachPartition( it => { var url = "jdbc:mysql://地址/库名?characterEncoding=utf8" val conn = DriverManager.getConnection(url, "user", "password") val pstat = conn.prepareStateme...
2018-07-09 10:54:55
3358
原创 spark读取数据库数据
此代码是spark用于从mysql中读取数据val conf = new SparkConf() .setMaster("local[*]") .setAppName("用户标签")val sc = new SparkContext(conf)val sqlC = new SQLContext(sc)val url = "jdbc:mysql://地址/数据库名"v...
2018-07-09 10:53:28
2560
TA创建的收藏夹 TA关注的收藏夹
TA关注的人