
sql
文章平均质量分 68
mtj66
这个作者很懒,什么都没留下…
展开
-
python多线程并发访问&数据库连接池原理以及代码
在工作中难免会使用数据库,为了能够高效并发访问数据库,数据库连接池必不可少,由于本站copy模式盛行,导致数据库连接池被错误使用,遇到错误甚至追求能跑通就行。本文就数据库链接池的实际使用场景来说明如何应用数据库连接池。在部署机器学习模型时采用的是flask框架,模型预测本身是一个很快的事情,无奈有太多的特征需要通过接口(或者是ots,mysql等)获取,导致响应时效性降低。为了能很好的实现并发性,提升QPS,采用gunicorn进行多进程,异步处理方案。此时单个进程只有一个数据库链接,就会导致异步执行的线程原创 2022-06-28 14:41:51 · 5694 阅读 · 10 评论 -
详解 PostgreSQL explain 查询计划
https://blog.youkuaiyun.com/kmblack1/article/details/80761647详解 PostgreSQL explain 查询计划2018年06月21日 15:49:57 kmblack1 阅读数:1004 除第一行以外每个->表示一个子动作 执行计划的阅读顺序都是从后至前 width=0是表示只获取行的位置,没有读取数据.开...转载 2019-01-29 16:33:15 · 791 阅读 · 0 评论 -
pgsql存储过程中-变量引用以及表名,列名使用
本文实现了一个按照指定百分位的数据生成等距的序列值,分位数的数据按照每增长一个百分点分一组,如果分组的数据没有值自动会合并到下一组,直到满足条件的分组,上限100组哦.TODO优化:动态分组,并且不限制分组数量.思路1 将分组后的数据进行自关联(需要转成行记录),拿到本组以及下一个分组的数值,然后和需要分组的表进行关联当需要分组的字段落地对应的分组区间的时候(此处采用不等值连接,不知道...原创 2019-01-15 18:11:42 · 9821 阅读 · 0 评论 -
存储过程使用学习
delimiter // /** 定义分隔符 **/DROP TABLE if exists test //CREATE TABLE test(id int(11) NULL) ///********************** 最简单的一个存储过程 **********************/drop procedure if exist原创 2017-04-11 16:42:27 · 424 阅读 · 0 评论 -
实时场景下的机器学习模型实时特征离线特征融合方案(踩坑笔记)
实时场景下的机器学习模型实时特征离线特征融合方案(踩坑指南)原创 2021-12-09 18:07:20 · 4708 阅读 · 0 评论 -
通过user-agent获取用户的手机品牌
本文主要提供流程1、通过useragent解析手机型号,手机网络,手机系统版本等2、通过解析的手机型号和手机品牌维表进行关联3、手机品牌维表需要自己更新维护,可以参考:https://github.com/matiji66/MobileModels,具体见如下流程具体流程可以参考文件:useragent解析逻辑&手机品牌匹配.txt-其它文档类资源-优快云下载...原创 2021-11-22 16:54:52 · 2758 阅读 · 0 评论 -
Flink Sql双流join-回撤机制导致数据重复
数据源:kafka topic数据类型为json业务场景:解析json,由于数据层级比较深,而且包含数组,此处键值可能为空所以数据就变成了双流join,甚至是多流join。问题原因:采用left join导致数据回撤,然后同一个主键数据产生重复是采用inner join 还是 outer join,具体区别见Flink Sql教程(5)_狄杰的博客-优快云博客_connector.startup-mode由于此处关联可能存在键值为空匹配不到的情况,采用了很多left join,..原创 2021-10-12 13:56:16 · 3219 阅读 · 0 评论 -
sql优化之一次from查询多次insert into操作
优化点:一次map多个reduce,有效节省了map操作.本脚本目的:实现表字段空值率统计流程:1.获取表结构2,通过excel或者是notepad进行批量转换,3,将语句格式化成如下的from insert 语句,然后执行就OK了.4,每个insert语句后面可以跟where语句create table if not exists tmp_null_static (...原创 2019-02-20 12:05:59 · 2246 阅读 · 0 评论 -
sql 采样
方式1. 随机采样,抽取百分之5 的数据 rand(id)<0.05-- 随机采样-- create table tmp_info_ycf as-- select * from info_ycf where rand(policy_id )< 0.03 limit 20000 ;-- ;方式2. 根据某个字段进行统计,数据尽量均匀,create table...原创 2019-02-28 11:43:44 · 3770 阅读 · 0 评论 -
三种join方式: 对驱动表和被驱动表的重新认识
http://www.cnblogs.com/CareySon/archive/2013/01/09/2853094.html 今天想到一些优化的问题,对驱动表重新认识了一下.浅谈SQL Server中的三种物理连接操作简介 在SQL Server中,我们所常见的表与表之间的Inner Join,Outer Join都会被执行引擎根据所选的列,数据上是否有索引,所选数据的选择...转载 2019-02-12 18:42:37 · 7397 阅读 · 0 评论 -
有没有 更简便的根据最大值和最小值的差值 等距分组的方法
分组的小技巧,不知道有没现成的函数可以计算出来各自对应的分组select policy_id ,reserve_amount_first ,min_coins_indemnity_fee ,max_coins_indemnity_fee,round((reserve_amount_first-min_coins_indemnity_fee + line_space/10)/(lin...原创 2018-12-13 16:33:32 · 1275 阅读 · 0 评论