- 博客(19)
- 资源 (3)
- 收藏
- 关注
原创 Elasticsearch 查询/聚合 date类型字段求差示例
需求背景文档中有两个字段 start_time(采集时间), create_time(存储ES时间), 需要统计下从采集到入库的延迟mapping"mappings" : { "properties" : { "create_time" : { "type" : "date" }, "start_time" : { "type" : "date"
2021-11-10 11:36:39
2343
原创 ES查询时_id含有特殊字符的问题
问题根据ID获取不到文档, 报错GET index/_doc/2_900002151162=I1B8PIUB1-66M04493WI71zDLXZliUSgmR9S9eVMLh2/NK3FcIhRi4yf8VU=
2021-05-31 19:03:06
2366
1
原创 北京-京医通-小孩-人脸识别
问题用京医通给孩子候补挂号时, 提示人脸识别.解决办法(客服回复)您好,请到儿研所,窗口添加/修改监护人信息,由监护人识别,带着 孩子就诊卡,有效证件和大人身份证,出生证明,都是原件,在线不支持修改,其他医院也暂不支持修改我理解, 支持京医通的医院, 应该都可以添加/修改的....
2021-05-26 13:48:27
5763
转载 Hive查询报partion错误
报错信息No partition predicate found for Alias解决办法在Hive前加上语句:set hive.mapred.mode = unstrict;参考,1)https://stackoverflow.com/questions/39049620/no-partition-predicate-found-for-alias-even-when-the-partition-predicate-in-pres...
2020-12-29 20:09:55
611
原创 maven打包控制JDK版本
本地默认jdk 1.8打的包, sdk发布后, 有小伙伴说必须要用1.7的.解决办法: 在pom配置中添加: <build> <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-compiler-plugin<...
2019-09-20 00:33:49
811
翻译 python, excel设置访问密码(文件级别)
FROM:https://stackoverflow.com/questions/27556751/unprotect-an-excel-file-programmatically安装 pywin32def Remove_password_xlsx(filename, pw_str): xcl = win32com.client.Dispatch("Excel.Applicat...
2019-05-26 21:13:52
7185
原创 检索指标-精度/召回率
一般的表述方式FROM: <<现代信息检索>> 第二版, 第4章-检索评价R为相关文档集, A为查询 在文档集 上查询返回的文档集, .那么, 精度(正确率) p ( Precision), 召回率 r (Recall)的定义如下 其他表述方式FROM<<信息检索导论中文版>> 相关(rele...
2018-12-20 20:12:40
868
原创 python/hive去除字符串两边的标点符号
目录pythonhive闲来无事, 处理一下正则表达式去除字符串两边的标点符号pythons=""""''& _+-' ..
2018-12-12 13:32:06
3565
原创 python PyDictObject对象学习小结
来自: <<python源码剖析>>Hash方案散列表+开放定址法创建PyDictObject先从对象缓冲池中取, 若没有, 则创建, 同时创建存储数据的表small_table[8]数据对象PyDictEntry有三种状态, unused, active, dummy. dummy的作用: 删除数据时, 并不真的删除(伪删除), 标记为du...
2018-11-07 11:03:38
742
转载 redis性能监控(二): 6 Crucial Redis Monitoring Metrics You Need To Watch
FROM:https://scalegrid.io/blog/6-crucial-redis-monitoring-metrics/Redis is an in-memory database that provides blazingly fast performance. This makes it a compelling alternative to disk-based datab...
2018-09-19 17:36:54
441
转载 redis性能监控(一): Redis Info 命令 - 获取 Redis 服务器的各种信息和统计数值
FROM: http://www.redis.net.cn/order/3676.html最近被要求统计存储的一批key中占用redis资源, 便看到了这里.Redis Info 命令以一种易于理解和阅读的格式,返回关于 Redis 服务器的各种信息和统计数值。通过给定可选的参数 section ,可以让命令只返回某一部分的信息: server : 一般 Redis 服务器信息,...
2018-09-19 15:35:23
2541
1
转载 Structuring Your Project
FROM: https://docs.python-guide.org/writing/structure/By “structure” we mean the decisions you make concerninghow your project best meets its objective. We need to consider how tobest leverage Pyt...
2018-09-18 17:48:40
585
转载 Good logging practice in Python
from: https://fangpenlin.com/posts/2012/08/26/good-logging-practice-in-python/ In reality, logging is important. When you transfer money, there are transfer records. When an airplane is flying, bla...
2018-09-13 15:05:38
415
转载 大多数人的平庸,来自于极差的执行力
摘录 来自:1) https://mp.weixin.qq.com/s/bVPDVlR5021wYo6ee_lkBw
2018-09-09 19:51:12
545
翻译 [seaborn]catplot方法部分参数小结
方法签名seaborn.catplot(x=None, y=None, hue=None, data=None, row=None, col=None, col_wrap=None, estimator=<function mean>, ci=95, n_boot=1000, units=None, order=None, hue_order=None, row_order=No...
2018-09-05 14:38:57
9470
翻译 [seaborn]relplot方法部分参数小结
目录方法签名参数kindhuestylesize 方法签名seaborn.relplot(x=None, y=None, hue=None, size=None, style=None, data=None, row=None, col=None, col_wrap=None, row_order=None, col_order=None, palette=N...
2018-09-03 18:00:36
7762
原创 数据规范化
1) 归一化(min-max)2) 标准化(z-score) import loggingfrom io import StringIOimport matplotlib.pyplot as pltimport numpy as npimport pandas as pdfrom sklearn.preprocessing import StandardScaler, M...
2018-08-16 19:36:14
327
原创 pyspark运行测试及笔记整理
先贴代码#!/usr/bin/env python# -*- coding: utf-8 -*-import datetimeimport loggingimport osimport pyspark.sql.functions as funfrom pyspark import SparkConf, SparkContextfrom pyspark.sql import ...
2018-08-07 09:51:21
1499
Spring MVC + Mybatis + H2 单测H2数据库执行失败
2023-07-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人