- 博客(12)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 sqoop 创建job -Dorg.apache.sqoop.splitter.allow_text_splitter=true \--create dot_task_push_job \失败
【代码】sqoop 创建job -Dorg.apache.sqoop.splitter.allow_text_splitter=true \--create dot_task_push_job \失败。
2023-08-22 15:27:44
532
原创 flask 蓝图blueprint 中使用缓存技术
flask 中使用flask-cache 或者flask-caching 都比较简单,但往往接口比较多的时候,都会使用蓝图BluePrint 来分模块使用,这时候使用缓存就是另外一个问题,搜了很多网上方案,都是错的,这里吐槽下,现在给出实际可行的方案,话不多说,上代码,这里只给出关键性的代码。说穿了很简单,最难的是找寻和实验的过程。创建视图,和缓存对象。
2023-06-21 09:57:27
508
1
原创 python list jaccard相似系数
网上求jaccard相似系数 list的交集和并集使用set存在一定的问题:1. set会去重;2.包含关系的时候为1这里改进下def jaccard_distance(s1, s2): """Jaccard 系数""" s1 = str(s1) s2 = str(s2) """保证s2 更长""" if len(s1) > len(s2): temp = s1 s1 = s2 s2 = temp
2022-02-15 10:56:35
917
原创 flask 打印日志 按日期分割
flask服务器,后台打印日志,如果直接使用TimedRotatingFileHandler ,基本上就是移动数据,而不是真正意义上按日期打印日志文件,这里使用改造的方法打印日志,已测试通过import timeimport loggingimport osimport sockethostname = socket.gethostname()# date = datetime.datetime.now().strftime('%Y-%m-%d-%H-%M')current_..
2021-10-19 18:57:42
1294
原创 python 判断两个字符串有是否有相同的字 快速方法
话不多说,上python代码: a = '哈哈哈' b = '打撒哈' a_set = set(a) b_set = set(b) if len(a_set & b_set) > 0: return True else: return False
2020-12-04 17:31:57
7536
4
原创 pymongo find 多条记录
话不多说上代码:import pymongofrom pymongo import UpdateOneimport datetimedef set_expire_time(collection, seconds): """ 设置过期时间 :param collection: :param seconds: :return: """ collection.create_index([("time", pymongo.ASCENDING)], e
2020-11-03 15:54:14
998
原创 java 通过 xmlrpc 调用 python3 函数
话不多少说,上代码:python3 服务端:from xmlrpc.server import SimpleXMLRPCServerfrom socketserver import ThreadingMixInfrom xmlrpc.client import ServerProxyimport threadingclass ThreadXMLRPCServer(ThreadingMixIn, SimpleXMLRPCServer): passclass RPCServer()
2020-10-28 14:56:09
205
原创 python page分页返回结果类
class Page: def __init__(self, currentPage, pageSize, rec_list): """ :param totalPage: 总页数 :param recordCount: 总记录数 :param currentPage: 当前页 :param pageSize:每页的数量 """ self.currentPage = currentPa
2020-10-28 14:53:03
577
原创 item-CF item-KNN的区别
CF。很直接,找到与item A,item B都评价过的用户 C,推荐item B给买过item A 的 用户D。KNN 则用到了基于社交的相似度计算法 。计算A与B的相似度,则是找到所有买过A的又买过B的用户,考虑评价偏差,计算完成后我们得到k个最相似的item。
2016-06-13 11:37:27
3370
原创 hive 与mysql 的区别 合并多列
mysql:select ORDR_ID,USER_ID, group_concat(PM_ID) from 表名 group by ORDR_ID limit 10hive :select ordr_id ,user_id, concat_ws(',',collect_set(pm_id))as pm_ids from 表名 group by ordr_i
2016-04-21 11:06:51
2484
DBN 能做回归吗???
2015-03-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅