
python coding block
python代码块
数学工具构造器
这个作者很懒,什么都没留下…
展开
-
废弃的计算距离的代码
A, M = X.shape B, _ = self.tsne_matrix.shape assert M == self.n_components # X, (A,M)->(A,B,M) matrix1 = np.repeat(X, B, axis=0) matrix1=matrix1.reshape([A,B,M]) # tsne_matrix, # (B,M)-&...原创 2020-07-13 16:51:38 · 283 阅读 · 0 评论 -
根据requirements.txt生成Makefile
#!/usr/bin/env python# -*- coding: utf-8 -*-# @Author : qichun tang# @Contact : tqichun@gmail.comfrom pathlib import PathMakefile = "Makefile"lines = Path(Makefile).read_text().split("\n")packages = Path("requirements.txt").read_text().split("\原创 2020-05-28 20:57:37 · 329 阅读 · 0 评论 -
Python在pickle或copy时不传递过大的data数据
#!/usr/bin/env python# -*- coding: utf-8 -*-# @Author : qichun tang# @Contact : tqichun@gmail.comfrom copy import deepcopyfrom pickle import loads, dumpsclass Example(): def __init__(self, data): self.data = data def __reduce__原创 2020-05-09 20:43:45 · 316 阅读 · 0 评论 -
python树状结构可视化
plotTree.py# -*- coding: utf-8 -*-import sys import osimport numpy as npimport matplotlib.pyplot as pltimport treePlotter as tp # 绘制树myTree = {'root': {0: 'leaf node', 1: {'level 2': {...原创 2019-12-24 20:18:29 · 3606 阅读 · 0 评论 -
read_table
def get_df(path)->pd.DataFrame: data=[] header=['id','score'] lines=Path(path).read_text().split('\n') for line in lines: words=line.split(' ') while '' in words: ...原创 2019-10-21 11:19:21 · 407 阅读 · 0 评论 -
重构同事代码
1. 减少循环层数修改前 FeatureFlat_Euc = np.zeros([len(Bins_Euc) - 1, len(ProEleList) * len(LigEleList)], float) FeatureFlat_Ele = np.zeros([len(Bins_Ele) - 1, len(ProEleList) * len(LigEleList)], flo...原创 2019-10-12 15:52:39 · 319 阅读 · 0 评论 -
解决Python中multiprocessing只能在Top-level的代码环境中执行的问题
文章目录1.问题背景1.1 click终端交互结构1.2 关于Top level script environment1.3 multiprocessing只能在Top-level的代码环境中执行2. 问题解决2.1 通过在PYTHONPATH中设置新地址,并重新导入模块来解决1.问题背景在scorefunc开发中,我用click模块来组织其整个项目的目录结构和终端交互的结构。但是,被clic...原创 2019-10-07 14:26:03 · 391 阅读 · 0 评论 -
Python并发编程
multiproccessingimport multiprocessing as mpcount = 0def job(id): global count count += 1 print(f'job {id}, {count}')pool = mp.Pool(4)for i in range(100): pool.apply_async(jo...原创 2019-10-07 13:24:42 · 299 阅读 · 0 评论 -
删除Python列表中某一项
In [9]: i=0 ...: while(i<len(lst)): ...: if lst[i]==2: ...: del lst[i] ...: else: ...: i+=1 ...: print(lst) ...: ...原创 2019-09-29 23:01:09 · 390 阅读 · 0 评论 -
Python深度学习代码块
ImageNet数据集预处理:如果一个图片的长宽比例小于一定比值,则直接拉伸。如果大于一定比值,按照 左、中、右 三部分进行切割def process(img,max_ratio=1.35): if len(img.shape)==2: img=cv2.cvtColor(img,cv2.COLOR_GRAY2RGB) h,w,_=img.shape r...原创 2019-06-01 22:17:22 · 391 阅读 · 0 评论 -
判断DataFrame某一列是否为rangeIndex
我在保存csv的时候,有时候用了Index=False,有的时候没有,就造成读取feature的训练数据的时候,不知道要不要删除第一列。于是可以用这个函数进行判断:def isDataFrameRangeIndex(df:pd.DataFrame,col): return (df.iloc[:, col].values == np.arange(df.shape[0])).all()...原创 2019-09-14 19:27:26 · 2346 阅读 · 0 评论 -
软链接批量分配
def symlink(origin:Path,target:Path): if target.exists(): os.remove(target.as_posix()) if target.is_symlink(): os.unlink(target.as_posix()) try: os.symlink(origin.a...原创 2019-09-10 14:06:05 · 278 阅读 · 0 评论 -
预处理数据集
import tarfiledef init_dataset(datapath): if Path(datapath).is_file() and datapath.endswith('.tar.gz'): parent=Path(datapath).parent tar = tarfile.open(datapath) dirname=...原创 2019-09-08 12:38:46 · 292 阅读 · 0 评论 -
python 列表切割(用于多进程)
def split_df(df, nums): ''' reverse operation: pd.concat(dfs) ''' rows = df.shape[0] interval = rows // nums dfs = [] for i in range(nums): s = i * interval ...原创 2019-09-05 18:14:37 · 366 阅读 · 0 评论 -
Python 打包: 把所有项目文件打进去
昨天打包的时候,有个bug就是没有把一个路径很深的文件夹打进去。因为Python调用了那个文件夹中的一些bash脚本,出错。折腾了接近一个小时,记录一下。import pdbfrom setuptools import setup, find_packagesfrom pathlib import Pathimport osdef get_recursion_file_list...原创 2019-08-30 10:03:23 · 420 阅读 · 0 评论 -
Python单核与多核切换, 命令行程序设计
CLI@click.option('--ncpu', '-j', type=int,help='How many CPUs to utilize,' ' 0 or 1 means single process,' ' -1...原创 2019-08-28 11:48:17 · 452 阅读 · 0 评论