
python技巧
淘气淘的宝宝
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python连接数据库
python连接不同的数据库原创 2022-06-07 11:21:55 · 3936 阅读 · 0 评论 -
python 控制台输出重定向到文件
import sys #start output = sys.stdout outputfile = open(filename,'w') sys.stdout = outputfile #end outputfile.close() sys.stdout = output转载 2021-09-22 10:44:58 · 1044 阅读 · 1 评论 -
python 批量合并csv
1.当csv数量在10以下,每个csv量很小时: import pandas as pd def merge_csv_file(path=None, col_name=[], file_type='csv'): """ 遍历并合并文件夹里的文件 :param path: 文件夹路径 :param col_name: 列名 :param file_type: 文件类型 :return: """ data = pd.DataFrame()原创 2021-07-07 16:16:56 · 1153 阅读 · 0 评论 -
tornado框架
from tornado.httpserver import HTTPServer from tornado.ioloop import IOLoop import tornado.web from handler import handler_recall_service os.environ['OMP_NUM_THREADS'] = "1" def multi_app(): port = 9090 app = tornado.web.Application(handlers=.原创 2021-02-22 14:46:21 · 187 阅读 · 0 评论 -
模型解释
又从kaggle离学到一个新的知识点,下面代码是对模型特征重要性的解释 import eli5 from eli5.sklearn import PermutationImportance #for SHAP values import shap from pdpbox import pdp, info_plots #for partial plots perm = PermutationImportance(model, random_state = 0).fit(x_test, y_test原创 2021-02-10 11:02:39 · 872 阅读 · 0 评论 -
EDA利器--pandas_profiling
今天混迹kaggle,发现了一个比较重要的模块,pandas_profiling,用pip、conda都可以安装,它主要的功能是生成数据分析报告,贼详细那种, 代码: import pandas_profiling profile = pandas_profiling.ProfileReport(data) profile 输出结果如下: 代码、图片来源:https://www.kaggle.com/roshansharma/heart-diseases-analysis/noteb.原创 2021-02-09 16:52:59 · 193 阅读 · 0 评论 -
python调试之logging
本想调试代码,但输出太多,也不知道是哪行哪个文件的输出,一气之下,来个总结。 1.方法一: 使用pycharm自带的debug,一步步打断点,调试 2.方法二: 程序运行时间过长,只想看某一部分的输出结果,先print()后exit() 3.方法三:logging 最简单的方式输出代码运行时间、文件、输出信息 import logging logging.basicConfig(level=logging.INFO, format='%(asctime原创 2021-02-08 13:45:05 · 473 阅读 · 1 评论 -
1117-新操作
1.计算数字型日期s前n天所对应的日期,返回与输入格式一致,(n可正可负) import pandas import datetime def transform_date(s,n): date = pd.to_datetime(s, format='%Y%m%d') res = (date + datetime.timedelta(days=n)).strftime("%Y%m%d") return int(res) [in]:tran原创 2020-11-17 15:04:08 · 159 阅读 · 0 评论 -
python 读取数据库
1.连接数据库,并执行查询语句,返回查询结果,并转成dataframe形式 import numpy as np import pandas as pd from operator import itemgetter import matplotlib.pyplot as plt import requests import pandas as pd import json from pyhive import hive import time import re def init_hive_con原创 2021-02-05 11:27:12 · 1516 阅读 · 1 评论 -
python-configparser模块
1.功能:读取配置文件 2.用法: 2.1配置文件格式 [db] db_host = 127.0.0.1 db_port = 69 db_user = root db_pass = root host_port = 69 [concurrent] thread = 10 processor = 20 2.2读取某一个值: from configparser import Configparser #导包 filen = ''原创 2021-02-05 11:14:42 · 242 阅读 · 2 评论