- 博客(15)
- 收藏
- 关注
原创 【IV2SLS(Instrumental Variables Two-Stage Least Squares)方法】变量关系
在第一阶段回归中,将内生变量作为因变量,同时加入其他外生变量和工具变量作为自变量。【大总结】第一阶段回归是为了估计内生变量的预测值,其中利用外生变量和工具变量作为自变量。总结:在第二阶段回归中,使用内生变量的估计值和其他外生变量作为自变量,因变量为具体的研究变量。2、外生变量(Exogenous Variable):不受内生性问题影响的变量,通常包括第一阶段回归中的自变量。总结:在第一阶段回归中,使用内生变量作为因变量,外生变量和工具变量作为自变量,估计得到内生变量的预测值。
2023-07-26 22:50:14
1080
原创 python连接sql server数据库取数(xls格式)
import pymssql # 引入pymssql模块import openpyxl # 引入xlwt模块import xlwtimport osimport datetimestyle_datetime = xlwt.XFStyle()style_datetime.num_format_str = 'M/D/YY hh:mm' # 设定时间格式# 获取当前运行路径current_dir = os.path.abspath(os.path.dirname(__file__)) +
2022-05-16 10:05:41
736
原创 python实现多对多映射
import pandas as pdimport numpy as npimport osimport xlsxwriterimport itertoolsfilepath = "F:\\python代码\\多对多映射\\" # 读取源文件路径mdturn = pd.read_excel(filepath + r"mdturn.xlsx")phid = pd.read_excel(filepath + r"phid.xlsx")print("已读取所有表格")phid.drop_
2022-05-08 14:58:44
974
原创 python批量转PDF(转换pdf)
import osfrom win32com.client import Dispatch, constants, gencache, DispatchExclass PDFConverter: def __init__(self, pathname, export='.'): self._handle_postfix = ['xlsx'] # ,'doc', 'docx', 'ppt', 'pptx', 'xls'
2022-04-28 15:59:52
1013
原创 python将Excel拆多表存放并批量运行宏文件
import osimport pandas as pdimport win32com.clientimport openpyxlimport xlsxwriterimport datetimefrom 转换pdf import PDFConverternowday = datetime.datetime.now().strftime("%m-%d")def fenzu(): filename = "读取大表数据.xlsx" filepath = "文件存储位置" + f
2022-04-27 19:15:36
1013
原创 python爬取未来15天天气情况
import pandas as pdimport requestsfrom bs4 import BeautifulSoupimport jsondef request_lists(city): url = 'http://weathernew.pae.baidu.com/weathernew/pc' province = '江苏省' srcid = 4982 headers = { 'cookie': 'BIDUPSID=EFE54456868
2022-04-20 10:31:41
760
原创 python实现一对多输出
每一产品对应多个生产日期data['生产日期'] = data['生产日期'].apply(lambda x: x.strftime('%Y-%m-%d')) # 转化为字符串Data = data.groupby('sku')['生产日期'].apply(','.join).reset_index() # 逗号为分隔符输出为excel中有个小技巧:选中区域CTRL+F,【,】替换为【,+Alt+10】,可批量实现单元格内每逢逗号自动换行。...
2021-08-04 19:00:18
261
原创 python_groupby用法
data = table_name['字段4'].groupby([table_name['字段1'], table_name['字段2'], table_name['字段3']]).sum()Data = pd.DataFrame({'合计': data}) # 命名Data.reset_index(inplace=True)# 函数设定def test(table_name, word1, word2, fun): if fun == 'count': data =
2021-07-13 11:17:36
1224
原创 python实现透视表功能
df = df.pivot_table(index='字段1', values='字段2', aggfunc=np.sum, fill_value=0)# 不同维度df = df.pivot_table(index=['字段1', '字段3'], values=['字段2', '字段4'], columns='字段5', aggfunc={'字段2':np.sum, '字段4':len}, margins=True, fill_value=0)# 重命名df.rename(columns={'字段2
2021-07-10 22:46:13
364
原创 python导出多个Dataframe存放同一Excel中
# 方法1writer = pd.ExcelWriter('data.xlsx')data1.to_excel(writer, 'sheet1')data2.to_excel(writer, 'sheet2')writer.save()writer.close()# 方法2with pd.ExcelWriter('data.xlsx') as writer: data1.to_excel(writer, 'sheet1') data2.to_excel(writer, 's.
2021-07-10 20:28:12
525
原创 获取城市天气数据(python代码)
import pandasimport requestsimport jsonimport pymongoimport timeimport numpy as npdef request(year, month, codenum): url = "http://d1.weather.com.cn/calendar_new/" + year + "/{}_".format( codenum) + year + month + ".html?_=149568575817.
2021-04-09 19:30:48
469
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人