方法一、PANDAS方法
# 获取会计科目数据
# 方法一、通过Pandas库从csv文件获取数据
# 写成函数,code为六位股票代码,itp为报表类型:'is for income_statement, bs for balance_sheet, cf for cash_flows
# n为默认参数,0表示最近一期,1表示最近两期,以下同
def select(code,itp,key,n=0):
import pandas as pds
s_file='/dev/shm/Finacials/{tp}{c}.csv'.format(c=code,tp=itp)
df=pds.read_csv(s_file,encoding='gbk',index_col=0).dropna(axis=1)
return df.ix[df.index.str.contains(key)].values[0][n]
%time select('600660','cf','经营活动产生的现金流量净额')
执行结果

方法二、直接处理csv文件
# 获取会计科目数据:方法二、直接处理文本
def select2(code,itp,key,n=0):
s_file='/dev/shm/Finacials/{tp}{c}.csv'.format(c=code,tp=itp)
ct=open(s_file,encoding='gbk').read().replace('--','0')
targ = ''
start = ct.find(key)
end = 0
if start>-1:
if key[0]=='\n':
end = ct.find('\n',start+1)
else:
end = ct.find('\n',start)
targ = ct[start:end-1]
return float(targ.split(',')[n+1])
%time select2('600660','cf','经营活动产生的现金流量净额')
执行结果

从上面可以看出,直接处理csv文本效率比通过Pandas处理快20倍左右,这在大量处理时还是很可观的。
注:上面代码中,s_file为你在网上爬取数据的保存位置,根据实际情况修改即可。
第二部分、编制财务指标
其实拿到数据后要计算财务指标并导出是非常简单的事,使用一个双重循环即可。但是这可能会使得写出的代码非常不灵活,打个比方,今天可能要导出盈利能力数据。好容易将代码写好了,明天可能又需要导出其它数据。然后就到原代码基础上改改改。今天导出沪深300的,明天可能又要中证500的怎么办。我们编制财务指标,就是为了将代码模块化,方便调用,以后不管需要什么数据,只需提供范围就可以导出数据了
# 这里只举一个例子并说明
# 权益乘数
def em(code,ny=0):
return round(select2(code,'bs','资产总计',ny)/select2(code,'bs','所有者权益(或股东权益)合计',ny),2)
def roic(code,ny=0):
i1 = select2(code,'is','净利润',ny)
l1 = select2(code,'bs','短期借款',ny)
l2 = select2(code,'bs','一年内到期的非流动负债',ny)
l3 = select2(code,'bs','其他流动负债',ny)
l4 = select2(code,'bs','长期借款',ny)
l5 = select2(code,'bs','应付债券',ny)
l6 = select2(code,'bs','其他非流动负债',ny)
e1 = select2(code,'bs','所有者权益(或股东权益)合计',ny)
return round(i1/(l1+l2+l3+l4+l5+l6+e1),2)
print('福耀玻璃的权益乘数是:', em('600660'))
print('福耀玻璃的投入资本回报率是:',roic('600660'))
执行结果

上面两个函数为定义的两个财务指标,大家可能注意到两个函数使用了一致的调用参数。什么,你不知道什么是调用参数?那。。。这么着说吧,假设有一个快递员,他在送快递时需要一个地址和送的包裹吧。我们在“定义”送快递这个动作的时候,“地址”和“包裹”是快递员在“送包裹”时需要的东西,这个就是形参数。因为它不代表具体的地址和具体的包裹,而在实际送包裹的时候(函数调用)需要提供实际的“地址(比如:城市花园233号”和“包裹(比如:狗粮)”。这个“城市花园233号”和“狗粮”就是调用参数(又称为实际参数),现在,“将这包狗粮送到城市花园233号”就完成了一次“送快递”动作,哎说不清楚了。未明白的,去看Python的相关教程吧。
由于我们在定义函数时采用了一致的参数,这就方便了我们使用同一方式进行函数调用,从而获得相应数据。接下来的第三部分,简单说说一次性送多个包裹(哦不,获取多只股票多个数据)的方法。
第三部分、导出数据
接下来,我们定义一个导出数据的函数(就是功能),接收两个参数:一个是需要数据的股票列表,一个是须要导出的财务指标。
from collections import OrderedDict
import tushare as t
def export_data(rn=['600660','000895'],fi_dict=OrderedDict([('权益乘数',em),('投入资本回报率',roic)])):
stock_b = t.get_stock_basics()
stock_b = stock_b.ix[:,0:3]
stock_b.columns=['股票名称','所在行业','所在区域']
stock_b = stock_b.ix[rn]
for k in fi_dict:
values = []
for c in stock_b.index:
try:
values.append(fi_dict[k](c))
except:
values.append(0)
stock_b[k] = values
#stock_b.to_csv('Fi.csv',encoding='gbk')
return stock_b
%time export_data()
执行结果

这里稍做解释:函数export_data定义了两个命名参数,“rn”为一个列表,表示所需获得数据的股票列表,默认值为[‘600660’,‘000895’],fi_dict是需要导出的财务指标,这里用了一个OrderedDict是为了保证财务指标按照指定的顺序输出。 该功能返回一个pandas.DataFrame表格,如上图。 注:各位小伙伴还可以编写更多的财务指标,实际更多样化的输出(为重复工作,这里不再赘述)
第四部分、数据可视化及图表
坦率讲我并不喜欢通过图表展示数据,感觉能够看得懂的图表吧展示的数据量不够,数据量大的图表吧,又不容易看得懂。所以这部分就不举例子了。Matplotlib官网上提供了各种图范例,如果有需要,将代码copy过来改下调用参数就可以了。参考 MatPlotLib Gallery
关于Python技术储备
最后
不知道你们用的什么环境,我一般都是用的Python3.6环境和pycharm解释器,没有软件,或者没有资料,没人解答问题,都可以免费领取(包括今天的代码),过几天我还会做个视频教程出来,有需要也可以领取~
给大家准备的学习资料包括但不限于:
Python 环境、pycharm编辑器/永久激活/翻译插件
python 零基础视频教程
Python 界面开发实战教程
Python 爬虫实战教程
Python 数据分析实战教程
python 游戏开发实战教程
Python 电子书100本
Python 学习路线规划

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
223

被折叠的 条评论
为什么被折叠?



