
Python 开发记录
文章平均质量分 56
主要记录和分享python开发中的心得、技巧、Bug
Jeff_ROS
路漫漫,上下求索!!!
展开
-
Python进程间通信之管道Pipe
在项目开展过程中用到了进程间通信,这里详细记录一下python的进程间通信主要模块:multiprocessing主要类:multiprocessing.Pipe()主要函数:multiprocessing.Pipe().send(),multiprocessing.Pipe().recv()源代码示例# -*- coding: utf-8 -*-import randomimport timeimport osimport multiprocessing def p.原创 2021-07-02 09:17:10 · 1227 阅读 · 0 评论 -
金融数据分析之公司年报会计师事务所信息批量提取
金融数据分析之PDF年报中词频率统计阅读本文之前可以看浏览一下上面这篇文章,对大数据分析和年报处理有一个大概的了解。目录一、前言二、需求分析三、数据特征分析四、代码实现五、提取结果示列一、前言 有位研究生同学,看到上面链接的文章,找到我,让我帮忙做一个年报的数据提取,随即我们便开展了合作。之前也做过年报数据的提取,比如3张财务表、金融衍生数据、银行理财数据、年报特定词汇频率统计等等,和我合作的大都是依据年报做投资的投资客和在校硕士和博士研究生,看得出来金融大...原创 2021-06-29 17:49:23 · 1530 阅读 · 1 评论 -
金融数据分析之PDF年报中词频率统计
一、前言近年来,大数据金融越来越火热,其金融数据的分析也变成非常重要的一部分。金融数据分析中,年报的数据分析参考意义不菲。年报数据可以做以下分析:(1)、统计年度财务数据,横向与纵向分析公司的的经营情况(2)、统计大量上市公司的财务数据,分析行业在历史各个年代的起伏兴衰(3)、统计年报中表述的措辞,分析公司乃至行业的未来发展方向和趋势(4)、统计年报数据,探索财务报表和会计政策、市场监管政策之间的关系作用......二、词频统计概述词频率统计主要是统计一篇文章中某些关键词出现的次原创 2021-06-08 14:19:37 · 7497 阅读 · 18 评论 -
金融数据分析之pdfplumber提取年报PDF关键数据(其他PDF数据通用)
目录一、前言二、难点三、提取难点解决思路四、源代码一、前言小编最近遇到需求了:<1>从PDF提取出关键数据;<2>将关键数据整理到对应的Excel文件;<3>要求批处理,可以处理多个类似的内容的PDF文件;<4>重点还是提取上市公司年报的财务数据。小编看到这个需求,首先想到用python,应了那句“人生苦短,必须python”。是的,python确实是一门好用的工具语言。问问度娘,还真有用于处理PDF文件的Packa原创 2021-05-20 09:39:58 · 5579 阅读 · 3 评论 -
python网页内容获取记录pkg
最近为了获取网页数据,积累了一些经验,这里记录 一下。网页内容获取用python真的是很好用,编写代码也快,偶尔有一些Bug需要调一下。这里记录一下常用的包bs4-----网页内容解析requests----请求下载网页内容,一般和bs4配合使用webbroswer---打开一个网页,可以选择指定浏览器,不可以下载网页内容。selenium---模拟网页操作,点击,滚动网页等,基本和人为操作差不多。还可以截图。有了这些工具,就可以自动化实现网页内容获取。但是有些网页做得比较扎实,很难获取原创 2021-03-23 10:12:28 · 150 阅读 · 0 评论 -
python字符映射与文件加密
今天学习python学了一招新关于加密的新招式,映射表加密是非常简单且加密性很好的一种方式,对写入文件的内容提供了很好的私密性。直接上代码t_map=str.maketrans("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_@0123456789. ","0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz-_@. ")# print(t_map)tt="."原创 2021-03-18 16:41:53 · 416 阅读 · 0 评论 -
python requests网页爬取初探
python开发过程中,有时候需要网页的数据,这时用到网页爬虫模块,减少重复性工作,python提供了requests 模块,urllib2模块,beautifulsoup bs4模块。软件开发中能够用脚本代替的工作尽量用脚本代替,我们专注于业务本身就好。今天试了一下request模块,Demo功能是下载网页财经的年报,代码如下:import requestsimport urllibnb_url='http://file.finance.sina.com.cn/211.154.219.原创 2020-12-18 20:17:14 · 249 阅读 · 1 评论 -
python 中空NULL的表示
对于空的字符或者NULL的元素判断a=''if (not a) or (a is None):原创 2020-12-17 19:53:50 · 3102 阅读 · 0 评论 -
python--xlrd: xlrd.open_workbook excel.xls CompDocError解决办法
使用xlrd加载xls格式的Excel文件时出现以下错误参考链接别人的优快云博客找到是comdoc.py文件出错,打开吧错误屏蔽如下,红色部分Python的第三方库也经常出现Bug,但是Python我还是很喜欢用的,用的时候要仔细了!...原创 2020-12-17 19:10:20 · 1234 阅读 · 1 评论