
python金融大数据挖掘与分析
qq_42839893
这个作者很懒,什么都没留下…
展开
-
datetime的用法
datetime的用法原创 2021-01-04 11:03:28 · 72 阅读 · 0 评论 -
time用法
import time获取当前时间戳t = time.time()print(‘1)获取当前时间戳:’, t)当前时间的struct_time形式t = time.localtime()print(‘2)当前时间的struct_time形式:’, t)print(‘3)当前年份:’, t.tm_year)当前时间的字符串形式t = time.ctime()print(‘4)当前时间的字符串形式:’, t)当前时间自定义格式的字符串t = time.strftime("%Y-%m-%d原创 2021-01-04 10:55:12 · 243 阅读 · 0 评论 -
pandas高级应用之数据表的拼接
数据表的拼接merge默认根据相同的列进行合并,并且取交集设置how去取并集如果想要保留左边的所有内容,但是对右边并不在意,那么就是用left如果想要保留右边的所有内容,但是对左边并不在意,那么就是用right根据行索引和列索引进行合并使用concat函数进行连接是一种(union all的方式)核心参数是axisaxis = 0axis=1append函数等价于 pd.concat([df1,df2] ,axis = 0),使得行增加...原创 2021-01-03 14:23:42 · 320 阅读 · 0 评论 -
Selenium库的使用
Selenium库的使用from selenium import webdriver# 声名要用 的 是 谷歌的浏览器# 无界面浏览器设置chrome_options = webdriver.ChromeOptions()chrome_options.add_argument("--headless")browser = webdriver.Chrome("/Users/apple/Downloads/chromedriver_87",options = chrome_options)原创 2021-01-03 13:52:49 · 126 阅读 · 0 评论 -
小知识:皮尔逊相关系数分析
小知识皮尔逊相关系数分析用于考虑线性相关程度的统计量在[-1,1]之间,绝对值越大,则越显著,负数表示负相关,正数表示正相关原创 2021-01-03 13:40:56 · 4041 阅读 · 0 评论 -
# 数据可视化基础(Matplotlib)
import matplotlib.pyplot as plt%matplotlib inline解决中文的显示问题(但是不知道为什么对我的 linux系统不起作用)import matplotlib.pyplot as pltplt.rcParams[‘font.sans-serif’] = [‘SimHei’] # 用来正常显示中文的标签plt.rcParams[‘axes.unicode_minus’] = False折线图x = [1,2,3]y= [2,4,6]#linewid原创 2021-01-03 13:24:37 · 196 阅读 · 0 评论 -
# 正则表达式梳理
正则表达式"."能匹配除了换行符(\n)之外的任意字符,“*”表示0个或者多个表达式贪婪匹配 ".*" ‘可能会匹配到过多的内容’非贪婪匹配 ".*?"不过我们在实战中基本上用的还是非贪婪匹配example 1example 2 推荐.*?的用法strip的用法sub的用法#设置邮件的主题,发件人,收件人msg[“Subject”] = “一个简简单单的主题”msg[“From”] = usermsg[“To”] = to#发送邮件s = smtplib.SMTP_SSL(“smtp.qq.com” , 4原创 2020-09-22 10:36:48 · 163 阅读 · 0 评论 -
爬虫(利用正则表达式爬取百度新闻(淘宝))
先直接在百度新闻中搜索“淘宝”得到url = “”"https://www.baidu.com/s?ie=utf-8&medium=0&rtt=1&bsst=1&rsv_dl=news_t_sk&cl=2&wd=%E6%B7%98%E5%AE%9D%E7%BD%91&tn=news&rsv_bp=1&rsv_sug3=12&rsv_sug1=3&rsv_sug7=100&oq=&rsv_sug2=0&原创 2020-09-22 10:17:00 · 2075 阅读 · 0 评论 -
python金融大数据挖掘与分析(1)(python正则表达式)
# 初步开始总结正则表达式的用法import re1.findall函数content = "Hello 123 World"result = re.findall("\d\d" , content)resultresult1 = re.findall("\d\d\d" , content)2.(.*?)非贪婪匹配import reres = "八爪鱼爬虫(我们看一下)会员,,,,,,八爪鱼爬虫,,,,会员"p_source = "八爪鱼(.*?)会员"source = r原创 2020-09-15 10:18:22 · 304 阅读 · 0 评论