
机器学习
胡熊熊
这个作者很懒,什么都没留下…
展开
-
【数据分析】用pandas处理财务报表
面对繁多的报表,如何从中快速的选取需要的字段,并按照一定规则加以计算,是工作中经常遇到的问题。本文记录了用pandas处理excel财务报表并加以计算的全过程。 目标从财务报表中(此项目中为excel文件)的资产负债表中筛选出资产总计、所有者权益的期初数与期末数,和利润表中营业总收入、已赚保费的期初数和当年累计,并计算同比和环比情况,写入新的excel中。 导入数据 通常财务数据报表文件数目较多,且每个文件中包含多个sheet。此项目中的源数据文件按照年、月储存在根目录下。观察..原创 2020-07-31 15:53:05 · 3162 阅读 · 0 评论 -
【机器学习】到底什么是交叉熵
一般地,熵(Entropy)被用于描述一个系统中的不确定性(the uncertainty of a system)。在不同领域熵有不同的解释,比如热力学的定义和信息论也不大相同。要想明白交叉熵(Cross Entropy)的意义,可以从信息量-> 熵 ->相对熵-> 交叉熵这个顺序入手。信息量顾名思义信息量表征事件发生冷门程度,越冷门,信息量越大。举个栗子,当小概...原创 2018-08-16 16:57:08 · 2551 阅读 · 2 评论 -
【机器学习】线性回归-理论与TensorFlow实现
作为CV领域的学生,研究生毕业以后就再没机会系统的梳理一遍机器学习所涉及的基础知识。现从基础理论下手将机器学习所涉及的基础内容做一次系统的总结,特记录下学习中的部分心得体会。本文分为如下几个部分:什么是线性回归 用TensorFlow从零实现线性回归1.什么是线性回归官方说法,线性回归(Linear regression)是一种以线性模型来建模自变量与因变量关系的方法。通常来说...原创 2020-01-13 17:00:06 · 273 阅读 · 0 评论