- 博客(18)
- 资源 (1)
- 收藏
- 关注
原创 财务分析之利润表、现金流量表
利润表企业在一定时间范围的经营成果,基于"收入-费用+利得-损失=利润"列出各项费用利润表中常见条目解释:净利润利润总额 - 所得税;利润总额营业利润+营业外收入-营业外支出营业利润营业收入-营业成本-营业税金及附加-期间费用-资产减值损失±公允价值变动损益±投资损益±资产处置损益+其他收入期间费用销售费用+管理费用+财务费用,企业在生产经营活动中不能归属于某个特定成本核算的费用;一般期间费用随着规模的增大而增大,但幅度会小于规模增大幅度营
2022-04-28 23:01:55
510
原创 财务分析之资产负债表
资产负债表某一时点企业的全部资产、负债与股东权益(自有资本)的存量及其结构,其中,股东权益(自有资本)也称作净资产。资产负债表主要包括流动资产、非流动资产、流动负债、非流动负债。流动资产1.货币资金:定义:货币形态的资金,包括库存现金、银行存款等特点:流动性高、收益性低;需要在现金流动性和收益能力间权衡举例:取得现金投资、获得现金捐助、获得银行贷款、销售收入;购买材料、支付工资、归还借款、支付税金2.应收账款:定义:销售产品、提供服务时应向购买单位收取的款项特
2022-04-28 14:11:29
653
原创 tensorflow serving过程及线上预测碰到的一些神经网络相关问题
一.安装docker安装教程很多,例如可参考docker官网:https://docs.docker.com/install/linux/docker-ce/centos/# 安装yum-utils包sudo yum install -y yum-utils# 设置repositorysudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo# 安装最新的Dockersud
2022-03-23 11:26:51
3032
2
原创 使用python将ppt文件批量转为pptx、批量提取ppt中的文字保存
import osfrom pptx import Presentationfrom docx import Documentimport os.pathimport win32com.clientclass PPT2Word(object): """将filepath对应的pptx文件中的文字提取,并保存为同名docx文档""" def __init__(self, filepath): self.wordfile = Document() self.
2022-02-20 18:24:26
2094
原创 新闻推荐系统概要
推荐量新文章初次推荐量:通过一段时间内对创作者的内容和读者阅读、关注行为的记录和分析得出的创作价值评分,包括健康度、关注度、传播度、垂直度、原创度等5个维度二次推荐量:将根据读者的点击率和阅读完成率以及其他点赞、转发、收藏、评论互动等来决定是否再进行新一轮更大范围推荐,或者还是减少推荐量另外还有一个影响二次推荐很大的因素,那就是发文时间。文章发布的时间越长了,推荐的数量就越低了,80%以上的推荐量是在24小时内完成的。推荐原理创作者没有粉丝也有可能获得百万千万的阅读量,因为APP自带粉丝通过
2021-09-10 18:19:46
649
原创 NDCG归一化折损累积增益
NDCG常用于TOP-K排序的评价指标,不仅体现了预测的TOP-K个结果是否真的相关(有无点击),同时体现这TOP-K个结果的相对排序。累积增益CG:推荐系统中CG表示将每个推荐结果相关性的分值累加后作为整个推荐列表的得分:CGk=∑i=1kreliCG_k = \sum_{i=1} ^{k}rel_i CGk=∑i=1kreli其中, relir e l_ ireli 表示位置 iii 的预测结果的相关性,kkk 表示推荐列表的大小。CG没有考虑每个推荐结果处于不同位置对整个推荐结果
2021-06-03 23:41:18
1553
原创 python三维视图制作
场景:三维视图,例如想可视化z随着x、y的变化规律maxlen = 5dim = 100# data是需要可视化的二维列表,shape为(maxlen, dim),值介于-1到1之间data = [[0.00000000e+00,1.00000000e+00,0.00000000e+00,1.00000000e+00,0.00000000e+00,1.00000000e+00,0.00000000e+00,1.00000000e+00,0.00000000e+00,1.00000000e+00
2021-05-13 18:10:30
416
原创 FM/FFM算法介绍
CTR/CVR预测时,用户的性别、职业、教育水平、品类偏好,商品的品类等特征,经过One-Hot编码后特征量膨胀,呈现数据稀疏性;某些特征之间相互关联之后与标签label的相关性大幅提升,例如商品类型特征与性别特征(”化妆品”类商品与“女”性,“球类运动配件”的商品与“男”性),因此,引入特征的关联特性非常具有意义。多项式模型是包含特征组合的最直观的模型,其中二阶多项式模型如下;前两项为普通的特征线性组合,后一项为特征交叉项;特征数量为n, xi和xj分别代表第i和第j个特征的值,只有当xi和xj均
2021-04-05 13:07:36
225
原创 UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position
该错误一般出现在涉及中文的地方,只需要在该地方(变量val)后加上encode(encoding=‘utf-8’) 即可,val.encode(encoding=‘utf-8’) ;另外,打开文件也可能出现该问题:open(path_file, encoding=‘utf-8’)
2021-03-02 17:58:43
1749
1
原创 pid进程相关操作
1.执行py文件生成进程的命令如下:/data/anaconda3/envs/python_env36/bin/python /data/yzx/sale_predicts_allenv/rocketmq_file/task_consumer.py prod2.未运行该文件,查看该文件相关进程:可以看到含有一个pid为10754的查询进程,且该进程号随时变化,task_consumer.py文件并未运行[root@node01 ~]# ps -ef|grep rocketmq_file/task_
2021-02-24 14:53:33
407
原创 时间序列分解:stl、prophet原理与实现
参考文章:局部加权线性回归Lowess时间序列分解算法:STL时间序列分解-STL分解法STL——以鲁棒局部加权回归作为平滑方法的时间序列分解方法STL时序分解:将时序分解为趋势项、季节项(周、月等)、余项。利用Lowess局部加权回归技术进行平滑;通过外循环设计体现鲁棒性。分别用Yv, Tv,Sv,Rv分别代表数据,趋势项、季节项和余项,v的范围为0到N,那么Yv=Tv+Sv+Rv ,其中v=1,⋯,N (加法模型中,各项具有相同量纲、STL只能处理加法模型,可以先将数据
2020-11-30 12:17:21
14408
7
原创 局部加权线性回归Lowess
当要预测的样本序列不是明显的线性关系时,用线性回归会存在拟合不好的现象,即欠拟合。局部加权回归定义:以一个点 x为中心,向前后截取一段长度为frac的数据,对于该段数据用权值函数 w做一个加权的线性回归,记 ( x , y ^ )为该回归线的中心值,其中 y ^为x拟合后曲线对应值。对于所有的n个数据点则可以做出n条加权回归线,每条回归线的中心值y ^的连线则为这段数据的Lowess曲线(上述为单次回归,局部加权回归可多次迭代)。线性回归与局部加权回归的损失函数:可以发现:局部加权回归对局部特征能较
2020-11-27 23:11:16
3830
1
原创 往MYSQL表中导入数据文件碰到的一些问题
1、mysql服务器建立好表table_a后,通过mysql客户端(例如mysql front)连接服务器,step1:点击表"table"—>“右键导入”—>“CSV文件”;step2:选择好相应数据文件data.txt后,右下角更改字符集为"UTF-8"(否则可能导入中文显示乱码问题),点击“确定”step3:选择相关配置:大标题:如果data.txt无字段标题行,则反选;如有字段标题行,则选中;分隔符:选择相应字符,一般为逗号“,”;2、mysql数据导入如果分隔符为一些特殊
2020-11-21 22:17:35
507
1
原创 conda虚拟环境相关
1.conda虚拟环境相关命令:创建虚拟环境:使用 conda create -n your_env_name python=X.X(2.7、3.6等),anaconda 命令创建python版本为X.X、名字为your_env_name的虚拟环境。conda create -n env_name python=2.7激活虚拟环境:Linux使用如下命令即可激活创建的虚拟环境source activate your_env_name(虚拟环境名称)退出虚拟环境: source deact
2020-11-18 00:42:44
589
原创 MYSQL增删改查操作、查询语句执行顺序、力扣试题解析
本文参考廖雪峰的MYSQL教程,链接:https://www.liaoxuefeng.com/wiki/1177760294764384样例用到的数据表如下:students表:| id class_id name gender score1 1 小明 M 902 1 小红 F 953 1 小军 M 884 1 小米 F 735 2 小白 F 816 2 小兵 M 557 2 小林 M 858 3 小新 F 919 3 小王 M 8910 3 小丽 F 85 | |classe
2020-11-13 11:38:19
1219
原创 HADOOP新datanode的添加
新datanode的添加1.对slave2机(已有datanode节点)进行克隆slave222.ifconfig查看mac地址00:0c:29:46:5b:4f3.编辑文件etc/sysconfig/network-scripts/ifcfg-ens33,修改mac地址和ip地址IPADDR=192.168.74.134HWADDR=00:0c:29:46:5b:4f4.nmtui修改主机名称在master主机上的/etc/hosts文件添加slave22机的名称、ip映射在mas
2020-11-10 23:31:54
547
原创 HADOOP完全分布式集群搭建注意点
HADOOP完全分布式集群搭建注意点1.集群规划2.环境相关:cent OS 8JAVA_HOME=/usr/local/jdk/jdk1.8.0_271/HADOOP_HOME=/usr/local/hadoop/hadoop-2.9.2/3.master主机在nat模式下的网络设置参考:https://blog.youkuaiyun.com/u013305747/article/details/783759464.重启网络服务命令:nmcli c reloadnmcli c up ens335
2020-11-08 19:01:22
573
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人