A股风格因子看板（2024.09 第13期）

最新推荐文章于 2025-12-10 14:00:36 发布

原创最新推荐文章于 2025-12-10 14:00:36 发布 · 319 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#数据库 #数据仓库 #大数据 #数据库架构 #python

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Tinysoft_SH

关注关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

精选资源

Y09_实现选股.zip_python选股_因子选股_因子选股 python_多因子选股_选股

07-15

多因子算法：采用多重因子筛选的Python算法

20121204-招商证券-量化选股因子跟踪月报：大小盘风格转变，流动性因子表现出众.pdf

06-19

4. 转变的市场风格：报告指出在2012年12月市场风格发生了转变，即从之前的某种风格转变为对大小盘股的偏好，从而影响了特定因子的表现。例如，Size因子（通常用来衡量公司规模大小）在市场风格转变下表现不佳。 5. ...

参与评论您还未登录，请先登录后发表或查看评论

A股数据存储实战：Parquet技术深度解析

船长Q的博客

03-04

1548

Parquet+OSS混合架构优化与智能压缩技术赋能，5.8:1压缩比、70%延迟降低，构建高效金融数据中台。

加班成常态，1024程序员节福利去哪儿了，真相令人深思

Instrulink的博客

09-28

763

auto-generated

多因子选股之有效因子策略源码.py

06-12

多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。

UBS报告：中国A 股量化研究-风格因子月报（29页）.zip

09-11

《UBS报告：中国A股量化研究-风格因子月报》是瑞士银行(UBS)发布的一份深度研究报告，旨在探讨中国A股市场中的量化投资策略及其相关风格因子的表现。这份29页的报告深入剖析了中国股市的量化投资领域，为投资者提供...

20201122-华泰证券-转债策略周报：来自转债风格因子的指引.pdf

04-08

20201122-华泰证券-转债策略周报：来自转债风格因子的指引.pdf

基于Java旅游信息推荐系统(源码+数据库+文档)

JIngJaneIL的博客

12-08

896

本文介绍了基于SpringBoot+Vue的旅游信息推荐系统和学生成绩管理系统开发项目。系统采用前后端分离架构，后端使用SpringBoot框架简化企业级开发，前端采用Vue.js实现响应式界面，数据库选用MySQL。文章详细说明了系统设计原则、技术选型理由，并提供了代码示例和测试案例。项目包含完整功能演示视频，所有源码经过验证可正常运行。同时提供最新计算机毕业设计选题参考，文末附有源码获取方式。系统适用于大学生项目实战开发，具有模块化设计、安全性强等特点。

Windows 64位安装MySQL5.7.44

宁德的小码农

12-09

283

本文提供了MySQL 5.7.44 64位版本在Windows系统下的详细安装配置指南。主要内容包括：从官方下载MySQL压缩包并解压到指定目录；创建my.ini配置文件，包含字符集设置、性能优化参数、日志配置等关键选项；通过命令行初始化数据库并记录临时密码；安装MySQL服务并启动；使用临时密码登录后修改root密码；最后验证分区模块是否启用。配置文件中特别优化了InnoDB缓冲池大小、查询缓存等参数，适合中大型应用场景，同时提供了日志记录和严格SQL模式等安全设置。

【赵渝强老师】国产金仓数据库的体系架构

赵渝强老师优快云博客主页

12-06

1101

金仓数据库（KingbaseES）作为国产数据库代表，其体系结构分为逻辑和物理存储两部分。逻辑存储包括数据库对象及其标识符，物理存储涵盖数据文件、日志文件和控制文件等核心组件。数据文件以OID命名并支持自动拆分，日志文件分为运行日志、WAL预写日志、事务日志和服务器日志四类，其中WAL日志采用16MB分段机制保障数据安全。控制文件记录数据库关键运行信息，可通过专用工具查看。该架构基于PostgreSQL开发，兼具开源特性与自主创新，体现了国产数据库在技术实现上的成熟性。

Spring Boot 项目集成模块- 2

qq_34823185的博客

12-07

1081

摘要 Spring Cloud LoadBalancer 提供了客户端负载均衡功能，支持轮询、随机等策略，与OpenFeign集成良好。整合步骤包括添加依赖、启用注解、配置策略，可通过RestTemplate或OpenFeign使用。相比Ribbon更轻量且支持响应式编程。 Spring Boot Cache 简化了缓存集成，支持Redis等多种实现。通过@EnableCaching启用，使用@Cacheable、@CachePut、@CacheEvict等注解管理缓存，可提升性能并降低数据库负载。配置简单

在MySQL中，gtid_purged 的初始化和更新机制

翔云

12-07

751

摘要：MySQL的gtid_purged变量记录已提交但被清除事务的GTID集合，其计算遵循gtid_purged = gtid_executed - 当前二进制日志中的GTID。初始化时通过扫描二进制日志确定，更新时机取决于服务器角色和配置：主库和开启log_slave_updates的从库在清理日志时更新，未开启的从库在事务提交时实时更新。该变量在复制环境搭建、备份恢复中起关键作用，错误配置可能导致复制中断。理解其机制对MySQL运维至关重要，特别是在处理GTID复制故障时。

二十三种设计模式(七)--桥接模式

万波的技术博客

12-06

204

桥接模式是一种结构型设计模式，用于分离多个维度的功能实现，使每个维度都能独立扩展。该模式通过抽象与实现的分离，避免了类数量的指数级增长。以数据库工具为例，将数据库类型（MySQL、Oracle等）和执行方式（普通、预编译等）两个维度拆分，通过抽象类引用接口的方式实现桥接。这样新增数据库类型或执行方式时只需添加相应类，而不影响其他维度，提高了系统的可扩展性和维护性。

第10篇：Redis监控、运维与故障排查

小雨下雨的雨

12-10

461

Redis监控与运维实践摘要本文系统讲解了Redis监控运维的关键要点：1）监控核心指标（QPS、延迟、内存、连接数）；2）使用INFO命令、redis-cli工具和Prometheus进行监控；3）日志配置与分析（服务器日志、慢查询）；4）性能测试与故障排查流程；5）常见问题处理（内存不足、性能下降等）；6）运维最佳实践（告警规则、备份策略）。通过建立完善的监控体系，可有效保障Redis稳定运行，快速定位解决问题。

基于Java二手交易管理系统(源码+数据库+文档)

JIngJaneIL的博客

12-05

902

本文介绍了一个基于SpringBoot+Vue的二手交易管理系统。系统采用前后端分离架构，后端使用SpringBoot框架简化开发流程，前端采用Vue.js实现响应式界面，数据库选用MySQL存储数据。文章展示了系统功能模块、技术选型原则、代码实现示例及测试用例，并提供了毕业设计选题参考和源码获取方式。系统设计遵循用户体验优先原则，具备完善的导航结构和一致性设计，支持商品管理等核心功能，适用于中小规模的二手交易场景。

基于微信小程序的篮球场馆预订系统【源码文末联系】

2402_84112588的博客

12-06

879

随着全民健身战略的深入推进，篮球运动在国内广泛普及，篮球爱好者数量持续增长，然而场馆资源供需矛盾日益突出。传统线下预订方式存在信息不对称、效率低下、管理混乱等问题，用户常面临场地难找、预约流程繁琐、支付不透明等痛点，场馆运营方也受困于人工管理成本高、资源调度不科学、数据统计滞后等挑战。

汽车EDI：埃贝赫Eberspächer EDI 需求分析

最新发布

EDI电子数据交换 | 知行软件

12-10

627

埃贝赫Eberspächer是全球领先的汽车热管理与排气技术Tier 1供应商，是一家拥有159年历史的德国家族企业，总部位于德国巴登-符腾堡州埃斯林根（Esslingen am Neckar）。截至2024财年，公司全球销售额约80亿欧元，员工超过11,000人，在欧洲、北美、南美、中国、印度、南非等地拥有50多个生产基地和18个研发中心。其高度重视供应链数字化与可追溯性，对全球供应商实施严格的EDI规范要求，以实现准时制（JIT/JIS）交付和全链条透明化管理。

[MySQL数据库] 索引

aeljg的博客

12-05

992

MySQL索引是一种提高查询效率的数据结构，通过特定规则组织数据，类似书籍目录。索引能加速查询但会增加存储开销并降低增删改速度。MySQL自动为主键、外键等约束创建索引，也可手动创建。常见索引类型包括主键、唯一和普通索引，创建方式多样。索引应建在高频查询列上，过多索引会降低性能。传统数据结构如二叉搜索树、哈希表等因查询效率或范围查询限制不适合索引。MySQL采用B+树作为索引结构，其特点是数据有序、非叶节点仅作索引、叶节点链接便于范围查询。B+树三层结构可支持约2200万条记录的高效查询，仅需三次IO操作。

Alibaba linux 3安装LAMP(3)

model2005的专栏

12-08

290

在上安装 MySQL，MySQL 使用了较新的 GPG 签名算法，而 Alibaba Linux 3 的rpmgpg版本较旧，经常会遇到GPG公钥未正确导入或版本不匹配。MariaDB是Ali维护的数据库，功能类似MySql。

根据这篇文献，给出相应的具体的数据选取方法以及完成全文研究的详细代码附带注释。深度学习与中国股票市场因子...——基于生成式对抗网络方法_马甜.pdf

03-16

<think>好的，我现在需要帮助用户解决他们的请求。他们提到了一篇名为《深度学习与中国股票市场因子——基于生成式对抗网络方法》的文献，希望根据这篇文献提供具体的数据选取方法、完成全文研究的详细代码以及注释。同时，用户还希望用中文回答，结构清晰，逐步解决问题，并确保回答真实可靠。首先，我需要思考用户的具体需求。他们可能是在进行类似的研究，需要参考该文献的方法和代码实现。但这里有几个问题需要注意： 1. **文献获取与版权问题**：用户提到的文献是“马甜”所写的，可能是一篇学术论文。由于我无法访问具体的文献内容，直接根据标题提供数据方法和代码可能会有偏差。需要提醒用户这一点，避免误导。 2. **数据选取方法的通用性**：在量化金融和深度学习领域，数据选取通常包括股票价格、财务指标、市场数据等。常见的因子可能包括动量、价值、规模等。GAN在金融中的应用可能涉及生成合成数据或因子建模。需要给出一般性的建议，同时建议用户参考原文的具体方法。 3. **代码实现的通用框架**：生成式对抗网络（GAN）的代码通常包括生成器和判别器的构建、数据预处理、训练循环等。但具体实现会根据研究目标有所不同，例如是否用于因子合成、价格预测等。需要提供一个示例代码框架，并注明可能需要调整的部分。 4. **注释的详细性**：代码注释需要解释每一步的作用，帮助用户理解。同时要指出关键参数和可能需修改的地方，以适应用户的具体数据和研究需求。 5. **可能的误解**：用户可能期望得到与文献完全一致的方法和代码，但受限于信息不足，需明确说明提供的是一般性方法，并建议用户查阅原文细节。接下来，我需要组织回答的结构，确保符合用户的要求：分步骤说明数据选取方法，然后给出代码框架和注释。同时，需要加入注意事项，提醒用户注意文献的具体细节和可能的调整。需要验证的是，常见的GAN在金融中的应用方法，例如使用GAN生成股票数据或增强因子模型，这可能涉及到时间序列数据的处理。数据预处理步骤如标准化、滑动窗口等可能是必要的。此外，因子构建的具体方法可能包括传统多因子模型的指标，结合深度学习特征。在代码部分，使用PyTorch或TensorFlow实现GAN是常见的。需要确保代码结构正确，包括生成器和判别器的网络结构、损失函数、优化器等。同时，数据加载部分需要适配用户的数据格式，可能需要进行调整。最后，需要检查回答是否符合系统级指令：数学公式使用$...$，独立公式用$$...$$，正确使用LaTeX语法，结构清晰，用中文回答。同时确保回答真实可靠，不虚构文献内容。</think>由于我无法获取《深度学习与中国股票市场因子——基于生成式对抗网络方法》这篇文献的具体内容，以下将结合通用深度学习在量化金融中的应用方法，提供**数据选取与代码实现的参考框架**。建议您结合原文方法论进行细节调整。 --- ### 一、数据选取方法（通用性建议） 1. **因子类型选择** - **传统因子**：市值（`size`）、动量（`momentum`）、价值（`value`）、波动率（`volatility`）等 - **技术指标**：MACD、RSI、布林带等 - **财务数据**：ROE、资产负债率、每股收益（EPS） - **市场数据**：日收益率、成交量、换手率 2. **数据预处理** - **缺失值处理**：线性插值或行业均值填充 - **标准化**：对因子进行`z-score`标准化 - **去极值**：Winsorize处理（如$3\sigma$截尾） - **时间窗口**：滑动窗口生成时序特征（如过去$T=60$日数据） 3. **GAN输入输出设计** - **生成器输入**：噪声向量$z \sim \mathcal{N}(0,1)$ - **判别器输入**：真实因子矩阵$X \in \mathbb{R}^{N \times D}$（$N$股票，$D$因子） --- ### 二、代码框架（PyTorch实现） ```python import torch import torch.nn as nn import pandas as pd import numpy as np # 数据加载与预处理 class StockDataset(torch.utils.data.Dataset): def __init__(self, data_path, window_size=60): self.data = pd.read_csv(data_path) self.factors = ['size', 'momentum', 'volatility'] # 根据文献替换为实际因子 self.window = window_size # 数据标准化 self.data_normalized = (self.data[self.factors] - self.data[self.factors].mean()) / self.data[self.factors].std() def __len__(self): return len(self.data) - self.window def __getitem__(self, idx): # 提取时间窗口内的因子矩阵 sample = self.data_normalized.iloc[idx:idx+self.window].values return torch.FloatTensor(sample) # 生成器网络 class Generator(nn.Module): def __init__(self, latent_dim=100, output_dim=3): super().__init__() self.model = nn.Sequential( nn.Linear(latent_dim, 128), nn.LeakyReLU(0.2), nn.LayerNorm(128), nn.Linear(128, 256), nn.LeakyReLU(0.2), nn.Linear(256, output_dim) # 输出维度=因子数量 ) def forward(self, z): return self.model(z) # 判别器网络 class Discriminator(nn.Module): def __init__(self, input_dim=3): super().__init__() self.model = nn.Sequential( nn.Linear(input_dim, 256), nn.LeakyReLU(0.2), nn.Linear(256, 128), nn.LeakyReLU(0.2), nn.Linear(128, 1), nn.Sigmoid() ) def forward(self, x): return self.model(x) # 训练循环 def train_gan(dataloader, generator, discriminator, epochs=1000): opt_g = torch.optim.Adam(generator.parameters(), lr=0.0002) opt_d = torch.optim.Adam(discriminator.parameters(), lr=0.0002) loss_fn = nn.BCELoss() for epoch in range(epochs): for real_data in dataloader: batch_size = real_data.size(0) # 训练判别器 real_labels = torch.ones(batch_size, 1) fake_labels = torch.zeros(batch_size, 1) # 真实数据损失 d_real_loss = loss_fn(discriminator(real_data), real_labels) # 生成数据损失 z = torch.randn(batch_size, latent_dim) fake_data = generator(z) d_fake_loss = loss_fn(discriminator(fake_data.detach()), fake_labels) d_total_loss = d_real_loss + d_fake_loss opt_d.zero_grad() d_total_loss.backward() opt_d.step() # 训练生成器 z = torch.randn(batch_size, latent_dim) fake_data = generator(z) g_loss = loss_fn(discriminator(fake_data), real_labels) opt_g.zero_grad() g_loss.backward() opt_g.step() ``` --- ### 三、关键注意事项 1. **文献适配**： - 若原文使用**条件GAN**（cGAN），需在输入中加入标签信息（如行业分类） - 若用于**因子增强**，需设计生成数据与原始数据的融合策略 2. **参数调优** - 噪声维度$z$：通常取50-200维 - 学习率：使用Adam优化器时建议$lr \in [0.0001, 0.001]$ - 批量归一化：可提升生成稳定性 3. **评价指标** - **因子有效性**：计算生成因子IC值（信息系数） - **多样性检验**：使用JS散度比较生成数据与真实数据分布建议结合原文补充模型结构细节（如是否使用LSTM处理时序特征）及具体因子列表。如需进一步优化代码细节，请提供文献中关键方法描述。