PyBroker项目实战：创建自定义数据源实现量化交易策略-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00197/article/details/148862499

PyBroker项目实战：创建自定义数据源实现量化交易策略

pybroker Algorithmic Trading in Python with Machine Learning 项目地址: https://gitcode.com/gh_mirrors/py/pybroker

前言

在量化交易领域，数据是策略开发的基础。PyBroker作为一款功能强大的Python量化交易框架，提供了灵活的数据源接入机制。本文将深入讲解如何在PyBroker中创建和使用自定义数据源，帮助开发者突破内置数据源的限制，实现更个性化的量化交易策略。

为什么需要自定义数据源

PyBroker虽然内置了多种数据源（如Yahoo Finance、Alpaca等），但在实际业务场景中，我们经常需要：

使用本地存储的历史交易数据
接入私有数据API
整合第三方数据服务
处理特殊格式的市场数据

这时，自定义数据源就成为了必要选择。

自定义数据源实现原理

PyBroker通过DataSource基类提供了数据源的标准接口，开发者只需继承该类并实现核心方法即可创建自定义数据源。

核心方法解析

_fetch_data方法是自定义数据源的核心，需要实现以下功能：

def _fetch_data(self, symbols, start_date, end_date, _timeframe, _adjust):
    # 实现数据获取逻辑
    # 返回包含指定symbols在指定日期范围内的数据
    return filtered_data

该方法接收以下参数：

symbols: 需要获取数据的证券代码列表
start_date: 开始日期
end_date: 结束日期
_timeframe: 数据时间粒度
_adjust: 是否调整价格

实战：CSV数据源实现

下面我们通过一个完整的CSV数据源实现案例，演示自定义数据源的开发流程。

1. 创建CSVDataSource类

import pandas as pd
import pybroker
from pybroker.data import DataSource

class CSVDataSource(DataSource):
    
    def __init__(self):
        super().__init__()
        # 注册自定义列
        pybroker.register_columns('rsi')
    
    def _fetch_data(self, symbols, start_date, end_date, _timeframe, _adjust):
        # 从CSV文件加载数据
        df = pd.read_csv('data/prices.csv')
        # 筛选指定symbols
        df = df[df['symbol'].isin(symbols)]
        # 转换日期格式
        df['date'] = pd.to_datetime(df['date'])
        # 筛选日期范围
        return df[(df['date'] >= start_date) & (df['date'] <= end_date)]

2. 关键点说明

数据列注册：通过register_columns方法注册自定义指标列（如RSI），使PyBroker能够识别和使用这些列。
必备字段：返回的DataFrame必须包含以下基础字段：
- symbol: 证券代码
- date: 日期时间
- open: 开盘价
- high: 最高价
- low: 最低价
- close: 收盘价
数据过滤：需要根据输入参数正确过滤symbols和日期范围。

3. 使用自定义数据源

创建数据源实例并查询数据：

csv_data_source = CSVDataSource()
df = csv_data_source.query(['MCD', 'NKE', 'DIS'], '6/1/2021', '12/1/2021')
print(df.head())

在策略中使用自定义数据源

自定义数据源可以无缝集成到PyBroker的策略中：

from pybroker import Strategy

def rsi_strategy(ctx):
    pos = ctx.long_pos()
    if not pos and ctx.rsi[-1] < 30:  # 使用自定义rsi指标
        ctx.buy_shares = 100
    elif pos and ctx.rsi[-1] > 70:
        ctx.sell_shares = pos.shares

strategy = Strategy(csv_data_source, '6/1/2021', '12/1/2021')
strategy.add_execution(rsi_strategy, ['MCD', 'NKE', 'DIS'])
result = strategy.backtest()
print(result.orders)

直接使用DataFrame的替代方案

如果不需要完整的DataSource功能，可以直接将Pandas DataFrame传递给Strategy：

df = pd.read_csv('data/prices.csv')
df['date'] = pd.to_datetime(df['date'])

# 注册自定义列
pybroker.register_columns('rsi')

# 创建策略时直接传入DataFrame
strategy = Strategy(df, '6/1/2021', '12/1/2021')