机器学习Day2——线性模型

本文介绍了机器学习中的线性模型,包括基本形式、模型求解以及在分类任务中的应用——对数几率回归。线性模型通过属性的线性组合进行预测,使用最小二乘法求解最优解,并在分类问题中借助对数几率函数进行转换。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基本形式

给定由d个属性描述的示例 x=(x1,x2,…,xd),其中xi是x在第i个属性上的取值,线性模型试图学的一个通过属性的线性组合来进行预测的函数,即
在这里插入图片描述
一般用向量形式写成
在这里插入图片描述
其中 w=(w1,w2,…,wd),w和b学得之后,模型就可以确定了。

模型求解

我们试图学得
在这里插入图片描述
这称为”多元线性回归“。
我们需要求解最优解,即f(xi)-yi的值趋向于0,利用最小二乘法

在这里插入图片描述
再把标记(预期结果)写成向量形式

在这里插入图片描述
则有
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

然而,在显示任务中往往不是满秩矩阵,此时可以解出多个w,他们都能使均方误差最小化,选择哪个解作为输出,将由学习算法的归纳偏好决定,常见的做法是引入正则化项。

广义线性模型
考虑单调可微函数g(·),另在这里插入图片描述
其中g(·)称为联系函数,对数线性回归是广义线性模型在g(·)=ln(·)时的特例。

对数几率回归(线性模型在分类任务中的变换)

在广义线性模型中,我们只需要找到一个单调可微函数,即可作为一般的线性模型来求解。

考虑二分类任务,其输出标记y∈{0,1},而线性回归模型产生的预测值是实值,于是,我们需要将z转换为0/1值。最理想的是”单位阶跃函数“
在这里插入图片描述
但是这并不是一个连续的函数,不可微,于是我们可以找一个一定成都上近似单位阶跃函数的”替代函数“。对数几率函数正是这样一个常用的替代函数:
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

### 量化投资中的机器学习模型 在金融领域,尤其是量化投资方面,机器学习技术被广泛应用来预测市场趋势、评估风险以及优化投资组合。Jannes Klaas在其著作《Machine Learning for Finance》中探讨了如何利用数据算法和深度学习方法构建有效的金融市场分析工具[^1]。 #### 常见的机器学习模型及其应用 1. **线性回归和支持向量机** 对于简单的股票价格预测任务,可以采用线性回归或支持向量机(SVM)这的监督学习模型来进行建模。这些模型能够基于历史股价和其他宏观经济指标建立关系,并对未来的价格变动做出预估。 2. **决策树与随机森林** 决策树是一种直观易懂的方法论,在处理分类问题上表现良好;而通过集成多个弱分类器形成的随机森林则提高了泛化能力和稳定性。这类模型可用于识别影响资产价值的关键因素并据此制定交易策略。 3. **神经网络及深度学习框架** 随着计算能力的增长和技术进步,深层架构如卷积神经网络(CNNs),循环神经网络(RNNs)及其变体LSTM/GRU逐渐成为主流选择之一。它们特别适合捕捉时间序列特征,从而更好地理解复杂模式下的市场价格波动规律。 4. **强化学习** 强化学习提供了一种全新的视角去解决动态环境下的最优化控制难题——即寻找最优的投资政策使得长期累积收益达到最大值。DQN(Deep Q-Network), PPO(Policy Gradient Methods with Proximal Policy Optimization)等都是当前研究热点所在。 ```python import numpy as np from sklearn.linear_model import LinearRegression # 构造简单线性回归示例 X = np.array([[1], [2], [3]]) # 特征变量(例如日期) y = np.array([1, 2, 3]) # 目标变量(例如收盘价) model = LinearRegression() model.fit(X, y) predicted_price = model.predict(np.array([[4]])) print(f'Predicted price at day 4 is {predicted_price}') ``` 上述代码展示了使用`scikit-learn`库实现基本的线性回归预测功能。当然实际应用场景下还需要考虑更多维度的数据清洗、特征工程等工作环节。 #### 投资组合优化 除了单个证券的选择外,合理的资金配置同至关重要。多周期均值-方差理论指出投资者应寻求一种平衡方案既追求高回报又要规避不必要的风险暴露。具体而言就是求解如下规划问题: \[ \min_{w} \frac{1}{T}\sum^{T}_{t=1}(r_t-\mu)^Tw\Sigma w^T+\lambda(\bar{\mu}-R_f) \] 这里\( r_t \)代表各期收益率向量,\( \Sigma \)为协方差矩阵,w表示权重系数。\(\lambda\)作为拉格朗日乘子用于调整期望超额收益水平相对于无风险利率 \( R_f \)[^2].
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值