使用结果加权学习估算个性化治疗规则

原创于 2025-12-06 09:57:08 发布 · 512 阅读

7 ·

CC 4.0 BY-SA版权

License CC BY-NC-SA 4.0 / 自豪地采用谷歌翻译

文章标签：

#学习

榛樿鍒嗙被专栏收录该内容

804 篇文章

订阅专栏

原文：towardsdatascience.com/estimating-individualized-treatment-rules-using-outcome-weighted-learning-1095b3c2d6e9?source=collection_archive---------8-----------------------#2024-03-31

一种用于为患者制定个性化治疗的非参数方法

https://medium.com/@nadavgoo?source=post_page---byline--1095b3c2d6e9--------------------------------https://towardsdatascience.com/?source=post_page---byline--1095b3c2d6e9-------------------------------- Nadav Har-Tuv

·发表于 Towards Data Science ·阅读时间 6 分钟·2024 年 3 月 31 日

–

在许多疾病中，不同的患者对不同的治疗反应不同。对一些患者有效的药物可能对其他具有不同特征的患者无效。因此，通过根据患者的特征进行治疗，而不是对所有患者采用相同治疗，可以显著提高医疗效果。

在本文中，我将尝试向你展示如何训练一个机器学习模型来学习最优的个性化治疗。

本文讨论的是个性化医疗领域，但其结果可以应用于任何领域。例如：不同的人对社交媒体上的不同广告反应不同，因此，在同一产品有多个广告的情况下，如何选择向哪些观众展示哪个广告？

该方法在任何必须给出治疗但每个样本个体只能接受一种治疗的情况下非常有用，因此你无法知道该个体如果接受其他治疗会有怎样的反应。

让我们形式化这个问题

进行了一项实验，比较了两种（或更多）治疗方法。我们将它们命名为 T = 1,2……一个协变量向量 X 表示每个患者。每个患者i具有一个协变量向量 Xᵢ，接受了治疗 Tᵢ，并且有一个记录的治疗反应 Rᵢ。

例如，假设你想测试三种不同的糖尿病药物，我们将这些药物命名为“1”、“2”、“3”。

我们有一个名为 Esther 的患者，她 64 岁，8 年前被诊断为糖尿病，体重 65 公斤，身高 1.54 米。Esther 接受了药物“1”，并且在服用新药后，她的血糖下降了 10 个点。

在我们的例子中，我们对 Esther 的数据点是 X = {女性，64 岁，诊断 8 年，65 公斤，1.54 米}，T = “1”，R = 10。

在这种设定下，我们希望学习一个最优的决策规则 D(x)，它为每个患者分配治疗“1”、“2”或“3”，以优化该患者的治疗效果。

解决这个问题的旧方法是将结果建模为数据和治疗的函数，并将预测结果表示为f(X,T)。一旦我们有了模型，我们就可以创建一个决策规则 D(x)：我们计算f(X,1)，f(X,2)，和f(X,3)，并给予患者能够最大化其期望结果的药物。

当我们对生成数据的基础模型有相当好的理解时，这个解决方案是有效的。在这种情况下，我们只需要一些微调来找到适合我们案例的最佳参数。

然而，如果模型不好，那么我们的结果也会不好，无论手头的数据有多少。

我们能否提出一个不带参数的决策规则，并且不假设数据与治疗结果之间有任何先验关系？

答案是肯定的，我们可以使用机器学习找到一个不假设反应和治疗之间关系的决策规则！

使用 Outcome Weighted Learning（OWL）方法解决非参数问题

解决这个问题的方法是解决一个分类问题，其中标签是实验中给予的治疗，每个数据点i的权重为 Rᵢ/π(Tᵢ|Xᵢ)，其中π(Tᵢ|Xᵢ)是给定你有特征 Xᵢ的情况下，获得治疗 Tᵢ的倾向性，这可以从数据中计算出来。

这有道理，因为我们试图遵循实验的结果，但仅仅是最有效的地方。我们通过倾向性进行除法，是为了修正类别大小的偏差。如果你学过强化学习，那么这个整个过程对你来说应该是熟悉的。

这里是一个使用支持向量机（SVM）的猫头鹰分类器的例子。你可以自由选择任何你喜欢的分类器。

import numpy as np
from sklearn.linear_model import LogisticRegression
from sklearn import svm

def owl_classifier(X_train, T, R, kernel, gamma):
  n = len(T)
  pi = np.zeroes(n) #Initialize pi as a vector of zeroes
  probs = LogisticRegression().fit(X_train, T).predict_proba(X_train)#This is a n*unique(T) matrix that gives every person the probability of getting each treatment
  for t in np.unique(T):
    pi += probs[,t]*(T==t) #Every data point is assigned the probability of getting the treatment that it got, given the covariates
  clf = svm.SVC(kernel = kernel, gamma = gamma) # initialize an svm classifier, the parameters need to be found by cross validation
  clf.fit(X_train, T, sample_weight = R/pi) # fit the classifier with the treatments as labels and R/pi as sample weights

用于测试 OWL 方法的仿真

模拟数据可以用来测试猫头鹰方法。我们创建奖励函数，以便知道每个患者的最佳治疗方案。然后，我们可以在数据上训练 OWL 分类器，并检查其与最佳分类器的契合程度。

例如：

我创建了 50 个特征，它们都是从 U([-1,1])分布中采样的。我随机均匀地给予患者三种治疗方案之一{1,2,3}。

响应函数是从 N(μ, 1)分布中采样的，其中μ = (X₁ + X₂)*I(T=1) + (X₁ — X₂)*I(T=2) + (X₂-X₁)*I(T=3)

# This code block creates the data for the simulation
import numpy as np

n_train = 500 # I purposely chose a small training set to simulate a medical trial
n_col = 50 # This is the number of features
n_test = 1000
X_train = np.random.uniform(low = -1, high = 1, size = (n_train, n_col))
T = np.random.randint(3, size = n_train) # Treatments given at random uniformly
R_mean = (X_train[:,0]+X_train[:,1])*(T==0) + (X_train[:,0]-X_train[:,1])*(T==1) + (X_train[:,1]-X_train[:,0])*(T==2)
R = np.random.normal(loc = R_mean, scale = .1) # The stanadard deviation can be tweaked
X_test = np.random.uniform(low = -1 , high = 1, size = (n_test, n_col))

# The optimal classifier can be deduced from the design of R
optimal_classifier = (1-(X_test[:,0] >0)*(X_test[:,1]>0))*((X_test[:,0] > X_test[:,1]) + 2*(X_test[:,1] > X_test[:,0]))

不难看出，最佳治疗方案是在 X₁和 X₂都为正时给治疗 1。如果它们都为负，则当 X₂ < X₁时给予治疗 2，当 X₁ < X₂时给予治疗 3。如果 X₁为正且 X₂为负，则给予治疗 2。如果 X₂为正且 X₁为负，则给予治疗 3。

或者我们可以通过图像展示这个内容。这些是最佳治疗的不同范围，针对 X₁和 X₂的范围展示：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/ae2b6be38b81bf4c36916484382a510e.png

X₁、X₂组合的最佳治疗范围

我采样了 500 个数据点，包含 50 个特征，并使用我上面描述的奖励函数。我用高斯（‘rbf’）核函数拟合了一个 OWL 分类器，并得到了以下分类结果，我将其可视化以展示 X₁和 X₂的值：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/77bcf965453c276e5caa43f081138e22.png

针对 X₁、X₂值的治疗组分类可视化

# Code for the plot 
import seaborn as sns

kernel = 'rbf'
gamma = 1/X_train.shape[1] 
# gamma is a hyperparameter that has to be found by cross validation but this is a good place to start
D = owl_classifier(X_train, T, R, kernel, gamma)
prediction = D.predict(X_test)
sns.scatterplot(x = X_test[:,0], y = X_test[:,1], c = prediction )