用各种回归模型进行建模之前最重要的就是处理数据,今天我想对机票价格和时间进行建模,自变量是时间。我用了list放时间数据,同样用list放价格数据。看下时间数据的数据格式:
然后进行fit
clf=linear_model.Ridge(alpha=1.0)
for j in range(T):
clf.fit(label0,minprice)发现会报错:
大概意思就是我的自变量shape只有1~但是明明我是一个不止一个字段的list啊!!仔细思考一下明白了:处理的时候python把整个list当做一个整体处理了,这样就不符合自变量和因变量大小相同的要求了。。。
接着找了一下别人处理数据的方式
# Function to get data
def get_data(file_name):
data = pd.read_csv(file_name)
X_parameter = []
Y_parameter = []
for single_square_feet ,single_price_value in zip(data['square_feet'],data['price']):
X_parameter.append([float(single_square_feet)])
Y_parameter.append(float(single

在使用Python进行回归分析时,遇到数据处理的挑战。尝试用时间作为自变量对机票价格建模,发现将时间数据(如'2015-09-21')存储在list中会导致形状错误。解决方案包括将时间数据转换为嵌套list,如[['2015-09-21'], ['2015-09-22']],或者使用mat().T转换为矩阵。这两种方法确保了自变量与因变量大小匹配。"
94038908,5764697,Java多线程基础:Thread类API详解,"['Java', '多线程', '并发编程', 'Thread']
最低0.47元/天 解锁文章
5万+

被折叠的 条评论
为什么被折叠?



