精简python代码 ,减少for循环

这段代码用于生成训练数据集,基于Search_list和Title_list,将相同search值对的样本标记为1.0,不同值对的样本标记为0.0。它使用了random.randint来选择不同的索引,并利用pandas的groupby函数对数据进行分组。
部署运行你感兴趣的模型镜像
# for idx in range(train_size):
#     train_data.append(InputExample(texts=[Search_list[idx], Title_list[idx]], label=1.0))
#     # if idx in m_list:
#     m_list = []
#     for m in range(0,train_size):
#         if Search_list[idx] == Search_list[m]:
#             m_list.append(m)
#         else:
#             break
#     j = randint(0, range(train_size))
#     while j in m_list:
#         j = randint(0, range(train_size))
#     train_data.append(InputExample(texts=[Search_list[idx], Title_list[j]], label=0.0))

#更改为 

train_data = []
train_data_0 = []
for idx,row in f.groupby('search'):
    for m in row.index:
        train_data.append(InputExample(texts=[Search_list[m], Title_list[m]], label=1.0))
        j = randint(0, train_size)
        while j in row.index:
            j = randint(0, train_size)
        train_data_0.append(InputExample(texts=[Search_list[m], Title_list[j]], label=0.0))

 

 

您可能感兴趣的与本文相关的镜像

Python3.10

Python3.10

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值