布尔数据集构建

Python实现超市购买记录转布尔数据集

最新推荐文章于 2025-12-04 16:00:21 发布

原创最新推荐文章于 2025-12-04 16:00:21 发布 · 274 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #开发语言

机器学习与实现专栏收录该内容

11 篇文章

订阅专栏

##将以下超市的购买记录（已用一个"超市购买记录.txt"来存放，读取该文件即可）

##注意：文件内容存放与下列展示一致，即顿号分隔，“##”号不是文件内容，文件编码为utf-8）：

## I1、西红柿、排骨、鸡蛋、毛巾、水果刀、苹果

## I2、西红柿、茄子、水果刀、香蕉

## I3、鸡蛋、袜子、毛巾、肥皂、苹果、水果刀

## I4、西红柿、排骨、茄子、毛巾、水果刀

## I5、西红柿、排骨、酸奶、苹果

## I6、鸡蛋、茄子、酸奶、肥皂、苹果、香蕉

## I7、排骨、鸡蛋、茄子、水果刀、苹果

## I8、土豆、鸡蛋、袜子、香蕉、苹果、水果刀

## I9、西红柿、排骨、鞋子、土豆、香蕉、苹果

## 将其转换为布尔数据集，其中数据集用数据框Data来表示，数据框中的字段名称即为商品名称，如果商品在某个购买记录中出现用1来表示，否则为0

def return_values():

import pandas as pd

items=['西红柿','排骨','鸡蛋','茄子','袜子','酸奶','土豆','鞋子']#商品名称，也是数据框的字段名

# 读取文件内容

with open('超市购买记录.txt', 'r', encoding='utf-8') as file:

lines = file.readlines()

# 初始化一个空的数据框

Data = pd.DataFrame(columns=items)

for line in lines:

# 去除换行符并按顿号分割

record = line.strip().split('、')

# 第一个元素是记录编号（如 I1），不需要

items_in_record = record[1:]

# 创建一个字典，表示当前记录的商品出现情况

row = {item: 1 if item in items_in_record else 0 for item in items}

# 将字典添加到数据框中

Data = Data.append(row, ignore_index=True)

return Data

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。