read dataset

OPEN DATASET FNAME FOR INPUT IN BINARY MODE.

  READ DATASET FNAME INTO TEXT2 LENGTH LENG.

 

leng 能够判断 text2 的长度

 

DATA FNAME(60) VALUE 'myfile'.

DATA: TEXT1(4) VALUE '1234    ',
      TEXT2(8) VALUE '12345678',
      TEXT3(2),
      LENG TYPE I.

OPEN DATASET FNAME FOR OUTPUT IN TEXT MODE.
   TRANSFER: TEXT1 TO FNAME,
             TEXT2 TO FNAME.
CLOSE DATASET FNAME.

OPEN DATASET FNAME FOR INPUT IN TEXT MODE.
   DO 2 TIMES.
      READ DATASET FNAME INTO TEXT3 LENGTH LENG.
      WRITE: / TEXT3, LENG.
   ENDDO.
CLOSE DATASET FNAME.

The output appears as follows:

12 4

12 8

This example writes the strings TEXT1 and TEXT2 to the file "myfile" in text mode. They are then read into the string TEXT3 (length 2). The amount of memory occupied by the lines is read into the field LENG.

### 如何验证数据集已成功加载 为了确保数据集已经成功加载,可以通过以下几个方面来完成验证: #### 1. 数据形状检查 通过打印数据的维度或大小,可以初步判断数据是否被正确加载。例如,在 Python 中使用 Pandas 库加载数据后,可以调用 `shape` 属性查看数据的行列数。 ```python import pandas as pd data = pd.read_csv('watermelon_dataset.csv') # 假设这是西瓜数据集文件路径 print(data.shape) # 输出 (样本数量, 特征数量) ``` 如果输出的结果是一个合理的二维元组,则说明数据可能已被正确加载[^2]。 #### 2. 查看前几行数据 利用 `head()` 方法显示数据集中前几行的内容,以便直观地观察数据结构和内容是否符合预期。 ```python print(data.head()) ``` 此方法可以帮助确认列名、数据类型以及部分实际值是否合理。 #### 3. 统计描述分析 通过对数据进行统计描述,进一步验证数据分布特性是否正常。Pandas 提供了便捷的方法来进行这一操作。 ```python print(data.describe()) # 对数值型特征生成基本统计数据 ``` 这些统计数据应与原始数据集文档中的描述一致,从而证明数据未发生意外丢失或错误转换。 #### 4. 缺失值检测 检查是否存在缺失值也是验证过程的一部分,因为某些情况下即使数据看似加载成功,也可能存在大量缺失项影响后续建模效果。 ```python print(data.isnull().sum()) # 检查每列是否有缺失值及其总数 ``` 任何异常高的缺失比例都提示潜在问题需解决。 综上所述,结合上述手段能够较为全面地验证数据集是否成功加载并处于可用状态。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值