Summary Ranges

class Solution {
public:
    vector<string> summaryRanges(vector<int>& nums) {
        vector<vector<int>> result;
        vector<int>ivec;
        vector<string>result1;
        int len=nums.size();
        int i=0;
        
        while(i<len)
        {
             if(i<len-1&&nums[i]==nums[i+1]-1)     //注意用了i+1一定要先判断i+1是否为空
            {
                ivec.push_back(nums[i]);
               while(i<len-1&&nums[i]+1==nums[i+1])
                i++;
           
             ivec.push_back(nums[i]);
             result.push_back(ivec);
             ivec.clear();
             i++;
            }
             
            
            else 
            {
             ivec.push_back(nums[i]);
           
             result.push_back(ivec);
             ivec.clear();
             i++;
             }
          
             
        }
        char buffer[10];
        for(int i=0;i<result.size();i++)
        {
           if(result[i].size()==2)
           {    sprintf(buffer, "%d->%d", result[i][0], result[i][1]);    利用sprintf函数进行整数到字符串的转换;
                result1.push_back(string(buffer)) ;
           }
           else
            {   sprintf(buffer, "%d", result[i][0]);
                result1.push_back(string(buffer)) ;
            }
            
       }
       return result1;
    }

};


字符串格式化命令,主要功能是把格式化的数据写入某个字符串中。

int main(void)
{
   char buffer[80];

   sprintf(buffer, "An approximation of Pi is %f\n", M_PI);
   puts(buffer);
   return 0;
}

sprintf的作用是将一个格式化的字符串输出到一个目的字符串中,而printf是将一个格式化的字符串输出到屏幕。sprintf的第一个参数应该是目的字符串,如果不指定这个参数,执行过程中出现     "该程序产生非法操作,即将被关闭...."的提示。
因为C语言在进行字符串操作时不检查字符串的空间是否够大,所以可能会出现数组越界而导致程序崩溃的问题。即使碰巧,程序没有出错,也不要这么用,因为早晚会出错。所以一定要在调用sprintf之前分配足够大的空间给buf。

//把整数123 打印成一个字符串保存在s 中。
sprintf(s, "%d", 123); //产生"123"
可以指定宽度,不足的左边补空格:
sprintf(s, "%8d%8d", 123, 4567); //产生:" 123 4567"
当然也可以左对齐:
sprintf(s, "%-8d%8d", 123, 4567); //产生:"123 4567"
也可以按照16 进制打印:
sprintf(s, "%8x", 4567); //小写16 进制,宽度占8 个位置,右对齐
sprintf(s, "%-8X", 4568); //大写16 进制,宽度占8 个位置,左对齐


import pandas as pd import matplotlib.pyplot as plt import numpy as np from scipy import stats plt.rcParams['font.sans-serif'] = ['SimHei'] # 使用黑体显示中文 plt.rcParams['axes.unicode_minus'] = False # 解决保存图像时负号 '-' 显示为方块的问题 def data_preprocessing(df): df['监测时间'] = pd.to_datetime(df['监测时间'], format='%Y-%m-%d %H') df = df.set_index('监测时间') full_range = pd.date_range(start=df.index.min(), end=df.index.max(), freq='h') df_clean = df.reindex(full_range) valid_ranges = { 'PH 值': (6.0, 9.0), '氨氮排放量': (0.01, 1.5), '化学需氧量排放量': (0.05, 5.0) } for col, (min_val, max_val) in valid_ranges.items(): mask = df_clean[col].between(min_val, max_val) df_clean[col] = df_clean[col].where(mask).interpolate(method='spline', order=3) return df_clean def timing_drawing(df): plt.figure(figsize=(15, 9)) plt.subplot(3, 1, 1) plt.plot(df['PH 值'], color='#1f77b4') plt.title('PH 值时序变化趋势', fontproperties='SimHei') plt.ylabel('PH 值', fontproperties='SimHei') plt.subplot(3, 1, 2) plt.plot(df['氨氮排放量'], color='#2ca02c') plt.title('氨氮排放量时序变化趋势', fontproperties='SimHei') plt.ylabel('mg/L', fontproperties='SimHei') plt.subplot(3, 1, 3) plt.plot(df['化学需氧量排放量'], color='#d62728') plt.title('化学需氧量排放量时序变化趋势', fontproperties='SimHei') plt.ylabel('mg/L', fontproperties='SimHei') plt.tight_layout() plt.savefig('时间序列图.png', dpi=300) plt.show() def statistical_analysis(df): stats_summary = df.describe().transpose() median_values = df.median() stats_summary['median'] = median_values.values stats_summary = stats_summary[['mean', 'median', 'std', 'max', 'min']] # 确保输出的表格有正确的列名和指标名字 stats_summary.index.name = '指标' stats_summary.reset_index(inplace=True) stats_summary.columns = ['指标', '均值', '中位数', '标准差', '最大值', '最小值'] print("统计量分析表:") print(stats_summary.to_markdown(index=False)) if __name__ == "__main__": raw_df = pd.read_excel('B 题附件.xls') processed_df = data_preprocessing(raw_df) processed_df.reset_index().to_excel('预处理数据.xlsx', index=True) timing_drawing(processed_df) statistical_analysis(processed_df) 上述代码只需要PH值、氨氮排放量、化学需氧量排放量
最新发布
03-24
这段代码主要用于处理和分析污水监测数据,特别是针对PH值、氨氮排放量和化学需氧量排放量三个关键指标。以下是代码的关键步骤及其功能: ### 代码概述 1. **导入必要的库**: - `pandas` 用于数据处理和操作。 - `matplotlib.pyplot` 用于绘图。 - `numpy` 提供科学计算支持。 - `scipy.stats` 用于统计分析。 2. **设置Matplotlib参数**: - 设置中文字体为黑体 (`SimHei`),以正确显示中文标签。 - 解决保存图像时负号显示为方块的问题。 3. **数据预处理 (`data_preprocessing`)**: - 将`监测时间`列转换为日期时间格式,并设置为索引。 - 创建完整的时间范围,确保数据按小时连续。 - 对异常值进行处理,使用三次样条插值填补缺失值,保留趋势特征。 - 返回清理后的数据框。 4. **绘制时序图 (`timing_drawing`)**: - 绘制PH值、氨氮排放量和化学需氧量排放量的时序变化趋势图。 - 每个图表都有对应的标题和轴标签,并保存为PNG图片。 5. **统计分析 (`statistical_analysis`)**: - 计算并汇总各指标的基本统计量(均值、中位数、标准差、最大值、最小值)。 - 输出统计量分析表。 6. **主程序 (`__main__`)**: - 读取Excel文件中的原始数据。 - 执行数据预处理,并保存预处理后的数据。 - 绘制时序图并进行统计分析。 ### 关键步骤解析 #### 数据预处理 (`data_preprocessing`) ```python def data_preprocessing(df): df['监测时间'] = pd.to_datetime(df['监测时间'], format='%Y-%m-%d %H') df = df.set_index('监测时间') full_range = pd.date_range(start=df.index.min(), end=df.index.max(), freq='h') df_clean = df.reindex(full_range) valid_ranges = { 'PH 值': (6.0, 9.0), '氨氮排放量': (0.01, 1.5), '化学需氧量排放量': (0.05, 5.0) } for col, (min_val, max_val) in valid_ranges.items(): mask = df_clean[col].between(min_val, max_val) df_clean[col] = df_clean[col].where(mask).interpolate(method='spline', order=3) return df_clean ``` #### 绘制时序图 (`timing_drawing`) ```python def timing_drawing(df): plt.figure(figsize=(15, 9)) plt.subplot(3, 1, 1) plt.plot(df['PH 值'], color='#1f77b4') plt.title('PH 值时序变化趋势', fontproperties='SimHei') plt.ylabel('PH 值', fontproperties='SimHei') plt.subplot(3, 1, 2) plt.plot(df['氨氮排放量'], color='#2ca02c') plt.title('氨氮排放量时序变化趋势', fontproperties='SimHei') plt.ylabel('mg/L', fontproperties='SimHei') plt.subplot(3, 1, 3) plt.plot(df['化学需氧量排放量'], color='#d62728') plt.title('化学需氧量排放量时序变化趋势', fontproperties='SimHei') plt.ylabel('mg/L', fontproperties='SimHei') plt.tight_layout() plt.savefig('时间序列图.png', dpi=300) plt.show() ``` #### 统计分析 (`statistical_analysis`) ```python def statistical_analysis(df): stats_summary = df.describe().transpose() median_values = df.median() stats_summary['median'] = median_values.values stats_summary = stats_summary[['mean', 'median', 'std', 'max', 'min']] # 确保输出的表格有正确的列名和指标名字 stats_summary.index.name = '指标' stats_summary.reset_index(inplace=True) stats_summary.columns = ['指标', '均值', '中位数', '标准差', '最大值', '最小值'] print("统计量分析表:") print(stats_summary.to_markdown(index=False)) ``` ### 总结 该代码实现了对污水监测数据的全面处理和分析,涵盖了数据预处理、时序图绘制以及统计分析等多个方面。通过这些步骤,能够清晰地展示和理解污水排放指标的时间变化趋势及其统计数据特征,为后续的数学建模和预测提供坚实的基础。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值