我十七岁

 

假如,我十五岁,或十六岁
我怕我不会,不会如此喜欢一人。

 

假如,我十八岁,或十九岁
我怕我后悔,后悔当初没有去追。

 

假如,我是无忧的溪流,
为什么,我无法停留?
为什么,我看到一人悲秋?

 

假如,我曾化南风轻吹,吹过谁的玫瑰
恋恋而过,却不再轻随。

 

假如,我如大海般浩瀚无穷,岂能强装虚伪?
更不会迷惘进退。

 

那天,我遥望皎皎明月,它高远明如镜台,
却不及,一星响窗。

 

假如,我轻捧明星,就愿时光清澈如水,
流走无奈忧愁,却别把它带回。

 

光阴向前走,可我不敢回头。
"那不是你心中向往的光辉吗?"
"是啊,我十七岁,可惜,我不是EZ。"

Nano-ESG数据资源库的构建基于2023年初至2024年秋季期间采集的逾84万条新闻文本,从中系统提炼出企业环境、社会及治理维度的信息。其构建流程首先依据特定术语在德语与英语新闻平台上检索,初步锁定与德国DAX 40成分股企业相关联的报道。随后借助嵌入技术对文本段落执行去重操作,以降低内容冗余。继而采用GLiNER这一跨语言零样本实体识别系统,排除与目标企业无关的文档。在此基础上,通过GPT-3.5与GPT-4o等大规模语言模型对文本进行双重筛选:一方面判定其与ESG议题的相关性,另一方面生成简明的内容概要。最终环节由GPT-4o模型完成,它对每篇文献进行ESG情感倾向(正面、中性或负面)的判定,并标注所涉及的ESG具体维度,从而形成具备时序特征的ESG情感与维度标注数据集。 该数据集适用于多类企业可持续性研究,例如ESG情感趋势分析、ESG维度细分类别研究,以及企业可持续性事件的时序演变追踪。研究者可利用数据集内提供的新闻摘要、情感标签与维度分类,深入考察企业在不同时期的环境、社会及治理表现。此外,借助Bertopic等主题建模方法,能够从数据中识别出与企业相关的核心ESG议题,并观察这些议题随时间的演进轨迹。该资源以其开放获取特性与连续的时间覆盖,为探究企业可持续性表现的动态变化提供了系统化的数据基础。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
### 题目重述 第17题:给定40组血清样本的近红外透射光谱数据(波长范围800~2400 nm,间隔4 nm,共401个波长点),以及对应的胆固醇真实浓度值。要求建立定量分析模型,预测胆固醇含量。 目标:使用如多元线性回归、主成分回归(PCR)、偏最小二乘回归(PLS)等方法构建回归模型,并评估其性能。 --- ### 详解 我们采用 **偏最小二乘回归(PLS Regression)**,因其特别适用于: - 自变量数量远大于样本数($ p > n $) - 自变量之间高度相关(光谱相邻波长强相关) #### 步骤如下: 1. **数据准备** - 设光谱矩阵 $ X \in \mathbb{R}^{40 \times 401} $:每行为一个样本在401个波长下的吸光度 - 浓度向量 $ y \in \mathbb{R}^{40} $:每个样本的胆固醇真实浓度 2. **数据预处理** - 中心化:将 $ X $ 和 $ y $ 列均值归零 - 可选:去趋势、标准正态变换(SNV)、导数滤波等以消除噪声和基线漂移 3. **模型训练(PLS回归)** - 提取若干隐变量(成分数),使X与Y协方差最大 - 使用交叉验证确定最优成分数 4. **模型评价指标** - 决定系数:$ R^2 = 1 - \frac{\sum(y - \hat{y})^2}{\sum(y - \bar{y})^2} $ - 均方根误差(RMSE):$ \sqrt{\frac{1}{n}\sum{(y_i - \hat{y}_i)^2}} $ 5. **预测新样本** --- #### MATLAB代码实现(模拟示例) ```matlab % 假设 X (40x401), y (40x1) 已加载 % 若从文件读取,请用: load('data.mat'); 或 readmatrix() % 数据中心化 X_centered = X - mean(X); y_centered = y - mean(y); % 使用交叉验证选择最优成分数(最多10个成分) max_comps = 10; mse_val = zeros(max_comps, 1); for k = 1:max_comps [XL, YL, XS, YS] = plsregress(X_centered, y_centered, k, 'CV', 5); mse_val(k) = sum(YS.^2); % 交叉验证误差平方和 end % 找最小误差对应的成分个数 [~, opt_comp] = min(mse_val); fprintf('最优成分数: %d\n', opt_comp); % 全数据建模 [XL, YL, XS, YS, beta_pls] = plsregress(X_centered, y_centered, opt_comp); % 预测 y_pred = X * beta_pls(2:end) + beta_pls(1); % 包含截距项 % 计算R²和RMSE SS_res = sum((y - y_pred).^2); SS_tot = sum((y - mean(y)).^2); R2 = 1 - SS_res / SS_tot; RMSE = sqrt(mean((y - y_pred).^2)); fprintf('R^2 = %.4f, RMSE = %.4f\n', R2, RMSE); % 可视化结果 scatter(y, y_pred); xlabel('真实浓度'); ylabel('预测浓度'); title(['PLS回归结果 (R^2=', num2str(R2), ')']); grid on; ``` --- ### 知识点 1. **偏最小二乘回归(PLSR)** 联合提取X与Y的潜在变量,最大化协方差,适合高维共线性数据。 2. **光谱预处理技术** 如SNV、导数法可消除散射影响,提升模型稳定性与精度。 3. **交叉验证(Cross Validation)** 分割数据评估泛化能力,防止过拟合,常用于选择最优模型参数。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值