自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 实证分析方法概述(附Python代码)

当你要研究变量之间的复杂关系时,结构方程模型(SEM)是一个强大的工具。在多元回归分析中,多个自变量之间可能存在强烈的相关性,这会导致多重共线性问题,影响回归系数的估计结果。首先,你需要对数据进行初步的描述性统计分析,以了解数据的基本特征。回归分析是实证分析中最常用的技术之一,适用于检验自变量和因变量之间的关系。如果数据集非常庞大,并且涉及的变量非常复杂,使用传统的回归方法可能无法获得良好的效果。它可以帮助你理解变量之间的复杂关系,并揭示更深层次的因果机制。:适用于自变量和因变量之间的线性关系。

2025-04-05 11:09:31 2450

原创 Transformer架构介绍

Transformer最初是在《Attention is All You Need》这篇论文中提出的,由Google的研究者Vaswani等人于2017年发表。Transformer的核心优势是它能够并行处理序列数据,而不需要像RNN那样逐步地处理序列,这使得它在训练速度上有显著的提升。Transformer架构由**编码器(Encoder)

2025-04-04 20:54:02 894

原创 自然语言处理(NLP):如使用RNN、LSTM、BERT等模型进行文本分析

自然语言处理(NLP)是机器学习的一个重要领域,涉及到如何让计算机理解、处理和生成自然语言(如英语、中文等)。NLP的应用非常广泛,从文本分类、情感分析到机器翻译、自动摘要等。在NLP中,我们通常使用不同类型的神经网络模型,如(Long Short-Term Memory)和(Bidirectional Encoder Representations from Transformers)来处理和理解文本数据。下面,我们将深入了解这些模型,并展示它们在NLP任务中的应用。

2025-04-04 20:52:41 1845

原创 机器学习:集成方法(如随机森林、XGBoost)、深度学习等

通过掌握集成方法和深度学习,你将能够应对更复杂的机器学习任务。

2025-04-04 20:51:26 1698

原创 Python数据科学与分析

通过掌握以上基础,你将能够进行数据清洗、分析、建模和评估。高级机器学习:集成方法(如随机森林、XGBoost)、深度学习等。时间序列分析:用于处理时间依赖的数据。自然语言处理(NLP):用于文本数据分析。大数据技术:如Spark、Hadoop等。

2025-04-04 20:48:40 686

原创 Python基础知识&一些高级主题

到目前为止,我们已经覆盖了Python的基础知识和一些高级主题。

2025-04-04 20:45:55 940

原创 报错:错误于library(caret): 不存在叫‘caret’这个名称的程序包

安装Rtools并尝试重新安装caret包。尝试使用默认的CRAN镜像源下载caret包。如果以上方法都无法解决,考虑手动安装或检查R版本。

2025-04-04 19:35:32 926

原创 R语言入门(八)

更复杂的机器学习算法神经网络适用于复杂的非线性建模,nnet包提供了简单的神经网络实现。XGBoost是一个强大的集成学习算法,适用于回归和分类问题。使用网格搜索和随机搜索对模型进行调优。大数据处理与分布式计算使用data.table包处理大数据,进行快速的数据操作。使用sparklyr包与Apache Spark进行分布式计算,适用于处理大规模数据集。

2025-04-04 19:28:04 312

原创 R语言入门(七)

模型部署使用saveRDS()保存模型,readRDS()加载模型。使用plumber包将模型部署为Web服务,进行在线预测。更复杂的机器学习算法随机森林:适用于分类和回归任务,通过多个决策树提高准确性。支持向量机:适用于分类任务,尤其在高维数据下表现优异。

2025-04-04 19:24:46 552

原创 R语言入门(六)

回归模型评估使用R-squaredMSERMSE和残差分析来评估回归模型的表现。分类模型评估使用混淆矩阵准确率精确率召回率和F1分数来评估分类模型的表现。模型调优使用交叉验证来防止过拟合,使用超参数调优来提高模型性能。

2025-04-04 19:22:20 908

原创 R语言入门(五)

探索性数据分析(EDA):通过统计、可视化等方法探索数据,了解数据分布、关系、异常值等。线性回归:用于预测一个连续变量,简单的回归模型。逻辑回归:用于处理二分类问题,通过回归模型进行分类预测。分类模型(决策树):使用决策树算法进行分类,适用于分类问题。

2025-04-04 19:20:38 436

原创 R语言入门(四)

数据可视化是数据分析中非常重要的一部分,R提供了强大的图形功能,可以帮助你直观地展示数据。我们将从基础的图形绘制开始,并逐步深入学习R中常用的绘图包,特别是ggplot2,它是一个非常强大的可视化工具,广泛应用于数据分析和科学研究。

2025-04-04 19:18:43 218

原创 R语言入门(三)

ggplot2。

2025-04-04 17:18:08 950

原创 R语言入门(二)

数据框是R中常用的数据结构之一,尤其在数据分析和统计建模中非常常见。R语言有很多常见的数学函数,你可以用它们来进行计算、处理数据。向量操作是R中最常见的操作。R提供了多种函数来对向量进行处理。R中有很多函数可以生成特定的数字序列或重复数字。R语言提供了常见的逻辑运算符,用来执行条件判断。下一步深入学习如何进行数据导入、清洗和可视化!处理字符数据时,R也提供了很多有用的函数。

2025-04-04 17:16:06 237

原创 R语言入门(一)

首先确认你已经安装好R语言和RStudio。RStudio是一个方便的集成开发环境(IDE),可以让你在R中编写和执行代码。下一步,我们将学习如何处理数据集、进行数据导入与导出,进行更复杂的数据操作。我们可以根据条件执行不同的代码。循环用于遍历一个序列(如向量、列表等)。是R中的一个内置函数,用于简化条件判断。循环会持续执行,直到条件不成立为止。向量是R中最基本的数据结构。R语言中有许多内置函数。R语言支持常见的数学运算符。函数检查变量的数据类型。,这是R语言的传统做法。在R语言中,可以使用。

2025-04-04 17:12:06 548

原创 英语中常见的动词搭配总结

以下是英语中常见的动词搭配总结,帮助你快速掌握。

2025-03-20 21:14:43 1301

原创 “to”后面接动词原形(do)还是动名词(doing)

在英语中,“to”后面接动词原形(do)还是动名词(doing),取决于“to”在句子中的功能。

2025-03-20 20:52:01 3809

原创 A survey on the fusion process in opinion dynamics(2018)

目录一、观点动力学模型的研究二、观点演化理论的一些基本模型一、观点动力学模型的研究基本元素的研究:观点表达的范式、融合规则、以及观点演化的环境稳定状态的研究:达成共识,两极分化,观点分裂在群体中,个体不会完全地接受或完全忽略其他个体的观点,而是会在更新观点的过程中考虑这些观点(观点融合规则中考虑进去)。通过群体的交互过程,个体不断更新和融合他们对同一问题的意见,并最终形成共识达成、两极分化或分裂三种稳定状态。意见动态模型可分为两类:一方面,有些模型认为观点是离散的(

2022-05-12 12:57:50 285

原创 网络类型笔记

典型的网络是由节点与连接两节点的边组成,现实生活存在大量复杂系统可通过网络加以描述,比如社交网络、电力网络、交通网络等。1. 基本概念【特征路径长度】(characteristic path length) 在网络中,任选两个节点,连通这两个节点的最少边数,定义为这两个节点的路径长度(距离),网络中所有节点对的路径长度的平均值,定义为网络的特征路径长度。这是网络的全局特征。【聚合系数】(clustering、 coefficient) 节点A和B相连,B和...

2022-05-11 16:08:44 148

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除