关于R语言中set.seed()

本文通过实例讲解了在R语言中使用set.seed()函数确保随机抽样的可重复性,强调了在进行样本抽取时,为了使结果可复现,每次抽样前都需设置相同的种子值。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在r中取sample时候,经常会有set.seed(某数),经常看见取值很大,其实这里无论括号里取值是多少,想要上下两次取值一样,都需要在每次取值前输入同样的set.seed(某数),才能保证两次取值相同,从而保证让样本可重复。

 

> set.seed(100)
> x <- rnorm(5)
> y <- rnorm(5)
> x==y
[1] FALSE FALSE FALSE FALSE FALSE
> set.seed(1000)
> x <- rnorm(5)
> set.seed(1000)
> y <- rnorm(5)
> x==y
[1] TRUE TRUE TRUE TRUE TRUE

 

转载于:https://www.cnblogs.com/mxly/p/10148278.html

### R语言 `set.seed` 函数使用方法 #### 设置伪随机数生成器的种子 为了确保每次运行程序时生成的随机数序列相同,从而让结果可重复再现,在R语言中可以通过调用`set.seed()`来实现这一目标[^3]。 ```r # 设定种子为123以便后续操作能够得到一致的结果 set.seed(123) ``` 此命令会初始化R使用的伪随机数发生算法的状态。当指定相同的参数值给`set.seed()`,之后执行涉及随机性的运算将会遵循同样的模式[^2]。 #### 结合其他函数一起工作 通常情况下,`set.seed()`会在涉及到随机抽样的地方之前被调用,比如创建服从特定分布的数据集或是打乱数据顺序等场景下: ```r # 创建一个正态分布样本并绘制直方图 set.seed(123) x <- rnorm(100, mean = 100, sd = 10) hist(x, breaks = 20) ``` 上述代码片段展示了如何利用设定好的种子去获取一组均值为100标准差为10的一百个数值,并将其可视化出来;如果再次运行这段代码而保持seed不变,则所获得图形应当完全一样[^4]。 另外值得注意的是改变传入`set.seed()`的不同整型参数也会相应地影响到后面产生的随机系列特性: ```r # 更改种子后重新抽取另一组不同的正态分布样本 set.seed(234) y <- rnorm(100, mean = 100, sd = 10) hist(y, breaks = 20) ``` 这里改变了初始状态(即新的种子),因此即使采用相同的统计特征构建新数组,其具体成员还是会有所区别。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值