读取文件中的随机一行 Random Probability

最新推荐文章于 2024-10-03 00:10:59 发布

原创最新推荐文章于 2024-10-03 00:10:59 发布 · 4.1k 阅读

1 ·

CC 4.0 BY-SA版权

高效计算同时被 3 个专栏收录

51 篇文章

订阅专栏

数学之美

44 篇文章

订阅专栏

Linux 操作系统

32 篇文章

订阅专栏

本文介绍了一种从大文件中随机选择一行的算法，并适用于不能完全加载到内存的大文件和文件流。此外，还讨论了如何生成0到n-1范围内m个不重复随机整数的有序列表。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

假设有一个文本文件，文件中有若干行。要求返回随机的一行。每行的被选概率相同。
两种情况：
1、如果文件很大，不能全放入内存
2、如果是文件流

大文件的特点是不能载入内存随机读取，文件流的特点是只能读取一次。

//伪代码
i = 1
chosen_line = ""
while line has next:
	# random returns a uniform random number in [0,1)
	if random() < 1/i:   
		chosen_line = line
		i += 1
	line = line.next
return chosen_line

类似随机选取问题：对于整数m和n，其中m<n，输出0~n-1范围内m个随机整数的有序列表，不允许重复。

void GenKnuth(int m, int n) 
{ 
	for(int i=0; i<n; ++i) 
	{ 
		if((bigrand()%(n-i)) < m) 
		{ 
			cout<<i<<endl; 
			--m; 
		}
	}
}

计算每个i被输出的概率，会发现都是m/n，因此是等概率的随机选取。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ojshilu

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

在 Python、Bootstrap、Jackknife、Monte Carlo 中重采样分布

gongdiwudu的专栏

08-04

2048

概率分布向我们展示了不同结果发生的概率。此分布非常有用，因为它描述了统计量的所有可能结果以及每个结果的可能性。我们可以用直方图或密度图来可视化概率分布。为了读取可视化并找到给定点的概率，我们在 x 轴上选择一个值，然后在 y 轴上找到相应的高度，这表示给定点的密度。

python森林生物量（蓄积量）数据处理到随机森林估算全流程

热爱分享，热爱记录

08-01

4265

基于python估算森林生物量

4 条评论您还未登录，请先登录后发表或查看评论

随机读取文件中一行数据

doufei_JLU_CCST_08

01-05

4015

随机读取文件中一行数据问题描述：对于一个事先不知道有多少行的文件，设计一种算法，能够快速地随机读取文件中的一行数据。思路1：先统计文件又多少行数据，假设共有N行。然后根据k = rand()%N得到选择的行，再从文件头开始，逐行读取，一直到第k行，作为随机读取的一行数据。这种思路简单直白，但是效率不高。思路2：只读取一遍文件，就能以相同的概率选出文件中的一行数据。具体做法是使用一个变量

随机带权选取文件中一行分类： linux c/c+...

weixin_34194087的博客

06-02

本程序实现从文件中随即选取一行，每行被选中的概率与改行长度成正比。程序用一次遍历，实现带权随机选取。算法：假设第i行权重wi(i=1...n).读取到文件第i行时,以概率wi/(w1+w2+...+wi) 用该行替换上一轮被选中的行，直至读取文件结束。这样可以从数学上保证i行被选中的概率为wi/(w1+w2+...+wn); #include<stdio.h&gt...

【random取概率】有一个大文件，只扫描一遍的情况下，等概率返回其中一行

weixin_42674696的博客

04-03

277

（简答题）有一个大文件，只扫描一遍的情况下，等概率返回其中一行顺次扫描文件的时候，第一行的时候，返回这一条数据，第二行以1/2的概率用第二行的数据替换这条数据，以此类推，在第n行的时候，以1/n的概率用这一行数据替换之前的结果。最终的数据作为返回结果。将这n个元素依次遍历，每次得到的数(第L个)取随机数r，r%L＝＝0（0-L之内） 1，2，3，4，5，6，7 第一个数：pick ＝...

随机输出文件中的一行

u011559236的博客

07-31

822

input([file,inplace[,backup]]) 便于遍历多个输入流中行 filename() 返回当前文件名称 lineno() 返回当前累计的行数 filelineno() 返回当前文件的行数 isfirstline() 检查当前文件是不是文件第一行

随机读取txt文件某一行

我的笔记

03-01

1808

<%response.write (get_str())response.write (get_str())response.write (get_str())function get_str() server.ScriptTimeout = 900 dim fso,txt_name,txt_path,tatol_line,times,fp,ForReading

Numpy.random随机矩阵：机器学习中的应用实例

Numpy.random是Python中Numpy库的一个子库，专门用于生成随机数。它提供了一系列强大的随机数生成函数，可以生成各种分布类型的随机数，包括均匀分布、正态分布、泊松分布等。 ## 功能 Numpy.random库的主要功能是...

金融数据_PySpark-3.0.3随机森林(RandomForestClassifier)实例

goufeng93的博客

04-04

1695

金融数据 PySpark-3.0.3随机森林(RandomForestClassifier)。

深度学习中的结构化概率模型 - 使用图来描述模型结构篇

绎岚科技的博客

10-03

1626

在深度学习的探索之路上，结构化概率模型以其独特的视角和强大的表达能力，成为了研究复杂数据关系的重要工具。这一模型的核心在于其巧妙地利用图来描述模型结构，将随机变量间的复杂交互关系可视化、结构化。图的引入，不仅为我们提供了一个直观理解数据内部结构的工具，更使得模型的学习与推理过程变得更加高效和精准。通过图，我们可以清晰地看到变量之间的依赖关系、信息传递路径以及潜在的因果结构，这为构建更加复杂、精确的深度学习模型提供了坚实的基础。

bat for 命令如何读取1.txt 其中一行内容

chaigang的博客

03-21

4万+

for /f "skip=1 delims=" %%a in (1.txt) do (set txt=%%~agoto :Show):Showecho %txt%pause以上代码就是读取第二行的内容。需要读取其它行的话，请自行修改skip=后面的数字，必须比你要读取的行数小一位。...

N行中等概率抽取M行的解法

逆风飞扬

10-11

2313

题目是这样子的：有一个文本，事先不知道数据行数，要求等概率抽出1000行来，只准读1遍（即表示你对每一行的选择是二维的，要么要，要么不要，如果选择不要这一行那么再没有机会选择这一行了）题目主要有两个难点，一个是保证等概率，另一个是对于当前行是要还是不要呢这个题目的解法目前我只知道以下这种，如果你知道更多的解法，欢迎留言讨论解法： C代码

bat脚本读取文件指定的行，进行处理

HYK_DJ5201314的博客

11-22

1万+

写一个bat脚本，读出指定文件的指定行，比如要读的文本是text.txt，文件内容如下图所示，要读的行是第二行。要读取第二行只需要设置一个行数flag，在行数为2的时候就输出文件内容。

从文件里一次读取一行

C++ 爱好者 make_it_simple888

09-05

1235

从文件里一次读取一行

window bat脚本循环读取txt文件的每一行，赋值给变量，并打印出来。

最新发布

06-04