NTFS文件结构实习笔记

 

 

 

定位C盘的index­_root

先读取0扇区,获取第一分区的偏移:3F = 63扇区

这个63扇区是磁盘MBR/EBR使用的扇区数量,从0-6263扇区,不同的磁盘这个值可以不一样。但同一个磁盘这个值是一样的。

63扇区获取MFT参数:每扇区512字节,每簇8扇区,MFT开始簇C0000MFT大小F6

 

定位MFTC0000 = 786432786432*8+63 = 6291519

定位MFT_INDEX_ROOT6291519 + 2*5 = 6291529;转到6291529

 

 

它的30属性里面是文件名称:‘.

 

他的90属性里面有1-2个基本文件;不同机器这里的数量和文件不同,根据文件名称的字母比较结果,以快速确定下一步访问的INDEX缓冲区块:

接下来的A0属性,描述了VCN的开始00簇到02簇结束,共3个簇;运行list11 03 03

表示一个字节的开始LCN=03簇,共03个簇大小;

 

 

LCN簇的大小

 

LCN开始簇 3*8=24=>24+63=87;就是说INDEX87扇区开始的24个扇区里面;11的第一个1表示LCN开始簇的位数,第二个1表示簇的大小的位数。

转到87扇区:

第一个INDEX的位置 = 18H +18H里面的值)40H = 58H

每个INDEX的开始值是该文件在MFT里面的参考号,这里第一个文件的是4;第2个是8

每个INDEX的偏移8的地方的该索引的大小,这里2个都是68H

 

autoexe.bat为例,看看他的文件内容:

他的第一个值MFT号码 = 2E9E => 11943;由于每个MFT文件占用2个扇区,所以就是第11943*2=23868个扇区;这个是在MFT开始后面偏移的扇区数量,于是23868+6291519的值就是文件的开始位置=6315387

 

转到6315387扇区看看,在30属性里面有他的文件名称->autoexe.bat,他的80属性里面是他的内容:REM Dummy file for NTVDM;如果文件内容很大,这里就不是数据,而是runlist 运行数据列表,他的结构和前面一样,分析完LCN的大小和开始位置后就到对应文件里面可以看到数据了。

 

 

 

同样的,可以定位第二个分区:

由分区表链,我们可以方便快速的定位到D盘的OBR =61448688 03A9A1B1H),他的MBR/EBR = 61448625 由于第二分区没有激活(不可引导)所以EBR所在的扇区是全0EBR+63=OBR的位置,这个63扇区与前面第一分区的MBR占用扇区数量相同,根据硬盘的容量的不同,这个值是不同的。比如我这个300G的是63扇区;还有一个1T的是1024扇区。在OBR中可找到MFT的相对偏移C0000*8=6291456扇区;那么MFT = 67740144

在转到MFT的第5#文件(偏移5*2=10扇区),就找到D盘的INDEXroot了。下面的他的A0属性:

这个31里面的1表示接下来的1位数是LCN的簇数=03簇;

这个31里面的3表示在LCN簇数的位数后面的3位数是LCN的开始簇=03D478251000);

整个这个runlist 就表示 D盘的索引在偏移(251000*8=2008000扇区开始的(3*8=24个扇区里面。

转到63456688OBR+偏移),看见INDX了,没有错!

 

关于NTFS系统索引的B+树,很是让我纠结。

先看看B+树的左、中、右三棵树吧:由于我的系统在$root里面有2个文件,所以索引应该有3棵树!!我个ROOT里面的2个文件分别是:config.sysUsers(这个是“用户”文件夹)

但是它对应的runlist却只有1个?

我在这里纠结了,不是应该有3个吗?后来我相当然的认为:他不是有3个簇吗?那是不是一个簇,就是1棵树呢?于是,我人为把第1簇划为左数,第2簇为中树,第3簇为右树。

当要查找的文件字母比config.sys小,比如是aa.txt的时候,到1簇里面找;相同,在configUser之间的在2簇里面找;大于User的就到3簇里面找,呵呵,还真让我找到了!

 

文件aa在第1簇(87-94扇区):

文件gg在第2簇(95-102扇区):

 

文件zz在第3簇(103-110扇区):

然而在我的另外一台电脑里面,相同的操作系统,相同的磁盘容量,他的ROOT里面却只有1个文件,也就只有左右2棵树了;而他的runlist却有2个?就按这2个分为2棵树却也是正确的…..

这个问题就这样结局了,我不想在继续纠结。接下来的问题我至今无解啊。。。纠结。。。

树我是分出来了,但是在不同的树里面,比如在左树里面,我要查找一个文件,难道我要遍历整个左树???也许你会说,笨,你就不会用折半查找(也叫二分查找)….大哭晕,我试了。可是我却傻眼了:因为我不知道树里面一共有多少项目(你不会要我去数吧?惊讶),而且每个INDEX项并不一定都是68H大小!!有的是60H,也有70H的!!

再晕一下,微软是怎么做的?微软为什么可以?目前我只有遍历某个树!!纠结中…..狂晕中…………我究竟还有哪里没有分析到呢,求指点,求包养啊害羞

其实,到这里,我在怀疑微软是不是也是遍历的。。。号称快速高效而已。。。。当然最大可能是我没有搞懂大哭

下载方式:https://pan.quark.cn/s/a4b39357ea24 在纺织制造领域中,纱线的品质水平对最终制成品的整体质量具有决定性作用。 鉴于消费者对于产品规格和样式要求的不断变化,纺织制造工艺的执行过程日益呈现为一种更为复杂的操作体系,进而导致对纱线质量进行预测的任务变得更加困难。 在众多预测技术中,传统的预测手段在面对多变量间相互交织的复杂关系时,往往显得力不从心。 因此,智能计算技术在预测纱线质量的应用场景中逐渐占据核心地位,其中人工神经网络凭借其卓越的非线性映射特性以及自适应学习机制,成为了众多预测方法中的一种重要选择。 在智能计算技术的范畴内,粒子群优化算法(PSO)和反向传播神经网络(BP神经网络)是两种被广泛采用的技术方案。 粒子群优化算法是一种基于群体智能理念的优化技术,它通过模拟鸟类的群体觅食行为来寻求最优解,该算法因其操作简便、执行高效以及具备优秀的全局搜索性能,在函数优化、神经网络训练等多个领域得到了普遍应用。 反向传播神经网络则是一种由多层节点构成的前馈神经网络,它通过误差反向传播的机制来实现网络权重和阈值的动态调整,从而达成学习与预测的目标。 在实际操作层面,反向传播神经网络因其架构设计简洁、实现过程便捷,因此被广泛部署于各类预测和分类任务之中。 然而,该方法也存在一些固有的局限性,例如容易陷入局部最优状态、网络收敛过程缓慢等问题。 而粒子群优化算法在参与神经网络优化时,能够显著增强神经网络的全局搜索性能并提升收敛速度,有效规避神经网络陷入局部最优的困境。 将粒子群优化算法与反向传播神经网络相结合形成的PSO-BP神经网络,通过运用粒子群优化算法对反向传播神经网络的权值和阈值进行精细化调整,能够在预测纱线断裂强度方面,显著提升预测结果的...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值