计算机原理(4)字节序与大小端问题

我们都知道一个字节等于8个比特,而一个比特只能存放一个0或者一个1,因此一个字节最大能存储的数字为 11111111(255)。那么当我们要存储 65530 这种需要多字节内容时,就会出现两种情况:
这里写图片描述
内存中的多字节数据相对于内存地址有大端和小端之分。

  • 大端字节序:高地址存低位
  • 小端字节序:低地址存低位

假设我们要将0x1234abcd存入以0x0000开头的内存中,

big-endian大端little-endian 小端
0x00000x120xcd
0x00010x340xab
0x00020xab0x34
0x00030xcd0x12

为什么会有大端字节序和小端字节序?

  • 计算机电路处理低字节序,效率比较高,因为计算都是从低位开始的
  • 人类习惯读写大端字节序,所以除了计算机内存处理,其他场合几乎都是大端字节序,比如:网络传输和文件存储。

如何判断电脑是大端还是小端?

int main()
{
    int a = 1;
    if( 1== ((char *)&a)[0]){
        printf("小端字节序\n");
    }
    else if( 0== ((char *)&a)[0]){
        printf("大端字节序\n");
    }
    return 0;
}
### 有参转录组分析流程中的表达矩阵与TPM矩阵 #### 表达矩阵的构建 在有参转录组分析中,表达矩阵是通过将测序读段映射到已知参考基因组来生成的。每行代表一个基因,而每列则对应不同的样本。此矩阵记录了各基因在不同样本中的原始计数(counts),即每个基因被检测到的读段数量。 对于这一过程,通常会采用如下方法: - **比对工具的选择**:可以利用`Hisat2`或`STAR`这样的短读段比对器将RNA-seq数据映射至参考基因组上[^4]。 - **量化步骤**:一旦完成了读段的定位工作之后,则可以通过诸如`featureCounts`之类的程序统计落在各个特征区域内的唯一匹配上的读取数目,从而形成初步的count matrix——也就是所谓的“counts矩阵”。 ```bash # 使用 featureCounts 进行定量计算 featureCounts -a annotation.gtf \ -o output_counts.txt \ aligned_reads.bam ``` #### TPM矩阵的转换 为了更好地比较跨样品间的基因表达水平差异,在得到初始的counts矩阵基础上还需要进一步标准化处理,其中一种常见的方式就是转化为Transcripts Per Million (TPM) 值的形式。这样做不仅考虑到了总测序量的影响因素,同时也校正了因目标片段长度不一致所带来的偏差问题。 具体来说,TPM 的计算公式为: \[ \text{TPM}_i = (\frac{\sum_j C_{ij}}{L_i})\times10^6 \] 这里 \(C\) 是指某个特定基因\(j\)下的read counts;\(L\)表示相应转录本的有效长度(通常是减去接头序列后的实际碱基数)。因此,当我们将所有的reads分配给它们所属的transcript后就可以按照上述方程求得最终的结果并构成新的TPM矩阵。 ```r library(edgeR) # 加载 count data 文件 d <- read.table("output_counts.txt", header=TRUE, row.names="Geneid") # 计算有效长度向量 L (假设我们有一个名为 'lengths' 的文件) gene_lengths <- scan('lengths', what='numeric') # 创建 DGEList 对象用于后续操作 y <- DGEList(counts=d, genes=gene_lengths) # 应用 TMM 归一化因子调整 y_tmm <- calcNormFactors(y, method="TMM") # 输出 TPM 矩阵 tpm_matrix <- cpm(y_tmm, log=FALSE)*1e6 / colSums(cpm(y_tmm)) write.csv(tpm_matrix,"tpm_output.csv") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值