六周第一次课(4月25日)

本文详细介绍如何利用正则表达式提升Shell脚本编写效率,涵盖grep、egrep等工具的基础用法与高级技巧,如通配符、限定符的应用,并通过实例演示如何过滤特定模式的数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

9.1 正则介绍_grep上

正则就是一串有规律的字符串

掌握好正则对于编写shell脚本有很大帮助

各种编程语言都有正则,原理都是一样的

grep/egrep, egrep是grep的扩展,能完成所有gred的功能

gred [-cvniABC] 'word' filename

#which grep


grep是自带颜色选项的

#  grep 'nologin'  passwd


-c:行数



-n:行号



-i:不区分大小写



-v: 取反



-r:遍历所有子目录

#grep -r 'root' /etc

只截图其中一部分



-A后面跟数字,过滤出符合要求的行以及下面的n行

#grep  -A3 'nologin'  passwd



-B后面跟数字,过滤出符合要求的行及上面的n行

#  grep  -nB3 'nologin'  passwd



-C后面跟数字,过滤出符合要求的行及上下n行
#  grep  -nC2 'nologin'  passwd



9.2 grep中

# grep '[0-9]'  passwd   //过滤出含有0-9的行



# grep -v '[0-9]'  passwd  //过滤出不含0-9的行


#grep  -n '^#'  inittab     //过滤出以#开头的行    //^在单引号内表示以某开头

# grep  -nv '^#'  inittab     //v取反,过滤出不以#开头的行


# grep -n '[^0-9]'  inittab   //过滤出不含0-9的,只要不含数字都过滤出来    //^在方括号内,表示非


# grep -n '^[^0-9]'  inittab   //过滤出非数字开头的行



9.3 grep下

# grep 'r.o' passwd     //'.'’表示任意的一个字符




#grep 'o*t' passwd   //过滤出在t前面有任意个o的       //o*表示含有0个或多个o



# grep 'mail.*nologin' passwd         //.*表示任意个任意字符



#grep 'o\{2\}' passwd  //过滤出含有2个o(连续的)的行    //{}需要用脱义字符才可以


或者加-E选项来不使用脱义符号



#egrep 'o{2}' passwd   //egrep可以不用脱义字符



# grep -E '(oo){2}' passwd   //oo重复2次



#egrep 'o+t' passwd  //过滤出t前面有1个或多个o的行    //o+表示1个或多个o


# egrep 'o?t' passwd  //过滤出t前面含有0个或1个o的行    //o?表示0个或1个o



# egrep 'root|nologin' passwd    //过滤出含有root或nologin的行       // |表示或



### 使用Transformer模型进行图像分类的方法 #### 方法概述 为了使Transformer能够应用于图像分类任务,一种有效的方式是将图像分割成固定大小的小块(patches),这些小块被线性映射为向量,并加上位置编码以保留空间信息[^2]。 #### 数据预处理 在准备输入数据的过程中,原始图片会被切分成多个不重叠的patch。假设一张尺寸为\(H \times W\)的RGB图像是要处理的对象,则可以按照设定好的宽度和高度参数来划分该图像。例如,对于分辨率为\(224\times 224\)像素的图像,如果选择每边切成16个部分的话,那么最终会得到\((224/16)^2=196\)个小方格作为单独的特征表示单元。之后,每一个这样的补丁都会通过一个简单的全连接层转换成为维度固定的嵌入向量。 ```python import torch from torchvision import transforms def preprocess_image(image_path, patch_size=16): transform = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), # 假设目标分辨率是224x224 transforms.ToTensor(), ]) image = Image.open(image_path).convert('RGB') tensor = transform(image) patches = [] for i in range(tensor.shape[-2] // patch_size): # 高度方向上的循环 row_patches = [] for j in range(tensor.shape[-1] // patch_size): # 宽度方向上的循环 patch = tensor[:, :, i*patch_size:(i+1)*patch_size, j*patch_size:(j+1)*patch_size].flatten() row_patches.append(patch) patches.extend(row_patches) return torch.stack(patches) ``` #### 构建Transformer架构 构建Vision Transformer (ViT),通常包括以下几个组成部分: - **Patch Embedding Layer**: 将每个图像块转化为低维向量; - **Positional Encoding Layer**: 添加绝对或相对位置信息给上述获得的向量序列; - **Multiple Layers of Self-Attention and Feed Forward Networks**: 多层自注意机制与前馈神经网络交替堆叠而成的核心模块; 最后,在顶层附加一个全局平均池化层(Global Average Pooling)以及一个多类别Softmax回归器用于预测类标签。 ```python class VisionTransformer(nn.Module): def __init__(self, num_classes=1000, embed_dim=768, depth=12, num_heads=12, mlp_ratio=4., qkv_bias=False, drop_rate=0.): super().__init__() self.patch_embed = PatchEmbed(embed_dim=embed_dim) self.pos_embed = nn.Parameter(torch.zeros(1, self.patch_embed.num_patches + 1, embed_dim)) self.cls_token = nn.Parameter(torch.zeros(1, 1, embed_dim)) dpr = [drop_rate for _ in range(depth)] self.blocks = nn.Sequential(*[ Block( dim=embed_dim, num_heads=num_heads, mlp_ratio=mlp_ratio, qkv_bias=qkv_bias, drop=dpr[i], ) for i in range(depth)]) self.norm = nn.LayerNorm(embed_dim) self.head = nn.Linear(embed_dim, num_classes) def forward(self, x): B = x.shape[0] cls_tokens = self.cls_token.expand(B, -1, -1) x = self.patch_embed(x) x = torch.cat((cls_tokens, x), dim=1) x += self.pos_embed x = self.blocks(x) x = self.norm(x) return self.head(x[:, 0]) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值