16、利用 sed 和 awk 进行模式匹配与正则表达式操作

onion

于 2025-08-12 00:23:03 发布

阅读量41

点赞数

CC 4.0 BY-SA版权

分类专栏： Linux Shell脚本编程：从入门到精通文章标签： sed awk 正则表达式

本文链接：https://blog.youkuaiyun.com/onion/article/details/150240305

Linux Shell脚本编程：从入门到精通专栏收录该内容

16 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

利用 sed 和 awk 进行模式匹配与正则表达式操作

1. awk 基本工作原理

awk 是一个强大的文本处理工具，其基本工作流程如下：
- awk 从文件中读取一行数据，并将其存入内部变量 $0 中，每一行被称为一个记录（record），默认情况下，每行以换行符结尾。
- 接着，每个记录会被分割成独立的单词或字段（field），每个单词会被存储在编号变量 $1 、 $2 等中，每个记录最多可有 100 个字段。
- awk 有一个内部变量 IFS （Internal Field Separator），默认值为空白字符（包括制表符和空格），字段将由 IFS 分隔。若要指定其他 IFS ，如 /etc/passwd 文件中的冒号 : ，则需在 awk 命令行中指定。

例如，执行以下命令：

$ awk '{print $1, $3}' sample.txt

该命令会打印每行的第一个和第三个字段，字段间默认用空格分隔。其工作原理的流程图如下：

graph TD;
    A[读取文件一行到 $0] --> B[按 IFS 分割字段];
    B --> C[根据命令处理字段];
    C --> D[输出结果];

订阅专栏解锁全文

会员秒杀 ¥9.9 重磅福利

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

onion

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

正则表达式与文本三剑客grep、sed、awk

weixin_43099162的博客

05-02

1252

处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。awk有很多内建的功能，比如数组、函数等，这是它和C语言的相同之处，灵活性是awk最大的优势。正则表达式，又称规则表达式。如果没有提供pattern语句块，则默认执行{print}，即打印每一个读取到的行，awk读取的每一行都会执行该语句块。被执行，这是一个可选的语句块，比如变量初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中。

正则表达式、sed、awk用法简介

树下一少年的博客

02-09

944

正则表达式、sed、awk用法简介一.grep介绍 1.格式：grep 参数过滤条件目标文件 2.参数二.正则表达式 1.基本正则表达式和扩展正则表达式 2.正则表达式字符集三.sed 1.格式：sed 参数匹配条件文件 2.常用参数 3.地址定界规则 4.常用编辑操作 5.特殊符号和常用操作四.awk 1.格式：awk '匹配模式{操作}' 2.工作流程 3.print和printf动作 4.变量 5.运算操作符

参与评论您还未登录，请先登录后发表或查看评论

php正则表达式匹配多行,awk：显示匹配的正则表达式(多行)

weixin_29224589的博客

03-10

307

我有一个看起来像这样的文件：SF:/home/developer/project/test/resources/somefile.jsDA:1,2DA:3,2end_of_recordSF:/home/developer/project/src/resources/otherfile.jsDA:9,2DA:15,2DA:22,2end_of_record...some more SF:/home/...

正则表达式-“三剑客”（grep、sed、awk）

2301_82330629的博客

10-09

1735

正则表达式描述了一种字符串匹配的模式，可以用来检查一个串是否含有某种子串，将匹配的子串替换或者从某个串中取出符号某个条件的子串等，在linux中代表自定义的模式模版，linux工具可以用正则表达式过滤文本。awk常用的变量有OFS、NF和NR，OFS和-F选项有类似的功能，也是用来定义分隔符的，但是他是在输出的时候定义，NF表示用分隔符分隔后一共有多少段，NR表示行号。在正则表达式中，^表示行的开始，$表示行的结尾，那么空行则可以用^$表示。这里的END是awk特有的语法，表示所有的行都已经执行。

三剑客（grep，awk，sed）+正则表达式

qzzqzzqzz111的博客

03-25

2000

三剑客

【Shell编程 / 6】正则表达式与模式匹配（grep、sed、awk）

卜及中的博客

01-16

1218

正则表达式（Regular Expression，即Regex）用于匹配字符串中的特定模式。扩展正则表达式（Extended Regular Expression, ERE）比基本正则表达式功能更强大，支持更多的元字符和模式。基本正则表达式（Basic Regular Expression, BRE）是一种较为简单的正则表达式形式，主要用于匹配基本的字符串模式。是一个强大的文本处理工具，可以基于正则表达式对文本进行模式匹配和操作。是一种强大的文本搜索工具，支持基本和扩展正则表达式。参数可以使用扩展正则。

linux awk 模式匹配,linux awk 正则表达式、正则运算符详细介绍

weixin_34458671的博客

05-14

609

使用awk作为文本处理工具，正则表达式是少不了的。要掌握这个工具的正则表达式使用。其实，我们不必单独去学习它的正则表达式。正则表达式就像一门程序语言，有自己语法规则已经表示意思。对于不同工具，其实大部分表示意思相同的。在linux众多文本处理工具(awk,sed,grep,perl)里面用到正则表达式。其实就只有3种类型。详细可以参考：linux shell 正则表达式(BREs,EREs,P...

sed & awk 第二版学习（二）—— 正则表达式语法

wzy0623的专栏

09-02

1585

在grep、sed、awk 中使用的正则表达式的语法

正则表达式及文本处理三剑客（grep、sed、awk）

十七拾的博客

01-31

2255

本文详细阐释了正则表达式和文本处理三剑客（grep、sed、awk）的具体用法，还有一些相关案例可供参考，希望对你有帮助

linux awk 正则,awk及正则表达式

weixin_34493012的博客

05-25

1383

9.6/9.7 awkawkawk是一种很棒的语言,它适合文本处理和报表生成,其语法较为常见,借鉴了某些语言的一些精华,如C语言等。awk在linux系统日常处理工作中,发挥很重要的作用,掌握了awk将会使你的工作变的高大上。awk语法比sed多，有变量、数组和语句控制，所以功能更加强大。不过初学awk建议先学一些常用的用途，后期再深入。最一开始不深入语法的话，awk比sed主要多了分段功能。aw...

利用sed和awk进行模式匹配与正则表达式操作

### 利用 sed 和 awk 进行模式匹配与正则表达式操作 #### 1. 正则表达式基础 正则表达式是用于在较大文本文件中搜索具有特定模式（包含元字符）的字符序列。例如，`$ ll /proc | grep cpuinfo` 命令中，`grep` 工具...

sed和awk的模式匹配与正则表达式

### sed和awk的模式匹配与正则表达式 在数据处理和文本编辑中，`sed` 和 `awk` 是两个非常强大的工具。它们可以帮助我们高效地处理文本文件、进行模式匹配和执行各种数据处理任务。下面将详细介绍它们的使用方法和...

含中间直流的三相电力电子变压器PET仿真模型（Simulink仿真实现）

12-16

含中间直流的三相电力电子变压器PET仿真模型（Simulink仿真实现）内容概要：本文档介绍了含中间直流环节的三相电力电子变压器（PET）的Simulink仿真模型，重点在于构建和模拟PET系统的核心结构与工作原理。该仿真模型涵盖了PET的前级整流、中间直流环节以及后级逆变部分，能够实现电能的高效转换与隔离，适用于研究PET在智能电网、新能源接入等场景下的动态特性与控制策略。通过Simulink平台，用户可对系统进行稳态与暂态性能分析，验证控制算法的有效性。; 适合人群：电气工程、电力电子及相关专业的高校师生、科研人员以及从事电力系统仿真的工程技术人员。; 使用场景及目标：①用于教学演示电力电子变压器的工作原理；②支撑科研项目中对PET控制策略（如电压、电流双闭环控制）的设计与验证；③为新型电力系统中电能变换装置的开发提供仿真基础。; 阅读建议：建议结合电力电子技术基础知识学习本仿真模型，重点关注各模块的参数设置与控制逻辑实现，建议动手搭建模型并进行仿真实验，以加深对PET系统运行机制的理解。

考虑柔性负荷的综合能源系统低碳经济优化调度【考虑碳交易机制】（Matlab代码实现）

最新发布

12-16

考虑柔性负荷的综合能源系统低碳经济优化调度【考虑碳交易机制】（Matlab代码实现）内容概要：本文围绕“考虑柔性负荷的综合能源系统低碳经济优化调度”展开，重点研究在碳交易机制下如何实现综合能源系统的低碳化与经济性协同优化。通过构建包含风电、光伏、储能、柔性负荷等多种能源形式的系统模型，结合碳交易成本与能源调度成本，提出优化调度策略，以降低碳排放并提升系统运行经济性。文中采用Matlab进行仿真代码实现，验证了所提模型在平衡能源供需、平抑可再生能源波动、引导柔性负荷参与调度等方面的有效性，为低碳能源系统的设计与运行提供了技术支撑。; 适合人群：具备一定电力系统、能源系统背景，熟悉Matlab编程，从事能源优化、低碳调度、综合能源系统等相关领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标：①研究碳交易机制对综合能源系统调度决策的影响；②实现柔性负荷在削峰填谷、促进可再生能源消纳中的作用；③掌握基于Matlab的能源系统建模与优化求解方法；④为实际综合能源项目提供低碳经济调度方案参考。; 阅读建议：建议读者结合Matlab代码深入理解模型构建与求解过程，重点关注目标函数设计、约束条件设置及碳交易成本的量化方式，可进一步扩展至多能互补、需求响应等场景进行二次开发与仿真验证。

大学怎样用AI工具3分钟生成技术成熟度报告？.docx

12-16

大学怎样用AI工具3分钟生成技术成熟度报告？

【云原生运维】基于Kubernetes的CI/CD全流程自动化：Spring Boot应用在容器化环境下的持续集成与部署实践

12-16

内容概要：本文详细展示了在Kubernetes环境下实现CI/CD全流程的完整示例，涵盖从代码提交、自动化构建、测试、安全扫描到多环境部署的各个环节。技术栈包括GitLab CI、Docker、Helm、Kustomize、Trivy等工具，并以Spring Boot应用为例，提供了Dockerfile、Kubernetes资源配置、Helm Chart结构以及蓝绿部署、金丝雀发布等高级部署策略的具体实现。同时，文章还介绍了GitOps（ArgoCD）、HPA自动扩缩容、Prometheus监控告警等增强能力，并强调了安全性、可靠性、可观测性和成本优化的最佳实践。; 适合人群：具备一定Kubernetes、容器化和DevOps基础知识，从事后端开发、运维或平台工程的技术人员，尤其是希望落地标准化CI/CD流程的团队成员；使用场景及目标：①构建基于Kubernetes的企业级持续交付流水线；②实现安全可控的多环境自动化部署；③集成监控告警与弹性伸缩机制提升系统稳定性；④推动GitOps理念在团队中的实践落地；阅读建议：建议结合实际Kubernetes集群环境，逐步复现文档中的各个步骤，重点关注CI/CD配置逻辑、部署策略差异及最佳实践部分，并将其适配到自身项目体系中进行持续优化。

【分布式系统】基于Redis的Session集中存储方案：实现Web服务器高可用与横向扩展

12-16

内容概要：本文介绍了基于Redis实现分布式Session的解决方案，重点阐述了将Session集中存储于Redis集群的技术思路与优势。文中指出，传统的tomcat-redis-session-manager仅适用于Tomcat容器层的HttpSession同步，存在应用层适配局限；相比之下，推荐使用Spring Session与Redis结合的方式，实现更灵活的应用层Session管理。通过将sessionId作为key、session数据作为value存储在Redis中，可在多台应用服务器间共享Session，确保高可用性和横向扩展能力。同时，文章对比了多种保证Session一致性的架构方案，包括Session同步法、客户端存储法、反向代理Hash一致性以及后端统一存储法，并强调后端统一存储为最优选择。; 适合人群：具备Java Web开发基础，熟悉分布式架构、Redis及Session机制的1-3年经验后端研发人员；使用场景及目标：①解决传统Web服务器集群中Session不一致问题；②实现服务无状态化设计，提升系统可扩展性与容灾能力；③在微服务或负载均衡环境下构建统一的Session管理中心；阅读建议：学习时应结合Spring Session实际集成案例，理解其与Redis的协作机制，并深入掌握不同Session共享方案的适用边界与设计权衡。

浏览器 12.5.0 安装包

12-16

浏览器安装包版本号 12.5.0。

Python自动日报生成器（多文件汇总+邮件发送）

12-16

一键读取多份 Excel/CSV，按配置表头映射后合并生成日报 Excel，可配置主键关联合并并支持 SMTP 邮件发送。内含示例数据、配置模板、依赖列表，修改表头和收件人即可直接运行。

sed与awk教程：模式匹配与正则表达式详解

这两者都广泛应用在日常的系统管理、编程和文本分析任务中，它们共享的核心概念之一是正则表达式，这是模式匹配的关键。书中深入探讨了正则表达式的语法，这是理解sed和awk操作的基础。作者强调了从grep这样的基础...