sed与awk菜鸟的笔记--第五章 基本sed命令

本文详细介绍了sed编辑器的基本命令,包括替换、追加、插入、更改等操作,以及如何使用sed进行文本模式匹配、打印行号、读写文件和条件退出等高级功能。

第五章 基本sed命令

命令语法:
[adress]command  #能接受逗号分隔的两个地址,这两个地址用来标识行的范围
[line-adress]command  #只接受单个行地址,不能接受某个范围的行.
adress{ 
 common1
 common2
 ...
}
   #多命令作用于同一个地址

替换:
[address]s/pattern/replacement/flags
flags:
n:1到512之间的数字,表示对本模式中指定模式出现第n次的情况进行替换
g:全局替换,没有g则替换第一次出现的情况.
p:打印模式空间内容.
w file:将模式空间内容写入文件file中.

$sed 's/\t/\n/1' file  #用换行替(\n)代每行第一个制表符(\t)

 

追加,插入,更改

追加: [line-address]a\
      text
插入: [line-address]i\
      text
更改: [address]c\
      text  
追加:将text放置在匹配[line-address]的行之后(注意是以行为单位,不是放在匹配的表达式前)
插入:将text放置在匹配[line-address]的行之前(注意是以行为单位,不是放在匹配的表达式前)
更改:将text替换匹配[line-address]的行(或范围)(注意是以行为单位,不是放在匹配的表达式前)

这些命令每一个后面都要跟反斜杠结尾.text要重启一行,连续多行要以反斜杠结束,最后一行例外.如果文本包含字面反斜杠,就再添加一个反斜杠转义它.
追加和插入只是单行地址,而不是一个范围的行(如果指定的是范围,则会在范围内每一行进行追加或插入).而更改可以处理一个范围内的行.即先删除范围内的所有行,然后将提供的文本放到删除的位置.
插入和追加不影响模式空间的内容,替换后的文本不会匹配后续的命令.(即新来的不会在本次执行中起作用,也不会很容易的造成死循环)

#下例是在第1行前面插入两行新行,执行完sed后,模式空间不会改变.后续命令也不会匹配AAA和BBB.
1i\
AAA\
BBB

终端执行:
$ cat test.sed
1i\
AAA\
BBB

$ cat file
a
b

$ sed -f test.sed file
AAA
BBB
a
b

#下例可以实现在文件结尾处添加行追加命令. 
$a\
End of file

终端执行:
$ cat test.sed
$a\
End of file

$ cat file
a
b

$ sed -f test.sed file
a
b
End of file


转换:
按位置将abc中的每个字符,转换成xyz中的等价字符.(它没有"词"的概念,这样,"a"都转换成"x",不管它后面有没有"b")
[address]y/abc/xyz/
y/abcd..../ABCDEF...../(26字母需全列出):此功能用于小写转大写.

打印行号:这个命令书上说不能对一个范围内的行进行操作,但我试试好像可以作用范围内.
[line-address]=

#以下例子打印有"if"的行号和行.执行方法:$sed -f if.sed -n file  (如果不加-n会输出所有行,别且显示行号的行也会重复输出)
$cat if.sed
/if/{
=
p
}

#以下例子是打印出匹配/a/的行号和行(行号与内容不在一行)
$ cat file
aaa
bbb
ccc

$ sed -n '/a/{=;p}' file
1
aa
2
bb
3
cc


下一步:NEXT
读取输入的下一行,而不返回到脚本的顶端.脚本中后续命令用于下一行,而不是当前行.
[address]n

#下面脚本含义:匹配以".H1"开始的行,然后打印这一行,然后读入下一行.如果下一行为空则删除它.
/^\.H1/{
n
/^$/d
}

读和写文件:用于直接处理文件,只有唯一的参数,就是文件名.
[line-address]r file
[address]w file

读命令:将file内容读入到模式空间.它不能对一个范围内的行进行操作.
写命令:将模式空间的内容写到file中.
读命令:命令和文件名之间必须有一个空格(空格后到换行符前每个字符都被当做文件名.)如果文件不存在也不会报错.
写命令:文件不存在就创建一个.存在则改写它.若脚本有多个指令写到同一文件,那么每个写命令都将内容追加到此文件中.
每个脚本最多只能打开10个文件.

读命令对将一个文件的内容插入到另一个文件的特定位置很有用.

#下例中 $是文件最后一行的寻址符号.上例是将当前目录下file1文件的内容加入到file2后一起输出.
$ sed '$r ./file1' file2

写命令用途之一是从一个文件中提取信息,并放在自己的文件中.
下面为原始文件file:
Tom male
Jerry male
Lucy female
Roy male
...

脚本如下:
/male$/w ./male.txt
/female$/w ./female.txt

#以上例子可轻松将男女分离到不同文件.

退出:
使sed停止读入行.只适用于单行地址,一旦找到address匹配行,那么脚本就结束.

[line-address]q
$ sed '100q' file #打印file前100行
对于大文件,找到匹配行即退出,比扫描全文件效率要高得多.

下载方式:https://pan.quark.cn/s/a4b39357ea24 在纺织制造领域中,纱线的品质水平对最终制成品的整体质量具有决定性作用。 鉴于消费者对于产品规格和样式要求的不断变化,纺织制造工艺的执行过程日益呈现为一种更为复杂的操作体系,进而导致对纱线质量进行预测的任务变得更加困难。 在众多预测技术中,传统的预测手段在面对多变量间相互交织的复杂关系时,往往显得力不从心。 因此,智能计算技术在预测纱线质量的应用场景中逐渐占据核心地位,其中人工神经网络凭借其卓越的非线性映射特性以及自适应学习机制,成为了众多预测方法中的一种重要选择。 在智能计算技术的范畴内,粒子群优化算法(PSO)和反向传播神经网络(BP神经网络)是两种被广泛采用的技术方案。 粒子群优化算法是一种基于群体智能理念的优化技术,它通过模拟鸟类的群体觅食行为来寻求最优解,该算法因其操作简便、执行高效以及具备优秀的全局搜索性能,在函数优化、神经网络训练等多个领域得到了普遍应用。 反向传播神经网络则是一种由多层节点构成的前馈神经网络,它通过误差反向传播的机制来实现网络权重和阈值的动态调整,从而达成学习预测的目标。 在实际操作层面,反向传播神经网络因其架构设计简洁、实现过程便捷,因此被广泛部署于各类预测和分类任务之中。 然而,该方法也存在一些固有的局限性,例如容易陷入局部最优状态、网络收敛过程缓慢等问题。 而粒子群优化算法在参神经网络优化时,能够显著增强神经网络的全局搜索性能并提升收敛速度,有效规避神经网络陷入局部最优的困境。 将粒子群优化算法反向传播神经网络相结合形成的PSO-BP神经网络,通过运用粒子群优化算法对反向传播神经网络的权值和阈值进行精细化调整,能够在预测纱线断裂强度方面,显著提升预测结果的...
植物实例分割数据集 一、基础信息 数据集名称:植物实例分割数据集 图片数量: - 训练集:9,600张图片 - 验证集:913张图片 - 测试集:455张图片 总计:10,968张图片 分类类别:59个类别,对应数字标签0至58,涵盖多种植物状态或特征。 标注格式:YOLO格式,适用于实例分割任务,包含多边形标注点。 数据格式:图像文件,来源于植物图像数据库,适用于计算机视觉任务。 二、适用场景 • 农业植物监测AI系统开发:数据集支持实例分割任务,帮助构建能够自动识别植物特定区域并分类的AI模型,辅助农业专家进行精准监测和分析。 • 智能农业应用研发:集成至农业管理平台,提供实时植物状态识别功能,为作物健康管理和优化种植提供数据支持。 • 学术研究农业创新:支持植物科学人工智能交叉领域的研究,助力发表高水平农业AI论文。 • 农业教育培训:数据集可用于农业院校或培训机构,作为学生学习植物图像分析和实例分割技术的重要资源。 三、数据集优势 • 精准标注多样性:标注采用YOLO格式,确保分割区域定位精确;包含59个类别,覆盖多种植物状态,具有高度多样性。 • 数据量丰富:拥有超过10,000张图像,大规模数据支持模型充分学习和泛化。 • 任务适配性强:标注兼容主流深度学习框架(如YOLO、Mask R-CNN等),可直接用于实例分割任务,并可能扩展到目标检测或分类等任务。
室内物体实例分割数据集 一、基础信息 • 数据集名称:室内物体实例分割数据集 • 图片数量: 训练集:4923张图片 验证集:3926张图片 测试集:985张图片 总计:9834张图片 • 训练集:4923张图片 • 验证集:3926张图片 • 测试集:985张图片 • 总计:9834张图片 • 分类类别: 床 椅子 沙发 灭火器 人 盆栽植物 冰箱 桌子 垃圾桶 电视 • 床 • 椅子 • 沙发 • 灭火器 • 人 • 盆栽植物 • 冰箱 • 桌子 • 垃圾桶 • 电视 • 标注格式:YOLO格式,包含实例分割的多边形标注,适用于实例分割任务。 • 数据格式:图片为常见格式如JPEG或PNG。 二、适用场景 • 实例分割模型开发:适用于训练和评估实例分割AI模型,用于精确识别和分割室内环境中的物体,如家具、电器和人物。 • 智能家居物联网:可集成到智能家居系统中,实现自动物体检测和场景理解,提升家居自动化水平。 • 机器人导航交互:支持机器人在室内环境中的物体识别、避障和交互任务,增强机器人智能化应用。 • 学术研究教育:用于计算机视觉领域实例分割算法的研究教学,助力AI模型创新验证。 三、数据集优势 • 类别多样性:涵盖10个常见室内物体类别,包括家具、电器、人物和日常物品,提升模型在多样化场景中的泛化能力。 • 精确标注质量:采用YOLO格式的多边形标注,确保实例分割边界的准确性,适用于精细的物体识别任务。 • 数据规模充足:提供近万张标注图片,满足模型训练、验证和测试的需求,支持稳健的AI开发。 • 任务适配性强:标注格式兼容主流深度学习框架(如YOLO系列),便于快速集成到实例分割项目中,提高开发效率。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值