^M

为什么打开文件有^M

计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。
于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。
一个叫做“回车”,告诉打字机把打印头定位在左边界;
一个叫做“换行”,告诉打字机把纸向下移一行。
这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。
后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。

mac和Windows

Unix 系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“<回车><换行>”,即“ \r\n”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。

### '^m' 的含义或用途 在编程和数据处理上下文中,`^m` 可能具有不同的解释,具体取决于使用的工具、语言或环境。以下是几种可能的情况: #### 1. 正则表达式中的 `^m` 如果 `^m` 出现在正则表达式的语境下,则可以分解为两个部分来理解: - `^`: 这是一个锚定符,在大多数正则表达式引擎中表示匹配字符串的开头[^3]。 - `m`: 如果单独作为字符存在,则通常被解释为字母 "m" 自身。 然而,某些高级正则表达式实现支持多行模式(multiline mode),在这种情况下: - 当启用了多行模式时,`^` 不仅匹配整个输入字符串的起始位置,还匹配每一行的起始位置。 - 结合上述逻辑,`^m` 表示匹配某一行以字母 "m" 开头的位置[^2]。 需要注意的是,不同工具对于正则表达式的解析可能存在差异。例如,在 GNU grep 中启用扩展正则表达式功能后,可以通过 `-E` 参数激活更复杂的语法结构;而在其他一些环境中,类似的组合可能会引发错误或者未定义行为。 #### 2. 特殊控制字符 ^M 在文本编辑器领域尤其是基于 Unix/Linux 平台的操作系统里,有时会看到文件中含有不可见字符显示成 `^M` 形式。实际上这是 DOS/Windows 风格下的回车符(Carriage Return),ASCII 编码值为 13 (`\r`) 而已。当从 Windows 移植文档到类 UNIX 系统上查看时如果没有正确转换换行序列(`CRLF -> LF`)就可能出现这种现象[^1]。 为了清理这些多余的 CR 字节,常用命令如下所示: ```bash dos2unix filename.txt ``` 另外也可以通过 sed 工具手动替换掉它们: ```bash sed 's/\r$//' inputfile > outputfile ``` #### 3. Lua 解析框架内的潜在意义 由于最初提到的内容涉及到了 lua 的表达式定义规则,这里也简单探讨一下是否存在关联的可能性。不过按照给出的标准来看,并不存在直接对应关系能够赋予 "^m" 明确的意义于其中[^1]。 --- ### 总结 综上所述,“^m”的确切含义需依据实际应用场景判断。它既可能是用于指示特定条件下首字母匹配需求的一部分(如正则里的行首限定加目标字串),也可能仅仅代表一种历史遗留下来的特殊编码表现形式即DOS风格回车标记而已。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值