Python3学习（五）：从字符串中提取数字

最新推荐文章于 2023-03-24 09:08:00 发布

原创最新推荐文章于 2023-03-24 09:08:00 发布 · 2.3w 阅读

41 ·

CC 4.0 BY-SA版权

文章标签：

#python

Python 专栏收录该内容

63 篇文章

订阅专栏

本文介绍了如何使用正则表达式来提取包含整数、小数形式的数字。通过简单的正则表达式d+.?d*即可完成任务。此表达式能够匹配1次或多次数字，接着是一个可选的小数点，最后是0个或多个数字。

1.使用正则表达式，用法如下：

## 总结
## ^ 匹配字符串的开始。
## $ 匹配字符串的结尾。
## \b 匹配一个单词的边界。
## \d 匹配任意数字。
## \D 匹配任意非数字字符。
## x? 匹配一个可选的 x 字符 (换言之，它匹配 1 次或者 0 次 x 字符)。
## x* 匹配0次或者多次 x 字符。
## x+ 匹配1次或者多次 x 字符。
## x{n,m} 匹配 x 字符，至少 n 次，至多 m 次。
## (a|b|c) 要么匹配 a，要么匹配 b，要么匹配 c。
## (x) 一般情况下表示一个记忆组 (remembered group)。你可以利用 re.search 函数返回对象的 groups() 函数获取它的值。

## 正则表达式中的点号通常意味着 “匹配任意单字符”

2.解题思路：

2.1 既然是提取数字，那么数字的形式一般是：整数，小数，整数加小数；

2.2 所以一般是形如：----.-----；

2.3 根据上述正则表达式的含义，可写出如下的表达式："\d+\.?\d*"；

2.4 \d+匹配1次或者多次数字，注意这里不要写成*，因为即便是小数，小数点之前也得有一个数字；\.?这个是匹配小数点的，可能有，也可能没有；\d*这个是匹配小数点之后的数字的，所以是0个或者多个；

3.代码如下：

# -*- coding: cp936 -*-
import re
 
string="A1.45，b5，6.45，8.82"
print re.findall(r"\d+\.?\d*",string)
 
# ['1.45', '5', '6.45', '8.82']