Python3学习(五):从字符串中提取数字

本文介绍了如何使用正则表达式来提取包含整数、小数形式的数字。通过简单的正则表达式d+.?d*即可完成任务。此表达式能够匹配1次或多次数字,接着是一个可选的小数点,最后是0个或多个数字。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.使用正则表达式,用法如下:

## 总结
## ^ 匹配字符串的开始。
## $ 匹配字符串的结尾。
## \b 匹配一个单词的边界。
## \d 匹配任意数字。
## \D 匹配任意非数字字符。
## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符)。
## x* 匹配0次或者多次 x 字符。
## x+ 匹配1次或者多次 x 字符。
## x{n,m} 匹配 x 字符,至少 n 次,至多 m 次。
## (a|b|c) 要么匹配 a,要么匹配 b,要么匹配 c。
## (x) 一般情况下表示一个记忆组 (remembered group)。你可以利用 re.search 函数返回对象的 groups() 函数获取它的值。

## 正则表达式中的点号通常意味着 “匹配任意单字符”


2.解题思路:

2.1 既然是提取数字,那么数字的形式一般是:整数,小数,整数加小数;

2.2 所以一般是形如:----.-----;

2.3 根据上述正则表达式的含义,可写出如下的表达式:"\d+\.?\d*";

2.4 \d+匹配1次或者多次数字,注意这里不要写成*,因为即便是小数,小数点之前也得有一个数字;\.?这个是匹配小数点的,可能有,也可能没有;\d*这个是匹配小数点之后的数字的,所以是0个或者多个;


3.代码如下:

# -*- coding: cp936 -*-
import re
 
string="A1.45,b5,6.45,8.82"
print re.findall(r"\d+\.?\d*",string)
 
# ['1.45', '5', '6.45', '8.82']

<think>好的,用户想知道如何用Python字符串提取数字。我需要仔细考虑不同的情况,比如字符串中的数字可能包含整数、浮点数,或者有多个数字需要提取。首先,用户可能指的是从包含混合字符的字符串提取出所有数字部分,例如从"abc123def45.6"中提取出123和45.6。 接下来,我需要回忆Python中处理字符串数字的方法。常见的方法有使用正则表达式,或者遍历字符串逐个字符判断。正则表达式可能更高效,特别是处理复杂情况时。比如,使用re模块的findall方法,匹配数字模式。但需要考虑不同格式的数字,比如整数、小数、可能带有正负号的情况。 然后,用户可能还需要知道如何处理更复杂的情况,比如科学计数法中的数字,例如"3e5"或"2.5E-3"。这时候正则表达式需要更全面的模式。另外,如果用户只需要提取整数,或者需要将提取字符串转换为数值类型(如int或float),也需要在回答中说明。 另外,可能还需要提到其他方法,比如使用filter和isdigit函数,但这种方法可能无法处理浮点数中的小数点,或者负数的情况。因此,正则表达式可能更全面。 需要参考提供的引用内容是否有相关的例子。查看引用,发现引用[4]提到了字符串替换的问题,但没有直接相关的内容。不过用户提供的引用中有处理XML数据的例子,可能对提取数字的方法没有直接帮助。因此,主要依靠常规的Python知识来回答。 另外,用户可能需要具体的代码示例,所以应该提供一个或多个方法,并解释每种方法的适用场景。例如,使用正则表达式提取所有数字,包括浮点数和整数,然后转换为列表中的数值类型。还要注意处理可能出现的异常情况,比如字符串中没有数字的情况。 最后,生成相关问题,可能涉及如何处理更复杂的提取需求,或者性能优化等问题。需要确保问题与主题相关,并帮助用户深入理解。</think>要从字符串提取数字Python常用的方法是通过正则表达式匹配数字模式。以下是三种典型场景的实现方法: ### 方法1:提取整数和浮点数 使用正则表达式`r&#39;-?\d+\.?\d*&#39;`匹配包含正负号、整数和小数的数字: ```python import re text = "温度从-5℃升到23.5℃,波动10度" numbers = re.findall(r&#39;-?\d+\.?\d*&#39;, text) # 输出: [&#39;-5&#39;, &#39;23.5&#39;, &#39;10&#39;] num_values = [float(n) for n in numbers] # 转换为数值类型 ``` ### 方法2:精确匹配整数/浮点数格式 使用更严格的正则表达式`r&#39;-?\d+(?:\.\d+)?&#39;`避免匹配不完整数字: ```python text = "坐标(x=12.3, y=4)" numbers = re.findall(r&#39;-?\d+(?:\.\d+)?&#39;, text) # 输出: [&#39;12.3&#39;, &#39;4&#39;] ``` ### 方法3:分离数字与非数字字符 通过分割非数字字符提取连续数字段: ```python text = "ID:007,电压3.7V" split_list = re.split(r&#39;[^-\d.]+&#39;, text) # 按非数字字符切割 numbers = [s for s in split_list if s] # 过滤空字符串得[&#39;007&#39;, &#39;3.7&#39;] ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

猪笨是念来过倒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值