python 正则表达式匹配带千分位和小数点的金额

原创已于 2023-01-15 22:38:29 修改 · 1.2k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#python #正则表达式

于 2023-01-15 22:36:09 首次发布

正则表达式同时被 2 个专栏收录

1 篇文章

订阅专栏

python

1 篇文章

订阅专栏

文章探讨了如何使用Python的re模块编写的正则表达式来提取各种格式的金额，包括带有币种、逗号分隔的数字和小数点。通过示例代码展示了如何从包含金额信息的文本中匹配和提取数值。

Python3.10

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

在一段文字中提取金额

如：本次交易金额为 123USD。

当然，金额有很多表达形式，包括是否带小数点，是否带千分位等，总结下来大致有以下几种情况（币制可能在前也可能在后）

 a='金额是JPY37,200,000.59'
 b='金额是USD37,280.59'
 c='金额为23569RMB'
 d='价格是23000.59EUR'
 e='总价是2GBP'

将金额切分为头、中、尾三部分，分别总结特点，考虑如下的正则表达式：

pattern=re.compile(r'(?P<price>\d+(,\d{3})*(\.\d+)?)')

测试：
import re
import pandas as pd

a='金额是JPY37,200,000.59' 
b='金额是USD37,280.59' 
c='金额为23569RMB' 
d='价格是23000.59EUR' 
e='总价是2GBP'
lis=[a,b,c,d,e]
print(lis)
pattern=re.compile(r'(?P<price>\d+(,\d{3})*(\.\d+)?)')
for item in lis:
    res=pattern.search(item)
    if res!=None:
        print(res.group('price'))
    else:
        print(item,"no match")

测试结果：

37,200,000.59

37,280.59

23569

23000.59

2

Process finished with exit code 0

您可能感兴趣的与本文相关的镜像

Python3.10

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本