切分表达式——写个tokenizer吧 (JAVA)

本文解析如何使用Java编程将四则运算表达式中的数字、运算符和括号作为tokens进行切割。通过示例展示了如何遍历输入字符串,正确识别并输出每个独立的token。

下一个空,回车
这个是数,下一个不是数且不是.回车
这个是符号(不是+,-,.)回车
这个是加减&&前一个非空,前一个为),或前一个为数,回车

四则运算表达式由运算数(必定包含数字,可能包含正或负符号、小数点)、运算符(包括+、-、*、/)以及小括号((和))组成,每个运算数、运算符和括号都是一个token(标记)。现在,对于给定的一个四则运算表达式,请把她的每个token切分出来。题目保证给定的表达式是正确的,不需要做有效性检查。

输入格式:
在一行中给出长度不超过40个字符的表达式,其中没有空格,仅由上文中token的字符组成

输出格式:
依次输出表达式中的tokens,每个token占一行。

输入样例:
32*((2-2)+5)/(-15)
输出样例:
32
*
(
(
2

2
)
+
5
)
/
(
-15
)

import java.util.Scanner;

public class Main{
    public static void main(String[] args){
        Scanner sc=new Scanner(System.in);
        String s=sc.next();
        for(int i=0;i<s.length();i++){
            char ch=s.charAt(i);
            System.out.printf("%c",ch);
            if(i+1==s.length())
                System.out.printf("%n");
            else if(ch>='0'&&ch<='9'&&!(s.charAt(i+1)>='0'&&s.charAt(i+1)<='9')&&s.charAt(i+1)!='.')
                System.out.printf("%n");
            else if(ch=='*'||ch=='/'||ch=='('||ch==')')
                System.out.printf("%n");
            else if((ch=='+'||ch=='-')&&i-1!=-1){
                if(s.charAt(i-1)==')'||s.charAt(i-1)>='0'&&s.charAt(i-1)<='9')
                    System.out.printf("%n");
            }
        }
    }
}
### 实现一个用于切分表达式Tokenizer 为了实现一个能够将四则运算表达式切分为 token 的工具,可以采用 Python 中的正则表达式模块 `re` 来完成这一任务。通过定义合适的模式匹配规则,可以识别并提取出所有的操作数、运算符和括号。 以下是完整的解决方案: #### 正则表达式设计 - 数字部分:支持整数、浮点数以及带有正负号的数值。可以通过 `\d+\.\d*|\d*\.\d+|-\d+(\.\d*)?|-\d*\.\d+|\d+` 表达[^1]。 - 运算符:包括加法 (`+`)、减法 (`-`)、乘法 (`*`) 和除法 (`/`)。可以直接用 `[+\-*\/]` 匹配[^1]。 - 小括号:左括号 (`(`) 和右括号 (`)`) 可以分别单独处理。 最终的正则表达式组合如下: ```python import re def tokenize(expression): pattern = r""" \s*( # 去掉空白字符 [-+]?\d+(\.\d*)? | # 整数或浮点数 (可选带符号) [-+]?\.\d+ | # 浮点数开头的小数点形式 [\(\)] | # 左右括号 [+\-*/] # 四则运算符 )\s* """ tokens = re.findall(pattern, expression, re.VERBOSE) return tokens ``` #### 示例运行 假设输入字符串为 `"3 + 4 * (2 - 1)"`,调用函数后的结果将是: ```python expression = "3 + 4 * (2 - 1)" tokens = tokenize(expression) print(tokens) ``` 输出结果为: ``` ['3', '+', '4', '*', '(', '2', '-', '1', ')'] ``` 此方法利用了正则表达式的强大功能来解析复杂的字符串结构,并将其分解成独立的单元(即 token),从而便于后续进一步计算或其他逻辑处理[^1]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值