Topcoder_8

本文介绍了一种词法分析器的设计与实现方法,该分析器能够处理预定义的语句列表,并从输入文本中识别这些语句。文章详细解释了分析器的工作原理,通过实例演示了如何将输入字符串分解成一系列合法的语句。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【问题描述】
    词法分析器的功能是将给定输入文本分成若干个预定义的语句。在该问题中预先给定一个合法语句列表(比如,tokens = {"ab","aba","A"})和一个输入的字符串,你的词法分析程序的工作方式应该按照以下规则:
  1、a)如果给定的字符串不是以合法的语句开始,则从字符串中移除第一个字符;
       b)如果给定的字符串是以一个合法的语句开始,那么找到最长匹配的语句并从输入的字符串中删除它,被移除的部分称为CONSUMED。
  2、重复第一步的操作直到分析完输入字符串中所有的字符。
    这个分析器是大小写敏感的,对于给定一个语句列表,该方法需要返回一个所有CONSUMED的列表(按照被解析的顺序排列)。
    例如,给定语句列表tokens = {"ab","aba","A"} ,输入的待分析的字符串input = "ababbbaAab"。在字符串的开始,能够同时匹配"ab"和"aba",但是由于"aba"较长所以它作为第一个 CONSUMED。因此现在consumed = {"aba"},待分析的字符串变为input = "bbbaAab"。因为没有合法的语句是以"b"开始的因此需要从input中移除三次"b" ,然后consumed = {"aba"} input = "aAab"。因为该分析器是大小写敏感的,因此"a"和"A"不能匹配,因此移除"a",然后consumed = {"aba"} input = "Aab"。根据以上的操作模式最终得到consumed = {"aba","A","ab"} input = "",返回CONSUMED列表,即{"aba","A","ab"}。

  定义:
类  Lexer
方法  public String[] tokenize(String[] tokens, String input)

  约束:
1、给定的语句列表包括0至50个元素
2、每个语句包括1至50个字符
3、每个语句仅包含字母(a-z, A-Z)
4、输入的待分析的字符串长度为0至50,且仅包含字母(a-z, A-Z)

  测试用例:
1、{"ab","aba","A"}  "ababbbaAab"
Returns: { "aba",  "A",  "ab" }
2、{"a","a","aa","aaa","aaaa","aaaaa","aa"} "aaaaaaaaaaaaaaaaaaaaaaaaa"
Returns: { "aaaaa",   "aaaaa",  "aaaaa",  "aaaaa",  "aaaaa" }
3、{"wow","wo","w"} "awofwwofowwowowowwwooo"
Returns: { "wo",  "w",  "wo",  "w",  "wow",  "wow",  "w",  "wo" }
4、{"int","double","long","char","boolean","byte","float"} "intlongdoublecharintintboolean"
Returns: { "int",  "long",  "double",  "char",  "int",  "int",  "boolean" }
5、{} "Great"
Returns: { }
6、{"AbCd","dEfG","GhIj"} "abCdEfGhIjAbCdEfGhIj"
Returns: { "dEfG",  "AbCd",  "GhIj" }
  1. import java.util.ArrayList;
  2. public class Lexer {
  3.     public String[] tokenize(String[] tokens, String input){
  4.         ArrayList<String> res = new ArrayList<String>();
  5.         String tmp="";
  6.         for(int i=0; i<tokens.length; i++){
  7.             for(int k=i+1; k<tokens.length; k++){
  8.                 if(tokens[k].length()>tokens[i].length()){
  9.                     tmp = tokens[k];
  10.                     tokens[k]=tokens[i];
  11.                     tokens[i]=tmp;
  12.                 }
  13.             }
  14.         }
  15.         tmp = input;
  16.         while(tmp.length()>0){
  17.             int i,k;
  18.             for(i=0; i<tokens.length; i++){
  19.                 for(k=0; k<tokens[i].length() && k<tmp.length(); k++){
  20.                     if(tmp.charAt(k)!=tokens[i].charAt(k))
  21.                         break;
  22.                 }
  23.                 if(k==tokens[i].length()){
  24.                     res.add(tokens[i]);
  25.                     tmp = tmp.substring(k);
  26.                     break;
  27.                 }
  28.             }
  29.             if(i==tokens.length)
  30.                 tmp=tmp.substring(1);
  31.         }
  32.         return res.toArray(new String[0]);
  33.     }
  34. }

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值