CCF201709-3 JSON查询(100分)【文本处理】

试题编号:201709-3
试题名称:JSON查询
时间限制:1.0s
内存限制:256.0MB
问题描述:

问题描述

  JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式,可以用来描述半结构化的数据。JSON 格式中的基本单元是值 (value),出于简化的目的本题只涉及 2 种类型的值:
  * 字符串 (string):字符串是由双引号 " 括起来的一组字符(可以为空)。如果字符串的内容中出现双引号 ",在双引号前面加反斜杠,也就是用 \" 表示;如果出现反斜杠 \,则用两个反斜杠 \\ 表示。反斜杠后面不能出现 " 和 \ 以外的字符。例如:""、"hello"、"\"\\"。
  * 对象 (object):对象是一组键值对的无序集合(可以为空)。键值对表示对象的属性,键是属性名,值是属性的内容。对象以左花括号 { 开始,右花括号 } 结束,键值对之间以逗号 , 分隔。一个键值对的键和值之间以冒号 : 分隔。键必须是字符串,同一个对象所有键值对的键必须两两都不相同;值可以是字符串,也可以是另一个对象。例如:{}、{"foo": "bar"}、{"Mon": "weekday", "Tue": "weekday", "Sun": "weekend"}。
  除了字符串内部的位置,其他位置都可以插入一个或多个空格使得 JSON 的呈现更加美观,也可以在一些地方换行,不会影响所表示的数据内容。例如,上面举例的最后一个 JSON 数据也可以写成如下形式。
  {
  "Mon": "weekday",
  "Tue": "weekday",
  "Sun": "weekend"
  }
  给出一个 JSON 格式描述的数据,以及若干查询,编程返回这些查询的结果。

输入格式

  第一行是两个正整数 n 和 m,分别表示 JSON 数据的行数和查询的个数。
  接下来 n 行,描述一个 JSON 数据,保证输入是一个合法的 JSON 对象。
  接下来 m 行,每行描述一个查询。给出要查询的属性名,要求返回对应属性的内容。需要支持多层查询,各层的属性名之间用小数点 . 连接。保证查询的格式都是合法的。

输出格式

  对于输入的每一个查询,按顺序输出查询结果,每个结果占一行。
  如果查询结果是一个字符串,则输出 STRING <string>,其中 <string> 是字符串的值,中间用一个空格分隔。
  如果查询结果是一个对象,则输出 OBJECT,不需要输出对象的内容。
  如果查询结果不存在,则输出 NOTEXIST。

样例输入

10 5
{
"firstName": "John",
"lastName": "Smith",
"address": {
"streetAddress": "2ndStreet",
"city": "NewYork",
"state": "NY"
},
"esc\\aped": "\"hello\""
}
firstName
address
address.city
address.postal
esc\aped

样例输出

STRING John
OBJECT
STRING NewYork
NOTEXIST
STRING "hello"

评测用例规模与约定

  n ≤ 100,每行不超过 80 个字符。
  m ≤ 100,每个查询的长度不超过 80 个字符。
  字符串中的字符均为 ASCII 码 33-126 的可打印字符,不会出现空格。所有字符串都不是空串。
  所有作为键的字符串不会包含小数点 .。查询时键的大小写敏感。
  50%的评测用例输入的对象只有 1 层结构,80%的评测用例输入的对象结构层数不超过 2 层。举例来说,{"a": "b"} 是一层结构的对象,{"a": {"b": "c"}} 是二层结构的对象,以此类推。

 

 

本题这里的解法采用有限状态自动机的思想来编写程序,出现某种语法成分后进入到某一种状态,在某种状态下则做相应的处理。对于文本处理来说,用有限状态自动机的原理进行处理是是否有效的。程序中有三种状态,另外用变量来辅助,最后实现对JSON文本的处理。这种处理是简易的,语法上未必是严密的,虽然能够得100分。

  文本处理问题也可以用正则表达式来处理,但是其本质(背后的处理)也是有限状态自动机。

同时由于输入文本中有多层{}结构,所以需要堆栈上一层的键值;

#include <iostream>
#include <string>
#include <vector>
#include <map>
#include <stack>
using namespace std;

map<string, string> mp;
int state = 0;
bool isstr = false;
stack<string> keys;
string key;
void handle(string &x)
{
	int i;
	string tmp;
	for (i = 0; i<x.size(); i++)
	{
		if (x[i] == '{')
		{
			if (state == 2)//遇到:号 
			{
				state = 3;
				keys.push(key);//上一层的键值入栈
			}
			else
			{
				state = 1;
				keys.push(key);
			}

		}
		if (x[i] == '}')
		{
			keys.pop();
			state = 1;
		}
		else if (x[i] == ':')
		{
			state = 2;

		}
		else if (x[i] == ',')
		{
			state = 1;

		}
		else if (x[i] == '"'&&isstr == false)//第一个" 打开取字符串
		{
			isstr = true;
		}
		else if (x[i] == '"'&&isstr == true)//第二个” 关闭取字符串
		{
			isstr = false;
		}
		if (isstr == true)//已经遇到第一个 ”,进入处理字符串
		{
			for (i = i + 1; x[i] != '"'; i++)
			{
				if (x[i] == '\\' && (x[i + 1] == '\"' || x[i + 1] == '\\'))i++;
				tmp.push_back(x[i]);
			}
			i--;
			if (state == 1)
			{
				if (!(keys.top().empty()))key = keys.top() + "." + tmp;//上一层的 
				else key = tmp;
				tmp.clear();
			}
			else if (state == 2)
			{
				mp[key] = "STRING "+tmp;
				tmp.clear();
			}
			else if (state == 3)
			{
				mp.insert(pair<string, string>(key, "OBJECT"));
				key += "." + tmp;
				tmp.clear();
			}
		}
	}
}
int main()
{
	int n, m, i;
	string tem;
	cin >> n >> m;
	getline(cin, tem);
	for (i = 0; i<n; i++)
	{
		getline(cin, tem);
		handle(tem);
	}
	for (i = 0; i<m; i++)
	{
		cin >> tem;
		cout << (mp[tem] == "" ? "NOTEXIST" : mp[tem]) << endl;
	}
	cin >> i;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值