c++ 解决乱码,分割字符串方法

本文介绍了两种实用的编程技巧:一是如何将UTF-8编码的字符串转换为GB编码,适用于处理中文乱码问题;二是提供了两种不同的字符串分割方法,包括正则表达式分割和普通字符分割,适用于数据解析和文本处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.解决乱码

string UTF8ToGB(const char* str)
{
	string result;
	WCHAR *strSrc;
	LPSTR szRes;

	//获得临时变量的大小
	int i = MultiByteToWideChar(CP_UTF8, 0, str, -1, NULL, 0);
	strSrc = new WCHAR[i + 1];
	MultiByteToWideChar(CP_UTF8, 0, str, -1, strSrc, i);

	//获得临时变量的大小
	i = WideCharToMultiByte(CP_ACP, 0, strSrc, -1, NULL, 0, NULL, NULL);
	szRes = new CHAR[i + 1];
	WideCharToMultiByte(CP_ACP, 0, strSrc, -1, szRes, i, NULL, NULL);

	result = szRes;
	delete[]strSrc;
	delete[]szRes;

	return result;
}

2.分割
(1)

vector<string> split(string str, string s)
{
	regex reg(s.c_str());
	std::vector<std::string> vec;
	sregex_token_iterator it(str.begin(), str.end(), reg, -1);
	sregex_token_iterator end;
	while (it != end)
	{
		vec.push_back(*it++);
	}
	return vec;
}

(2)

vector<string> split(const string& in, const string& delim)
{
	vector<string> ret;
	try
	{
		regex re {delim };
		return vector<string>{
			sregex_token_iterator(in.begin(), in.end(), re, -1),
				sregex_token_iterator()
		};
	}
	catch (const std::exception& e)
	{
		cout << "error:" << e.what() << std::endl;
	}
	return ret;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值