驴槽马嘴:外来文字的对应(Oracle10.2.0.3)

本文介绍了如何使用ORACLE的UNISTR函数和自定义函数code_to_char来解决CSV文件中出现的日文乱码问题。通过将HTMLNUMBER式转换为UNICODE并正确显示日文字符,实现数据的正确读取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

营业部门送来的客户数据(CSV格式)里出现了乱码。 “三沢株式会社”。从上下文看,这大概是一个日文汉字。正是:驴槽上出了马嘴。

从格式看,这是HTML NUMBER格式。大概是用户通过WEB页面输入,因为浏览器对这种格式可自动转换,显示时并不出现乱码,但是保存后会出现。

 

我的ORACLE用的是UNICODE,相信没有显示不了的字符。

Oracle提供了一个UNISTR的函数,它要求输入4位16进制格式。当字符的UNICODE codepoint过大时,要先做切分,再说了,HTML NMBER是10进制,还要先转换到16进制。

好在xmlquery中可以用codepoints-to-string这样的函数。(http://www.sqlsnippets.com/en/topic-13438.html

 

1.     自定义函数

 

create function code_to_char(dec_code in number)

return varchar2

is

  chr_str varchar2(256);

  sql_str varchar2(3200);

begin

sql_str := 'select xmlquery(''fn:codepoints-to-string('||dec_code||')'' returning content ).getstringval() from dual';

EXECUTE IMMEDIATE sql_str into chr_str ;

return chr_str;

end;

 

2. 验证

select code_to_char('沢') C from dual;

C

可见, “三沢株式会社”应该是“三沢株式会社”。

 

select code_to_char(35) Digit2, code_to_char(245) Digit3, code_to_char(26576) Digit4, code_to_char(34003) Digit5, code_to_char(169808) Digit6 from dual;

 

DIGIT2

DIGIT3

DIGIT4

DIGIT5

DIGIT6

#

õ

*

 

* 这个字的UNICODE信息可参见:http://en.glyphwiki.org/wiki/u29750

 

3. 利用此函数转换相应的字符

(详情略。使用单一的Udapte+replace怕不成。也许要用PL/SQL,还要用循环)

 

资源下载链接为: https://pan.quark.cn/s/f989b9092fc5 今天给大家分享一个关于C#自定义字符串替换方法的实例,希望能对大家有所帮助。具体介绍如下: 之前我遇到了一个算法题,题目要求将一个字符串中的某些片段替换为指定的新字符串片段。例如,对于源字符串“abcdeabcdfbcdefg”,需要将其中的“cde”替换为“12345”,最终得到的结果字符串是“ab12345abcdfb12345fg”,即从“abcdeabcdfbcdefg”变为“ab12345abcdfb12345fg”。 经过分析,我发现不能直接使用C#自带的string.Replace方法来实现这个功能。于是,我决定自定义一个方法来完成这个任务。这个方法的参数包括:原始字符串originalString、需要被替换的字符串片段strToBeReplaced以及用于替换的新字符串片段newString。 在实现过程中,我首先遍历原始字符串,查找需要被替换的字符串片段strToBeReplaced出现的位置。找到后,就将其替换为新字符串片段newString。需要注意的是,在替换过程中,要确保替换操作不会影响后续的查找和替换,避免遗漏或重复替换的情况发生。 以下是实现代码的大概逻辑: 初始化一个空的字符串result,用于存储最终替换后的结果。 使用IndexOf方法在原始字符串中查找strToBeReplaced的位置。 如果找到了,就将originalString中从开头到strToBeReplaced出现位置之前的部分,以及newString拼接到result中,然后将originalString的查找范围更新为strToBeReplaced之后的部分。 如果没有找到,就直接将剩余的originalString拼接到result中。 重复上述步骤,直到originalStr
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值