问题描述:发送压缩文件到qq邮箱,发现标题为中文名称,能正常显示,但是附件的中文名称为乱码。
任务:解决附件中文名称的乱码问题。
前期资料总结:
1、SMTP乱码解决方案(源自https://blog.youkuaiyun.com/saokeliu/article/details/5194547)
Smtp发送中文邮件的时候也会产生像ftp乱码的现象,不知道在网上这样的资料很少,让我们那些第一次遇到这种问题的人真不知道该从何下手,不过还好,这个问题相对ftp的解决起来简单一些,因为我们可以很清楚地想到还是要根据他的rfc文档来进行代码的调整,描述smtp的rfc文件有:rfc2821,2045,2046,2047,2048,2049,因为rfc文档是权威性的协议开发”手册”,所以进行网络协议的开发的对于这种编程遇到问题第一想到的当然是查文档,
Smtp发送邮件要注意编码方面问题的至少包括两个部分:邮件主题和邮件内容,至于其他的属性都是英文的表示形式,对这种情况编码方式并不敏感,所以我们最主要的任务就是找出设置主题和内容为某种制定编码的格式的rfc参考文档:
Subject:rfc2047
Connect:rfc2045
sprintf(pOutBuff,“Subject: =?utf-8?B?%s?=/r/n”,local_out_buf)//指定邮件主题为utf-8编码,当然也可以制定其他的,但是utf-8是现在字符编码都争相支持的最有前途的一种编码方式,所以为了最大可能的使得我们的代码通用性更强,最好是使用utf-8的编码方式.
sprintf(pOutBuff, “Content-Type: text/plain;/r/n/tcharset=/“utf-8/”/r/n”);//指定邮件内容为utf-8编码。
对于那些不需要附件或者是附件不会包含中文的文件或音频视频或二进制等文件都不需要进行处理了,但是如果你的附件的文件名为中文的话这个时候也是需要和上面的方式一样的处理方法.
sprintf(pOutBuff,“Subject: =?utf-8?B?%s?=/r/n”,local_out_buf)//一样的方法设置附件名的编码方式。
差点忘记说了,传送过去的需要你将原来的编码进行转换到你设置的编码方式去了,比如这里就需要你将原来的编码转到utf-8。
2、KETTLE 发送邮件乱码修正 (源自https://blog.youkuaiyun.com/mendan/article/details/48784565#0-tsina-1-45165-397232819ff9a47a7b7e80a40613cfe1)
1) 发件人名称乱码
826行: 将
msg.setFrom( new InternetAddress( sender_address ) );
改成:
// Set Mail sender (From)
String sender_add = sender_address;
….. ……
msg.setFrom( new InternetAddress(sender_add, sender_address,"UTF-8" ) );
2)附件中文乱码
1010行:将
files.setFileName( file.getName().getBaseName() );
改成 :
BASE64Encoder enc = new BASE64Encoder();
String fileName="=?UTF-8?B?"+enc.encode(file.getName().getBaseName().getBytes("utf-8"))+"?=";
files.setFileName( fileName);
3、C语言base64编解码 (源自:https://blog.youkuaiyun.com/u011491972/article/details/52800177)
base64码简介
百度词条
Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,大家可以查看RFC2045~RFC2049,上面有MIME的详细规范。Base64编码可用于在HTTP环境下传递较长的标识信息。例如,在Java Persistence系统Hibernate中,就采用了Base64来将一个较长的唯一标识符(一般为128-bit的UUID)编码为一个字符串,用作HTTP表单和HTTP GET URL中的参数。在其他应用程序中,也常常需要把二进制数据编码为适合放在URL(包括隐藏表单域)中的形式。此时,采用Base64编码具有不可读性,即所编码的数据不会被人用肉眼所直接看到。
0. 源数据都是8位位宽的数据;
1. 相当于分组码,将源数据分为3个一组,每一组共24bits,采用每6位对应一个编码码字,那么3*8bits = 4*6its, 将3个数据映射成4个数据,由于编码的码字都是6位长度,换位10进制就是0-63,总共有64中可能性,这也是base64名字的来历;
2. 6bits对应10进制数对应的码字如最后的表;
C代码
编码
#include <stdio.h>
#include <string.h>
// 全局常量定义
const char * base64char = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
const char padding_char = '=';
/*编码代码
* const unsigned char * sourcedata, 源数组
* char * base64 ,码字保存
*/
int base64_encode(const unsigned char * sourcedata, char * base64)
{
int i=0, j=0;
unsigned char trans_index=0; // 索引是8位,但是高两位都为0
const int datalength = strlen((const char*)sourcedata);
for (; i < datalength; i += 3){
// 每三个一组,进行编码
// 要编码的数字的第一个
trans_index = ((sourcedata[i] >> 2) & 0x3f);
base64[j++] = base64char[(int)trans_index];
// 第二个
trans_index = ((sourcedata[i] << 4) & 0x30);
if (i + 1 < datalength){
trans_index |= ((sourcedata[i + 1] >> 4) & 0x0f);
base64[j++] = base64char[(int)trans_index];
}else{
base64[j++] = base64char[(int)trans_index];
base64[j++] = padding_char;
base64[j++] = padding_char;
break; // 超出总长度,可以直接break
}
// 第三个
trans_index = ((sourcedata[i + 1] << 2) & 0x3c);
if (i + 2 < datalength){ // 有的话需要编码2个
trans_index |= ((sourcedata[i + 2] >> 6) & 0x03);
base64[j++] = base64char[(int)trans_index];
trans_index = sourcedata[i + 2] & 0x3f;
base64[j++] = base64char[(int)trans_index];
}
else{
base64[j++] = base64char[(int)trans_index];
base64[j++] = padding_char;
break;
}
}
base64[j] = '\0';
return 0;
}
解码
包括两个函数:
/** 在字符串中查询特定字符位置索引
* const char *str ,字符串
* char c,要查找的字符
*/
inline int num_strchr(const char *str, char c) //
{
const char *pindex = strchr(str, c);
if (NULL == pindex){
return -1;
}
return pindex - str;
}
/* 解码
* const char * base64 码字
* unsigned char * dedata, 解码恢复的数据
*/
int base64_decode(const char * base64, unsigned char * dedata)
{
int i = 0, j=0;
int trans[4] = {0,0,0,0};
for (;base64[i]!='\0';i+=4){
// 每四个一组,译码成三个字符
trans[0] = num_strchr(base64char, base64[i]);
trans[1] = num_strchr(base64char, base64[i+1]);
// 1/3
dedata[j++] = ((trans[0] << 2) & 0xfc) | ((trans[1]>>4) & 0x03);
if (base64[i+2] == '='){
continue;
}
else{
trans[2] = num_strchr(base64char, base64[i + 2]);
}
// 2/3
dedata[j++] = ((trans[1] << 4) & 0xf0) | ((trans[2] >> 2) & 0x0f);
if (base64[i + 3] == '='){
continue;
}
else{
trans[3] = num_strchr(base64char, base64[i + 3]);
}
// 3/3
dedata[j++] = ((trans[2] << 6) & 0xc0) | (trans[3] & 0x3f);
}
dedata[j] = '\0';
return 0;
}
测试主函数:
// 测试
int main()
{
const unsigned char str[] = "a45rbcd";
const unsigned char *sourcedata = str ;
char base64[128];
base64_encode(sourcedata, base64);
printf("编码:%s\n",base64);
char dedata[128];
base64_decode(base64, (unsigned char*)dedata);
printf("译码:%s", dedata);
getchar();
getchar();
return 0;
}
我的解决过程:
根据方法1找到大概的解决思路,单独测试,不能解决!
结合方法1和方法2的思路,发现需要方法3来支持,综合一下,测试通过!
代码逻辑:
原来的处理:
char *output_file_name[1024] = {};
char input_file_name[1024] = "中文测试文件.zip";
sprintf(output_file_name, "%s", input_file_name);
...
sendto(output_file_name);
解决后的处理:
char *output_file_name[1024] = {};
char input_file_name[1024] = "测试.zip";
/* 添加base64编码 */
char base64[1024] = {}
base64_encode(input_file_name, base64); /*使用方法1的函数*/
sprintf(output_file_name, "=?utf-8?B?%s?=", base64); /*注意别溢出了,最好使用strlcpy(output_file_name, 目标字符串, sizeof(output_file_name))*/
...
sendto(output_file_name);