近日正在对于开发的框架进行完善。
已经很久没有更新博客了,天天看到JavaEye的管理员无聊的发送消息,这篇文章被减分,那篇减分,感觉到很好笑。从来不在意分。
以下是收录的一篇关于JavaMail发送接收邮件时的编码的问题的处理,讲的很精辟,与大家共勉。
使用java mail 包收发中文邮件的编码,解码问题以及解决方法
<script language="javascript" src="/ad/js/edu_left_300-300.js" type="text/javascript"></script>
编码 邮件头(参见RFC822,RFC2047)只能包含US-ASCII字符。邮件头中任何包含非US-ASCII字符的部分必须进行编码,使其只包含US-ASCII字符。所以使用java mail发送中文邮件必须经过编码,否则别人收到你的邮件只能是乱码一堆。不过使用java mail 包的解决方法很简单,用它自带的MimeUtility工具中encode开头的方法(如encodeText)对中文信息进行编码就可以了。 例子: MimeMessage mimeMsg = new MimeMessage(mailSession); //让javamail决定用什么方式来编码 ,编码内容的字符集是系统字符集
mimeMsg.setSubject( MimeUtility.encodeText( Subject) ); //使用指定的base64方式编码,并指定编码内容的字符集是gb2312 mimeMsg.setSubject( MimeUtility.encodeText( Subject,”gb2312”,”B”)); 通常对邮件头的编码方式有2种,一种是base64方式编码,一种是QP(quoted-printable)方式编码,javamail根据具体情况来选择编码方式。 如“txt测试”编码后内容如下: =?GBK?Q?Txt=B2=E2=CA=D4 里面有个=?GBK?Q?,GBK表示的是内容的字符集,?Q?表示的是以QP方式编码的,后面紧跟的才是编码后的中文字符。所以用MimeUtility工具编码后的信息里包含了编码方式的信息。 邮件的正文也要进行编码,但它不能用MimeUtility里的方法来编码。邮件正文的编码方式的信息是要放在Content-Transfer-Encoding这个邮件头参数中的,而MimeUtility里面的方法是将编码方式的信息放在编码后的正文内容中。所以如果你对正文也用MimeUtility进行处理,那么其他邮件程序就不会正常显示你编码的邮件,因为其他邮件软件如outlook,foxmail只会根据Content-Transfer-Encoding这个里面的信息来对邮件正文进行解码。 其实,邮件正文部分的编码javamail已经自动帮你做了,当你发送邮件的时候,它会自己决定编码方式,并把编码方式的信息放入Content-Transfer-Encoding这个邮件头参数中,然后再发送。所以你所要做的就是直接把邮件正文的内容放入邮件中就可以了。 对邮件正文的编码方式比较多,包括了base64和QP方式,还有一些如7bit,8bit等等,因为javamail自动为邮件正文编码,所以我就不一一祥叙了。 例子: //处理邮件正文 MimeBodyPart mbp=new MimeBodyPart(); if ( ContentType() == null || ContentType.equals("")) mbp.setText( Content ); else mbp.setContent( Content, Content ); 解码 javamail包中的MimeUtility工具中也提供了对邮件信息解码的方法,都是以decode开头的一些方法(如decodeText) 例子: String Subject = mimemsg.getSubject(); String ChSubject = MimeUtility.decodeText(Subject); 对于base64和QP编码后信息,decode* 方法能将他们正确的解码,但是,如果指定的字符集不对,那么javamail就会出现错误,不能正确地将其解码。 如有的邮件系统将”txt测试”编码后如下: =?x-unkown?Q?Txt=B2=E2=CA=D4 这里指定的字符集是x-unknown,是非明确的字符集,javamail就不能正确的处理了,但是”测试”这两个中文字还是按照gbk字符集编码的,所以你可以手工的将编码方式信息改正确,再用decode*方法来解码。 例子: if ( str.indexOf("=?x-unknown?") >=0 ){ str = str.replaceAll("x-unknown","gbk" ); // 将编码方式的信息由x-unkown改为gbk try{ str = MimeUtility.decodeText( str ); //再重新解码 }catch( Exception e1){ return str ; } decode*方法都是根据在编码信息中包含的编码方式的信息来解码,所以decode*方法对邮件正文解码是无效的,因为邮件正文中不包含编码方式的信息。 同编码一样,邮件正文的解码也是由javamail做了。Javamail根据Content-Transfer-Encoding里的信息,来对邮件的正文解码。 客户程序从javamail取得的正文内容字符集为iso-8859-1,所以还要将字符集转换一下,例: String CorrectContent = new String( Content.getbytes(“iso-8859-1”),”gb2312”); CorrentContent为正确的邮件正文了 。
本人测试了一下,发送邮件时没有什么问题,javaMail会自动为你加上编码信息
接收时发现subject的编码一般与正文相同,需要做字符串转换。
相关代码如下: String contenttype = part.getContentType(); System.out.println("CONTENTTYPE: " + contenttype); int icharset = contenttype.toLowerCase().indexOf("charset"); if (icharset != -1) { System.out.println(contenttype.charAt(icharset + 8)); if (contenttype.charAt(icharset + 8) == '"') { int iend = contenttype.lastIndexOf("\""); if (iend > icharset + 9) { bodyCharset = contenttype.substring(icharset + 9, iend); } } else { bodyCharset = contenttype.substring(icharset + 8); } }
取得正文编码信息。Foxmail发送的邮件一般为text/html;charset="GB2312",其他的为text/html;charset=GB2312,差了一个引号。还有一些邮件没有编码信息,此时bodyCharset默认为ISO-8859-1。
subject = MimeUtility.decodeText(mimeMessage.getSubject()); if (subject == null) { subject = ""; } subject = new String(subject.getBytes(bodyCharset), "GBK");
内容解码同上。
试了试FoxMail,WEB,javamail等方式发送的邮件,MimeUtility.decodeText(mimeMessage.getSubject())与mimeMessage.getSubject()的值是相等的。