Python 读取邮件

最新推荐文章于 2025-10-03 09:51:20 发布

原创

最新推荐文章于 2025-10-03 09:51:20 发布 · 1.1k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#python #webmail

最近由于工作需要，对参会的代表发给我的姓名、电话、公司、行程车次等信息进行统计处理形成联系单，我的思路是：可以Python利用POP协议自动收取邮件，Numpy+Pandas对发来的数据进行处理并导出至Excel / MySQL数据库。

收取邮件就是编写一个MUA作为客户端，从MDA把邮件获取到用户的电脑或者手机上。收取邮件最常用的协议是POP协议，目前版本号是3，俗称POP3。

POP3协议收取的不是一个已经可以阅读的邮件本身，而是邮件的原始文本，这和SMTP协议很像，SMTP发送的也是经过编码后的一大段文本。

要把POP3收取的文本变成可以阅读的邮件，还需要用email模块提供的各种类来解析原始文本，变成可阅读的邮件对象。
所以，用Python的poplib模块收取邮件分两步：第一步是用POP3协议把邮件获取到本地，第二步是用email模块把原始邮件解析为Message对象，然后，用适当的形式把邮件内容展示给用户。

收取邮件
import poplib
import email
import sys
from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr

def decode_str(s):
value, charset = decode_header(s)[0]
if charset:
value = value.decode(charset)
return value

def guess_charset(msg):
# 先从msg对象获取编码:
charset = msg.get_charset()
if charset is None:
# 如果获取不到，再从Content-Type字段获取:
content_type = msg.get('Content-Type', '').lower()
pos = content_type.find('charset=')
if pos >= 0:
charset = content_type[pos + 8:].strip()
return charset

def get_email_headers(msg):
# 邮件的From, To, Subject存在于根对象上:
headers = {}

最低0.47元/天解锁文章