理解邮件传输协议(SMTP、POP3、IMAP、MIME)

http://blog.csdn.net/xyang81/article/details/7672745

电子邮件需要在邮件客户端和邮件服务器之间,以及两个邮件服务器之间进行传递,就必须遵循一定的规则,这些规则就是邮件传输协议。SMTP协议定了邮件客户端与SMTP服务之间,以及两台SMTP服务器之间发送邮件的通信规则;POP3/IMAP协议定义了邮件客户端与POP3服务器之间收发邮件的通信规则。

一、SMTP协议

 

SMTP(Simple Mail Transfer Protocol,简单邮件传输协议)定义了邮件客户端与SMTP服务器之间,以及两台SMTP服务器之间发送邮件的通信规则 。SMTP协议属于TCP/IP协议族,通信双方采用一问一答的命令/响应形式进行对话,且定了对话的规则和所有命令/响应的语法格式。

SMTP协议中一共定了18条命令,发送一封电子邮件的过程通常只需要其中的6条命令即可完成发送邮件的功能,下表按照发送命令的先后顺序列出了这6条命令,并描述了其语法及功能说明,其中,<SP>代表空格,<CRLF>代表回车和换行。

SMTP命令格式 说明
ehlo<SP><domain><CRLF>        ehlo命令是SMTP邮件发送程序与SMTP邮件接收程序建立连接后必须发送的第一条SMTP命令,参数<domain>表示SMTP邮件发送者的主机名。
ehlo命令用于替代传统SMTP协议中的helo命令。
auth<SP><para><CRLF>       如果SMTP邮件接收程序需要SMTP邮件发送程序进行认证时,它会向SMTP邮件发送程序提示它所采用的认证方式,SMTP邮件发送程序接着应该使用这个命令回应SMTP邮件接收程序,参数<para>表示回应的认证方式,通常是SMTP邮件接收程序先前提示的认证方式。
mail<SP>From:<reverse-path><CRLF>     此命令用于指定邮件发送者的邮箱地址,参数<reverse-path>表示发件人的邮箱地址
rcpt<SP>To:<forword-path><CRLF>      此命令用于指定邮件接收者的邮箱地址,参数<forward-path>表示接收者的邮箱地址。如果邮件要发送给多个接收者,那么应使用多条rcpt<SP>To命令来分别指定每一个接收者的邮箱地址。
data<CRLF>      此命令用于表示SMTP邮件发送程序准备开始输入邮件内容,在这个命令后面发送的所有数据都将被当做邮件内容,直至遇到“<CRLF>.<CRLF>"标志符,则表示邮件内容结束。
quit<CRLF>     此命令表示要结束邮件发送过程,SMTP邮件接收程序接收到此命令后,将关闭与SMTP邮件发送程序的网络连接。

其它SMTP命令的语法及功能描述可以参考RFC821RFC1869文档。

对于SMTP邮件发送程序发送的每一条命令,SMTP邮件接收程序都将回应一条响应信息。每条响应信息都以一个响应状态开头,如:250  OK。响应状态用于表示SMTP服务器对请求命令的处理结果和状态,它是一个三位的十进制数。响应状态码的最高位数字代表了不同的分类,当其为 2 时表示命令执行成功;为5时表示命令执行失败;为3时表示命令没有完成。关于响应状态码所代表的具体含义,可以参考RFC821文档。

SMTP协议是一个基于TCP/IP的应用层协议,SMTP服务器默认的网络监听端口号为25,下面将通过telnet程序,手工发送SMTP命令来发送一封电子邮件,从而理解SMTP协议的交互过程。

模拟环境说明:连接sina的SMTP服务器,给163的SMTP服务器发送一封邮件,操作过程如下图所示:

理解邮件传输协议(SMTP、POP3、IMAP、MIME)

理解邮件传输协议(SMTP、POP3、IMAP、MIME)

说明:

1、连接SMTP服务器的用户名和密码需要经过base64编码,下面是对用户名和密码进行base64编码的JAVA程序:

  1. package org.yangxin.study.jm.util;
  2. import java.io.BufferedReader;
  3. import java.io.IOException;
  4. import java.io.InputStreamReader;
  5. import sun.misc.BASE64Encoder;
  6. public class Base64Util {
  7. public static void main(String[] args) throws IOException {
  8. BASE64Encoder encoder = new BASE64Encoder();
  9. System.out.println("请输入用户名:");
  10. String username = new BufferedReader(new InputStreamReader(System.in)).readLine();
  11. System.out.println(encoder.encode(username.getBytes()));
  12. System.out.println("请输入密码:");
  13. String password = new BufferedReader(
  14. new InputStreamReader(System.in))
  15. .readLine();
  16. System.out.println(encoder.encode(password.getBytes()));
  17. }
  18. }

理解邮件传输协议(SMTP、POP3、IMAP、MIME)

2、红色箭头指向的文字表示我在telnet程序中输入的命令,以2、3、5数字开头的行表示SMTP服务器对命令的响应。通过上表中的6个SMTP命令就完成了一封简单电子邮件的发送。当然一封复杂的邮件不只包含这些信息,还应包括主题、发送日期、抄送和附件等消息头。

二、POP3协议

 
        邮件服务提供商专门为每个用户申请的电子邮箱提供了专门的邮件存储空间,SMTP服务器将接收到的电子邮件保存到相应用户的电子邮箱中。用户要从邮件服务提供商提供的电子邮箱中获取自己的电子邮件,就需要通过邮件服务提供商的POP3邮件服务器来帮助完成。POP3(Post Office Protocol 邮局协议的第三版本)协议定义了邮件客户端程序与POP3服务器进行通信的具体规则和细节。
    POP3协议在RFC 1939文档中定义,它采用的网络监听端口号默认为110。POP3协议共定义了 12 条POP3命令,邮件客户端程序通过这些命令来检索和获取用户电子邮箱中的邮件信息。下表列举出了这12条POP3命令及其说明,其中,<SP>代表空格,<CRLF>代表回车和换行。
POP3命令格式 说明
user<SP>username<CRLF>       user 命令是POP3客户端程序与POP3邮件服务器建立连接后通常发送的第一条命令,参数 username 表示收件人的帐户名称。
pass<SP>password<CRLF>       pass 命令是在user命令成功通过后,POP3客户端程序接着发送的命令,它用于传递帐户的密码,参数 password 表示帐户的密码。
apop<SP>name,digest<CRLF>       apop 命令用于替代user和pass命令,它以MD5 数字摘要的形式向POP3邮件服务器提交帐户密码。
stat<CRLF>      stat 命令用于查询邮箱中的统计信息,例如:邮箱中的邮件数量和邮件占用的字节大小等。
uidl<SP>msg#<CRLF>      uidl 命令用于查询某封邮件的唯一标志符,参数msg#表示邮件的序号,是一个从1开始编号的数字。
list<SP>[MSG#]<CRLF>      list 命令用于列出邮箱中的邮件信息,参数 msg#是一个可选参数,表示邮件的序号。当不指定参数时,POP3服务器列出邮箱中所有的邮件信息;当指定参数msg#时,POP3服务器只返回序号对应的邮件信息。
retr<SP>msg#<CRLF>     retr 命令用于获取某封邮件的内容,参数 msg#表示邮件的序号。
dele<SP>msg#<CRLF>     dele 命令用于在某封邮件上设置删除标记,参数msg#表示邮件的序号。POP3服务器执行dele命令时,只是为邮件设置了删除标记,并没有真正把邮件删除掉,只有POP3客户端发出quit命令后,POP3服务器才会真正删除所有设置了删除标记的邮件。
rest<CRLF>     rest 命令用于清除所有邮件的删除标记。
top<SP>msg#<SP>n<CRLF>     top 命令用于获取某封邮件的邮件头和邮件体中的前n行内容,参数msg#表示邮件的序号,参数n表示要返回邮件的前几行内容。使用这条命令以提高 Web Mail系统(通过Web站点上收发邮件)中的邮件列表显示的处理效率,因为这种情况下不需要获取每封邮件的完整内容,而是仅仅需要获取每封邮件的邮件头信息。
noop<CRLF>     noop 命令用于检测POP3客户端与POP3服务器的连接情况。
quit<CRLF>     quit 命令表示要结束邮件接收过程,POP3服务器接收到此命令后,将删除所有设置了删除标记的邮件,并关闭与POP3客户端程序的网络连接。

对于POP3客户程序发送的每一条POP3命令,POP3服务器都将回应一些响应信息。响应信息由一行或多行文本信息组成,其中的第一行始终以“+OK” 或 “-ERR” 开头,它们分别表示当前命令执行成功或执行失败。

 
下面通过telnet程序连接163的POP3服务器,来分析邮件的接收过程。操作步聚见下图:
理解邮件传输协议(SMTP、POP3、IMAP、MIME)
理解邮件传输协议(SMTP、POP3、IMAP、MIME)
理解邮件传输协议(SMTP、POP3、IMAP、MIME)
 
交互过程:
1、首先用tlenet程序连接到163的pop3邮箱,telnet pop3.163.com 110。
2、执行user命令指定用户名,user xyang0917。
3、执行pass命令输入密码,pass 123456abc。
验证成功后,提示邮箱中有一封邮件,占1822字节邮箱空间。
4、执行stat命令统计邮箱中的信息,结果显示邮箱中有一封邮件,占1822字节的邮箱空间。
5、执行list命令列出邮箱中的所有邮件,结果显示1 1822,1代表邮件编号,1822代表邮件的大小,如果有多封邮件,编号从1开始向上累加依次列出来。
6、执行retr 1命令查看第一封邮件的内容。
7、执行dele 1命令将第一封邮件设置删除标志。
8、执行rset命令重置所有邮件的删除标志。
9、执行quit命令退出邮件接收程序,POP3服务器接收到客户端发送的quit命令后,将删除所有设置了删除标记的邮件,并断开与客户端的网络连接。并且Telnet程序自动结束运行,退回到Window命令行窗口状态。

三、IMAP协议

 
        IMAP(Internet Message Access Protocol)协议是对POP3协议的一种扩展,定了邮件客户端软件与邮件服务器的通信规则。IMAP协议在RFC2060文档中定义,目前使用的是第4个版本,所以也称为IMAP4。IMAP协议相对于POP3协议而言,它定了更为强大的邮件接收功能,主要体现在以下一些方面:
  1. IMAP具有摘要浏览功能,可以让用户在读完所有邮件的主题、发件人、大小等信息后,再由用户做出是否下载或直接在服务器上删除的决定。
  2. IMAP可以让用户有选择性地下载邮件附件。例如一封邮件包含3个附件,如果用户确定其中只有2个附件对自已有用,就可只下载这2个附件,而不必下载整封邮件,从而节省了下载时间。
  3. IMAP可以让用户在邮件服务器上创建自己的邮件夹,分类保存各个邮件。
疑问:那么POP3协议与IMAP协议都有哪些区别呢?
 

四、MIME协议

 

早期人们在使用电子邮件时,都是使用普通文本内容的电子邮件内容进行交流,由于互联网的迅猛发展,人们已不满足电子邮件仅仅是用来交换文本信息,而希望使用电子邮件来交换更为丰富多彩的多媒体信息,例如,在邮件中嵌入图片、声音、动画和附件等二进制数据。但在以往的邮件发送协议RFC822文档中定义,只能发送文本信息,无法发送非文本的邮件,针对这个问题,人们后来专门为此定义了MIME(Multipurpose Internet Mail Extension,多用途Internet邮件扩展)协议。

MIME协议用于定义复杂的邮件体格式,它可以表达多段平行的文本内容和非文本的邮件内容,例如,在邮件体中内嵌的图像数据和邮件附件等。另外,MIME协议的数据格式也可以避免邮件内容在传输过程发生信息丢失。对于表示某个具体资源的MIME消息,它的消息头中需要指定资源的数据类型;对于MIME组合消息,它的消息中需要指定组合关系。具体资源的数据类型和组合消息的组合关系,都是通过消息头中的Content-Type头字段来指定的。Content-Type字段中的内容以“主类型/子类型”的形式出现,主类型有text、image、audio、video、application、multipart、message等,分别表示文本、图片、音频、视频、应用程序、组合结构、消息等。每个主类型下面都有多个子类型,例如text类型包含plain、html、xml、css等子类型。multipart主类型用于表示MIME组合消息,它是MIME协议中最重要的一种类型。一封MIME邮件中的MIME消息可以有三种组合关系:混合、关联、选择,它们对应MIME类型如下:

  • multipart/mixed
表示消息体中的内容是混和组合类型,内容可以是文本、声音和附件等不同邮件内容的混和体。比如一封邮件中即包含附件,邮件内容还引用内嵌的图片或附件资源,这种类型邮件的MIME类型就必须定义为multipart/mixed。
  • multipart/related
表示消息体中的内容是关联(依赖)组合类型。比如:邮件内容有一个img标签,这个标签的src属性指向的是邮件内部的一个图片资源,所以这封邮件MIME类型就应该定义为multipart/related
  • multipart/alternative
表示消息体中的内容是选择组合类型,例如一封邮件的邮件正文同时采用HTML格式和普通文本格式进行表达时,就可以将它们嵌套在一个multipart/alterntive类型的组合消息中。这种做法的好处在于如果邮件阅读程序不支持HTML格式时,可以采用其中的文本格式进行替代。
    一封最复杂的电子邮件的基本情况为:含有邮件正文和邮件附件,邮件正文可以同时使用HTML格式和普通文本格式表示,并且HTML格式的正文中又引用了其它的内嵌资源。对于这种最复杂的电子邮件,可以采用下图所示的MIME消息结构进行描述:
理解邮件传输协议(SMTP、POP3、IMAP、MIME)
    从上图中可以看出,如果在邮件中要添加附件,就必须将整封邮件的MIME类型定义为multipart/mixed;如果要在HTML格式的正文中引用内嵌资源,那就要定义multipart/related类型的MIME消息;如果普通文本内容与HTML文本内容共存,那就要定义multipart/alternative类型的MIME消息。
    注意:如果整封邮件中只有普通文本内容与HTML文本内容,那么整封邮件的MIME类型则应定义为multipart/alternative;如果整封邮件中包含有HTML文本内容和内嵌资源,但不包含附件,那么整封邮件的MIME类型则应该定义为multipart/related。

了解更多MIME协议的细节,请参考《张孝祥JAVA邮件开发详解》第三章 邮件的组织结构,第2小节 MIME协议

上一篇:有关PHP 10条有用的建议


下一篇:.net程序员转行做手游开发经历(二)