本文转自: http://www.rosoo.net/a/201108/14800_2.html
POST表单处理
下面我们来考虑另外一种表单传送方法:POST。假设我们要实现的任务是这样的:把表单中客户输入的一段文本内容添加到服务器上的一个文本文件的后面。这 可以看作是一个留言版程序的雏形。显然,这个工作是无法用java script这种客户端脚本来实现,也算得上真正意义上的CGI程序了。
看起来这个问题和上面讲的内容很相近,仅仅是用不同的表单和不同的脚本(程序)而已。但实际上,这中间是有一些区别的。在上面的例子中,GET的处理方法 可以看作是“纯查询(pure query)”类型的,也就是说,它与状态无关。同样的数据可以被提交任意的次数,而不会引起任何的问题(除了服务器的一些小小的开销)。但是现在的任务 就不同了,至少它要改变一个文件的内容。因而,可以说它是与状态有关的。这也算是POST和GET的区别之一。而且,GET对于表单的长度是有限制的,而 POST则不然,这也是在这个任务中选用POST方法的主要原因。但相对的,对GET的处理速度就要比POST快一些。
在CGI的定义中,对于POST类型的表单,其内容被送到CGI程序的标准输入(在C语言中是stdin),而被传送的长度被放在环境变量 CONTENT_LENGTH中。因而我们要做的就是,在标准输入中读入CONTENT_LENGTH长度的字符串。从标准输出读入数据听起来似乎要比从 环境变量中读数据来的要容易一些,其实则不然,有一些细节地方要注意,这在下面的程序中可以看到。特别要注意的一点就是:CGI程序和一般的程序有所不 同,一般的程序在读完了一个文件流的内容之后,会得到一个EOF的标志。但在CGI程序的表单处理过程中,EOF是永远不会出现的,所以千万不要读多于 CONTENT_LENGTH长度的字符,否这会有什么后果,谁也不知道(CGI规范中没有定义,一般根据服务器不同而有不同得处理方法)。
我们来看看到底如何从POST表单收集数据到CGI程序,下面給出了一個比较简单的C源代碼:
- #include < stdio.h >
- #include < stdlib.h >
- #define MAXLEN 80
- #define EXTRA 5
- /* 4个字节留给字段的名字"data", 1个字节留给"=" */
- #define MAXINPUT MAXLEN+EXTRA+2
- /* 1个字节留给换行符,还有一个留给后面的NULL */
- #define DATAFILE "../data/data.txt"
- /* 要被添加数据的文件 */
- void unencode(char *src, char *last, char *dest)
- {
- for(; src != last; src++, dest++)
- if(*src == "+")
- *dest = " ";
- else if(*src == "%") {
- int code;
- if(sscanf(src+1, "%2x", &code) != 1) code = "?";
- *dest = code;
- src +=2; }
- else
- *dest = *src;
- *dest = " ";
- *++dest = "";
- }
- int main(void)
- {
- char *lenstr;
- char input[MAXINPUT], data[MAXINPUT];
- long len;
- printf("%s%c%c ",
- "Content-Type:text/html;charset=gb2312",13,10);
- printf("< TITLE >Response< /TITLE > ");
- lenstr = getenv("CONTENT_LENGTH");
- if(lenstr == NULL || sscanf(lenstr,"%ld",&len)!=1 || len > MAXLEN)
- printf("< P >表单提交错误");
- else {
- FILE *f;
- fgets(input, len+1, stdin);
- unencode(input+EXTRA, input+len, data);
- f = fopen(DATAFILE, "a");
- if(f == NULL)
- printf("< P >对不起,意外错误,不能够保存你的数据 ");
- else
- fputs(data, f);
- fclose(f);
- printf("< P >非常感谢,您的数据已经被保存< BR >%s",data);
- }
- return 0;
- }
从本质上来看,程序先从CONTENT_LENGTH环境变量中得到数据的字长,然后读取相应长度的字符串。因为数据内容在传输的过程中是经过了编码的,所以必须进行相应的解码。编码的规则很简单,主要的有这几条:
1. 表单中每个每个字段用字段名后跟等号,再接上上这个字段的值来表示,每个字段之间的内容用&连结;
2. 所有的空格符号用加号代替,所以在编码码段中出现空格是非法的;
3. 特殊的字符比如标点符号,和一些有特定意义的字符如“+”,用百分号后跟其对应的ACSII码值来表示。
例如:如果用户输入的是:
Hello there!
那么数据传送到服务器的时候经过编码,就变成了data=Hello+there%21 上面的unencode()函数就是用来把编码后的数据进行解码的。在解码完成后,数据被添加到data.txt文件的尾部,并在浏览其中回显出来。
把文件编译完成后,把它改名为collect.cgi后放在CGI目录中就可以被表单调用了。下面给出了其相应的表单:
< form ACTION="/cgi-bin/collect.cgi" METHOD="POST" >
< P >请输入您的留言(最多80个字符):< BR >< INPUT NAME="data" SIZE="60" MAXLENGTH="80" >< BR >
< INPUT TYPE="SUBMIT" values="确定" >
< /form >
事实上,这个程序只能作为例子,是不能够正式的使用的。它漏掉了很关键的一个问题:当有多个用户同时像文件写入数据是,肯定会有错误发生。而对于一个这样 的程序而言,文件被同时写入的几率是很大的。因此,在比较正式的留言版程序中,都需要做一些更多的考虑,比如加入一个信号量,或者是借助于一个钥匙文件 等。因为那只是编程的技巧问题,在这儿就不多说了。
最后,我们来写一个浏览data.txt文件的的CGI程序,这只需要把内容输出到stdout就可以了:
- #include < stdio.h >
- #include < stdlib.h >
- #define DATAFILE "../data/data.txt"
- int main(void)
- {
- FILE *f = fopen(DATAFILE,"r");
- int ch;
- if(f == NULL) {
- printf("%s%c%c ",
- "Content-Type:text/html;charset=gb2312",13,10);
- printf("< TITLE >错误 < /TITLE > ");
- printf("< P >< EM >意外错误,无法打开文件< /EM >"); }
- else {
- printf("%s%c%c ",
- "Content-Type:text/plain",13,10);
- while((ch=getc(f)) != EOF)
- putchar(ch);
- fclose(f); }
- return 0;
- }
这个程序唯一要注意的是:它并没有把data.txt 包装成HTML格式后再输出,而是直接作为简单文本(plain text)输出,这只要在输出的头部用text/plain类型代替text/html就可以了,浏览器会根据Content-Type的类型自动的选择 相应的处理方法。
要触发这个程序也很简单,因为没有数据要输入,所以只需一个按钮就可以搞定了:
< form ACTION="/cgi-bin/viewdata.cgi" >
< P >< INPUT TYPE="SUBMIT" values="察看" >
< /form >
到这儿,一些基本的用C编写CGI程序的原理就将完了。当然,就凭讲的这些内容,还很难编写出一个好的CGI程序,这需要进一步的学习CGI的规范定义,以及一些其他的CGI编程特有的技巧。
这篇文章的目的,也就是要你了解一下CGI编程的概念。事实上,现在的一些主流的服务器端脚本编程语言如ASP,PHP,JSP等,都基本上具备了CGI 编程的大部分的功能,但他们在使用上的,确实是比无论用什么语言进行CGI编程都要容易的多。所以在进行服务器端编程的时候,一般都会首先考虑使用这些脚 本编程语言。只有当他们也解决不了,比如要进行一些更为底层的编程的时候,才会用到CGI。