C语言简介
一、历史
C 语言最初是作为 Unix 系统的开发工具而发明的。
1969年,美国贝尔实验室的肯·汤普森(Ken Thompson)与丹尼斯·里奇(Dennis Ritchie)一起开发了 Unix 操作系统。Unix 是用汇编语言写的,无法移植到其他计算机,他们决定使用高级语言重写。但是,当时的高级语言无法满足他们的要求,汤普森就在 BCPL 语言的基础上发明了 B 语言。
1972年,丹尼斯·里奇和布莱恩·柯林汉(Brian Kernighan)又在 B 语言的基础上重新设计了一种新语言,这种新语言取代了 B 语言,所以称为 C 语言。
1973年,整个 Unix 系统都使用 C 语言重写。此后,这种语言开始快速流传,广泛用于各种操作系统和系统软件的开发。
1988年,美国国家标准协会(ANSI)正式将 C 语言标准化,标志着 C 语言开始稳定和规范化。
几十年后的今天,C 语言依然是最广泛使用、最流行的系统编程语言之一,Unix 和 Linux 系统现在还是使用 C 语言开发。
二、C 语言的特点
C 语言能够长盛不衰、广泛应用,主要原因是它有一些鲜明的特点。
(1)低级语言
C 语言能够直接操作硬件、管理内存、跟操作系统对话,这使得它是一种非常接近底层的语言,也就是低级语言,非常适合写需要跟硬件交互、有极高性能要求的程序。
(2)可移植性
C 语言的原始设计目的,是将 Unix 系统移植到其他计算机架构。这使得它从一开始就非常注重可移植性,C 程序可以相对简单地移植到各种硬件架构和操作系统。
除了计算机,C 语言现在还是嵌入式系统的首选编程语言,汽车、照相机、家用电器等设备的底层系统都是用 C 语言编程,这也是因为它良好的可移植性。
(3)简单性
C 语言的语法相对简单,语法规则不算太多,也几乎没有语法糖。一般来说,如果两个语法可以完成几乎相同的事情,C 语言就只会提供一种,这样大大减少了语言的复杂性。
而且,C 语言的语法都是基础语法,不提供高级的数据结构,比如 C 语言没有“类”(class),复杂的数据结构都需要自己构造。
(4)灵活性
C 语言对程序员的限制很少。它假设程序员知道自己在干嘛,不会限制你做各种危险的操作,你干什么都可以,后果也由自己负责。
C 语言的哲学是“信任程序员,不要妨碍他们做事”。比如,它让程序员自己管理内存,不提供内存自动清理功能。另外,也不提供类型检查、数组的负索引检查、指针位置的检查等保护措施。
表面上看,这似乎很危险,但是对于高级程序员来说,却有了更大的编程自由。不过,这也使得 C 语言的 debug 不太容易。
(5)总结
上面这些特点,使得 C 语言可以写出性能非常强、完全发挥硬件潜力的程序,而且 C 语言的编译器实现难度相对较低。但是另一方面,C 语言代码容易出错,一般程序员不容易写好。
此外,当代很多流行语言都是以 C 语言为基础,比如 C++、Java、C#、JavaScript 等等。学好 C 语言有助于对这些语言加深理解。
三、C 语言的版本
历史上,C 语言有过多个版本。
(1)K&R C
K&R C指的是 C 语言的原始版本。1978年,C 语言的发明者丹尼斯·里奇(Dennis Ritchie)和布莱恩·柯林汉(Brian Kernighan)合写了一本著名的教材《C 编程语言》(The C programming language)。由于 C 语言还没有成文的语法标准,这本书就成了公认标准,以两位作者的姓氏首字母作为版本简称“K&R C”。
(2)ANSI C(又称 C89 或 C90)
C 语言的原始版本非常简单,对很多情况的描述非常模糊,加上 C 语法依然在快速发展,要求将 C 语言标准化的呼声越来越高。
1989年,美国国家标准协会(ANSI)制定了一套 C 语言标准。1990年,国际标准化组织(ISO)通过了这个标准。它被称为“ANSI C”,也可以按照发布年份,称为“C89 或 C90”。
(3)C95
1995年,美国国家标准协会对1989年的那个标准,进行了补充,加入多字节字符和宽字符的支持。这个版本称为 C95。
(4)C99
C 语言标准的第一次大型修订,发生在1999年,增加了许多语言特性,比如双斜杠(//
)的注释语法。这个版本称为 C99,是目前最流行的 C 版本。
(5)C11
2011年,标准化组织再一次对 C 语言进行修订,增加了 Unicode 和多线程的支持。这个版本称为 C11。
(6)C17
C11 标准在2017年进行了修补,但发布是在2018年。新版本只是解决了 C11 的一些缺陷,没有引入任何新功能。这个版本称为 C17。
(7)C2x
标准化组织正在讨论 C 语言的下一个版本,据说可能会在2023年通过,到时就会称为 C23。
四、C 语言的编译
C 语言是一种编译型语言,源码都是文本文件,本身无法执行。必须通过编译器,生成二进制的可执行文件,才能执行。编译器将代码从文本翻译成二进制指令的过程,就称为编译阶段,又称为“编译时”(compile time),跟运行阶段(又称为“运行时”)相区分。
目前,最常见的 C 语言编译器是自由软件基金会推出的 GCC 编译器,它可以免费使用。Linux 和 Mac 系统可以直接安装 GCC,Windows 系统可以安装 MinGW。但是,也可以不用这么麻烦,网上有在线编译器,能够直接在网页上模拟运行 C 代码,查看结果,下面就是两个这样的工具。
-
CodingGround: Online C Compiler
-
OnlineGDB: Online C Compiler - online editor
-
Hello World 示例
C 语言的源代码文件,通常以后缀名
.c
结尾。下面是一个简单的 C 程序hello.c
。它就是一个普通的文本文件,任何文本编译器都能用来写。#include <stdio.h> int main(void) { printf("Hello World\\\\n"); return 0; }
上面这个程序的唯一作用,就是在屏幕上面显示“Hello World”。
这里不讲解这些代码是什么意思,只是作为一个例子,让大家看看 C 代码应该怎么编译和运行。假设你已经安装好了 GCC 编译器,可以打开命令行,执行下面的命令。
$ gcc hello.c
上面命令使用
gcc
编译器,将源文件hello.c
编译成二进制代码。注意,$
是命令行提示符,你真正需要输入的是$
后面的部分。运行这个命令以后,默认会在当前目录下生成一个编译产物文件
a.out
(assembler output 的缩写,Windows 平台为a.exe
)。执行该文件,就会在屏幕上输出Hello World
。$ ./a.out Hello World
GCC 的
-o
参数(output 的缩写)可以指定编译产物的文件名。$ gcc -o hello hello.c
上面命令的
-o hello
指定,编译产物的文件名为hello
(取代默认的a.out
)。编译后就会生成一个名叫hello
的可执行文件,相当于为a.out
指定了名称。执行该文件,也会得到同样的结果。$ ./hello Hello World
GCC 的
-std=
参数(standard 的缩写)还可以指定按照哪个 C 语言的标准进行编译。$ gcc -std=c99 hello.c
上面命令指定按照 C99 标准进行编译。
注意,
-std
后面需要用=
连接参数,而不是像上面的-o
一样用空格,并且=
前后也不能有多余的空格。
C程序组成
简单来说,一个C程序就是由若干头文件
和函数
组成。
#include <stdio.h>
就是一条预处理命令, 它的作用是通知C语言编译系统在对C程序进行正式编译之前需做一些预处理工作。
函数
就是实现代码逻辑的一个小的单元。
一个C程序有且只有一个主函数,即main函数。
- C程序就是执行主函数里的代码,也可以说这个主函数就是C语言中的唯一入口。(注意:C程序一定是从主函数开始执行的,无论主函数在哪(建议主函数放在最上方))
- 而main前面的int就是主函数的类型.
- printf()是格式输出函数,这里就记住它的功能就是在屏幕上输出指定的信息
- return是函数的返回值,根据函数类型的不同,返回的值也是不同的。
- \n是转义字符中的换行符。
- 一个说明或一个语句占一行,例如:包含头文件、一个可执行语句结束都需要换行。
- 建议:函数体内的语句要有明显缩进,通常以按一下Tab键为一个缩进。或者四个空格
- 括号要成对写,如果需要删除的话也要成对删除。
- 当一句可执行语句结束的时候末尾需要有分号。
- 代码中所有符号均为英文半角符号。
注释:计算机不执行注释内容(用于调试)
多行注释: /* 注释内容 */
单行注释: // 注释内容
C语言代码规范
这里面的算法代码均使用C语言完成,养成良好的代码规范习惯,不但可以写出优质的代码,也可以更快的阅读其他优秀开源代码。代码规范主要有:
一、符号命名
局部变量 尽量短,能表达清楚意思即可,能简写就简写,比如"err" 表示 "error"; "fd" 表示文件描述符 ,循环变量可以使用i,j,k ;结构体成员变量不需要"m_"前缀;全局变量"g_"开头
常量名 全大写,单词之间"_"分割,如 "MAX_NUMBER_OF_SLAB_CLASSES" ;
宏定义 对于options 宏定义,适当使用前缀 ,比如:
/* Client classes for client limits, currently used only for
* the max-client-output-buffer limit implementation. */
#define CLIENT_TYPE_NORMAL 0 /* Normal req-reply clients + MONITORs */
#define CLIENT_TYPE_SLAVE 1 /* Slaves. */
#define CLIENT_TYPE_PUBSUB 2 /* Clients subscribed to PubSub channels. */
#define CLIENT_TYPE_MASTER 3 /* Master. */
#define CLIENT_TYPE_OBUF_COUNT 3
枚举 使用前缀:
enum conn_states {
conn_listening, /* the socket which listens for connections */
conn_new_cmd, /* Prepare connection for next command */
conn_waiting, /* waiting for a readable socket */
conn_read, /* reading in a command line */
conn_parse_cmd, /* try to parse a command from the input buffer */
conn_write, /* writing out a simple response */
conn_nread, /* reading in a fixed number of bytes */
conn_swallow, /* swallowing unnecessary bytes w/o storing */
conn_closing, /* closing this connection */
conn_mwrite, /* writing out many items sequentially */
conn_closed, /* connection is closed */
conn_max_state /* Max state value (used for assertion) */
};
函数命名 全小写,单词之间"_"分割。如"split_cmdline_strerror()"
二、注释
第一种:// 后面一行是注释
第二种:/* 这里面是注释,可以跨行输入*/ (都使用第二种)
三、其他
合理使用static,const 等关键字,能提升程序的安全性,也能避免函数命名冲突
合理使用数据类型:rel_time_t,uint8_t,uint32_t,uint64_t,size_t,off_t
C语言标准库,头文件
程序需要用到的功能,不一定需要自己编写,C 语言可能已经自带了。程序员只要去调用这些自带的功能,就省得自己编写代码了。举例来说,printf()
这个函数就是 C 语言自带的,只要去调用它,就能实现在屏幕上输出内容。
C 语言自带的所有这些功能,统称为“标准库”(standard library),因为它们是写入标准的,到底包括哪些功能,应该怎么使用的,都是规定好的,这样才能保证代码的规范和可移植。
不同的功能定义在不同的文件里面,这些文件统称为“头文件”(header file)。如果系统自带某一个功能,就一定还会自带描述这个功能的头文件,比如printf()
的头文件就是系统自带的stdio.h
。头文件的后缀通常是.h
。
如果要使用某个功能,就必须先加载对应的头文件,加载使用的是#include
命令。这就是为什么使用printf()
之前,必须先加载stdio.h
的原因。
#include <stdio.h> // #号开头的均为预处理的,不需要 ; 结尾
C语言基础
一、语句
C 语言的代码由一行行语句(statement)组成。语句就是程序执行的一个操作命令。C 语言规定,语句必须使用分号结尾,除非有明确规定可以不写分号。
int x = 1;
一个语句也可以写成多行,这时就要依靠分号判断语句在哪一行结束。
int x; x
1 ;
上面示例中,第二个语句x = 1;
被拆成了四行。编译器会自动忽略代码里面的换行。
单个分号也是有效语句,称为“空语句”,虽然毫无作用。
;
二、表达式
C 语言的各种计算,主要通过表达式完成。表达式(expression)是一个计算式,用来获取值。
1 + 2
上面代码就是一个表达式,用来获取1 + 2
这个算术计算的结果。
表达式加上分号,也可以成为语句,但是没有实际的作用。
8;
3 + 4;
上面示例是两个表达式,加上分号以后成为语句。
表达式与语句的区别主要是两点:
- 语句可以包含表达式,但是表达式本身不构成语句。
- 表达式都有返回值,语句不一定有。因为语句用来执行某个命令,很多时候不需要返回值,比如变量声明语句(
int x = 1
)就没有返回值。
三、语句块
C 语言允许多个语句使用一对大括号{}
,组成一个块,也称为复合语句(compounded statement)。在语法上,语句块可以视为多个语句组成的一个复合语句。
{
int x;
x = 1;
}
上面示例中,大括号形成了一个语句块。
大括号的结尾不需要添加分号。
四、空格
C 语言里面的空格,主要用来帮助编译器区分语法单位。如果语法单位不用空格就能区分,空格就不是必须的,只是为了增加代码的可读性。
int x = 1;
// 等同于
int x=1;
上面示例中,赋值号(=
)前后有没有空格都可以,因为编译器这里不借助空格,就能区分语法单位。
语法单位之间的多个空格,等同于单个空格。
int x = 1;
上面示例中,各个语法单位之间的多个空格,跟单个空格的效果是一样的。
空格还用来表示缩进。多层级的代码有没有缩进,其实对于编译器来说并没有差别,没有缩进的代码也是完全可以运行的。强调代码缩进,只是为了增强代码可读性,便于区分代码块。
大多数 C 语言的风格要求是,下一级代码比上一级缩进4个空格。
只包含空格的行被称为空白行,编译器会完全忽略该行。
五、占位符
printf()
可以在输出文本中指定占位符。所谓“占位符”,就是这个位置可以用其他值代入。
// 输出 There are 3 apples
printf("There are %i apples\\n", 3);
上面示例中,There are %i apples\\n
是输出文本,里面的%i
就是占位符,表示这个位置要用其他值来替换。占位符的第一个字符一律为百分号%
,第二个字符表示占位符的类型,%i
表示这里代入的值必须是一个整数。
printf()
的第二个参数就是替换占位符的值,上面的例子是整数3
替换%i
。执行后的输出结果就是There are 3 apples
。
常用的占位符除了%i
,还有%s
表示代入的是字符串。
printf("%s will come tonight\\n", "Jane");
上面示例中,%s
表示代入的是一个字符串,所以printf()
的第二个参数就必须是字符串,这个例子是Jane
。执行后的输出就是Jane will come tonight
。
输出文本里面可以使用多个占位符。
printf("%s says it is %i o'clock\\n", "Ben", 21);
上面示例中,输出文本%s says it is %i o'clock
有两个占位符,第一个是字符串占位符%s
,第二个是整数占位符%i
,分别对应printf()
的第二个参数(Ben
)和第三个参数(21
)。执行后的输出就是Ben says it is 21 o'clock
。
printf()
参数与占位符是一一对应关系,如果有n
个占位符,printf()
的参数就应该有n + 1
个。如果参数个数少于对应的占位符,printf()
可能会输出内存中的任意值。
printf()
的占位符有许多种类,与 C 语言的数据类型相对应。下面按照字母顺序,列出常用的占位符,方便查找,具体含义在后面章节介绍。
%c
:字符。%d
:十进制整数。%f
:小数(包含float
类型和double
类型)。%p
:指针。%s
:字符串。%u
:无符号整数(unsigned int)。%%
:输出一个百分号
六、输出格式
printf()
可以定制占位符的输出格式。
(1)限定宽度
printf()
允许限定占位符的最小宽度。
printf("%5d\\n", 123); // 输出为 " 123"
上面示例中,%5d
表示这个占位符的宽度至少为5位。如果不满5位,对应的值的前面会添加空格。
输出的值默认是右对齐,即输出内容前面会有空格;如果希望改成左对齐,在输出内容后面添加空格,可以在占位符的%
的后面插入一个-
号。
printf("%-5d\\n", 123); // 输出为 "123 "
上面示例中,输出内容123
的后面添加了空格。
对于小数,这个限定符会限制所有数字的最小显示宽度。
// 输出 " 123.450000"
printf("%12f\\n", 123.45);
上面示例中,%12f
表示输出的浮点数最少要占据12位。由于小数的默认显示精度是小数点后6位,所以123.45
输出结果的头部会添加2个空格。
(2)总是显示正负号
默认情况下,printf()
不对正数显示+
号,只对负数显示-
号。如果想让正数也输出+
号,可以在占位符的%
后面加一个+
。
printf("%+d\\n", 12); // 输出 +12
printf("%+d\\n", -12); // 输出 -12
上面示例中,%+d
可以确保输出的数值,总是带有正负号。
(3)限定小数位数
输出小数时,有时希望限定小数的位数。举例来说,希望小数点后面只保留两位,占位符可以写成%.2f
。
// 输出 Number is 0.50
printf("Number is %.2f\\n", 0.5);
上面示例中,如果希望小数点后面输出3位(0.500
),占位符就要写成%.3f
。
这种写法可以与限定宽度占位符,结合使用。
// 输出为 " 0.50"
printf("%6.2f\\n", 0.5);
上面示例中,%6.2f
表示输出字符串最小宽度为6,小数位数为2。所以,输出字符串的头部有两个空格。
最小宽度和小数位数这两个限定值,都可以用*
代替,通过printf()
的参数传入。
printf("%*.*f\\n", 6, 2, 0.5);
// 等同于
printf("%6.2f\\n", 0.5);
上面示例中,%*.*f
的两个星号通过printf()
的两个参数6
和2
传入。
(4)输出部分字符串
%s
占位符用来输出字符串,默认是全部输出。如果只想输出开头的部分,可以用%.[m]s
指定输出的长度,其中[m]
代表一个数字,表示所要输出的长度。
// 输出 hello
printf("%.5s\\n", "hello world");
上面示例中,占位符%.5s
表示只输出字符串“hello world”的前5个字符,即“hello”。
内容来自Github上的clang-tutorial
GitHub - wangdoc/clang-tutorial: C 语言教程
如有侵权,请联系删除。