【C语言】基础了解

转载已于 2024-01-10 22:21:59 修改 · 233 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：https://github.com/wangdoc/clang-tutorial

文章标签：

#c语言

于 2023-12-21 14:22:12 首次发布

本文全面介绍了C语言，包括其历史、特点、版本和编译方法。阐述了C程序的组成，强调了代码规范，如符号命名、注释等。还介绍了C语言标准库、头文件，以及基础的语句、表达式、语句块、空格、占位符和输出格式等知识。

C语言简介

一、历史

C 语言最初是作为 Unix 系统的开发工具而发明的。

1969年，美国贝尔实验室的肯·汤普森（Ken Thompson）与丹尼斯·里奇（Dennis Ritchie）一起开发了 Unix 操作系统。Unix 是用汇编语言写的，无法移植到其他计算机，他们决定使用高级语言重写。但是，当时的高级语言无法满足他们的要求，汤普森就在 BCPL 语言的基础上发明了 B 语言。

1972年，丹尼斯·里奇和布莱恩·柯林汉（Brian Kernighan）又在 B 语言的基础上重新设计了一种新语言，这种新语言取代了 B 语言，所以称为 C 语言。

1973年，整个 Unix 系统都使用 C 语言重写。此后，这种语言开始快速流传，广泛用于各种操作系统和系统软件的开发。

1988年，美国国家标准协会（ANSI）正式将 C 语言标准化，标志着 C 语言开始稳定和规范化。

几十年后的今天，C 语言依然是最广泛使用、最流行的系统编程语言之一，Unix 和 Linux 系统现在还是使用 C 语言开发。

二、C 语言的特点

C 语言能够长盛不衰、广泛应用，主要原因是它有一些鲜明的特点。

（1）低级语言

C 语言能够直接操作硬件、管理内存、跟操作系统对话，这使得它是一种非常接近底层的语言，也就是低级语言，非常适合写需要跟硬件交互、有极高性能要求的程序。

（2）可移植性

C 语言的原始设计目的，是将 Unix 系统移植到其他计算机架构。这使得它从一开始就非常注重可移植性，C 程序可以相对简单地移植到各种硬件架构和操作系统。

除了计算机，C 语言现在还是嵌入式系统的首选编程语言，汽车、照相机、家用电器等设备的底层系统都是用 C 语言编程，这也是因为它良好的可移植性。

（3）简单性

C 语言的语法相对简单，语法规则不算太多，也几乎没有语法糖。一般来说，如果两个语法可以完成几乎相同的事情，C 语言就只会提供一种，这样大大减少了语言的复杂性。

而且，C 语言的语法都是基础语法，不提供高级的数据结构，比如 C 语言没有“类”（class），复杂的数据结构都需要自己构造。

（4）灵活性

C 语言对程序员的限制很少。它假设程序员知道自己在干嘛，不会限制你做各种危险的操作，你干什么都可以，后果也由自己负责。

C 语言的哲学是“信任程序员，不要妨碍他们做事”。比如，它让程序员自己管理内存，不提供内存自动清理功能。另外，也不提供类型检查、数组的负索引检查、指针位置的检查等保护措施。

表面上看，这似乎很危险，但是对于高级程序员来说，却有了更大的编程自由。不过，这也使得 C 语言的 debug 不太容易。

（5）总结

上面这些特点，使得 C 语言可以写出性能非常强、完全发挥硬件潜力的程序，而且 C 语言的编译器实现难度相对较低。但是另一方面，C 语言代码容易出错，一般程序员不容易写好。

此外，当代很多流行语言都是以 C 语言为基础，比如 C++、Java、C#、JavaScript 等等。学好 C 语言有助于对这些语言加深理解。

三、C 语言的版本

历史上，C 语言有过多个版本。

（1）K＆R C

K&R C指的是 C 语言的原始版本。1978年，C 语言的发明者丹尼斯·里奇（Dennis Ritchie）和布莱恩·柯林汉（Brian Kernighan）合写了一本著名的教材《C 编程语言》（The C programming language）。由于 C 语言还没有成文的语法标准，这本书就成了公认标准，以两位作者的姓氏首字母作为版本简称“K&R C”。

（2）ANSI C（又称 C89 或 C90）

C 语言的原始版本非常简单，对很多情况的描述非常模糊，加上 C 语法依然在快速发展，要求将 C 语言标准化的呼声越来越高。

1989年，美国国家标准协会（ANSI）制定了一套 C 语言标准。1990年，国际标准化组织（ISO）通过了这个标准。它被称为“ANSI C”，也可以按照发布年份，称为“C89 或 C90”。

（3）C95

1995年，美国国家标准协会对1989年的那个标准，进行了补充，加入多字节字符和宽字符的支持。这个版本称为 C95。

（4）C99

C 语言标准的第一次大型修订，发生在1999年，增加了许多语言特性，比如双斜杠（//）的注释语法。这个版本称为 C99，是目前最流行的 C 版本。

（5）C11

2011年，标准化组织再一次对 C 语言进行修订，增加了 Unicode 和多线程的支持。这个版本称为 C11。

（6）C17

C11 标准在2017年进行了修补，但发布是在2018年。新版本只是解决了 C11 的一些缺陷，没有引入任何新功能。这个版本称为 C17。

（7）C2x

标准化组织正在讨论 C 语言的下一个版本，据说可能会在2023年通过，到时就会称为 C23。

四、C 语言的编译

C 语言是一种编译型语言，源码都是文本文件，本身无法执行。必须通过编译器，生成二进制的可执行文件，才能执行。编译器将代码从文本翻译成二进制指令的过程，就称为编译阶段，又称为“编译时”（compile time），跟运行阶段（又称为“运行时”）相区分。

目前，最常见的 C 语言编译器是自由软件基金会推出的 GCC 编译器，它可以免费使用。Linux 和 Mac 系统可以直接安装 GCC，Windows 系统可以安装 MinGW。但是，也可以不用这么麻烦，网上有在线编译器，能够直接在网页上模拟运行 C 代码，查看结果，下面就是两个这样的工具。

CodingGround: Online C Compiler
OnlineGDB: Online C Compiler - online editor
Hello World 示例

C 语言的源代码文件，通常以后缀名.c结尾。下面是一个简单的 C 程序hello.c。它就是一个普通的文本文件，任何文本编译器都能用来写。
```
#include <stdio.h>

int main(void) {
  printf("Hello World\\\\n");
  return 0;
}
```
上面这个程序的唯一作用，就是在屏幕上面显示“Hello World”。

这里不讲解这些代码是什么意思，只是作为一个例子，让大家看看 C 代码应该怎么编译和运行。假设你已经安装好了 GCC 编译器，可以打开命令行，执行下面的命令。
```
$ gcc hello.c
```
上面命令使用gcc编译器，将源文件hello.c编译成二进制代码。注意，$是命令行提示符，你真正需要输入的是$后面的部分。

运行这个命令以后，默认会在当前目录下生成一个编译产物文件a.out（assembler output 的缩写，Windows 平台为a.exe）。执行该文件，就会在屏幕上输出Hello World。
```
$ ./a.out
Hello World
```
GCC 的-o参数（output 的缩写）可以指定编译产物的文件名。
```
$ gcc -o hello hello.c
```
上面命令的-o hello指定，编译产物的文件名为hello（取代默认的a.out）。编译后就会生成一个名叫hello的可执行文件，相当于为a.out指定了名称。执行该文件，也会得到同样的结果。
```
$ ./hello
Hello World
```
GCC 的-std=参数（standard 的缩写）还可以指定按照哪个 C 语言的标准进行编译。
```
$ gcc -std=c99 hello.c
```
上面命令指定按照 C99 标准进行编译。

注意，-std后面需要用=连接参数，而不是像上面的-o一样用空格，并且=前后也不能有多余的空格。

C程序组成

简单来说，一个C程序就是由若干头文件和函数组成。

#include <stdio.h>就是一条预处理命令, 它的作用是通知C语言编译系统在对C程序进行正式编译之前需做一些预处理工作。

函数就是实现代码逻辑的一个小的单元。

一个C程序有且只有一个主函数，即main函数。

C程序就是执行主函数里的代码，也可以说这个主函数就是C语言中的唯一入口。(注意：C程序一定是从主函数开始执行的，无论主函数在哪（建议主函数放在最上方）)
而main前面的int就是主函数的类型.
printf()是格式输出函数，这里就记住它的功能就是在屏幕上输出指定的信息
return是函数的返回值，根据函数类型的不同，返回的值也是不同的。
\n是转义字符中的换行符。
一个说明或一个语句占一行，例如：包含头文件、一个可执行语句结束都需要换行。
建议：函数体内的语句要有明显缩进，通常以按一下Tab键为一个缩进。或者四个空格
括号要成对写，如果需要删除的话也要成对删除。
当一句可执行语句结束的时候末尾需要有分号。
代码中所有符号均为英文半角符号。

注释：计算机不执行注释内容（用于调试）

多行注释： /* 注释内容 */

单行注释： // 注释内容

C语言代码规范

这里面的算法代码均使用C语言完成，养成良好的代码规范习惯，不但可以写出优质的代码，也可以更快的阅读其他优秀开源代码。代码规范主要有：

一、符号命名

局部变量 尽量短，能表达清楚意思即可，能简写就简写，比如"err" 表示 "error"; "fd" 表示文件描述符，循环变量可以使用i,j,k ;结构体成员变量不需要"m_"前缀;全局变量"g_"开头

常量名 全大写，单词之间"_"分割，如 "MAX_NUMBER_OF_SLAB_CLASSES" ;

宏定义 对于options 宏定义，适当使用前缀，比如：

/* Client classes for client limits, currently used only for
 * the max-client-output-buffer limit implementation. */
#define CLIENT_TYPE_NORMAL 0 /* Normal req-reply clients + MONITORs */
#define CLIENT_TYPE_SLAVE 1  /* Slaves. */
#define CLIENT_TYPE_PUBSUB 2 /* Clients subscribed to PubSub channels. */
#define CLIENT_TYPE_MASTER 3 /* Master. */
#define CLIENT_TYPE_OBUF_COUNT 3

枚举使用前缀:

enum conn_states {
    conn_listening,  /* the socket which listens for connections */
    conn_new_cmd,    /* Prepare connection for next command */
    conn_waiting,    /* waiting for a readable socket */
    conn_read,       /* reading in a command line */
    conn_parse_cmd,  /* try to parse a command from the input buffer */
    conn_write,      /* writing out a simple response */
    conn_nread,      /* reading in a fixed number of bytes */
    conn_swallow,    /* swallowing unnecessary bytes w/o storing */
    conn_closing,    /* closing this connection */
    conn_mwrite,     /* writing out many items sequentially */
    conn_closed,     /* connection is closed */
    conn_max_state   /* Max state value (used for assertion) */
};

函数命名 全小写，单词之间"_"分割。如"split_cmdline_strerror()"

二、注释

第一种：// 后面一行是注释

第二种：/* 这里面是注释，可以跨行输入*/ （都使用第二种）

三、其他

合理使用static,const 等关键字,能提升程序的安全性，也能避免函数命名冲突

合理使用数据类型：rel_time_t,uint8_t,uint32_t,uint64_t,size_t,off_t

C语言标准库，头文件

程序需要用到的功能，不一定需要自己编写，C 语言可能已经自带了。程序员只要去调用这些自带的功能，就省得自己编写代码了。举例来说，printf()这个函数就是 C 语言自带的，只要去调用它，就能实现在屏幕上输出内容。

C 语言自带的所有这些功能，统称为“标准库”（standard library），因为它们是写入标准的，到底包括哪些功能，应该怎么使用的，都是规定好的，这样才能保证代码的规范和可移植。

不同的功能定义在不同的文件里面，这些文件统称为“头文件”（header file）。如果系统自带某一个功能，就一定还会自带描述这个功能的头文件，比如printf()的头文件就是系统自带的stdio.h。头文件的后缀通常是.h。

如果要使用某个功能，就必须先加载对应的头文件，加载使用的是#include命令。这就是为什么使用printf()之前，必须先加载stdio.h的原因。

#include <stdio.h>  // #号开头的均为预处理的，不需要 ; 结尾

C语言基础

一、语句

C 语言的代码由一行行语句（statement）组成。语句就是程序执行的一个操作命令。C 语言规定，语句必须使用分号结尾，除非有明确规定可以不写分号。

int x = 1;

一个语句也可以写成多行，这时就要依靠分号判断语句在哪一行结束。

int x; x

1 ;

上面示例中，第二个语句x = 1;被拆成了四行。编译器会自动忽略代码里面的换行。

单个分号也是有效语句，称为“空语句”，虽然毫无作用。

;

二、表达式

C 语言的各种计算，主要通过表达式完成。表达式（expression）是一个计算式，用来获取值。

1 + 2

上面代码就是一个表达式，用来获取1 + 2这个算术计算的结果。

表达式加上分号，也可以成为语句，但是没有实际的作用。

8;
3 + 4;

上面示例是两个表达式，加上分号以后成为语句。

表达式与语句的区别主要是两点：

语句可以包含表达式，但是表达式本身不构成语句。
表达式都有返回值，语句不一定有。因为语句用来执行某个命令，很多时候不需要返回值，比如变量声明语句（int x = 1）就没有返回值。

三、语句块

C 语言允许多个语句使用一对大括号{}，组成一个块，也称为复合语句（compounded statement）。在语法上，语句块可以视为多个语句组成的一个复合语句。

{
  int x;
  x = 1;
}

上面示例中，大括号形成了一个语句块。

大括号的结尾不需要添加分号。

四、空格

C 语言里面的空格，主要用来帮助编译器区分语法单位。如果语法单位不用空格就能区分，空格就不是必须的，只是为了增加代码的可读性。

int x = 1;
// 等同于
int x=1;

上面示例中，赋值号（=）前后有没有空格都可以，因为编译器这里不借助空格，就能区分语法单位。

语法单位之间的多个空格，等同于单个空格。

int    x =     1;

上面示例中，各个语法单位之间的多个空格，跟单个空格的效果是一样的。

空格还用来表示缩进。多层级的代码有没有缩进，其实对于编译器来说并没有差别，没有缩进的代码也是完全可以运行的。强调代码缩进，只是为了增强代码可读性，便于区分代码块。

大多数 C 语言的风格要求是，下一级代码比上一级缩进4个空格。

只包含空格的行被称为空白行，编译器会完全忽略该行。

五、占位符

printf()可以在输出文本中指定占位符。所谓“占位符”，就是这个位置可以用其他值代入。

// 输出 There are 3 apples
printf("There are %i apples\\n", 3);

上面示例中，There are %i apples\\n是输出文本，里面的%i就是占位符，表示这个位置要用其他值来替换。占位符的第一个字符一律为百分号%，第二个字符表示占位符的类型，%i表示这里代入的值必须是一个整数。

printf()的第二个参数就是替换占位符的值，上面的例子是整数3替换%i。执行后的输出结果就是There are 3 apples。

常用的占位符除了%i，还有%s表示代入的是字符串。

printf("%s will come tonight\\n", "Jane");

上面示例中，%s表示代入的是一个字符串，所以printf()的第二个参数就必须是字符串，这个例子是Jane。执行后的输出就是Jane will come tonight。

输出文本里面可以使用多个占位符。

printf("%s says it is %i o'clock\\n", "Ben", 21);

上面示例中，输出文本%s says it is %i o'clock有两个占位符，第一个是字符串占位符%s，第二个是整数占位符%i，分别对应printf()的第二个参数（Ben）和第三个参数（21）。执行后的输出就是Ben says it is 21 o'clock。

printf()参数与占位符是一一对应关系，如果有n个占位符，printf()的参数就应该有n + 1个。如果参数个数少于对应的占位符，printf()可能会输出内存中的任意值。

printf()的占位符有许多种类，与 C 语言的数据类型相对应。下面按照字母顺序，列出常用的占位符，方便查找，具体含义在后面章节介绍。

%c：字符。
%d：十进制整数。
%f：小数（包含float类型和double类型）。
%p：指针。
%s：字符串。
%u：无符号整数（unsigned int）。
%%：输出一个百分号

六、输出格式

printf()可以定制占位符的输出格式。

（1）限定宽度

printf()允许限定占位符的最小宽度。

printf("%5d\\n", 123); // 输出为 "  123"

上面示例中，%5d表示这个占位符的宽度至少为5位。如果不满5位，对应的值的前面会添加空格。

输出的值默认是右对齐，即输出内容前面会有空格；如果希望改成左对齐，在输出内容后面添加空格，可以在占位符的%的后面插入一个-号。

printf("%-5d\\n", 123); // 输出为 "123  "

上面示例中，输出内容123的后面添加了空格。

对于小数，这个限定符会限制所有数字的最小显示宽度。

// 输出 "  123.450000"
printf("%12f\\n", 123.45);

上面示例中，%12f表示输出的浮点数最少要占据12位。由于小数的默认显示精度是小数点后6位，所以123.45输出结果的头部会添加2个空格。

（2）总是显示正负号

默认情况下，printf()不对正数显示+号，只对负数显示-号。如果想让正数也输出+号，可以在占位符的%后面加一个+。

printf("%+d\\n", 12); // 输出 +12
printf("%+d\\n", -12); // 输出 -12

上面示例中，%+d可以确保输出的数值，总是带有正负号。

（3）限定小数位数

输出小数时，有时希望限定小数的位数。举例来说，希望小数点后面只保留两位，占位符可以写成%.2f。

// 输出 Number is 0.50
printf("Number is %.2f\\n", 0.5);

上面示例中，如果希望小数点后面输出3位（0.500），占位符就要写成%.3f。

这种写法可以与限定宽度占位符，结合使用。

// 输出为 "  0.50"
printf("%6.2f\\n", 0.5);

上面示例中，%6.2f表示输出字符串最小宽度为6，小数位数为2。所以，输出字符串的头部有两个空格。

最小宽度和小数位数这两个限定值，都可以用*代替，通过printf()的参数传入。

printf("%*.*f\\n", 6, 2, 0.5);

// 等同于
printf("%6.2f\\n", 0.5);

上面示例中，%*.*f的两个星号通过printf()的两个参数6和2传入。

（4）输出部分字符串

%s占位符用来输出字符串，默认是全部输出。如果只想输出开头的部分，可以用%.[m]s指定输出的长度，其中[m]代表一个数字，表示所要输出的长度。

// 输出 hello
printf("%.5s\\n", "hello world");

上面示例中，占位符%.5s表示只输出字符串“hello world”的前5个字符，即“hello”。

内容来自Github上的clang-tutorial

GitHub - wangdoc/clang-tutorial: C 语言教程

如有侵权，请联系删除。