C语言复习笔记
C语言编译环境与发展史
C语言是一门编译型的编程语言,源代码要经过编译器编译成汇编代码,汇编代码经过汇编成机器码之后才能被机器执行。编译器(如下图gcc)编译包括四步:1.预处理(Preprocessing), 2.编译(Compilation), 3.汇编(Assemble), 4.链接(Linking),下面这张图已经够详细了。
C语言在不同环境下的编译方式有很大不同,一大堆名词可能会看得云里雾里,所以对下列名词进行解释。在类Unix系统(Linux发行版、macOS)上主流的两个编译器,一个是gcc,一个是Clang。gcc是属于GNU(免费UNIX软件集合)项目的编译器,Clang是LLVM项目的编译器。在Windows上,微软的集成开发环境(Visual Studio)上自带了C语言的编译器;或者选择在Widnows上模拟Linux的编译环境,可以选择MinGW或Cygwin。
根据CPU的指令集不同,可以分为复杂指令集和简单指令集,复杂指令集的代表是Intel,简单指令集的代表是ARM。如果要在Intel CPU的机器上编译能够运行在ARM架构CPU的机器上,还需要用到交叉编译工具链。做嵌入式的C语言开发离不开这个。
# 使用gcc编译器编译hello.c源代码
# 编译完成后会生成一个hello的可执行文件
gcc hello.c -o hello
C语言主要的三个标准:C89(C90)、C99、C11,语言标准的命名是标准的公布年份。
- C90是第一个C语言标准,其内容和ANSI C保持一致。
- C99是第二个C语言标准。在C90的基础上增加了:1.国际化编程;2.解决明显的缺陷;3.适应科学和工程项目中的关键数值计算。
- 增加了对编译器的限制,比如源程序每行要求至少支持到 4095 字节,变量名函数名的要求支持到 63 字节(extern 要求支持到 31)。
- 增强了预处理功能。例如:
- 宏支持取可变参数 #define Macro(…) __VA_ARGS__
- 使用宏的时候,允许省略参数,被省略的参数会被扩展成空串。
- 支持 // 开头的单行注释(这个特性实际上在C89的很多编译器上已经被支持了)
- 增加了新关键字 restrict, inline, _Complex, _Imaginary, _Bool
- 支持 long long, long double _Complex, float _Complex 等类型
- 支持不定长的数组,即数组长度可以在运行时决定,比如利用变量作为数组长度。声明时使用 int a[var] 的形式。不过考虑到效率和实现,不定长数组不能用在全局,或 struct 与 union 里。
- 变量声明不必放在语句块的开头,for 语句提倡写成 for(int i=0;i<100;++i) 的形式,即i 只在 for 语句块内部有效。
- 允许采用(type_name){xx,xx,xx} 类似于 C++ 的构造函数的形式构造匿名的结构体。
- 复合字面量:初始化结构的时候允许对特定的元素赋值,形式为:
- struct test{int a[3],b;} foo[] = { [0].a = {1}, [1].a = 2 };
- struct test{int a, b, c, d;} foo = { .a = 1, .c = 3, 4, .b = 5 }; // 3,4 是对 .c,.d 赋值的
- 格式化字符串中,利用 \u 支持 unicode 的字符。
- 支持 16 进制的浮点数的描述。
- printf scanf 的格式化串增加了对 long long int 类型的支持。
- 浮点数的内部数据描述支持了新标准,可以使用 #pragma 编译器指令指定。
- 除了已有的 __line__ __file__ 以外,增加了 __func__ 得到当前的函数名。
- 允许编译器化简非常数的表达式。
- 修改了 /% 处理负数时的定义,这样可以给出明确的结果,例如在C89中-22 / 7 = -3, -22% 7 = -1,也可以-22 / 7= -4, -22% 7 = 6。 而C99中明确为 -22 / 7 = -3, -22% 7 = -1,只有一种结果。
- 取消了函数返回类型默认为 int 的规定。
- 允许 struct 定义的最后一个数组不指定其长度,写做 [](flexible array member)。
- const const int i 将被当作 const int i 处理。
- 增加和修改了一些标准头文件,比如定义 bool 的 <stdbool.h> ,定义一些标准长度的 int 的 <inttypes.h> ,定义复数的 <complex.h> ,定义宽字符的 <wctype.h> ,类似于泛型的数学函数 <tgmath.h>, 浮点数相关的 <fenv.h>。 在<stdarg.h> 增加了 va_copy 用于复制 … 的参数。里增加了 struct tmx ,对 struct tm 做了扩展。
- 输入输出对宽字符以及长整数等做了相应的支持。
- C11是最近的一次C语言标准。主要是提高了对C++的兼容性。
- 对齐处理(Alignment)的标准化(包括_Alignas标志符,alignof运算符, aligned_alloc函数以及<stdalign.h>头文件。
- Noreturn 函数标记,类似于 gcc 的 __attribute_((noreturn))。
- _Generic 关键字。
- 多线程(Multithreading)支持,包括:
- _Thread_local存储类型标识符,<threads.h>头文件,里面包含了线程的创建和管理函数。
- _Atomic类型修饰符和<stdatomic.h>头文件。
- 增强的Unicode的支持。基于C Unicode技术报告ISO/IEC TR 19769:2004,增强了对Unicode的支持。包括为UTF-16/UTF-32编码增加了char16_t和char32_t数据类型,提供了包含unicode字符串转换函数的头文件<uchar.h>.
- 删除了 gets() 函数,使用一个新的更安全的函数gets_s()替代。
- 增加了边界检查函数接口,定义了新的安全的函数,例如 fopen_s(),strcat_s() 等等。
- 增加了更多浮点处理宏。
- 匿名结构体/联合体支持。这个在gcc早已存在,C11将其引入标准。
- 静态断言(static assertions),_Static_assert(),在解释 #if 和 #error 之后被处理。
- 新的 fopen() 模式,(“…x”)。类似 POSIX 中的 O_CREAT|O_EXCL,在文件锁中比较常用。
- 新增 quick_exit() 函数作为第三种终止程序的方式。当 exit()失败时可以做最少的清理工作。
数据类型
基本数据类型:short、int、long、char、float、double。
注:在不同字长的机器上,数据类型占据的字节长度以实际为准。比如在32位机器上int占据的内存大小是4 个byte;double占据的内存大小是8 个byte;
基本数据类型的转换只能从高精度到低精度:
另外,在<limit.h>中规定了整型的上下限值。
类型 | 有符号最小值 | 有符号最大值 | 无符号最大值 |
---|---|---|---|
字符 | SCHAR_MIN | SCHAR_MAX | UCHAR_MAX |
短整型 | SHRT_MIN | SHRT_MAX | USHRT_MAX |
整型 | INT_MIN | INT_MAX | UINT_MAX |
长整型 | LONG_MIN | LONG_MAX | ULONG_MAX |
在<float.h>中规定了浮点数的上下限值。
类型 | 最小值 | 最大值 |
---|---|---|
float | FLT_MIN | FLT_MAX |
double | DBL_MIN | DBL_MAX |
long double | LDBL_MIN | LDBL_MAX |
枚举类型
//定义枚举类型
enum WEEKDAY {
MONDAY, TUESDAY, WEDNESDAY,
THURSDAY, FRIDAY, SATURDAY,
SUNDAY
};
enum SHORT_WEEKDAY {
MON = 1, TUE = 2, WED = 3,
THU = 4, FRI = 5, SAT = 6,
SUN = 0
};
printf("%d\n", MONDAY); //0
printf("%d\n", sizeof(MONDAY)); //4
enum WEEKDAY mon = MONDAY; //定义枚举变量
定义类型别名:typedef关键字
typedef int IntegerNumber;
IntegerNumber a;
控制流和函数
- if-else
- while
- do-while
- for
- switch-case-default
- break
- continue
- goto
switch
#include <stdio.h>
int main() {
enum {
SUN, MON, TUE, WED, THU, FRI, STA
};
int input;
while (1) {
printf("input=");
scanf("%d", &input);
switch (input) {
case 0:
printf("Today is SUN.\n");
break;
case 1:
printf("Today is MON.\n");
break;
case 2:
printf("Today is TUE.\n");
break;
case 3:
printf("Today is WED.\n");
break;
case 4:
printf("Today is THU.\n");
break;
case 5:
printf("Today is FRI.\n");
break;
case 6:
printf("Today is STA.\n");
break;
default:
printf("WRONG INPUT\n");
break;
}
}
return 0;
}
goto
#include <stdio.h>
int main() {
int number;
outer:
printf("input a number:");
scanf("%d", &number);
if (number < 0) {
printf("the input number can't be negative\n");
goto outer;
}
printf("input success:%d\n", number);
return 0;
}
可变长参数列表
#include <stdio.h>
#include <stdarg.h>
int calc_sum_of_numbers(int n, ...) {
int sum = 0;
va_list var_arg;//声明结构体对象
va_start(var_arg, n);//初始化参数指针,分配内存
for (int i = 0; i < n; ++i) {//指针往后移动多少位需要传参
sum += va_arg(var_arg, int);//通过指针间接访问,并向后移动一位
}
va_end(var_arg);//销毁指针,释放内存
return sum;
}
int main() {
int res = calc_sum_of_numbers(3, 1, 2, 3);
printf("res=%d\n", res);
return 0;
}
操作符和表达式
- 算术操作符:算数运算 + - * / %
- 移位操作符:进行二进制移位操作 << 左移直接丢弃 >> 右移分为逻辑右移(补0)和算数右移(符号不变)
- 位操作符:进行二进制位运算 AND(按位与,&,相同为1)、OR(按位或,|,有1为1)、XOR(按位异或,^,不同为1)
- 赋值 = 从右到左 可以和其他操作符结合
- 单目操作符:只作用于一个变量 ! ++ - & sizeof ~ – + * (类型)