命令行环境
命令行参数
C 语言程序可以从命令行接收参数。
$ ./foo hello world
上面示例中,程序foo
接收了两个命令行参数hello
和world
。
程序内部怎么拿到命令行参数呢?C 语言会把命令行输入的内容,放在一个数组里面。main()
函数的参数可以接收到这个数组。
#include <stdio.h>
int main(int argc, char* argv[]) {
for (int i = 0; i < argc; i++) {
printf("arg %d: %s\n", i, argv[i]);
}
}
上面示例中,main()
函数有两个参数argc
(argument count)和argv
(argument variable)。这两个参数的名字可以任意取,但是一般来说,约定俗成就是使用这两个词。
第一个参数argc
是命令行参数的数量,由于程序名也被计算在内,所以严格地说argc
是参数数量 + 1。
第二个参数argv
是一个数组,保存了所有的命令行输入,它的每个成员是一个字符串指针。
以./foo hello world
为例,argc
是 3,表示命令行输入有三个组成部分:./foo
、hello
、world
。数组argv
用来获取这些输入,argv[0]
是程序名./foo
,argv[1]
是hello
,argv[2]
是world
。一般来说,argv[1]
到argv[argc - 1]
依次是命令行的所有参数。argv[argc]
则是一个空指针 NULL。
由于字符串指针可以看成是字符数组,所以下面三种写法是等价的。
// 写法一
int main(int argc, char* argv[])
// 写法二
int main(int argc, char** argv)
// 写法三
int main(int argc, char argv[][])
另一方面,每个命令行参数既可以写成数组形式argv[i]
,也可以写成指针形式*(argv + i)
。
利用argc
,可以限定函数只能有多少个参数。
#include <stdio.h>
int main(int argc, char** argv) {
if (argc != 3) {
printf("usage: mult x y\n");
return 1;
}
printf("%d\n", atoi(argv[1]) * atoi(argv[2]));
return 0;
}
上面示例中,argc
不等于3
就会报错,这样就限定了程序必须有两个参数,才能运行。
另外,argv
数组的最后一个成员是 NULL 指针(argv[argc] == NULL
)。所以,参数的遍历也可以写成下面这样。
for (char** p = argv; *p != NULL; p++) {
printf("arg: %s\n", *p);
}
上面示例中,指针p
依次移动,指向argv
的每个成员,一旦移到空指针 NULL,就表示遍历结束。由于argv
的地址是固定的,不能执行自增运算(argv++
),所以必须通过一个中间变量p
,完成遍历操作。
退出状态
C 语言规定,如果main()
函数没有return
语句,那么结束运行的时候,默认会添加一句return 0
,即返回整数0
。这就是为什么main()
语句通常约定返回一个整数值,并且返回整数0
表示程序运行成功。如果返回非零值,就表示程序运行出了问题。
Bash 的环境变量$?
可以用来读取上一个命令的返回值,从而知道是否运行成功。
$ ./foo hello world
$ echo $?
0
上面示例中,echo $?
用来打印环境变量$?
的值,该值为0
,就表示上一条命令运行成功,否则就是运行失败。
注意,只有main()
会默认添加return 0
,其他函数都没有这个机制。
环境变量
C 语言提供了getenv()
函数(原型在stdlib.h
)用来读取命令行环境变量。
#include <stdio.h>
#include <stdlib.h>
int main(void) {
char* val = getenv("HOME");
if (val == NULL) {
printf("Cannot find the HOME environment variable\n");
return 1;
}
printf("Value: %s\n", val);
return 0;
}
上面示例中,getenv("HOME")
用来获取命令行的环境变量$HOME
,如果这个变量为空(NULL
),则程序报错返回。