C 语言字符串(译)

  C 语言的 switch 语句非常强大。然而,它不能用字符串作为判断条件,只能用常整数。这是可以理解的,因为 C 的字符串仅仅是数组,它们并不是并不是一个整体。

  在某些情况下,将 string 作为 switch 语句判断条件是非常有用的。在 lwan 中我用一个小窍门避免在热门路径调用 strcmp 家族函数。这是利用字符串仅仅是字节数组这个概念,我们将这些字节数组转化成一个指向 32 位整数的指针,并解引用这个指针。利用这个窍门,我们就可以在 switch 语句中使用短小的字符串(例如:文件扩展名,包括 . 它们大多数只有四个字符)来作为判断条件。

  C 也支持多字节整型常量。然而由于大小端的影响, 当你在这些编译这些常量时启用 -Wall -Wextra 选项,GCC 会发出警告。我的解决方法是:用宏和枚举类型配合去创建一个编译器期望的常整型。下面的代码直接从 lwan 拷贝的,为了说明  STRING_SWITCH 语句的用法:

 #define STRING_SWITCH_L(s) switch (*((int32_t *)(s)) | 0x20202020)
#define MULTICHAR_CONSTANT(a,b,c,d) ((int32_t)((a) | (b) << 8 | (c)<< 16 | (d) << 24)) enum {
EXT_JPG = MULTICHAR_CONSTANT_L('.','j','p','g'),
EXT_PNG = MULTICHAR_CONSTANT_L('.','p','n','g'),
EXT_HTM = MULTICHAR_CONSTANT_L('.','h','t','m'),
EXT_CSS = MULTICHAR_CONSTANT_L('.','c','s','s'),
EXT_TXT = MULTICHAR_CONSTANT_L('.','t','x','t'),
EXT_JS = MULTICHAR_CONSTANT_L('.','j','s',),
} lwan_mime_ext_t; const char* lwan_determine_mime_type_for_file_name(char *file_name)
{
char *last_dot = strrchr(file_name, '.');
if (UNLIKELY(!last_dot))
goto fallback; STRING_SWITCH_L(last_dot) {
case EXT_CSS: return "text/css";
case EXT_HTM: return "text/html";
case EXT_JPG: return "image/jpeg";
case EXT_JS: return "application/javascript";
case EXT_PNG: return "image/png";
case EXT_TXT: return "text/plain";
} fallback:
return "application/octet-stream";
}

  我们注意到,STRING_SWITCH_L 是将字符串与一个 32 位整数按位或,这样做可以一次性检测 4 个字符的情况。

  这样的 switch 语句在 lwan 中用来匹配 HTTP 头和 HTTP 请求方法。也用来做简单的文件扩展名到 MIME-Type 的转换,就像上面代码所展示的那样。

  译自 http://tia.mat.br/blog/html/2012/08/09/string_switch_in_c.html ,如有错误,清留言!

上一篇:【LOJ】 #2521. 「FJOI2018」领导集团问题


下一篇:关于解决java读取excel文件遇空行抛空指针的问题 !