我们知道计算机中数据都是用二进制数存储。二进制数是一系列0和1的组合,长整型64位,最短的字节型也有8位。其中每一位0和1都可以看做一种状态的开和关,所以就有了这样的一种状态码存储方式:把同一对象的多种状态按位组合到一个整数中。
例如我们最最常见的 *nix 文件权限:
第9位 | 第8位 | 第7位 | 第6位 | 第5位 | 第4位 | 第3位 | 第2位 | 第1位 | 第0位 |
---|---|---|---|---|---|---|---|---|---|
是否目录 | 所有者读权限 | 所有者写权限 | 所有者执行权限 | 组读权限 | 组写权限 | 组执行权限 | 其余用户读权限 | 其余用户写权限 | 其余用户执行权限 |
0 | 1 | 1 | 1 | 1 | 0 | 1 | 1 | 0 | 1 |
那么这一组状态在程序中表示为:0b0111101101
,即八进制的 0o755
,十进制的 493
。
二进制状态码存储的主要好处是节省存储空间,相对于键值对(对象)存储而言可读性较差(当然文件权限这种另说)。这种存储方式仅适用于“一个对象有多种状态,每种状态仅有两种情况”这一情形,请不要对一种状态多种情况的情形使用二进制状态码存储方式,更不要出现十进制的 0
1
10
这种状态码,很蠢。。。
使用位运算操作状态码
基于这种存储方式,也衍生了一些操作状态码的方式:
判断第 x 位状态是否开启(x 以 0 开始,下同):
status & (1 << x) == 0 // bt ( bit test )
打开第 x 位
status |= 1 << x // bts ( bit test and set )
重置第 x 位
status &= ~(1 << x) // btr ( bit test and reset )
取反第 x 位
status ^= 1 << x // btc ( bit test and complement )
编程语言支持
某些编程语言提供了对二进制状态码的一些原生支持。C/C++ 提供了 ,以及专门的模板库 用于简化位运算操作。C# 则提供了 特性标记某个枚举被视作位域
另外很重要一点,JavaScript 虽然也支持位运算,但由于 JavaScript 中的 number
类型都是双精度浮点数,在做位运算时会先将数值截断至 32 位长度。例如很著名的数字转整数bug:10000000000 | 0 => 1410065408
。所以注意如果后端返回二进制状态码让前端判断,确保后端使用 uint32_t 存储