前言
看到有些人对位运算还存在问题,于是决定写这篇文章作个简要说明。
什么是位(bit)?
很简单,位(bit)就是单个的0或1,位是我们在计算机上所作一切的基础。计算机上的所有数据都是用位来存储的。一个字节(BYTE)由八个位组成,一个字(WORD)是二个字节或十六位,一个双字(DWORD)是二个字(WORDS)或三十二位。如下所示:
0 1 0 0 0 1 1 1 1 0 0 0 0 1 1 1 0 1 1 1 0 1 0 0 0 1 1 1 1 0 0 0
| | | | | | |
| +- bit 31 | | | bit 0 -+ |
| | | | |
+-- BYTE 3 ---- -+---- BYTE 2 ---+---- BYTE 1 ---+--- BYTE 0 -----+
| | |
+------------ WORD 1 ------------+----------- WORD 0 -------------+
| |
+----------------------------- DWORD -----------------------------+
使用位运算的好处是可以将BYTE, WORD 或 DWORD 作为小数组或结构使用。通过位运算可以检查位的值或赋值,也可以对整组的位进行运算。
16进制数及其与位的关系
用0或1表示的数值就是二进制数,很难理解。因此用到16进制数。
16进制数用4个位表示0 - 15的值,4个位组成一个16进制数。也把4位成为半字节(nibble)。一个BYTE有二个nibble,因此可以用二个16进制数表示一个BYTE。如下所示:
NIBBLE HEX VALUE
====== =========
0000 0
0001 1
0010 2
0011 3
0100 4
0101 5
0110 6
0111 7
1000 8
1001 9
1010 A
1011 B
1100 C
1101 D
1110 E
1111 F
如果用一个字节存放字母 "r "(ASCII码114),结果是:
0111 0010 二进制
7 2 16进制
可以表达为: '0x72 '
有6种位运算:
& 与运算
| 或运算
^ 异或运算
~ 非运算(求补)
> > 右移运算
< < 左移运算
与运算(&)
双目运算。二个位都置位(等于1)时,结果等于1,其它的结果都等于0。
1 & 1 == 1
1 & 0 == 0
0 & 1 == 0
0 & 0 == 0
与运算的一个用途是检查指定位是否置位(等于1)。例如一个BYTE里有标识位,要检查第4位是否置位,代码如下:
BYTE b = 50;
if ( b & 0x10 )
cout < < "Bit four is set " < < endl;
else
cout < < "Bit four is clear " < < endl;
上述代码可表示为:
00110010 - b
& 00010000 - & 0x10
----------------------------
00010000 - result
可以看到第4位是置位了。
或运算( | )
双目运算。二个位只要有一个位置位,结果就等于1。二个位都为0时,结果为0。
1 | 1 == 1
1 | 0 == 1
0 | 1 == 1
0 | 0 == 0
与运算也可以用来检查置位。例如要检查某个值的第3位是否置位:
BYTE b = 50;
BYTE c = b | 0x04;
cout < < "c = " < < c < < endl;
可表达为:
00110010 - b
| 00000100 - | 0x04
----------
00110110 - result
异或运算(^)
双目运算。二个位不相等时,结果为1,否则为0。
1 ^ 1 == 0
1 ^ 0 == 1
0 ^ 1 == 1
0 ^ 0 == 0
异或运算可用于位值翻转。例如将第3位与第4位的值翻转:
BYTE b = 50;
cout < < "b = " < < b < < endl;
b = b ^ 0x18;
cout < < "b = " < < b < < endl;
b = b ^ 0x18;
cout < < "b = " < < b < < endl;
可表达为:
00110010 - b
^ 00011000 - ^0x18
----------
00101010 - result
00101010 - b
^ 00011000 - ^0x18
----------
00110010 - result
非运算(~)
单目运算。位值取反,置0为1,或置1为0。非运算的用途是将指定位清0,其余位置1。非运算与数值大小无关。例如将第1位和第2位清0,其余位置1:
BYTE b = ~0x03;
cout < < "b = " < < b < < endl;
WORD w = ~0x03;
cout < < "w = " < < w < < endl;
可表达为:
00000011 - 0x03
11111100 - ~0x03 b
0000000000000011 - 0x03
1111111111111100 - ~0x03 w
非运算和与运算结合,可以确保将指定为清0。如将第4位清0:
BYTE b = 50;
cout < < "b = " < < b < < endl;
BYTE c = b & ~0x10;
cout < < "c = " < < c < < endl;
可表达为:
00110010 - b
& 11101111 - ~0x10
----------
00100010 - result
移位运算(> > 与 < <)
将位值向一个方向移动指定的位数。右移 > > 算子从高位向低位移动,左移 < < 算子从低位向高位移动。往往用位移来对齐位的排列(如MAKEWPARAM, HIWORD, LOWORD 宏的功能)。
BYTE b = 12;
cout < < "b = " < < b < < endl;
BYTE c = b < < 2;
cout < < "c = " < < c < < endl;
c = b > > 2;
cout < < "c = " < < c < < endl;
可表达为:
00001100 - b
00110000 - b < < 2
00000011 - b > > 2
译注:以上示例都对,但举例用法未必恰当。请阅文末链接的文章,解释得较为清楚。
位域(Bit Field)
位操作中的一件有意义的事是位域。利用位域可以用BYTE, WORD或DWORD来创建最小化的数据结构。例如要保存日期数据,并尽可能减少内存占用,就可以声明这样的结构:
struct date_struct {
BYTE day : 5, // 1 to 31
month : 4, // 1 to 12
year : 14; // 0 to 9999
}date;
在结构中,日期数据占用最低5位,月份占用4位,年占用14位。这样整个日期数据只需占用23位,即3个字节。忽略第24位。如果用整数来表达各个域,整个结构要占用12个字节。
| 0 0 0 0 0 0 0 0 | 0 0 0 0 0 0 0 0 | 0 0 0 0 0 0 0 0 |
| | | |
+------------- year --------------+ month+-- day --+
现在分别看看在这个结构声明中发生了什么
首先看一下位域结构使用的数据类型。这里用的是BYTE。1个BYTE有8个位,编译器将分配1个BYTE的内存。如果结构内的数据超过8位,编译器就再分配1个BYTE,直到满足数据要求。如果用WORD或DWORD作结构的数据类型,编译器就分配一个完整的32位内存给结构。
其次看一下域声明。变量(day, month, year)名跟随一个冒号,冒号后是变量占用的位数。位域之间用逗号分隔,用分号结束。
使用了位域结构,就可以方便地象处理普通结构数据那样处理成员数据。尽管我们无法得到位域的地址,却可以使用结构地址。例如:
date.day = 12;
dateptr = &date;
dateptr-> year = 1852;