LSB算法是数字图像信息隐藏应用较早较普遍的算法[3],是在图像信息的最不重要二进制位嵌入秘密信息。根据24位BMP图像文件的结构特点,每个文件只能非压缩地存放一幅彩色图像;文件头由54个字节的数据段组成,其中包含有该位图文件的类型、大小、图像尺寸及打印格式等;从第55个字节开始,是该文件的图像数据部分,由一系列的字节所组成,每连续3个字节便描述图像一个像素点的颜色信息,这三个字节分别代表蓝、绿、红三基色在此像素中的亮度。LSB算法是用图像数据部分每个字节中最低位来隐藏信息。这样每8个字节就可隐藏1个字节的信息[4]。
嵌入信息的方法为:首先,将待隐藏的秘密信息转化为二进制数据码流;然后,将BMP文件图像数据部分的每个字节的最低位替换为需隐藏的信息位。最后,原样复制其他不需要继续隐藏信息的原始数据。从对位图文件的分析,得知偏移量为0x06的4个字节为系统保留,可将被隐藏文件的大小写入该位置,以便提取信息时提前知道有用信息的长度,提高解码效率。对文件头部的其他50个字节,原样复制即可。隐藏过程如图1所示。
图1. LSB图像隐藏算法示意图
Fig.1 LSB data hiding algorithm
信息提取是把隐藏的信息从载体图像中读取出来,其过程和步骤正好与信息嵌入相反。首先,到隐藏信息后的图像文件的0x06处读取被隐藏信息的字节数;然后,从0x36处开始,求取BMP文件图像数据部分每个字节最低位,每够8个字节,便将输出的8位二进制数组成一个字节。经过上述处理,得到一系列8位二进制数,便是隐藏信息的代码,将代码转换成文本、或图像、或声音,就是隐藏的信息。提取过程如图2所示。
由于原始24位BMP图像文件隐藏信息后,其数据部分字节数值最多变化为1,该字节代表的像素颜色值最多只变化了1/256,所以,已隐藏信息的BMP图像与未隐藏信息的BMP图像,用肉眼是看不出差别的。将信息直接嵌入像素RGB值的优点是嵌入信息的容量与所选取的掩护图像的大小成正比。使用这种方法,一个大小为32k的24位BMP图像文件,可以隐藏约32k/8=4k的信息(忽略文件头不能隐藏数据的54个字节),该方法具有较高的信息隐藏率。
图2. LSB图像提取算法示意图
Fig.2 LSB data extracting algorithm
由于该算法是通过调整原始数据的最低位来隐藏信息,使一般用户对于隐藏信息,在视觉和听觉上很难察觉。但作为数字水印算法,该算法因其基本原理限制,所隐藏的数字水印信息是极为脆弱的,无法经受一些无损和有损的信号处理。
3 新的数字水印算法
这种技术的改进,是在基于LSB图像隐藏技术的基础上,对待隐藏的水印信息进行反复的隐藏,因为图片布满水印信息,所以,有很强的抗剪裁能力。
对载体图片进行剪裁后,极有可能会破坏水印信息原有的位置,使我们无法对水印信息进行定位,也就无从实现提取了。因此,这种算法的关键在于如何对水印信息进行同步。下面,提出一种同步的方法:
(1)在数字水印信息前依次连续写入同步信号0000,1111,1111数遍(4遍以上),然后写入前标识符1001,0001,再写入隐藏信息,最后写入后标识符1001,0001。
(2)读入被剪裁后的载体图片的信息位,如果首位是0则跳过,从非0的位开始读取,连续读入8位,判断该数据是否为同步字FF,如果不是同步字FF则继续从非0的位开始读其后的8位,直到连续读出2组同步字FF,证明已经同步,然后一直到读出前标识符,说明其后为隐藏信息位,读出数据,直到读入后标识符,说明隐藏信息已经完整的读完,至此读出一条完整的信息。如图3所示,无论从第1个同步字的任何一位开始读取,可以保证到第3个同步字时已经完成同步操作,第4个同步字完成确认同步并等待前标识的到来。