数字图像水印技术的研究与实现外文翻译Word格式.docx
- 文档编号:3958133
- 上传时间:2023-05-02
- 格式:DOCX
- 页数:18
- 大小:97.03KB
数字图像水印技术的研究与实现外文翻译Word格式.docx
《数字图像水印技术的研究与实现外文翻译Word格式.docx》由会员分享,可在线阅读,更多相关《数字图像水印技术的研究与实现外文翻译Word格式.docx(18页珍藏版)》请在冰点文库上搜索。
压缩,裁剪,滤波,几何变换等和恶意攻击移除伪造水印。
1.1实用性
数字水印在很多方面都有潜在的实用性,包括:
所有权判断。
水印可以被用作所有权的判断,要判断一个图像的所有权,Alice可以产生一个秘密私钥的水印信号加入原始图像,她可以使加过水印的图像公开,之后,当Bob宣称这幅公开图像的所有权时,Alice就可以证明在Bob的图像中她做的水印的存在。
由于Alice的原始图像Bob是没法获得的,所以他不能做同样的事情。
为了实现这一计划,图象处理技术要逃过恶意的移除攻击。
除此以外,水印应该以不能被修改的方式插入,因为Alice可不想对不属于她的图像负责。
指纹获取。
在网络上以电子形式分布的多媒体内容的应用中,内容的所有者不想内容XX的被复制和通信,所以他们通常会在每份数据中嵌入一个明显的水印(或者一个指纹印)。
之后的某一时间,当XX的复制品被发现,复制品的来源就能通过指纹印来确定。
在这个应用中,水印需要是不可见的,也不能被恶意攻击修改,移除和破坏掉。
此外,与所有权判断的实用性不同,水印应该对共谋有抵抗性。
也就是说一组拥有同样图像但包含不同指纹应该不能共谋和证明某一个指纹无效或者创造一个没有指纹的复制品。
复制品预防和控制。
水印也能用于复制品的预防和控制。
例如,在一个封闭系统中的多媒体内容需要专用硬件拷贝和观看,一个数字水印就可以插入以说明允许拷贝的份数。
当一份复制完后,水印能被硬件修改。
当允许的数字变为0时,硬件就不能再复制数据了。
这样一个系统的例子就是数字多用磁盘(DVD)。
事实上,一个在他的核心包含数字水印复制机器是被认为当前的标准。
而第二代DVD产品将很好的包括能读取水印的能力和不管他们存在与否都能起作用。
另一个例子是数码相机,他可以把信息像水印那样加入每一个背景或者一系列背景,以更快帮助调查者找到照片的剽窃,还能指出戏剧和电影发行的弱点。
这个技术对付一种很普通的剽窃行为最有用,就如:
某人用摄像机拍摄在电影院播放的电影,然后把它复制到光盘或者VHC磁带上发行。
欺骗和篡改的检测。
当多媒体内容是用做法律目的,医学应用,新闻报道和商业交易时,保证内容是有一个明确的出处和没有被篡改过非常重要,这就需要加入水印。
随后,当照片被检查时,水印将用一个唯一密钥从出处提取出来,数据的完整性将被提取出来的水印的完整性证实。
水印也能加入一些来自原始图片的信息使图片不能被修改和覆盖。
很明显的,水印的使用的目的是不影响图像的质量和能抵抗伪造品。
强健性对取走水印后内容将变得不可靠和没有价值不严格。
身份证安全。
在护照和身份证中的信息(例如护照号,人的名字等)也能包含在身份证上的照片中。
提取嵌入的信息,然后跟在本上的信息比较,就能证实身份证的真实。
例如,当身份证被偷,照片被伪造的代替,如果不能从身份证上提取出水印,这个身份证就是无效的。
以上都是代表数字水印在潜在使用的一些例子。
此外,还有很多其他应用,管理权利,追踪文章的使用,把文章和一些特殊播放器捆绑,无线电广播监视器等。
在以上所写的多种多样的应用中可以看出数字水印技术能满足很多需要。
自具体应用要求改变以来,水印技术应该在他们被使用的整个系统下设计完成。
每个应用利用不同的需求,将会要求可见和不可见的不同种类水印计划或者组合。
在这章剩下的章节里,我们描述了不可见水印的一些总原则和技术,我们的目的是使读者更好的了解数字水印的基本原则,内在交换,优点和弱点。
我们将会关注我们所讨论和举例的图像水印。
但是,就如我们之前提到的,这个概念在本质上也同样适用于其它形式的内容,例如视频和音频。
1.2信息隐藏和隐写术的关系
除了数字水印之外,把信息隐藏进数字内容的基本思想有很广泛的应用,而不仅仅是版权保护和认证,这些应用中包含的技术被统称为信息隐藏。
例如,元数据提供了图像额外的信息,虽然元数据也能被存在数字图象的头文件中,但是这有很多局限性。
通常,当一个文件被转换成另一种格式(例如,从TIFF到JPEG或者到BMP),元数据就丢失了。
同样的,剪裁或者任何一种图片形式操作都会破坏元数据。
最后,当图像以数字形式元存在时,数据只能附属于图像,而当图像印刷时,元数据就丢失。
信息隐藏允许元数据跟着图像移动,丝毫不在意文件的形式和图像的状态(数字的或者模拟的)。
嵌入的元数据信息有很多作用,例如,在生意中可以在网站的URL嵌入特有产品的图片中以为此产品做广告。
用户拿着杂志照片站在在一个成品低的CMOS照相机面前,这个照相机集成在个人电脑,移动电话或掌上电脑上。
从低质量的照片中提取的数据是被用做浏览指定网站的。
另一个例子是加入拍摄图片时所在位置的GPS数据(大约56比特)。
这个应用和水印的关键差别在于没有主动的对手。
在水印应用方面如版权保护和证明,这些都有一个主动的对手在尝试去掉,伪造水印和使水印无效。
而在信息隐藏中就没有一个这样主动的对手,所以就没有价值同移动隐藏在内容中信息的行为计较。
然而,信息隐藏技术需要鲁棒行来防止意外的破坏。
例如,在图4所示应用中,尽管经历了打印和扫描过程的破坏,嵌入在文件图像中的信息还应能被提取出来。
但是这些破坏只是处理过程的一部分并且不是由活跃对手引起。
另一个和水印相关的主题是隐写术,是一种秘密通信的科学和艺术。
虽然几十年来,隐写术被当作密码学的一部分,它的焦点是秘密通信。
事实上,对这个问题现在被称为犯人问题。
这儿,Alice和Bob正在策划一个逃狱计划,问题是他们之间的所有交流都被典狱长Wendy检查着,Wendy一发现他们有什么令人怀疑的交流就会在第一时间把他们单独监禁。
因此,Alice和Bob必须交换表面上看起来很正常但实际上包含了涉及逃狱计划的隐藏信息。
这有两种通常讨论的版本——一种是典狱长是被动的,只看消息。
另一种是典狱长是主动的,有修改消息以防止隐藏消息的习惯。
很明显,在这最重要的问题是隐藏的消息的存在必须被隐藏好。
然而,在数字水印中一个好的水印技术是否隐蔽不是很明显。
1.3水印问题
在水印技术研究中的出现的重要方面有:
容量:
能嵌入一个所给信号最大限度数据的量是多少?
什么是嵌入和提取信息最合适的方法?
强健:
我们嵌入和恢复数据,怎么才能在恶意的攻击和偶然的转移中使它完整的提取出来?
透明:
我们怎么把信息嵌入才能不被感知地降低载体的质量?
安全:
我们怎么能判断嵌入的信息是否被篡改,伪造和移除?
确实,这些问题是过去几年学习的焦点,也已经取得一些非凡的进步。
然后,在这个高速发展的研究领域,问题总是比答案多。
会这样的一个重要原因是数字水印是一个内在的结合多种学科的以多种学科的发展为基础的一个主题。
这些领域为数字水印发展所做出的贡献至少包括下面几个方面:
信息和通信理论
判断和检测理论
信号处理
密码学和密码协议
这些领域里的每一个都处理了数字水印问题的一个特殊方面,一般来说,信息和通信理论方法处理数据的嵌入方面。
举例来说,消息理论方法在数据的总量计算机中有用,数据是能被嵌入一个给予的信号中,这个信号易受各种约束例如嵌入数据的峰值功率(幅度的平方)或者嵌入产生的畸变。
主信号可以被当作一个通信的频道,而各种操作例如压缩/解压,过滤等可以被当作是噪声。
用这个框架,好多从经典信息论得出的结论可以而且应该可以成功的适用于计算一个信号所嵌入的数据的容量。
判断思想被用做从收件人那边分析是否有数据嵌入程序,对于一个给予的数据嵌入程序,我们怎么从易受有意或者无意攻击的主信号中提取出隐藏的数据?
数据提取程序必须是能保证确定量的可靠性。
提取出来的数据正好是原始嵌入数据的机会有多大?
即使数据嵌入算法不够智能和精练,一个好的数据析取算法能补偿这点。
在版权保护的水印应用中,判断论被用做检测嵌入数据的存在;
在媒体桥水印应用方面,判断论需要提取出嵌入的信息。
因此,判断论在数字水印的提取和检测方面充当了一个重要作用。
所以,为数字水印应用发展出一个可靠的,有效率和强健的检测器非常重要。
各种各样的信号处理算法被用在数字水印方面。
这些算法都是基于人类视觉系统,信号变化(例如:
离散余弦变化(DTC)),噪声特性,各种信号处理攻击等。
在应用和上下文的基础上,这些方法可以被当作编码员或者译码机或者两者的工具。
使用者可以灵活的混合搭配不同的基于应用和计算约束的技术。
虽然一些问题,例如画面质量,强健,和实时约束可以被接纳,但是之前讨论过的数据水印使用单一算法能否达到令人满意的特性仍然不太清楚。
在很多情况下,这些特性有很多内在的交易,因此,发展信号处理方法去对抗数据水印特性竞争间的平衡是必须的。
密码学的问题是很多信息隐藏应用的核心,但不幸的是几乎没有人注意。
可能这是因为数字水印的好多工作都是在信号处理和交流公共信息,因此,密码学专家对秘密通信和共谋抵抗指纹更加关注。
它常常被假定使用了简单的原始密码学,就如译成密码,时间印记,数字签名等等,造成了安全的信息隐藏应用。
我们相信,这离真理还很远。
事实上,我们相信安全的数字水印技术的设计要求密码学,信息论和信号处理错综复杂的混合。
剩下的章节是这么安排的:
在第2章我们描述了脆弱和半脆弱水印,第3章处理强健水印,水印的通信和信息理论在第4章讨论。
2.脆弱和半脆弱水印
在模拟世界中,通常一个图像(照片)是描述事件存在的证据。
数字图象的优点和他们的易操作性,改变了这个戏剧性的处境。
对于一个给予的图像,不论是数字或模拟形式,都不能确保它的可靠性。
这就需要图像证明技术。
几十年来证明技术已经在密码学中研究过,他们提供了一个证明消息完整的方法。
所以初看起来,图像证明技术的需要同密码学发展中的很多有效的证明技术那样不会造成问题。
遗憾的是,这离真相还很远。
考虑到存在的大量多余图像数据,目前图像证明技术的要求的是唯一问题是由普通的密码学证明技术准备的。
在下面我们列举了一些问题。
相比于在图像内容方面的应用,内容的表现形式是可取的,例如,是图像格式从JPEG向GIF转变。
只要可感知的内容没变,人们喜欢证明不同表现中差别的成立。
通常,证明技术基于密码学HASH函数,信息摘要和数字签名只能证明表现形式为真。
要证明图像内容为真时,证明者自主的嵌入信息是可取的。
这样做的一个好处是,证明就不要求修改大量图片内容存在的表现形式(如GIF格式)。
不管怎样,在我们看来,最重要的优点是证明在图像中嵌入的标签可以在各种不同形式的数据编码中保存下来,包括在一个完整透明的方式下模拟数字和数字模拟转换。
要证明图像内容为真时,不仅要检测到内容被修改了,还要检测到被修改内容的确切位置。
对于数据高度集中的图像内容,在硬件和软件中,任何证明技术在一个实时工具上有效率的计算都应该是可能的。
以上问题将会被基于数字水印的图像证明技术解决,在证明的应用发面有两种水印技术被开发出来—易碎水印技术和稳健水印技术。
在本节剩下的内容中,我们通过给出一些有说明性的例子描述普通的类似现象
2.1脆弱水印
脆弱水印是用来表示图像中的任何细小的修改,举例说明脆弱水印最基本的用法,我们描述最近由Wong和Memon提出的技术。
这个技术是在m*l图像X中插入一个无形的水印W,原始的图像X被分成k*l的小块Xr,同样的,水印也被分割成同样的小块Wr。
对于每块图像Xr都有相应的块
生成,和Xr最大的差异是在
中的每个元素的最低有效位都置0。
对于每个Xr,用密码学的哈斯
(如MD5)计算,其中K是用户的密钥。
哈斯输出的第一个kl字符,排成一个矩形阵列,和当前的水印块Wr异或就形成一个新的二元块Cr,Cr的每个元素都被插入
相应元素的最低有效位,产生一个输出块
。
图像证明是通过提取在每一个水印图像的
块中的Cr,然后通过和如上方法类似的方法与
′异或,产生一个提取出来的水印块。
水印过的图像变化使得相应二元水印领域也产生变化,使技术使图像XX的改变局部化。
水印算法能被扩展一个公开密钥的算法,需要把公开算法的私钥
插入水印。
然而,提取方法只要求使用者A的公钥,更明确的说,在算法公开密钥的版本中,图像数据块Xr和图像大小参数被分开,这就出现了用公钥提取的算法。
提取出来的块在合并的结果被嵌入块的最低有效位之前和当前的二元水印块Wr异或在提取过程中,相同的MSB数据和图像参数被分散。
数据块(密文)的最低有效位是用公钥提取,然后和哈斯函数异或产生一个水印块。
水印的插入和取出是各自独立的。
上面的技术只是脆弱水印技术的一个例子,在文献中有很多类似的例子。
脆弱水印技术中主要希望被解决的问题是:
位置:
这个技术怎么认出被修改象素的精确位置,在上面描述的技术只能认出被修改的数据块(至少12*12)。
被修改的任何一个比这小的区域就不能被发现。
水印的插入使图片质量下降了多少?
对于一个不知道插入水印的人在图像中插入水印是简单还是困难?
2.2半脆弱水印
在之前章节中描述的方法认证多媒体内容中的数据,认证过程并不对这些数据和其它流媒体数据区别处理。
在多媒体内容中插入签名的进程把数据流当成人能观察到景象处理。
例如,一个水印系统可以维持一个图片整体的平均色彩,或者在原始数据流的最低有效位插入水印和使他们不可感知,或者和图像内容无关。
所有的多媒体内容都有一定数量的多余的,这就是说数据的表现内容可以在不被感知的情况下改变。
进一步说,即使是可感知的改变也有可能不影响内容。
举例来说,当处理图像时,可以使图像发光,无损压缩或者改变对比度。
由操作造成的改变是可以感知的,是可取的,但是图像内容是没有改变的。
在图像中的物体在相同位置上设置仍是可认出的。
证明使用多媒体证件考虑到允许操作,图像文本关于允许首要的,剩下次要的。
任何证明都应该被证实因为它是真正的有用。
最近有一些对付图像内容证明技术的攻击,不仅是图像数据。
一个靠近使用特征点的图像文本是强健的图象压缩。
图像文本的证明计划将会被用成密码学系统如证明这些特征点的数字签名。
典型的特征点包括:
如地图,坐标等。
问题是用这些方法很难按照一些特征定义图像内容;
如根据图的边缘不够把图像内容定义为相同,因为它可能有两个完全不同的内容(一个人的脸被另一个人取代),但是在边缘部分是一样的。
尽管图像攻击和内容压缩被解决了,图像内容还是好多极其不清楚的地方,另一个靠近证明图像文本为真是计算图像被嵌入和被密钥提取出来信息的数量。
对于图像的公共密钥,私钥是用户个人的密钥,而将来任何一个有用户公钥的人都可以核实,如数字签名。
和被嵌入强健水印技术的图像相比,图像摘要要小的多,这点应该被注意到。
而且,图像摘要有原来的特性除非图像内容改变了从本身计算出来的摘要。
显然的,图像摘要功能是一个困难的问题,然而,这些功能中的一些在文献中和图像证明系统中设计出来。
可能最广泛引用的图像摘要功能/证明系统是SARI,这是由Lin和Chang提出的。
SARI证明系统包含图像能使JPEG无损压缩的摘要功能,那样,散列比特不改变无损压缩JPEG图像,但是却改变了其他相当大的一部分或者进行了恶意操作。
SARI的图像文章组成是基于在两个挑选出来的图像块中DTC系数的差别。
他能证明这个关系是即使在JPEG整个图像中使用同样的量子矩阵压缩后仍然存在。
由于图像摘要是基于这个特性,SATI可以区分JPEG的压缩和其他恶意的修改操作。
更具体的说,在SARI中,要证明的图像先被转换成二维的DCT,DCT块分成不重复的如下Pp和Pq
其中N是输入图像DTC块的总数。
一个任意的映射函数,Z被定义成满足如下关系
Φ和Pp∪Pq=P其中,P是输入图像所有DCT块的套。
映射函数Z是SARI安全的中心,是不公开的。
事实上,Z是基于密钥K的。
映像有效的把图像块分割成成对的,对于每一对块,都有一个DCT系数。
然后特征代码或者散列比特就在这对块中比较是否有相同的系数。
如,在一队块
中,如果DTC系数在块Pm中的比在块Pn中的大,就把散列比特定为1,否则为0。
很显然,散列比特是给出了所给的块的DTC系数间的关系,这些每个块的散列比特就组成了输入图像的摘要。
这些摘要可以自主的嵌入图像或者作为一个附注。
证明程序的接收端需要提取嵌入的摘要。
收到图像的摘要是由编码和同提取和破译出来的摘要比较所产生的。
由于挑选出来的DCT系数之间的关系是在JPEG压缩后仍然存在,这个证明系统就能把JPEG压缩同其他恶意的攻击区分开来。
但是,最近表明如果一个系统在所有图像中使用相同的密钥K和相同的映射函数Z来形成数据块队列,攻击者有足够多使用这种证明系统的图像就可以随心所欲的伪造图像了。
虽然压缩是最普通的图像操作,但设计成用来证明压缩的SARI是局限的。
一些应用将会要求一些简单的图像处理操作如锐化,模糊等。
再次,很多技术已经被提出,但可能最有名的是Fridrich提出的。
这个技术中,N随机矩阵是有始终不变的以[0,1]分布的条目使用密钥产生的,然后,一个低通滤波器在N随机矩阵中的反复应用。
然后通过使DC减去自身得到Pi,其中i=1,2..N。
然后图像块B,就对这些随机图案进行处理,如果数据大于0,散列比特产生1,否则为0。
这样,图像证明的N比特哈斯产生了。
由于图案Pi没有意义,这个设计不是依靠块的价值而是依靠块自身的多样的变化。
位析取技术的强健性是在一个真实图像上测试过的,它也显示了它的可靠性:
它能从一个64*64图像中提取48个正确的比特(从50比特中),以上正确率是在如下的操作中实现的:
15%品质的JPEG压缩,在30个灰色水平中添加不变的噪声,50%对比调节,25%亮度调节,8色的浓淡处理,锐化,模糊,马赛克处理,直方图平坦化和拉伸,提高边缘,在0.7-1.5范围内修正。
然而,类似凸饰和几何变换如旋转,变换,改变比例的操作将会不能成功提取出正确的比特。
总体来说,使用视觉散列函数和用强健水印嵌入散列的图像内容证明是一个有希望的领域,未来将会看到这方面的很多发展。
这是一个很困难的问题,我们怀疑是否有一个完全令人满意的答案。
那样的主要原因图像内容的定义还不清楚,对图像的小改动讲会导致一个不同的内容。
3强健水印
同脆弱水印不同,强健水印对有意或无意攻击或信号处理操作是有弹性的。
理想状态下,它能抵抗破坏和移除攻击。
强健水印包含了如下特性:
感知的透明:
强健性一定不能以牺牲可察觉的降低水印的数据为代价。
如,一个高能水印能对抗很多信号处理攻击;
但是,即使没有攻击,它也能造成水印图像画面品质的大量失真。
高负载:
一个强健水印应该有能力在攻击面前可靠的携带大量信息。
对旋转,裁剪,缩放等几何操作有弹性。
强健性可以对抗由多分水印数据创造出来的水印攻击。
计算简单:
当设计强健水印时,对复杂计算的考虑是很重要的。
如果一个水印算法很强健但是在编码和译码的过程中计算复杂的话,这个水印在现实生活的用处是有限的。
把水印嵌入图像中可觉察的微小成分中会对水印图像造成极微小的变形。
但是,我们注意到,这种水印技术对有意和无意的攻击不够强健。
例如,如果水印图像进行一个有损压缩,然后压缩算法把可察觉的微小成分丢弃了。
因此,要是水印强健,尽管我们冒着造成可察觉变形的危险,它必须被放在一个图像可感知的重要成分中。
这样就出现了两个重要问题:
1,什么是一个信号可感知的重要成分?
2,怎么样才能使由于强健水印引起的感知降低估计?
第一个问题的答案是根据多媒体—音频,图象或者视频的形式决定的。
如,一些空间频率和一些空间特性如插入图像是可感知的标志。
所以,选择这些成分添加强健水印对一些操作如有损压缩不利。
水印插入可感知的标志成分有很多方法,但是,一定要使承运者的特性和原始特性相一致。
在大部分强健水印算法中使用的一个常用技术是改编水印能量去适应承运者的特性。
这些通常都是在原始图像的统计基础上做的,这样,水印在视觉上就不可察觉了。
在过去的几年里,很多强健水印发展起来了。
有些是在空间域的,有些是在频域的,有些是添加的水印,有些使用量子化和代替策略,有些是线性的和有些是非线性的。
我们选择详细描述Kodak的技术是因为它清楚的提出了在强健水印技术中需要的各种要素。
Kodak的水印技术
空间水印技术的一个例子是基于Kodak提出的相位分散。
Kodak方法有几个理由是值得注意的。
1,它能被用做加入灰度图像或者二进制数据。
2,该技术能在没有分开信号的条件下决定剪裁坐标。
此外,用于旋转和缩放的策略适用于在图像领域中插入周期性水印的其他水印方法。
最后,Kodak算法使用StirMark3.0得到了0.98的成绩。
下面是这个技术的一个概要描述。
简单的说,只考虑了嵌入的二进制数据。
二进制数字由正和负增量函数(1和0)代表,在消息图像M中有一个唯一的位置。
这些位置被信息样板T明确的预定义了。
一般来说,样板图像的尺寸是原始图像的一部分。
然后,一个和消息图像有相同尺寸的承运图像
是使用密钥后产生的。
承运图像是在傅立叶领域中个空间频率分配一个均匀随机相位所产生的。
承运图像被消息图像围绕着,为了产生分散的消息,然后加入原始图像。
因为消息图像一般比原始图像小,原始图像被分成几个不重叠的紧接着的和消息图像同样大小的方块Xr。
消息嵌入过程根据如下关系创造了水印图像块
:
其中,*代表循环卷积,选择一个任意常数使嵌入消息无形的和普通进程强健。
在上式中,很明显对消息图像没有限制,它的象素值可以是二元的也可以是多元的。
基础提取进程很简单,是由被用来嵌入消息的相同的承运图像构成。
提取出来的信息图像
用如下式子:
其中N代表循环的相互关系,承运者之间的相互关系可以有点展开函数
,由于回绕操作和替换上式为:
取出的消息是原始消息和一个由原始消息和承运者异或所产生的低噪声的线性版本。
原始消息可以被任何一种普通的恢复技术如Wiener过滤器恢复。
然而,对于一个理想的承运者,p(x;
y)是一个增量函数,水印取出进程会造成消息图像和低噪声的版本。
当噪声成分由于图像成分在块与块之间变动而减少时,块的总和补充了水印成分。
为了创造一个足够强健的系统,在设计承运者和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 水印 技术 研究 实现 外文 翻译
![提示](https://static.bingdoc.com/images/bang_tan.gif)