2数字图像基础赵国庆博士guoqingzh@163.
com北京师范大学教育技术学院http://set.
bnu.
edu.
cn北京师范大学知识科学与工程研究所http://ksei.
bnu.
edu.
cn内容提要1颜色及色彩模型颜色的形成原理——光的本质从本质上讲,光是一种电磁波.
颜色的形成原理——光的本质颜色是视觉系统对可见光的感知结果.
我们通常所说的光是指可见光,它们是波长在380nm-780nm之间的电磁波.
在自然界中,人们看到的大多数光不是单一波长的波,而是由多种不同波长的波组合而成的.
我们将光谱中不能再分解的光称为单色光,由单色光组合而成的光称为复色光.
常见的光的波长与颜色的对应关系如表所示.
颜色红橙黄绿青蓝紫波长(nm)700620580546480436380颜色的形成原理——光的本质人们获取的信息的70%来自视觉系统研究表明,人的视网膜有对红(Red)、绿(Green)、蓝(Blue)颜色敏感程度不同的三种锥体细胞,另外还有一种在光功率极端低的条件下才起作用的杆状细胞,因此颜色只存在于眼睛和大脑.
由于红、绿、蓝三种颜色可以混合而成自然界的任何一种颜色,因此被称为三基色.
颜色的形成原理人的视觉系统对颜色的感知可归纳出如下几个特性:眼睛本质上是一个照相机红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同自然界中的任何一种颜色都可以由R、G、B这3种颜色值之和来确定.
颜色三要素色彩可以用色调、亮度和饱和度来描述.
人眼看到的任何一种颜色都是都三个特性的综合效果.
因此这三个特性被称为色彩的三要素.
三要素中,色调由光波的波长决定,亮度和饱和度与光波的振幅有关.
颜色三要素——色调色调表示光的颜色,决定于光的波长.
自然界中的七色光分别对应着不同的色调,而每种色调又分别对应着不同的波长.
色调用红、橙、黄、绿、青、蓝、紫来表示,而黑、白、灰无色彩.
色调有一个基本顺序:红(Red)、橙(Orange)、黄(Yellow)、绿(Green)、青(Cyan)、蓝(Blue)、紫(Magenta).
在这个次序中,人们混合相邻颜色时,能够得到这两种颜色之间连续变化的色调.
颜色三要素——色调(2)按照不同的色调按红、橙、黄、绿、青、蓝、紫的顺序衔接起来,就形成了一个色调连续变化过渡的圆环,称为色环.
以色环的中心为极坐标极点,各种色调与极轴的夹角称为色调的色相.
例如红色的色相为0度,红、绿、蓝三基色的夹角为120度,黄色(=红+绿)的色相为60度,正好位于红色和绿色之间.
颜色三要素——亮度亮度用来表示某种颜色在人眼视觉上引起的明暗程度,它只与光的强度有关.
光的强度越大,物体就越亮;光的强度越小,物体就越暗.
在纯正光谱的七色光中,黄色的亮度最高,显得最亮,往下依次是橙色、绿色、红色、蓝色、紫色.
颜色三要素——饱和度饱和度是指彩色光所呈现颜色的深浅或纯洁程度.
对于同一色调的彩色光,饱和度越高,颜色就越纯;饱和度越低,颜色就越浅.
在彩色光中加入白光,基本色调没有变化,但亮度提高了,饱和度却下降了.
因此,在某色调的彩色光中加入别的彩色光,会引起色调的变化;而掺入白光仅仅引起饱和度的变化.
图像的色彩模型色彩模型是用来精确标定和生成各种颜色的一套规则和定义.
不同的应用又有不同的色彩模型,最常用的色彩模型有RGB、CMYK、HSB、YUV以及Lab色彩模型.
其中RGB、CMYK是两种专门面向数码设计和出版印刷的色彩模型.
一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定,使用RGB相加混色模型;一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定,用CMY相减混色模型.
RGB相加混色模型电视机和计算机显示器使用的阴极射线管(CRT)是一个有源物体.
CRT使用3个电子枪分别产生红(Red)、绿(Green)和蓝(Blue)三种波长的光,并以各种不同的相对强度综合起来产生颜色.
LCD与CRT电脑显示器包括两种:液晶LCD(liquidcrystaldisplay)阴极射线管CRT电脑CRT显示器类似于彩色电视机中的CRT.
显示屏上的每个彩色像点由代表R、G、B三种模拟信号的相对强度决定,这些彩色像点就构成一幅彩色图像.
彩色显像管产生颜色的原理RGB相加混色模型从理论上讲,任何一种颜色都可用三种基本颜色按不同的比例混合得到.
三种颜色的光强越强,到达我们眼睛的光就越多,它们的比例不同,我们看到的颜色也就不同,没有光到达眼睛,就是一片漆黑.
当三基色按不同强度相加时,总的光强增强,并可得到任何一种颜色.
某一种颜色和这三种颜色之间的关系可用下面的式子来描述:颜色=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比)RGB相加混色模型Red(红)+Green(绿)=Yellow(黄)Red(红)+Blue(蓝)=Magenta(品红)Green(绿)+Blue(蓝)=Cyan(青)CMYK相减混色模型用彩色墨水或颜料进行混合,这样得到的颜色称为相减色.
在理论上说,任何一种颜色都可以用三种基本颜料按一定比例混合得到.
这三种颜色是青色(Cyan)、品红(Magenta)和黄色(Yellow),通常写成CMY,称为CMY模型.
理论上,当青色(C)、洋红(M)和黄色(Y)色素在合成后可以吸收所有光线并产生黑色.
但由于所有的打印油墨都存在一些杂质,这三种油墨实际会产生土棕色.
因此,在四色打印中除了使用纯青色、洋红和黄色油墨外,还会使用黑色油墨(K).
(为避免与蓝色混淆,黑色用K而非B表示.
)因此,该模型通常写成CMYK,称为CMYK相减混色模型.
CMYK相减混色模型在相减混色中,当三基色等量相减时得到黑色;(为什么)等量黄色(Y)和品红(M)相减而青色(C)为0时,得到红色(R);(为什么)等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B);(为什么)等量黄色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G).
(为什么)CMYK相减混色模型RGB模型与CMYK模型的区别第一,RGB色彩模式是发光的,存在于屏幕等显示设备中,不存在于印刷品中;CMYK色彩模式是反光的,需要外界辅助光源才能被感知,它是印刷品唯一的色彩模式.
第二,色彩数量上RGB色域的颜色数比CMYK多出许多.
但两者各有部分色彩是互相独立(即不可转换)的.
第三,RGB通道灰度图中偏白表示发光程度高;CMYK通道灰度图中偏白表示油墨含量低.
反而反之.
RGB模型与CMYK模型的区别(2)特别注意第二条:两者各有部分色彩是互相独立(即不可转换)的.
如右图中绿色大圆表示RGB色域,蓝色小圆表示CMYK色域.
这一大一小表示RGB的色域范围(即色彩数量)要大于CMYK.
而在转换色彩模式后,只有位于混合区的颜色彩可以被保留,位于RGB特有区及CMYK特有区的颜色将丢失.
RGB模型与CMYK模型的选择虽然理论上RGB与CMYK的互转都会损失一些颜色,不过从CMYK转RGB时损失的颜色较少,在视觉上有时很难看出区别.
而从RGB转CMYK颜色将损失较多,视觉大部分都可以明显分辨出来.
因此习惯上也有CMYK转RGB时颜色无损的说法,其实这种说法的真正所指是:宁可CMYK转RGB,不可RGB转CMYK.
明白了以上道理,我们对如何选择图像的色彩模式就有了一个概念了:如果图像只在电脑上显示,就用RGB模式,这样可以得到较广的色域;如果图像需要打印或者印刷,就必须使用CMYK模式,才可确保印刷品颜色与设计时一致.
活动任务任务1:通过Photoshop体验颜色三要素(色调、亮度、饱和度)任务2:调整颜色通道,让图片的颜色更加鲜艳原图效果图2图像的数字化图像的数字化计算机只能处理数字化的图像.
自然界中的景物成像后无论以何种记录介质保存都是连续的.
从空间上看,一幅图像在二维空间上都是连续分布的,从空间的某一点位置的亮度来看,亮度值也是连续分布的.
图像数字化就是把连续的空间位置和亮度离散,它包括两个方面的内容:空间位置的离散和数字化,亮度值的离散和数字化.
图像的数字化过程包括采样、量化和编码三个阶段.
①采样把一幅连续的图像在二维方向上分成m*n个网格,每个网格用一个亮度值表示,这样一幅图像就要用m*n个亮度值表示,这个过程称为采样.
每一个网格称为数字图像的一个像素.
m和n的大小决定着数字图像的质量.
①采样图像中的每个像素都有一个值,称为像素值,它表示特定颜色的强度.
一个像素值往往用R、G、B三个分量表示.
如果每个像素的每个颜色分量用二进制的1位来表示,那么每个颜色的分量只有"1"和"0"这两个值.
这也就是说,每种颜色的强度是100%,或者是0%.
在这种情况下,每个像素所显示的颜色是8种可能出现的颜色之一.
8色RGB颜色000黑001蓝010绿011青RGB颜色100红101品红110黄111白量化和编码②量化.
采样的图像亮度值,在采样的连续空间上仍然是连续值.
把亮度分成k个区间,某个区间对应相同的亮度值,共有k个不同的亮度值,这个过程称为量化.
③编码.
对每个像素的亮度值采用相应的二进制数来表示,这个过程称为编码.
图像数字化的指标影响图像数字化质量的主要参数有分辨率、像素深度.
分辨率、像素深度和色彩类型一起构成了数字图像的三大基本属性.
分辨率是位图图像的重要参数.
我们经常遇到的分辨率有三种:显示分辨率、图像分辨率和像素分辨率.
图像分辨率图像分辨率是指组成一幅图像的像素密度的度量方法.
对同样大小的一幅图,如果组成该图的图像像素数目越多,则说明图像的分辨率越高,看起来就越逼真.
相反,图像显得越粗糙.
在用扫描仪扫描彩色图像时,通常要指定图像的分辨率,用每英寸多少点表示,即DPI(dotsperinch).
如果用300DPI来扫描一幅8″*10″的彩色图像,就得到一幅2400*3000个像素的图像.
分辨率越高,像素就越多.
显示分辨率图像分辨率与显示分辨率是两个不同的概念.
图像分辨率是确定组成一幅图像的像素数目,而显示分辨率是指显示屏上能够显示出的像素数目.
屏幕能够显示的像素越多,说明显示设备的分辨率越高,显示的图像质量也就越高.
例如,显示分辨率为640*480表示显示屏分成480行,每行显示640个像素,整个显示屏就含有307200个显像点.
如果显示屏的分辨率为640*480,那么一幅320*240的图像只占显示屏的1/4;相反,2400*3000的图像在这个显示屏上就不能显示一个完整的画面.
像素分辨率像素分辨率是指显像管荧光屏上一个像素点的宽和长之比.
例如:在捕捉图像时,如果显像管的象素分辨率为2:1,而产生图像的显像管的象素分辨率为1:1,这时该图像会发生变形.
像素深度像素深度是指存储每个像素所用的位数,它也是用来度量图像的分辨率.
像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数.
像素深度例如,一幅彩色图像的每个像素用R、G、B三个分量表示,若每个分量用8位,那么一个像素共用24位表示,就说像素的深度为24,每个像素可以是224=16777216种颜色中的一种.
在这个意义上,往往把像素深度说成是图像深度.
表示一个像素的位数越多,它能表达的颜色数目就越多,而它的深度就越深.
色彩类型:真彩色、伪彩色与直接色图像的色彩需要用三维空间来表示,如RGB色彩模型,而色彩的空间表示法又不是唯一的,所以每个像素点的像素深度的分配还与图像的色彩类型有关.
以常见的RGB色彩模型为例,像素深度与色彩的映射关系主要有真彩色、伪彩色和直接色.
真彩色真彩色是指在组成一幅彩色图像的每个像素值中,有R、G、B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色.
例如用RGB5∶5∶5表示的彩色图像,R、G、B各用5位,用R、G、B分量大小的值直接确定三个基色的强度,这样得到的彩色是真实的原图彩色.
真彩色如果用RGB8:8:8方式表示一幅彩色图像,就是R、G、B都用8比特来表示,每个基色分量占一个字节,共3个字节,每个像素的颜色就是由这3个字节中的数值直接决定,可生成的颜色数就是224=16777216种.
真彩色用3个字节表示的真彩色图像所需要的存储空间很大,而人的眼睛是很难分辨出这么多种颜色的,因此在许多场合往往用RGB5:5:5来表示,每个彩色分量占5个比特,再加1比特显示属性控制位共2个字节,生成的真颜色数目为215=32K.
伪彩色伪彩色图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表CLUT(colorlook-uptable)的表项入口地址,去查找一个显示图像时使用的R、G、B强度值,用查找出的R、G、B强度值产生的彩色称为伪彩色.
伪彩色彩色查找表CLUT(colorlookuptable)是一个事先做好的表,表项入口地址也称为索引号.
例如16种颜色的查找表,0号索引对应黑色,.
.
.
,15号索引对应白色.
彩色图像本身的像素数值和彩色查找表的索引号有一个变换关系.
直接色每个像素值分成R、G、B分量,每个分量作为单独的索引值对它做变换,也就是通过相应的彩色变换表找出基色强度,用变换后得到的R、G、B强度值产生的彩色称为直接色.
它的特点是对每个基色进行变换.
直接色与真彩色、伪彩色的比较直接色与真彩色相比,相同之处是都采用R、G、B分量决定基色强度,不同之处是前者的基色强度直接用R、G、B决定,而后者的基色强度由R、G、B经变换后决定.
因而这两种系统产生的颜色就有差别.
试验结果表明,使用直接色在显示器上显示的彩色图像看起来真实、很自然.
直接色与伪彩色系统相比,相同之处是都采用查找表,不同之处是前者对R、G、B分量分别进行变换,后者是把整个像素当作查找表的索引值进行彩色变换.
活动任务任务1:观察位图的像素点.
任务2:抓图体验图像分辨率与显示分辨率3数字图像的分类图像的种类按照图像的几何特性,可以将图像分为点阵图和矢量图两大类.
按照图像的颜色,可以将图像分为彩色图和灰度图两大类.
矢量图与点阵图(位图)在计算机中,表达图像和计算机生成的图形图像有两种常用的方法:一种叫做是矢量图(vectorbasedimage)法,另一种叫点阵图(bitmappedimage)法.
虽然这两种生成图的方法不同,但在显示器上显示的结果几乎没有什么差别.
矢量图(图形)图形(Graphic)是指从点、线、面到三维空间的黑白或彩色几何图.
图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合.
在图形文件中只记录生成图的算法和图上的某些特征点,因此也称矢量图.
点阵图(位图/图像)图像(Image)是由像素点阵组成的画面.
静止的图像是一个矩阵,阵列中的各项数字用来描述构成图像的各个点(称为像素点pixel)的强度与颜色等信息.
这种图像也称为位图(bit-mappedpicture).
矢量图与点阵图的比较位图文件占据的存储器空间比较大.
影响点位图文件大小的因素主要有两个:图像分辨率和像素深度.
分辨率越高,就是组成一幅图的像素越多,则图像文件越大;像素深度越深,就是表达单个像素的颜色和亮度的位数越多,图像文件就越大.
而矢量图文件的大小则主要取决于图的复杂程度.
矢量图与点阵图的比较(2)矢量图与位图相比,显示位图文件比显示矢量图文件要快;矢量图侧重于"绘制"、去创造,而位图偏重于"获取"、去"复制";矢量图和位图之间可以用软件进行转换,由矢量图转换成点位图采用光栅化(rasterizing)技术,这种转换也相对容易;由点位图转换成矢量图用跟踪(tracing)技术,这种技术在理论上说是容易,但在实际中很难实现,对复杂的彩色图像尤其如此.
灰度图灰度图(gray-scaleimage)按照灰度等级的数目来划分.
只有黑白两种颜色的图像称为单色图像(monochromeimage).
图中的每个像素的像素值用1比特存储,它的值只有"0"或者"1",一幅640*480的单色图像需要占据37.
5KB的存储空间.
标准单色图和标准灰度图彩色图像彩色图像(colorimage)可按照颜色的数目来划分,例如256色图像和真彩色(224=16777216种颜色)等.
256色标准图像转换成的256级灰度图像256色标准图像转换成的256级灰度图像上图是一幅用256色标准图像转换成的256级灰度图像256色彩色图像的每个像素的R、G和B值用一个字节来表示,一幅640*480的8比特彩色图像需要307.
2KB的存储空间;(640*480*1=307200byte)(这副彩色图像是真彩色还是伪彩色)真彩色图像转换成的256级灰度图像真彩色图像转换成的256级灰度图像上图是一幅真彩色图像转换成的256级灰度图像,每个像素的R、G、B分量分别用一个字节表示,一幅640*480的真彩色图像需要921.
6KB的存储空间.
(640*480*3=921600byte)32位真彩色许多24比特彩色图像是用32比特存储的,这个附加的8比特叫做alpha通道,它的值叫做alpha值,它用来表示该像素如何产生特技效果.
使用真彩色表示的图像需要很大的存储空间,在网络传输也很费时间.
由于人的视角系统的颜色分辨率不高,因此在没有必要使用真彩色的情况下就尽可能不用.
4数字图像的存储图像数据量图像数据量是指磁盘上存储整幅图像所需的字节数.
图像数据量的计算表达式为:图像数据量=图像分辨率*像素深度/8(byte)例如:一幅640*480的256级灰度图像,未压缩的原始数据量=640*480*8/8(byte)=307200byte=307200/1024KB=300KB.
一幅1024*768的真彩色图像,未压缩的原始数据量=1024*768*24/3(byte)=2359296byte=2.
25M.
图象的压缩从上面计算的结果可以看出,图像数字化之后的数据量非常大,在因特网上传输时很费时间,在盘上存储时很占"地盘",因此就必须要对图像数据进行压缩.
压缩的目的就是要满足存储容量和传输带宽的要求,而付出的代价是大量的计算.
图像的压缩图像数据压缩主要根据下面两个基本事实来实现的.
一个是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;另一个事实是人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到压缩数据的目的.
利用前一个事实的压缩技术就是无损压缩技术,利用后一个事实的压缩技术就是有损压缩技术.
实际的图像压缩是综合使用各种有损和无损压缩技术来实现的图像文件格式BMP格式GIF格式JPG格式PNG格式PSD格式……BMP格式(相对文件较大)BMP是一种与硬件设备无关的图像文件格式,使用非常广.
它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BMP文件所占用的空间很大.
BMP文件的图像深度可选1bit、4bit、8bit及24bit.
BMP是最普遍的位图格式之一,也是Windows系统下的标准格式.
BMP格式支持RGB.
索引颜色、灰度和位图颜色模式,不支持Alpha通道.
GIF格式GIF是一种压缩的8位图像文件,广泛用于网络传输,最多只有256色.
新的GIF89a格式,能储存成背景透明化的形式(支持Alpha通道),并且可以将数张图存成一个文件,形成动画效果,还支持位图模式、灰度或索引颜色模式图像.
JPEG格式JPEG是一种高效率的压缩格式,在存档时能够将人眼无法分辨的资料删除,以节省存储空间.
JPEG格式支持RGB和灰度颜色模式,不支持Alpha通道.
JPEG格式通过选择性地去掉数据来压缩文件,是有损压缩.
它比GIF图像包含更多颜色方面的信息,优点是色彩比较逼真,文件也较小.
在多媒体及网页中用到的照片和图像适合存为JPEG格式.
vpsdime上了新产品系列-Windows VPS,配置依旧很高但是价格依旧是走低端线路。或许vpsdime的母公司Nodisto IT想把核心产品集中到vpsdime上吧,当然这只是站长个人的猜测,毕竟winity.io也是专业卖Windows vps的,而且也是他们自己的品牌。vpsdime是一家新上来不久的奇葩VPS提供商,实际是和backupspy以及crowncloud等都是同一家公司...
RackNerd今天补货了3款便宜vps,最便宜的仅$9.49/年, 硬盘是SSD RAID-10 Storage,共享G口带宽,最低配给的流量也有2T,注意,这3款补货的便宜vps是intel平台。官方网站便宜VPS套餐机型均为KVM虚拟,SolusVM Control Panel ,硬盘是SSD RAID-10 Storage,共享G口带宽,大流量。CPU:1核心内存:768 MB硬盘:12 ...
hosthatch在做美国独立日促销,可能你会说这操作是不是晚了一个月?对,为了准备资源等,他们拖延到现在才有空,这次是针对自己全球14个数据中心的VPS。提前示警:各个数据中心的网络没有一个是针对中国直连的,都会绕道而且ping值比较高,想买的考虑清楚再说!官方网站:https://hosthatch.com所有VPS都基于KVM虚拟,支持PayPal在内的多种付款方式!芝加哥(大硬盘)VPS5...