DIP_review_1
DIP_review_1 - Digital image fundamentals
1.Introduction
- 信号的分类
- Analog signal 模拟信号
- 连续时间信号,且具有连续值的波峰
- 许多自然界的信号是模拟的
- Quantized boxcar signal
- 连续时间信号,但离散值波峰
- 存在于数字电路
- sampled-data signal 采样信号 -> 将坐标轴数字化,即离散时间
- 离散时间,但连续值波峰
- 可视为对模拟信号用周期性脉冲采样
- Digital signal 数字信号 ->将峰值数字化,即离散波峰
- 离散时间,且离散值波峰
- 是采样信号量化后的结果
- Analog signal 模拟信号
- Pixel/Voxel
- 数字图像由有限个数量的Pixel组成,Pixel中包含着位置和Intensity value的信息,主要用来表示图像的的灰度值,颜色,高度和不透明度等重要信息
- 用(x,y)作为Pixel在图像中的坐标,f(x,y)作为其对应的幅值即Intensity or brightness(color)
2.Human visual system, perception and pixel
- Pixel basis
- 邻居Neighbors of Pixel
- 上下左右,十字
- 左上,左下,右上,右下,斜对角线
- Adjacency邻接性
- Intensity values V 的集合
- Binary image: V = {1}
- Gray-scale image: V = [Lmin, Lmax]
- 4-adjacency
- p, q V
- q
- 8-adjacency(当形成三角形时可能会导致绕圈圈)
- p, q V
- q
- M-adjacency (mixed adjacency)对于8邻接的改进旨在消除产生的歧义
- p, q V
- q 或者
- q 且(只有当4邻接的两点都不在时,才能连8邻接,避免成环)
- Intensity values V 的集合
- Connectivity连通性(可以到达每一个点,即任意两个点之间存在通路)
- 4邻接连通
- 8邻接连通
- Region区域(R:图像的子集,which is a 连通集合)
- 4邻接情况下有几个区域
- 8邻接情况下有几个区域
- Boundary边界(A set of pixels that are adjacent to pixels in the complement of R.)
- Inner border
- outer border
- Image border
- Edge(不一定闭合,可能只是图像中的一条线)
- Distance measurements
- 满足空间几何三定律
- Distance 类型
- 欧式集合距离:
- City-block distance:
- Chessboard distance:
- distance 定义为点之间的最短m-path,即通过m-邻接来判断距离长短
- 满足空间几何三定律
- 矩阵和数组操作
- 矩阵操作即矩阵乘法
- 数组操作即点乘,矢量乘法
- 邻居Neighbors of Pixel
3.Intensity transform and spatial filtering
- Histogram直方图
- 直方图Histogram
- def: , where r_k代表Intensity value, n_k代表对应pixel的数量
- 归一化直方图Normalized(pdf)
- def: , where MN代表Image的pixel总数
- Properties
- 丢失了空间位置信息
- 相同直方图可能对应有着不同的image
- 若 且 A, B disjoint,那么
- 直方图Histogram
- Intensity transformation 要保证为单调递增函数
- Image nevative
- Contrast Stretching
- , 即中间折线的斜率计算公式
- 最极端的对比拉伸为灰度值二值化
- Intensity-level slicing
- Log transformation
- c为调整程度,暗的区域扩大动态范围,亮的区域缩写
- 反对数变换
- 与对数变换效果相反
- Gamma Transformaiton(将对数变换和反对数变换相统一)
- log transformation
- No transform
- inverse log transformation
- Bit-Plane Slicing位图分割
- 高位携带着图像的主要信息
- 用处打水印,将水印放在低位
- Image nevative
- Histogram processing
- Histogram Equalization 直方图均衡化
- ,
- 注意是求和因此可以理解为cdf
- 同时我们允许其得到的s进行round四舍五入
- round(255 * cdf(intensity + 1))来得到新的投影像素
- Histogram Matching 直方图匹配 -> 生成一个带有特殊化直方图的处理后图像
- r投影到s,z投影到s,那么其直接可以以s为媒介,实现r投影到z
- 首先r至s我们能做直方图均衡化,有了r->s的projection
- 接着z到s我们也可以做均衡化,有了s->z的projection
- 最后我们就有了r->s->z的投影,最终得到z的变换
- AHE(Adaptive Histogram Equalization) 注意padding的形式!!!!!“circular”!!
- 利用batch一块一块去做直方图均衡化,然后每次更新中心点的像素
- 优势:更好的均匀分布
- 劣势:高复杂度
- 对于快速AHE,改进为每次更新中心M*M的像素点
- Contrast Limited Adaptive Histogram Equalization (CLAHE)
- 相较于AHE,额外加入对比度限制,在每一块batch计算其pdf时,计入一个阈值clip limit来将高于该阈值的部分切除,在平均分配给所有灰度值,以减少对噪声的过度放大
- Histogram Equalization 直方图均衡化
- Spatial Filtering(Kernels or templates or masks or windows)
- spatial filter/ correlation
- 满足分配律,不满足交换律和结合律
- convolution (翻转)
- 满足分配律,交换律,结合律
- filter kernel的可分离性
- 以此可以减少卷积的计算量!!
- 注意padding!!!!!
- 对于滤波来说,是为了满足前后图片大小一致
- 对于卷积来说,是为了符合signal卷积后的性质
- 滤波器分类
- 线性滤波器(更容易处理Gaussian noise)/平滑滤波器
- 均值滤波器/box filter
- 高斯滤波器 , 越大,图像越模糊
- LoG filter 对 Gaussian求取二阶导
- 非线性滤波器(更容易处理salt-and-pepper noise)
- 中值滤波器/统计排序滤波器
- 最大值滤波器
- 锐化滤波器
- 拉普拉斯算子
-
- 如果想要直接得到锐化后的结果那么对应的kernel为
-
- 拉普拉斯算子可以分为两个1维kernel的组合从他的表达式来看(并非矩阵拆分)
- I_{xx} = [1, -2, 1] 提取纵向轴信息
- I_{yy} = [1; -2; 1] 提取横向轴信息
- 将二者结果相加仍等于拉普拉斯算子对图像卷积得到的details
- 使用简单,但会丢失方向信息
- 对噪声敏感,需加入smoothing
- Roberts cross-gradient operator(罗伯特交叉梯度算子)
- Sober operator
- Unsharpen Mask(非锐化掩蔽)
- 线性滤波器(更容易处理Gaussian noise)/平滑滤波器
- spatial filter/ correlation
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.