一文带你读懂图像处理工作原理

本文为 AI 研习社编译的技术博客，原标题：

An Amazing Insight of How Image Processing Works

作者 | Bhanu Parashar

翻译 | 老赵校对 | 酱番梨

整理 | 菠萝妹

原文链接：

https://medium.com/@bhanuparashar23/an-amazing-insight-of-how-image-processing-works-9b7a17aa42a4

对图像处理如何工作的理解

我发现的最令人惊奇的是如何使用微积分巧妙地计算图像边缘。

考虑一个黑白图像

一文带你读懂图像处理工作原理

在这里，我放大了一个小区域。

如你所见，它包含许多像素。

它可以表示为具有以下约束的2D矩阵：

在AijAij中，i表示像素的x坐标，j表示y坐标
左上角是坐标（0,0）
x，即向右移动时增加，而y，j在向下移动时增加
AijAij的值范围为0到255,0表示黑色255表示白色

所以这个小区域的矩阵将是

一文带你读懂图像处理工作原理

现在只考虑矩阵的一行。

即：像这样的东西

一文带你读懂图像处理工作原理

表示为：

一文带你读懂图像处理工作原理

如果我们在图表上绘制它：

它会像

一文带你读懂图像处理工作原理

记住高值意味着更多的白色，低值意味着更多的黑色，范围从0到255。

第1部分：现在有趣的开始

如果我们将这个图表区分开来，考虑到函数y = f（x），该怎么办？

这里y是值AijAij，x是矩阵的i（这里y是不同的）

那么让我们绘制它的衍生物

正如你可以看到，从白色到黑色的图像变化点，衍生物的值突然增加

如果我们进一步区分，即双重差异，该怎么办？

一文带你读懂图像处理工作原理

所以你可以看到变化区域的突然爆发。

让我们在图像行中标记点：

一文带你读懂图像处理工作原理

现在，如果我们将这个东西应用于所有行并标记双重导数的高值。

它沿着图像的边缘

同样也可以将它用于所有列，你将获得图像中的完整边缘。

第2部分：数学实施（比上面更令人惊讶）

如何通过计算机将这种差异应用于图像：

一些数学家发现了一种叫做卷积的现象让我先解释一下：

考虑一个大的NxN矩阵和一个小的3×3矩阵：

一文带你读懂图像处理工作原理

这里，如果小矩阵的点积与大矩阵的所有3×3大小的部分完成。点积表示每个元素乘以其各自的元素，例如。 131 *（ – 1），162 * 0,232 * 1等。

结果保存在另一个矩阵中。

这个过程称为卷积，这里3×3矩阵是内核，它可以更大，但最常用的是3×3。

这种现象是，如果一个大矩阵与一个类似于核的核心区域进行卷积，则在结果矩阵中突出显示（值增加），而非相似区域变暗。

代表双重差异的内核是：

一文带你读懂图像处理工作原理

以上这些也称为Sobel Kernel

第3部分：基于C ++的OpenCV实现

一文带你读懂图像处理工作原理

输出

一文带你读懂图像处理工作原理

通过使用高斯导数，Canny边缘检测去除噪声可以实现许多进步，这些可以在线轻松研究。

图像：除了提供链接的图像之外的所有图像都是由我捕获和编辑的。

它如何扩展到彩色图像

颜色通常表示为RGB值（这里是OpenCV，它是BGR）

B->蓝色，G->绿色，R->红色边缘检测通常在将彩色图像转换为黑白之后进行。

但是还有一种方法，Image可以转换为HSV色空间这里 H 代表 Hue，S 代表饱和度，V 代表值，即 H 代表颜色，S 代表强度，V 代表亮度。

因此，如果我们只采用H或Hue，我们可以找到边缘而不受阴影或光线的影响。

还有其他方法。雷锋网(公众号：雷锋网)雷锋网雷锋网

想要继续查看该篇文章相关链接和参考文献？

长按链接点击打开或点击【一文带你读懂图像处理工作原理】：

http://ai.yanxishe.com/page/TextTranslation/1248

AI研习社每日更新精彩内容，观看更多精彩内容：

神经网络如何完成表征？

进入 kaggle 竞赛前 2% 的秘诀

如何极大效率地提高你训练模型的速度？

这 25 个开源机器学习项目，一般人我不告诉 Ta

等你来译：

五个很厉害的 CNN 架构

这5种计算机视觉技术，刷新你的世界观

神经网络和3D程序化生成的未来

使用TensorSpace.js来做神经网络的的3D可视化

AI研习社资料推荐：

一文带你读懂图像处理工作原理

。

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/134655.html

一文带你读懂图像处理工作原理

第1部分：现在有趣的开始

第2部分：数学实施（比上面更令人惊讶）

第3部分：基于C ++的OpenCV实现

进入 kaggle 竞赛前 2% 的秘诀

如何极大效率地提高你训练模型的速度？

这 25 个开源机器学习项目，一般人我不告诉 Ta

五个很厉害的 CNN 架构

这5种计算机视觉技术，刷新你的世界观

神经网络和3D程序化生成的未来

使用TensorSpace.js来做神经网络的的3D可视化

相关推荐

发表回复