OpenCV探索之路（五）：图片缩放和图像金字塔 / 开普饭

对图像进行缩放的最简单方法当然是调用resize函数啦！

resize函数可以将源图像精确地转化为指定尺寸的目标图像。

要缩小图像，一般推荐使用CV_INETR_AREA来插值；若要放大图像，推荐使用CV_INTER_LINEAR。

现在说说调用方式

第一种，规定好你要图片的尺寸，就是你填入你要的图片的长和高。

#include<opencv2\opencv.hpp>
#include<opencv2\highgui\highgui.hpp>

using namespace std;
using namespace cv;

//图片的缩小与放大
int main()
{
Mat img = imread("lol5.jpg");
imshow("原始图", img);

Mat dst = Mat::zeros(512, 512, CV_8UC3); //我要转化为512*512大小的
resize(img, dst, dst.size());

imshow("尺寸调整之后", dst);

waitKey(0);

}

第二种，填入你要缩小或者放大的比率。

#include<opencv2\opencv.hpp>
#include<opencv2\highgui\highgui.hpp>

using namespace std;
using namespace cv;

//图片的缩小与放大
int main()
{
Mat img = imread("lol5.jpg");
imshow("原始图", img);

Mat dst;
resize(img, dst, Size(),0.5,0.5);//我长宽都变为原来的0.5倍

imshow("尺寸调整之后", dst);

waitKey(0);

}

接下来说说图像金字塔

说白了，图像金字塔就是用来进行图像缩放的，干的事情跟resize函数没两样，那我们还需要学它吗？我觉得有必要的额，因为在学习卷积神经网络中会遇到这个名词，所以都学一学吧，搞图形都绕不过他！

说说什么是图像金字塔。

其实非常好理解，如上图所示，我们将一层层的图像比喻为金字塔，层级越高，则图像尺寸越小，分辨率越低。

两种类型的金字塔：

高斯金字塔：用于下采样，主要的图像金字塔；
拉普拉斯金字塔：用于重建图像，也就是预测残差（我的理解是，因为小图像放大，必须插入一些像素值，那这些像素值是什么才合适呢，那就得进行根据周围像素进行预测），对图像进行最大程度的还原。比如一幅小图像重建为一幅大图像，

图像金字塔有两个高频出现的名词：上采样和下采样。现在说说他们俩。

上采样：就是图片放大（所谓上嘛，就是变大），使用PryUp函数
下采样：就是图片缩小（所谓下嘛，就是变小），使用PryDown函数

下采样将步骤：

对图像进行高斯内核卷积
将所有偶数行和列去除

下采样就是图像压缩，会丢失图像信息。

上采样步骤：

将图像在每个方向放大为原来的两倍，新增的行和列用0填充；
使用先前同样的内核（乘以4）与放大后的图像卷积，获得新增像素的近似值。

上、下采样都存在一个严重的问题，那就是图像变模糊了，因为缩放的过程中发生了信息丢失的问题。要解决这个问题，就得看拉普拉斯金字塔了。

下面给出OpenCV中pryUp和pryDown的用法。

#include<opencv2\opencv.hpp>
#include<opencv2\highgui\highgui.hpp>

using namespace std;
using namespace cv;

//图像金字塔
int main()
{
Mat img = imread("lol8.jpg");
imshow("原始图", img);

Mat dst,dst2;
pyrUp(img, dst, Size(img.cols*2, img.rows*2)); //放大一倍
pyrDown(img, dst2, Size(img.cols * 0.5, img.rows * 0.5)); //缩小为原来的一半
imshow("尺寸放大之后", dst);
imshow("尺寸缩小之后", dst2);

waitKey(0);

}

显然，无论是放大还是缩小，图像都变得模糊了，这就是他的致命缺点。

个人认为，要做缩放就用resize函数吧，毕竟方便太多而且图像不会变模糊！

OpenCV探索之路（五）：图片缩放和图像金字塔

相关推荐