图像基本处理算法的简单实现（一）

2021-08-25 23:13:24

图像基本处理算法的简单实现（一）

一、引言

图像处理基本算法整理。

拿来举例的实现代码是在JNI方法内直接实现的，且传入参数为int[]颜色值，返回为新的int[]颜色值，可能头上还包括了长宽。（很丑，见谅T^T）

2.2的NDK提供了Bitmap.h，这种方式可参考《Android NDK基础样例》的样例3，灰度化图像（Bitmap作为参数）。

二、目录

1）缩放算法

据说有最邻近插值、双线性内插值、高阶插值、三次卷积法等等。（我已经晕了~）

缩放是从原图像->目标图像的过程。目标图像的新颜色值，由图像长宽比反向计算在原图像的位置，从而获得。反向计算得到的坐标一般为浮点坐标，表示为(i+u,j+v)（i,j整数整数、u,v小数部分）。

1）最邻近插值：取(i,j)的颜色值即可，效果不咋的==

2）双线性内插值：由(i,j)、(i+1,j)、(i,j+1)、(i+1,j+1)四点距(i+u,j+v)远近计算比例求得（四领域乘以相应的权重）。效果不错了哈==

公式：f(i+u,j+v)=(1-u)(1-v)*f(i,j)+(1-u)v*f(i,j+1)+u(1-v)*f(i+1,j)+uv*f(i+1,j+1)

复制：双线性内插值具有低通滤波器性质，使高频风量受损，可能会使图像轮廓在一定程度上变得模糊。尤其放大处理，影响将更为明显。

3）高阶插值、三次卷积法等：说是双线性使细节柔化、会有锯齿什么的。这些算法就是能够更好的修正这些不足，但计算量更大==。（高阶插值没搜索到具体算法啊，是指一类概念么？双三次插值属于高阶插值这类的意思？）

双线性内插值的实现：

int min(int x, int y) {
return (x <= y) ? x : y;
}
int alpha(int color) {
return (color >> 24) & 0xFF;
}
int red(int color) {
return (color >> 16) & 0xFF;
}
int green(int color) {
return (color >> 8) & 0xFF;
}
int blue(int color) {
return color & 0xFF;
}
int ARGB(int alpha, int red, int green, int blue) {
return (alpha << 24) | (red << 16) | (green << 8) | blue;
}
/**
* 按双线性内插值算法将对应源图像四点颜色某一颜色值混合
*
* int(*fun)(int)指向从color中获取某一颜色值的方法
*/
int mixARGB(int *color, int i, int j, float u, float v, int(*fun)(int)) {
// f(i+u,j+v)=(1-u)(1-v)*f(i,j)+(1-u)v*f(i,j+1)+u(1-v)*f(i+1,j)+uv*f(i+1,j+1)
return (1 - u) * (1 - v) * (*fun)(color[0]) + (1 - u) * v * (*fun)(color[1])
+ u * (1 - v) * (*fun)(color[2]) + u * v * (*fun)(color[3]);
}
/**
* 按双线性内插值算法将对应源图像四点颜色值混合
*
* color[]需要有四个颜色值，避免越界
*/
int mixColor(int *color, int i, int j, float u, float v) {
int a = mixARGB(color, i, j, u, v, alpha); // 获取alpha混合值
int r = mixARGB(color, i, j, u, v, red); // 获取red混合值
int g = mixARGB(color, i, j, u, v, green); // 获取green混合值
int b = mixARGB(color, i, j, u, v, blue); // 获取blue混合值
return ARGB(a, r, g, b);
}
/**
* 将Bitmap缩放后返回（双线性内插值算法）
*
* JNIEnv* jni环境（jni必要参数）
* jobject java对象（jni必要参数）
* jintArray Bitmap所有像素值
* int Bitmap宽度
* int Bitmap高度
* int Bitmap新宽度
* int Bitmap新高度
*/
JNIEXPORT jintArray JNICALL Java_org_join_image_util_JoinImage_stretch(
JNIEnv* env, jobject obj, jintArray buf, int srcW, int srcH, int dstW,
int dstH) {
LOGE("==stretch==");
jint * cbuf;
cbuf = (*env)->GetIntArrayElements(env, buf, 0); // 获取int数组元素
int newSize = dstW * dstH;
jint rbuf[newSize]; // 新图像像素值
float rateH = (float) srcH / dstH; // 高度缩放比例
float rateW = (float) srcW / dstW; // 宽度缩放比例
int dstX, dstY; // 目标图像XY坐标
float srcX, srcY; // 目标图像对应源图像XY坐标
int i, j; // 对应源图像XY坐标整数部分
int i1, j1; // 对应源图像XY坐标整数部分+1
float u, v; // 对应源图像XY坐标小数部分
int color[4]; // f(i+u,j+v)对应源图像(i,j)、(i+1,j)、(i,j+1)、(i+1,j+1)的像素值
for (dstY = 0; dstY <= dstH - 1; dstY++) {
srcY = dstY * rateH; // 对应源图像Y坐标
j = (int) srcY; // 对应源图像Y坐标整数部分
j1 = min(j + 1, srcH - 1); // 对应源图像Y坐标整数部分+1
v = srcY - j; // 对应源图像Y坐标小数部分
for (dstX = 0; dstX <= dstW - 1; dstX++) {
srcX = dstX * rateW; // 对应源图像X坐标
i = (int) srcX; // 对应源图像X坐标整数部分
i1 = min(i + 1, srcW - 1); // 对应源图像X坐标整数部分+1
u = srcX - i; // 对应源图像X坐标小数部分
// 双线性内插值算法（注意ARGB时，需要分别由插值算法求得后重组）:
// f(i+u,j+v)=(1-u)(1-v)*f(i,j)+(1-u)v*f(i,j+1)+u(1-v)*f(i+1,j)+uv*f(i+1,j+1)
color[0] = cbuf[j * srcW + i]; // f(i,j)颜色值
color[1] = cbuf[j1 * srcW + i]; // f(i,j+1)颜色值
color[2] = cbuf[j * srcW + i1]; // f(i+1,j)颜色值
color[3] = cbuf[j1 * srcW + i1]; // f(i+1,j+1)颜色值
// 给目标图像赋值为双线性内插值求得的混合色
rbuf[dstY * dstW + dstX] = mixColor(color, i, j, u, v);
}
}
jintArray result = (*env)->NewIntArray(env, newSize); // 新建一个jintArray
(*env)->SetIntArrayRegion(env, result, 0, newSize, rbuf); // 将rbuf转存入result
(*env)->ReleaseIntArrayElements(env, buf, cbuf, 0); // 释放int数组元素
return result;
}

2）灰度化

把图像变灰，有好些方法，求RGB平均值啊，RGB最大值啊什么的。不过还是建议按规范的标准来。

彩色转灰度的著名心理学公式：Gray = R*0.299 + G*0.587 + B*0.114（话说我心理学与生活一本书都看完了也没提到这公式啊==）

实际应用中为了避免浮点运算，然后就有了移位运算代替了。

2至20位精度的系数：

Gray = (R*1 + G*2 + B*1) >> 2
Gray = (R*2 + G*5 + B*1) >> 3
Gray = (R*4 + G*10 + B*2) >> 4
Gray = (R*9 + G*19 + B*4) >> 5
Gray = (R*19 + G*37 + B*8) >> 6
Gray = (R*38 + G*75 + B*15) >> 7
Gray = (R*76 + G*150 + B*30) >> 8
Gray = (R*153 + G*300 + B*59) >> 9
Gray = (R*306 + G*601 + B*117) >> 10
Gray = (R*612 + G*1202 + B*234) >> 11
Gray = (R*1224 + G*2405 + B*467) >> 12
Gray = (R*2449 + G*4809 + B*934) >> 13
Gray = (R*4898 + G*9618 + B*1868) >> 14
Gray = (R*9797 + G*19235 + B*3736) >> 15
Gray = (R*19595 + G*38469 + B*7472) >> 16
Gray = (R*39190 + G*76939 + B*14943) >> 17
Gray = (R*78381 + G*153878 + B*29885) >> 18
Gray = (R*156762 + G*307757 + B*59769) >> 19
Gray = (R*313524 + G*615514 + B*119538) >> 20

3与4、7与8、10与11、13与14、19与20的精度说是一样的==。16位运算下最好的计算公式是使用7位精度。而游戏由于场景经常变化，用户感觉不到，最常用2位精度。

灰度化实现：

JNIEXPORT jintArray JNICALL Java_org_join_image_util_JoinImage_imgToGray(
JNIEnv* env, jobject obj, jintArray buf, int w, int h) {
LOGE("==imgToGray==");
jint * cbuf;
cbuf = (*env)->GetIntArrayElements(env, buf, 0); // 获取int数组元素
int alpha = 0xFF; // 不透明值
int i, j, color, red, green, blue;
for (i = 0; i < h; i++) {
for (j = 0; j < w; j++) {
color = cbuf[w * i + j]; // 获得color值
red = (color >> 16) & 0xFF; // 获得red值
green = (color >> 8) & 0xFF; // 获得green值
blue = color & 0xFF; // 获得blue值
color = (red * 38 + green * 75 + blue * 15) >> 7; // 灰度算法（16位运算下7位精度）
color = (alpha << 24) | (color << 16) | (color << 8) | color; // 由ARGB组成新的color值
cbuf[w * i + j] = color; // 设置新color值
}
}
int size = w * h;
jintArray result = (*env)->NewIntArray(env, size); // 新建一个jintArray
(*env)->SetIntArrayRegion(env, result, 0, size, cbuf); // 将cbuf转存入result
(*env)->ReleaseIntArrayElements(env, buf, cbuf, 0); // 释放int数组元素
return result;
}

3）二值化

灰度值[0,255]和一阈值比较，变成0或255，要么纯黑要么纯白==。但是阈值的获取就牵扯算法了。只知道有Otsu、Bernsen…，具体算法查下就好^^

Otsu：最大类间方差法，整体算出一个阈值。计算次数少但抗干扰性差，适合光照均匀的图像。

Bernsen：局部阈值法，在一点周围一定范围内（相当于一窗口）计算出一阈值。计算次数多但抗干扰性强，用于非均匀光照的图像。

二值化（Otsu）的实现：

/**
* 将灰度化Bitmap各像素值二值化后返回
*
* JNIEnv* jni环境（jni必要参数）
* jobject java对象（jni必要参数）
* jintArray Bitmap所有像素值
* int Bitmap宽度
* int Bitmap高度
*/
JNIEXPORT jintArray JNICALL Java_org_join_image_util_JoinImage_binarization(
JNIEnv* env, jobject obj, jintArray buf, int w, int h) {
LOGE("==binarization==");
jint * cbuf;
cbuf = (*env)->GetIntArrayElements(env, buf, 0); // 获取int数组元素
int white = 0xFFFFFFFF; // 不透明白色
int black = 0xFF000000; // 不透明黑色
int thresh = otsu(cbuf, w, h); // OTSU获取分割阀值
LOGE("==[阀值=%d]==", thresh);
int i, j, gray;
for (i = 0; i < h; i++) {
for (j = 0; j < w; j++) {
gray = (cbuf[w * i + j]) & 0xFF; // 获得灰度值（red=green=blue）
if (gray < thresh) {
cbuf[w * i + j] = white; // 小于阀值设置为白色（前景）
} else {
cbuf[w * i + j] = black; // 否则设置为黑色（背景）
}
}
}
int size = w * h;
jintArray result = (*env)->NewIntArray(env, size); // 新建一个jintArray
(*env)->SetIntArrayRegion(env, result, 0, size, cbuf); // 将cbuf转存入result
(*env)->ReleaseIntArrayElements(env, buf, cbuf, 0); // 释放int数组元素
return result;
}
/**
* OTSU算法求最适分割阈值
*/
int otsu(jint* colors, int w, int h) {
unsigned int pixelNum[256]; // 图象灰度直方图[0, 255]
int color; // 灰度值
int n, n0, n1; // 图像总点数，前景点数，后景点数（n0 + n1 = n）
int w0, w1; // 前景所占比例，后景所占比例（w0 = n0 / n, w0 + w1 = 1）
double u, u0, u1; // 总平均灰度，前景平均灰度，后景平均灰度（u = w0 * u0 + w1 * u1）
double g, gMax; // 图像类间方差，最大类间方差（g = w0*(u0-u)^2+w1*(u1-u)^2 = w0*w1*(u0-u1)^2）
double sum_u, sum_u0, sum_u1; // 图像灰度总和，前景灰度总和，后景平均总和（sum_u = n * u）
int thresh; // 阈值
memset(pixelNum, 0, 256 * sizeof(unsigned int)); // 数组置0
// 统计各灰度数目
int i, j;
for (i = 0; i < h; i++) {
for (j = 0; j < w; j++) {
color = (colors[w * i + j]) & 0xFF; // 获得灰度值
pixelNum[color]++; // 相应灰度数目加1
}
}
// 图像总点数
n = w * h;
// 计算总灰度
int k;
for (k = 0; k <= 255; k++) {
sum_u += k * pixelNum[k];
}
// 遍历判断最大类间方差，得到最佳阈值
for (k = 0; k <= 255; k++) {
n0 += pixelNum[k]; // 图像前景点数
if (0 == n0) { // 未获取前景，直接继续增加前景点数
continue;
}
if (n == n0) { // 前景点数包括了全部时，不可能再增加，退出循环
break;
}
n1 = n - n0; // 图像后景点数
sum_u0 += k * pixelNum[k]; // 前景灰度总和
u0 = sum_u0 / n0; // 前景平均灰度
u1 = (sum_u - sum_u0) / n1; // 后景平均灰度
g = n0 * n1 * (u0 - u1) * (u0 - u1); // 类间方差（少除了n^2）
if (g > gMax) { // 大于最大类间方差时
gMax = g; // 设置最大类间方差
thresh = k; // 取最大类间方差时对应的灰度的k就是最佳阈值
}
}
return thresh;
}

图像基本处理算法的简单实现（二）

图像基本处理算法的简单实现（三）

本文转自winorlose2000 51CTO博客，原文链接：http://blog.51cto.com/vaero/822997如需转载请自行联系原作者

码农公寓

相关文章