图像处理 -- 仿射变换之Affine Transformation
仿射变换(Affine Transformation)
仿射变换是图像处理中的一种基本操作,通过线性变换和平移实现图像的几何变换。仿射变换包括旋转、缩放、平移、翻转、错切(shear)等操作。
1. 仿射变换的作用
- 旋转:将图像绕一个固定点(通常是图像中心)旋转一定角度。
- 缩放:对图像进行放大或缩小,改变图像的尺寸。
- 平移:将图像在平面上移动到指定位置。
- 翻转:沿特定轴将图像反转,比如水平或垂直翻转。
- 错切:将图像的某一个方向拉伸,使图像产生倾斜效果。
仿射变换在计算机视觉和图像处理中的应用非常广泛,比如在图像配准、目标检测、图像增强等领域中都可以看到仿射变换的身影。
2. 数学实现原理
仿射变换通过一个矩阵乘法和一个向量加法来实现。假设二维空间中的一个点的坐标为 ( x , y ) (x, y) (x,y),经过仿射变换后,该点的新坐标为 ( x ′ , y ′ ) (x', y') (x′,y′)。则有如下数学表达式:
( x ′ y ′ ) = ( a b c d ) ( x y ) + ( e f ) \begin{pmatrix} x' \\ y' \\ \end{pmatrix} = \begin{pmatrix} a & b \\ c & d \\ \end{pmatrix} \begin{pmatrix} x \\ y \\ \end{pmatrix} + \begin{pmatrix} e \\ f \\ \end{pmatrix} (x′y′)=(acbd)(xy)+(ef)
这里, ( a b c d ) \begin{pmatrix} a & b \\ c & d \end{pmatrix} (acbd) 是 2x2 仿射变换矩阵, ( e f ) \begin{pmatrix} e \\ f \end{pmatrix} (ef) 是平移向量。
具体仿射变换:
-
平移:
x ′ = x + e , y ′ = y + f x' = x + e, \quad y' = y + f x′=x+e,y′=y+f
其中, e e e 和 f f f 是平移量。 -
旋转:
x ′ = x ⋅ cos ( θ ) − y ⋅ sin ( θ ) , y ′ = x ⋅ sin ( θ ) + y ⋅ cos ( θ ) x' = x \cdot \cos(\theta) - y \cdot \sin(\theta), \quad y' = x \cdot \sin(\theta) + y \cdot \cos(\theta) x′=x⋅cos(θ)−y⋅sin(θ),y′=x⋅sin(θ)+y⋅cos(θ)
其中, θ \theta θ 是旋转角度。 -
缩放:
x ′ = x ⋅ s x , y ′ = y ⋅ s y x' = x \cdot s_x, \quad y' = y \cdot s_y x′=x⋅sx,y′=y⋅sy
其中, s x s_x sx 和 s y s_y sy 是在 x 轴和 y 轴上的缩放比例。 -
错切:
x ′ = x + λ y ⋅ y , y ′ = y + λ x ⋅ x x' = x + \lambda_y \cdot y, \quad y' = y + \lambda_x \cdot x x′=x+λy⋅y,y′=y+λx⋅x
其中, λ x \lambda_x λx 和 λ y \lambda_y λy 是在 x 轴和 y 轴上的错切系数。
3. 注意事项
-
矩阵可逆性:为了保证仿射变换能被逆变换,仿射变换矩阵 ( a b c d ) \begin{pmatrix} a & b \\ c & d \end{pmatrix} (acbd) 必须是非奇异的,即其行列式不为 0。这确保了变换后的图像可以通过逆变换恢复原状。
-
边界处理:仿射变换可能导致图像的一部分移出图像边界,或者图像空白区域增加。因此,通常需要对图像进行裁剪或填充处理。
-
插值方法:在仿射变换过程中,目标图像中的像素可能对应源图像中非整数坐标的点,因此需要使用插值方法(如最近邻插值、双线性插值或双三次插值)来计算这些点的像素值。
-
保持图像质量:频繁进行仿射变换可能导致图像质量下降,比如模糊、锯齿效应等。因此,在设计变换时需要考虑如何最小化质量损失。
-
变换顺序:如果需要执行多个变换,变换的顺序会影响最终结果。例如,旋转后再平移和先平移后旋转的结果是不一样的。因此,需要谨慎设计变换的顺序以达到预期效果。
C代码示例
#include <stdio.h>
#include <stdlib.h>
#include <math.h>#define IMAGE_WIDTH 1088
#define IMAGE_HEIGHT 1288
#define DEGREE_TO_RADIAN(deg) ((deg) * M_PI / 180.0)// 图像数据结构
typedef struct {int width;int height;unsigned char *data; // 指向图像像素数据的指针
} Image;// 从RAW8文件读取图像数据
Image *read_raw8_image(const char *filename, int width, int height) {FILE *file = fopen(filename, "rb");if (!file) {printf("无法打开文件 %s\n", filename);return NULL;}// 在堆上为图像数据分配内存unsigned char *data = (unsigned char *)malloc(width * height * sizeof(unsigned char));if (!data) {printf("内存分配失败\n");fclose(file);return NULL;}// 读取图像数据fread(data, sizeof(unsigned char), width * height, file);fclose(file);// 创建Image结构并返回Image *image = (Image *)malloc(sizeof(Image));image->width = width;image->height = height;image->data = data;return image;
}// 将图像数据写入RAW8文件
void write_raw8_image(const char *filename, Image *image) {FILE *file = fopen(filename, "wb");if (!file) {printf("无法打开文件 %s\n", filename);return;}// 写入图像数据fwrite(image->data, sizeof(unsigned char), image->width * image->height, file);fclose(file);
}
// 释放图像内存
void free_image(Image *image) {if (image) {if (image->data) {free(image->data);}free(image);}
}// 仿射变换函数:旋转图像
Image *affine_transform(Image *image, float angle) {int width = image->width;int height = image->height;// 角度转弧度float radians = DEGREE_TO_RADIAN(angle);float cos_theta = cos(radians);float sin_theta = sin(radians);// 中心点int center_x = width / 2;int center_y = height / 2;// 在堆上为旋转后的图像数据分配内存Image *rotated_image = (Image *)malloc(sizeof(Image));rotated_image->width = width;rotated_image->height = height;rotated_image->data = (unsigned char *)malloc(width * height * sizeof(unsigned char));// 初始化旋转后图像为0(黑色)for (int i = 0; i < width * height; i++) {rotated_image->data[i] = 0;}// 遍历原始图像的每一个像素for (int y = 0; y < height; y++) {for (int x = 0; x < width; x++) {// 计算相对于中心点的偏移int x_offset = x - center_x;int y_offset = y - center_y;// 进行仿射变换(旋转)int new_x = (int)(cos_theta * x_offset + sin_theta * y_offset) + center_x;int new_y = (int)(-sin_theta * x_offset + cos_theta * y_offset) + center_y;// 检查新坐标是否在图像范围内if (new_x >= 0 && new_x < width && new_y >= 0 && new_y < height) {rotated_image->data[new_y * width + new_x] = image->data[y * width + x];}}}return rotated_image;
}
int main() {// 读取RAW8图像Image *image = read_raw8_image("input.raw", IMAGE_WIDTH, IMAGE_HEIGHT);if (!image) {return 1;}// 对图像进行15度旋转Image *rotated_image = affine_transform(image, 15.0);// 保存旋转后的图像write_raw8_image("rotated_output.raw", rotated_image);// 释放内存free_image(image);free_image(rotated_image);return 0;
}
高性能处理之OpenCL实现
#include <stdio.h>
#include <stdlib.h>
#include <CL/cl.h>
#include <math.h>
#include <time.h>
#include <stdint.h>#define CHECK_ERROR(err) if (err != CL_SUCCESS) { printf("OpenCL Error at line %d: %d\n", __LINE__, err); exit(EXIT_FAILURE); }// OpenCL kernel source for affine transformation (rotation)
const char *kernel_source =
"__kernel void affine_rotate(__global const uchar *input, __global uchar *output, int width, int height, float cos_theta, float sin_theta, int new_width, int new_height) { \n"
" int x = get_global_id(0); \n"
" int y = get_global_id(1); \n"
" float cx = width / 2.0f; \n"
" float cy = height / 2.0f; \n"
" float new_x = cos_theta * (x - new_width / 2.0f) + sin_theta * (y - new_height / 2.0f) + cx; \n"
" float new_y = -sin_theta * (x - new_width / 2.0f) + cos_theta * (y - new_height / 2.0f) + cy; \n"
" int src_x = (int)(new_x + 0.5f); \n"
" int src_y = (int)(new_y + 0.5f); \n"
" if (src_x >= 0 && src_x < width && src_y >= 0 && src_y < height) { \n"
" output[y * new_width + x] = input[src_y * width + src_x]; \n"
" } else { \n"
" output[y * new_width + x] = 0; \n"
" } \n"
"} \n";static uint64_t get_monotonic_time_ns(void) {struct timespec ts;clock_gettime(CLOCK_MONOTONIC, &ts);return (uint64_t)ts.tv_sec * 1000000000 + ts.tv_nsec;
}void read_raw_image(const char *filename, unsigned char *buffer, size_t size) {FILE *file = fopen(filename, "rb");if (!file) {perror("Failed to open input file");exit(EXIT_FAILURE);}fread(buffer, 1, size, file);fclose(file);
}void write_raw_image(const char *filename, const unsigned char *buffer, size_t size) {FILE *file = fopen(filename, "wb");if (!file) {perror("Failed to open output file");exit(EXIT_FAILURE);}fwrite(buffer, 1, size, file);fclose(file);
}int main(int argc, char **argv) {uint64_t ts = 0;if (argc != 4) {printf("Usage: %s <input.raw> <output.raw> <rotation_angle_in_degrees>\n", argv[0]);return EXIT_FAILURE;}const char *input_filename = argv[1];const char *output_filename = argv[2];float angle_degrees = atof(argv[3]);float angle_radians = angle_degrees * M_PI / 180.0f;// 输入图像的宽度和高度const int width = 1088;const int height = 1288;const int new_width = 1088; // 简单处理,这里不改变图片的尺寸const int new_height = 1288;// 分配输入和输出图像缓冲区size_t image_size = width * height;unsigned char *input_image = (unsigned char*)malloc(image_size);unsigned char *output_image = (unsigned char*)malloc(image_size);if (!input_image || !output_image) {printf("Failed to allocate memory for images.\n");return EXIT_FAILURE;}// 读取RAW8图像read_raw_image(input_filename, input_image, image_size);cl_platform_id platform;cl_device_id device;cl_context context;cl_command_queue queue;cl_program program;cl_kernel kernel;cl_mem buffer_input, buffer_output;cl_int err;// 初始化OpenCLerr = clGetPlatformIDs(1, &platform, NULL);CHECK_ERROR(err);err = clGetDeviceIDs(platform, CL_DEVICE_TYPE_GPU, 1, &device, NULL);CHECK_ERROR(err);context = clCreateContext(NULL, 1, &device, NULL, NULL, &err);CHECK_ERROR(err);queue = clCreateCommandQueue(context, device, CL_QUEUE_PROFILING_ENABLE, &err);CHECK_ERROR(err);// 创建内存缓冲区buffer_input = clCreateBuffer(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, image_size, input_image, &err);CHECK_ERROR(err);buffer_output = clCreateBuffer(context, CL_MEM_WRITE_ONLY, image_size, NULL, &err);CHECK_ERROR(err);// 编译内核program = clCreateProgramWithSource(context, 1, &kernel_source, NULL, &err);CHECK_ERROR(err);err = clBuildProgram(program, 1, &device, NULL, NULL, NULL);if (err != CL_SUCCESS) {size_t log_size;clGetProgramBuildInfo(program, device, CL_PROGRAM_BUILD_LOG, 0, NULL, &log_size);char *log = (char *)malloc(log_size);clGetProgramBuildInfo(program, device, CL_PROGRAM_BUILD_LOG, log_size, log, NULL);printf("Build log:\n%s\n", log);free(log);CHECK_ERROR(err);}// 创建内核kernel = clCreateKernel(program, "affine_rotate", &err);CHECK_ERROR(err);// 设置内核参数float cos_theta = cos(angle_radians);float sin_theta = sin(angle_radians);err = clSetKernelArg(kernel, 0, sizeof(cl_mem), &buffer_input);CHECK_ERROR(err);err = clSetKernelArg(kernel, 1, sizeof(cl_mem), &buffer_output);CHECK_ERROR(err);err = clSetKernelArg(kernel, 2, sizeof(int), &width);CHECK_ERROR(err);err = clSetKernelArg(kernel, 3, sizeof(int), &height);CHECK_ERROR(err);err = clSetKernelArg(kernel, 4, sizeof(float), &cos_theta);CHECK_ERROR(err);err = clSetKernelArg(kernel, 5, sizeof(float), &sin_theta);CHECK_ERROR(err);err = clSetKernelArg(kernel, 6, sizeof(int), &new_width);CHECK_ERROR(err);err = clSetKernelArg(kernel, 7, sizeof(int), &new_height);CHECK_ERROR(err);// 设置执行维度size_t global_size[2] = {new_width, new_height};ts = get_monotonic_time_ns();// 记录执行时间cl_event event;err = clEnqueueNDRangeKernel(queue, kernel, 2, NULL, global_size, NULL, 0, NULL, &event);CHECK_ERROR(err);// 等待完成err = clFinish(queue);CHECK_ERROR(err);// 获取执行时间cl_ulong time_start, time_end;err = clGetEventProfilingInfo(event, CL_PROFILING_COMMAND_START, sizeof(time_start), &time_start, NULL);CHECK_ERROR(err);err = clGetEventProfilingInfo(event, CL_PROFILING_COMMAND_END, sizeof(time_end), &time_end, NULL);CHECK_ERROR(err);double time_ns = (double)(time_end - time_start);printf("Rotation took %.3f ns\n", time_ns);// 读取处理后的图像err = clEnqueueReadBuffer(queue, buffer_output, CL_TRUE, 0, image_size, output_image, 0, NULL, NULL);CHECK_ERROR(err);printf("cost_ns:%llu\n", get_monotonic_time_ns() - ts);// 写入处理后的图像write_raw_image(output_filename, output_image, image_size);// 释放资源clReleaseMemObject(buffer_input);clReleaseMemObject(buffer_output);clReleaseProgram(program);clReleaseKernel(kernel);clReleaseCommandQueue(queue);clReleaseContext(context);clReleaseEvent(event);free(input_image);free(output_image);return 0;
}
在nxp 8plus的平台上处理1088x1288的raw8数据旋转15度大概耗时30ms;
