Search…

Giới Thiệu Ứng Dụng Của Làm Mờ Ảnh (Lọc Nhiễu) trong Bài Toán Nhận Dạng

10/11/20204 min read
Việc chọn phương pháp lọc nhiễu phù hợp sẽ giữ được các đặc trưng quan trọng, đại diện cho đối tượng trong ảnh, khi đưa sang bộ lọc để trích xuất đặc trưng trong ảnh. Và vì vậy, việc đưa các đặc trưng ở trên vào input của một mô hình học sẽ cho ra mô hình dự đoán chính xác hơn. Bài toán cho ra kết quả dự đoán chính xác hơn.

Làm mờ ảnh là kỹ thuật xử lý ảnh để nâng cao chất lượng ảnh. Tuỳ vào loại nhiễu mà ta có phương pháp xử lý nhiễu khác nhau để bài toán đạt kết quả chính xác cao. Trong bài viết này, tôi trình bày một số loại nhiễu thường gặp và các phương pháp xử lý nhiễu thông dụng, đồng thời, giới thiệu tổng quát về bài toán nhận dạng.

Bài viết liên quan:

Bài toán nhận dạng

Các bài toán tôi đề cập dưới đây được biết đến nhiều trong lĩnh vực thị giác máy tính:

  • Nhận dạng đối tượng trong ảnh.
  • Nhận dạng mặt người.
  • Nhận dạng hành động trong video.
  • Nhận dạng ngôn ngữ ký hiệu, chữ số viết tay, chữ ngoại cảnh.
  • Phát hiện sự kiện trong ảnh.

Thông thường, phương pháp phổ biến để giải quyết các bài toán nhận dạng đó là:

  1. Tiền xử lý tập ảnh huấn luyện.
  2. Rút trích đặc trưng từ tập dữ liệu.
  3. Đưa vào mô hình huấn luyện (svm, neural network, ...) để tìm ra quy luật phân lớp của tập dữ liệu và cho ra mô hình nhận dạng.
  4. Đưa dữ liệu kiểm tra vào mô hình nhận dạng sau khi đã tiền xử lý.

Xoá nhiễu là một cách để tiền xử lý ảnh. Tuy nhiên, việc tiền xử lý ảnh còn có nhiều phương pháp khác nhau để phù hợp với mục tiêu và tính chất của mỗi bài toán.

Việc chọn phương pháp lọc nhiễu phù hợp sẽ giữ được các đặc trưng quan trọng, đại diện cho đối tượng trong ảnh, khi đưa sang bộ lọc để trích xuất đặc trưng trong ảnh. Và vì vậy, việc đưa các đặc trưng ở trên vào input của một mô hình học sẽ cho ra mô hình dự đoán chính xác hơn. Bài toán cho ra kết quả dự đoán chính xác hơn.

Nguyên nhân nhiễu ảnh

Nhiễu được định nghĩa trong xử lý ảnh là những điểm ảnh có giá trị độ xám trội hơn so với cục bộ, tức là chênh lệch lớn so với các điểm ảnh lân cận.

Trong quá trình capture ảnh, chất lượng ảnh thu được sẽ không tốt do ảnh hưởng của thời tiết (ánh sáng, mưa, gió), hoặc do bị che khuất. Hoặc một số nhiễu cũng do thiết bị thu hình ảnh kém chất lượng.

Một số trường hợp chuyển động của đối tượng quá nhanh so với tốc độ capture của thiết bị, làm ảnh thu được bị nhoè.

Nhiễu sẽ làm ảnh hưởng đến kết quả bài toán mà ta đang giải quyết theo chiều hướng tiêu cực.

Một số phương pháp xử lý nhiễu phổ biến

Có hai hướng xử lý nhiễu: trong miền không gian và trong miền tần số miền tần số.

Ở đây, tôi chỉ giới thiệu một số phương pháp làm mờ ảnh (xoá nhiễu) trong miền không gian với ảnh xám:

Gọi M, N là số điểm ảnh theo chiều dọc và chiều ngang của ảnh. Ảnh được biểu diễn bởi hàm ảnh f(x, y) (x: 0...M-1, y: 0...N-1), giá trị hàm ảnh tương ứng với độ sáng tại các điểm ảnh.

1. Toán tử trung bình

Hay còn gọi là lọc trung bình, bằng cách thay thế giá trị độ xám tại điểm ảnh đang xét bằng trung bình cộng giá trị độ xám của các điểm ảnh lân cận (bạn có thể xác định kích thước của vùng lân cận tuỳ ý sao cho kết quả làm trơn là tốt nhất). Tuy nhiên, nhược điểm của toán tử này sẽ làm biên cạnh của đối tượng bị mờ (do biên cạnh là những pixel có sự chênh lệch độ xám lớn so với cục bộ).  Ảnh kết quả được định nghĩa với bộ lọc kích thước m x n.

2. Toán tử trung vị

Lọc trung vị, thay thế giá trị độ xám tại điểm ảnh đang xét bằng giá trị độ xám của điểm ảnh nằm ở trung vị của dãy điểm ảnh sau khi sắp xếp theo giá trị độ xám tăng dần (xem minh hoạ). Toán tử này có tác dụng đối với những điểm ảnh có giá trị độ xám lớn hơn hoặc nhỏ hơn hẳn các pixel lân cận.

Bộ lọc trung vị được định nghĩa:

Minh hoạ thực hiện toán tử trung vị

3. Toán tử Gaussian

Giá trị độ xám tại điểm ảnh đang xét, được thay bằng trung bình lượng giá của các pixel lân cận tích chập với bộ lọc đại diện cho hàm gauss (kích thước bộ lọc m x n).

Bộ lọc của toán tử Gaussian:

Giá trị σ là độ lệch chuẩn của hàm gauss, giá trị càng lớn thì mức độ ảnh hưởng của các pixel lân cận càng lớn. Giá trị độ xám của điểm ảnh đang xét sẽ có tính tương đồng cao so với các điểm ảnh lân cận.

Kết quả làm trơn ảnh vân tay (sử dụng MATLAB): Kích thước cả ba bộc lọc: 5x5.

 Từ trái sang phải: Ảnh gốc; Lọc trung bình; Lọc trung vị; Lọc Gaussian (σ = 2)
IO Stream

IO Stream Co., Ltd

30 Trinh Dinh Thao, Hoa Thanh ward, Tan Phu district, Ho Chi Minh city, Vietnam
+84 28 22 00 11 12
developer@iostream.co

383/1 Quang Trung, ward 10, Go Vap district, Ho Chi Minh city
Business license number: 0311563559 issued by the Department of Planning and Investment of Ho Chi Minh City on February 23, 2012

©IO Stream, 2013 - 2024