Ngày nay, công nghệ thông tin là một phần tất yếu trong cuộc sống con người. Cùng với sự phát triển của xã hội và thời đại, công nghệ thông tin đã có ứng dụng và ảnh hưởng sâu sắc đến nhiều lĩnh vực đời sống. Nó phục vụ con người từ việc giải trí, kinh doanh, liên lạc cho đến những vấn đề phức tạp trong khoa học kỹ thuật. Càng ngày, thế giới càng cần ít thời gian cho sự gia tăng tốc độ phát triển khoa học kỹ thuật. Như vậy, với khả năng thu thập xử lý thông tin gần như vô hạn của máy tính điện tử hiện nay, có một câu hỏi đặt ra là: Con người phải làm gì với một khối tri thức khổng lồ và ngày càng tăng nhanh tới mức không thể tưởng tượng nổi với hình thức cung cấp vô cùng dễ dàng? Liệu con người có thể thích nghi được với thế giới thông tin bao quanh, và nếu được thì nhờ những công cụ và phương tiện nào?
Để trả lời cho câu hỏi này, không gì khác chúng ta thấy rõ ràng cần phải có một cuộc cách mạng trong giáo dục và đào tạo. Phát triển đồng bộ các cơ quan và tổ chức trường học cùng với các chương trình và trước hết là phương pháp đào tạo. Bởi vì chức năng của nhà trường bao giờ cũng là chuẩn bị con người cho việc đáp ứng những thay đổi của văn minh nhân loại.
Trong bối cảnh phát triển như hiện nay, nếu muốn nền giáo dục đáp ứng được đòi hỏi cấp thiết của công cuộc công nghiệp hóa, hiện đại hóa đất nước, nếu muốn việc dạy học theo kịp cuộc sống, chúng ta nhất thiết phải cải cách phương pháp dạy học theo hướng vận dụng CNTT và các thiết bị dạy học hiện đại phát huy mạnh mẽ tư duy sáng tạo, kỹ năng thực hành và hứng thú học tập của học sinh để nâng cao chất lượng đào tạo.
76 trang |
Chia sẻ: luyenbuizn | Lượt xem: 1021 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Xây dựng chương trình hỗ trợ giảng dạy môn xử lý ảnh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
MỤC LỤC
MỞ ĐẦU
Ngày nay, công nghệ thông tin là một phần tất yếu trong cuộc sống con người. Cùng với sự phát triển của xã hội và thời đại, công nghệ thông tin đã có ứng dụng và ảnh hưởng sâu sắc đến nhiều lĩnh vực đời sống. Nó phục vụ con người từ việc giải trí, kinh doanh, liên lạc cho đến những vấn đề phức tạp trong khoa học kỹ thuật. Càng ngày, thế giới càng cần ít thời gian cho sự gia tăng tốc độ phát triển khoa học kỹ thuật. Như vậy, với khả năng thu thập xử lý thông tin gần như vô hạn của máy tính điện tử hiện nay, có một câu hỏi đặt ra là: Con người phải làm gì với một khối tri thức khổng lồ và ngày càng tăng nhanh tới mức không thể tưởng tượng nổi với hình thức cung cấp vô cùng dễ dàng? Liệu con người có thể thích nghi được với thế giới thông tin bao quanh, và nếu được thì nhờ những công cụ và phương tiện nào?
Để trả lời cho câu hỏi này, không gì khác chúng ta thấy rõ ràng cần phải có một cuộc cách mạng trong giáo dục và đào tạo. Phát triển đồng bộ các cơ quan và tổ chức trường học cùng với các chương trình và trước hết là phương pháp đào tạo. Bởi vì chức năng của nhà trường bao giờ cũng là chuẩn bị con người cho việc đáp ứng những thay đổi của văn minh nhân loại.
Trong bối cảnh phát triển như hiện nay, nếu muốn nền giáo dục đáp ứng được đòi hỏi cấp thiết của công cuộc công nghiệp hóa, hiện đại hóa đất nước, nếu muốn việc dạy học theo kịp cuộc sống, chúng ta nhất thiết phải cải cách phương pháp dạy học theo hướng vận dụng CNTT và các thiết bị dạy học hiện đại phát huy mạnh mẽ tư duy sáng tạo, kỹ năng thực hành và hứng thú học tập của học sinh để nâng cao chất lượng đào tạo.
Qua quá trình học tập tại Đại học Hàng Hải, em đã được các thầy giáo trong Khoa công nghệ thông tin tận tình chỉ bảo, cung cấp rất nhiều thông tin, những ý tưởng quan trọng trong việc làm đồ án tốt nghiệp. Được sự định hướng, tạo điều kiện của Khoa công nghệ thông tin và sự hướng dẫn trực tiếp của thầy giáo KS. Nguyễn Văn Giang - Khoa Công nghệ thông tin – Học Viện Kỹ Thuật Quân Sự, em đã lựa chọn đề tài “Xây dựng chương trình hỗ trợ giảng dạy môn học xử lý ảnh” làm đồ án tốt nghiệp cho mình.
Xuất phát từ ý tưởng dạy học bằng hình ảnh, em muốn xây dựng phần mềm mô phỏng tất cả các hiện tượng, sự vật có trong chương trình của các môn học nhằm hỗ trợ các giáo viên khi giảng dạy trên máy vi tính, có được các hình ảnh minh hoạ phục vụ việc giảng dạy một cách thực tế hơn, sinh động hơn. Một phương pháp giảng dạy mới “trực quan sinh động” và một phương pháp học mới “mắt thấy tai nghe”: đó là điều mà phần mềm này sẽ mang lại cho ngành giáo dục. Với phương pháp dạy và học này hứa hẹn sẽ nâng cao chất lượng nền giáo dục nước nhà.
Tuy nhiên do khả năng và điều kiện thời gian còn nhiều hạn chế nên đồ án của em không tránh khỏi nhiều sai sót, em rất mong được sự chỉ bảo, đóng góp của các thầy giáo và tất cả mọi người quan tâm đến vấn đề này. Em xin cảm ơn các giáo viên trong Khoa công nghệ thông tin và đặc biệt là thầy giáo Nguyễn Văn Giang đã chỉ bảo hướng dẫn tận tình, giúp em hoàn thành đồ án này.
Nội dung của báo cáo đồ án bao gồm có các chương sau:
Chương I: Cơ sở lý thuyết.
Chương II: Khảo sát hệ thống thực.
Chương III: Phân tích hệ thống.
Chương IV: Thiết kế và xây dựng chương trình.
CƠ SỞ LÍ THUYẾT
GIỚI THIỆU VỀ XỬ LÝ ẢNH
Tổng quan về một hệ thống xử lý ảnh
Xử lý ảnh là một khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác, nhất là trên qui mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuất hiện những máy tính chuyên dụng. Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta sẽ xem xét các bước cần thiết trong xử lý ảnh.
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera. Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hoá (loại CCD - Charge Coupled Device).
Hình 1.1. Các giai đoạn chính trong xử lý ảnh
Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh, tranh được quét trên scanner. Tiếp theo là quá trình số hoá (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hoá bằng lượng hoá, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết là công việc tăng cường ảnh để nâng cao chất lượng ảnh. Do những nguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc - trạng thái trước khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, trích chọn các đặc tính, v.v...
Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác. Các giai đoạn chính của quá trình xử lý ảnh có thể mô tả ở hình 1.1
Với các giai đoạn trên, một hệ thống xử lý ảnh (cấu trúc phần cứng theo chức năng) gồm các thành phần tối thiểu như hình 1.2
Hình 1.2. Các thành phần chính của hệ thống xử lý ảnh
Một số khái niệm
Pixel (Picture Element): phần tử ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng hoá thành phần giá trị mà thể về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này, người ta sử dụng khái niệm Picture element mà ta quen gọi hay viết là Pixel - phần tử ảnh. Ở đây cũng cần phân biệt khái niệm pixel hay đề cập đến trong các hệ thống đồ hoạ máy tính. Để tránh nhầm lẫn ta tạm gọi khái niệm pixel này là pixel thiết bị. Khái niệm pixel thiết bị có thể xem xét như sau: khi ta quan sát màn hình (trong chế độ đồ hoạ), màn hình không liên tục mà gồm nhiều điểm nhỏ, gọi là pixel. Mỗi pixel gồm một cặp tọa độ x, y và màu.
Cặp tọa độ x, y tạo nên độ phân giải (resolution). Như màn hình máy tính có nhiều loại với độ phân giải khác nhau: màn hình CGA có độ phân giải là 320 x 200; màn hình VGA là 640 x 350,...
Như vậy, một ảnh là một tập hợp các điểm ảnh. Khi được số hoá, nó thường được biểu diễn bởi bảng hai chiều I(n,p): n dòng và p cột. Ta nói ảnh gồm n x p pixels. Người ta thường kí hiệu I(x,y) để chỉ một pixel. Thường giá trị của n chọn bằng p và bằng 256.
Gray level: Mức xám
Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số - kết quả của quá trình lượng hoá. Cách mã hoá kinh điển thường dùng 16, 32 hay 64 mức. Mã hoá 256 mức là phổ dụng nhất do lý do kỹ thuật. Vì 28 = 256 (0, 1, ..., 255), nên với 256 mức, mỗi pixel sẽ được mã hoá bởi 8 bit.
Biểu diễn ảnh xám:
Trên ảnh hai chiều, mỗi điểm (x,y) trên mặt phẳng ảnh ứng với một f(x,y) giá trị mô tả mức xám cho điểm ảnh. Trong đó, x là số hiệu cột và y là số hiệu dòng trên ảnh.
(x,y) ® f(x,y)
Ở đây f(x,y) là mức xám. Chẳng hạn, nếu có 256 mức xám thì 0 £ f(x,y) £ 255.
Nếu là ảnh màu, có bảng màu thì f(x,y) là số hiệu màu.
Nếu là ảnh hơn 256 màu thì f(x,y) là ba byte thể hiện các giá trị R, G và B của điểm ảnh.
BIỂU DIỄN ẢNH
Biểu diễn màu
Màu của một đối tượng phụ thuộc vào:
Bản thân đối tượng.
Ánh sáng chiếu của nguồn sáng.
Môi trường xung quanh.
Thị giác của con người.
Mô hình màu được xác định trên một số màu sơ cấp. Xét theo cấu tạo của mắt, các màu đều là liên két của ba màu sơ cấp là:
Đỏ (RED) 700mm
Xanh lá cây (GREEN) 546,1 mm
Xanh da trời (BLUE) 435,8 mm
Các màu sơ cấp cộng với nhau cho màu thứ cấp. Ví dụ:
Magenta := RED + BLUE
YELOW := RED + GREEN
CIE (The Commission International de I’Eclairage – Uỷ ban chuẩn quốc tế) đã xây dựng một chuẩn cho tất cả các màu, xác định thông qua ba thành phần cơ sở là RED, GREEN và BLUE.
Mô hình màu RGB
Hệ RGB gồm các màu cơ sở là RED, GREEN và BLUE.
Hệ màu RGB được sử dụng trong màn hình, trong đồ hoạ raster màu.
Mô tả hệ RGB theo hệ toạ độ Decarte.
Hình 1.3. Hệ tọa độ màu
Hệ RGB là chuẩn công nghiệp cho các thao tác đồ hoạ. Nếu thể hiện trên hệ màu khác, cuối cùng vẫn phải chuyển về RGB.
Với các màn hình khác nhau, giá trị RGB có thể khác nhau.
Mô hình màu CMY
Hệ CMY dựa trên các màu sơ cấp CYAN, MAGENTA và YELLOW.
Các màu này là phần bù của RED, GREEN và BLUE.
Mô hình màu HSV
HSV (Hue – màu sắc, Saturation - sự bão hoà và Value – giá trị), hay còn gọi là HSB (Hue, Saturation, Brightness - cường độ sáng).
Hue nhận giá trị trong khoảng [0o..360o].
Saturation, Value nhận giá trị trong khoảng [0..1].
Mô hình ánh sáng
Ánh sáng nhìn thấy được là tổng hợp các thành phần đơn sắc.
Tỷ lệ trộn khác nhau dẫn đến các màu khác nhau. Ví dụ về các màu đơn sắc như RED, GREEN, BLUE hoặc CYAN, MAGENTA, YELLOW.
Cường độ sáng phản xạ là giá trị đo được trên bề mặt của đối tượng tại điểm tới. Cường độ sáng của tia phản xạ phụ thuộc vào góc tới và hệ số phản xạ của bề mặt.
Số hóa ảnh
Từ môi trường qua thiết bị thu nhận ảnh, sẽ ánh xạ thực thể thành ma trận các điểm ảnh khác nhau, và tùy vào độ phân giải cũng như không gian màu. Việc số hóa thông qua quá trình lấy mẫu sau đó tiến hành lượng tử hóa các phần tử để lưu trữ.
TT
Số màu
Bits/Pixel
1
2
1
2
16
4
3
256
8
4
16 triệu
24
Phương pháp LUT (LookUp Table – Bảng dò tìm). Địa chỉ bộ nhớ trong LUT chứa một số bit, được ánh xạ đến toạ độ các pixel trên màn hình. Các sơ đồ bit được đọc vào bộ đệm khung. Mỗi giá trị của pixel là chỉ số cho bảng LUT. Nếu có N sơ đồ bits thì LUT có 2N đầu vào. Khi này chỉ có 2N cường độ (màu) khác nhau có thể tạo ra cùng một lúc. Có thể lập trình lại LUT. Thông thường với độ màu <=8 bit màu sẽ có bảng ánh xạ lấy trong không gian màu chuẩn (24 bit).
Các định dạng ảnh cơ bản trong xử lý ảnh
Định dạng ảnh IMG
Ảnh IMG là ảnh đen trắng. Phần đầu của ảnh IMG có 16 bytes chứa các thông tin cần thiết :
+ 6 bytes đầu: dùng để đánh dấu định dạng ảnh IMG. Giá trị của 6 bytes này viết dưới dạng Hexa: 0x0001 0x0008 0x0001.
+ 2 bytes tiếp theo: chứa độ dài mẫu tin. Đó là độ dài của dãy các bytes kề liền nhau mà dãy này sẽ được lặp lại một số lần nào đó. Số lần lặp này sẽ được lưu trong byte đếm.
+ 4 bytes tiếp: mô tả kích cỡ pixel.
+ 2 bytes tiếp : số pixel trên một dòng ảnh.
+ 2 bytes cuối: số dòng ảnh trong ảnh.
Ảnh IMG được nén theo từng dòng. Mỗi dòng bao gồm các gói (pack). Các dòng giống nhau cũng được nén thành một gói. Có 4 loại gói sau:
Loại 1: Gói các dòng giống nhau.
Loại 2: Gói các dãy giống nhau.
Loại 3: Dãy các pixel không giống nhau, không lặp lại và không nén được.
Loại 4: Dãy các pixel giống nhau.
File ảnh PCX
Nếu ta hình dung trong một tệp ảnh xếp liên tiếp các byte từ đầu đến cuối và dồn chúng vào trong một hộp chữ nhật, thì có thể hình dung tệp ảnh PCX như hình vẽ sau:
Hình 1.4. Cấu trúc file ảnh PCX
File ảnh BMP
Hình 1.5. Cấu trúc file ảnh BMP
Định dạng ảnh TIFF
Kiểu định dạng TIFF được thiết kế để làm nhẹ bớt các vấn đề liên quan đến việc mở rộng tệp ảnh cố định. Về cấu trúc, nó cũng gồm 3 phần chính:
Phần Header (IFH): có trong tất cả các tệp TIFF và gồm 8 byte:
Phần thứ 2 (IFD): Nó không ở ngay sau cấu trúc IFH mà vị trí của nó được xác định bởi trường Offset trong đầu tệp. Có thể có một hay nhiều IFD cùng tồn tại trong file (nếu file có nhiều hơn 1 ảnh).
Cấu trúc phần dữ liệu thứ 3: các DE. Các DE có độ dài cố định gồm 12 byte.
Một số phương pháp biểu diễn ảnh
Mã loạt dài
Phương pháp này hay dùng biểu diễn cho vùng ảnh hay ảnh nhị phân. Một vùng ảnh R có thể biểu diễn đơn giản nhờ một ma trận nhị phân:
u(m,n) = 1 nếu (m,n) Î R
0 nếu không
Với cách biểu diễn trên, một vùng ảnh hay ảnh nhị phân được xem như gồm các chuỗi 0 hay 1 đan xen. Các chuỗi này gọi là một mạch (run). Theo phương pháp này, mỗi mạch sẽ được biểu diễn bởi địa chỉ bắt đầu của mạch và chiều dài mạch theo dạng: (, chiều dài).
0 1 2 3 4
0 ảnh được biểu diễn
1 (1,1) 1, (1,3) 2
2 (2,0) 4, (3,1) 2
Hình 1.6. Ảnh nhị phân và các biểu diễn mã loạt dài tương ứng.
Mã xích
Mã xích thường được dùng để biểu diễn biên của ảnh. Thay vì lưu trữ toàn bộ ảnh, người ta lưu trữ dãy các điểm ảnh như A, B,..., M . Theo phương pháp này, 8 hướng của véctơ nối 2 điểm biên liên tục được mã hoá. Khi đó ảnh được biểu diễn qua điểm ảnh bắt đầu A cùng với chuỗi các từ mã. Điều này được minh hoạ trong hình 2.5 dưới đây.
2 A 7
3 1 M 1 0 1 E 0
2 J C D G 4 0 K 4 J 2 5
3 I 4 H
5 6 7
Hình 1.7. Hướng các điểm biên và mã tương ứng.
A 111 110 000 001 000 110 101 110 101 010 100 010
Mã tứ phân
Theo phương pháp mã tứ phân, một vùng của ảnh coi như bao kín bởi một hình chữ nhật. Vùng này được chia làm 4 vùng con (quadrant). Nếu một vùng con gồm toàn điểm đen (1) hay toàn điểm trắng (0) thì không cần chia tiếp. Trong trường hợp ngược lại, vùng con gồm cả đen và trắng gọi là vùng xám lại tiếp tục được chia làm 4 vùng con tiếp. Quá trình chia dừng lại khi không thể chia tiếp được nữa, có nghĩa là vùng con chỉ chứa thuần nhất điểm đen hay trắng. Như vậy, cây biểu diễn gồm một chuỗi các ký hiệu b(black), w(white) và g(grey) kèm theo ký hiệu mã hoá 4 vùng con. Biểu diễn theo phương pháp này ưu việt hơn so với các phương pháp trên, nhất là so với mã loạt dài. Tuy nhiên, để tính toán số đo các hình như chu vi, mô men là khá khó.
NÂNG CAO CHẤT LƯỢNG ẢNH
Cải thiện ảnh dùng toán tử điểm
Toán tử điểm là toán tử không bộ nhớ, ở đó một mức xám u Î[0,N] được ánh xạ sang một mức xám v Î[0,N]: v=f(u). Ánh xạ f tuỳ theo các ứng dụng khác nhau có các dạng khác nhau:
Tăng độ tương phản.
Tách nhiễu phân ngưỡng.
Biến đổi âm bản.
Cắt theo mức.
Trích chọn bít.
Trừ ảnh.
Nén dải độ sáng.
Tăng độ tương phản.
Độ tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền, hay nói cách khác, độ tương phản là độ nổi của điểm ảnh hay vùng ảnh so với nền.
Ảnh số là tập hợp các điểm, mà mỗi điểm có giá trị độ sáng khác nhau. Ở đây, độ sáng để mắt người dễ cảm nhận ảnh song không phải là quyết định. Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng nhưng đặt trên hai nền khác nhau sẽ cho cảm nhận khác nhau. Vì vậy, ta có thể thay đổi độ tương phản của ảnh sao cho phù hợp.
Để điều chỉnh độ tương phản của ảnh, ta điều chỉnh biên độ của ảnh trên toàn dải hay trên dải có giới hạn bằng cách biến đổi tuyến tính biên độ đầu vào (dùng hàm biến đổi là hàm tuyến tính) hay phi tuyến (hàm mũ hay hàm logarit). Khi dùng hàm tuyến tính các độ dốc a, b, g phải chọn lớn hơn 1 trong miền cần giãn. Các cận a, b có thể chọn khi xem xét lược đồ xám của ảnh.
vb
va
a
b
L
u
v
Chú ý: Nếu giãn độ tương phải bằng hàm tuyến tính ta có:
a = b = g ảnh kết quả trùng với ảnh gốc.
a, b, g >1 giãn độ tương phản.
a, b, g <1 co độ tương phản.
Hàm mũ hay dùng giãn độ tương phản có dạng
F = (X[m,n])p ; p thường chọn bằng 2
A B
A. Ảnh gốc B. Ảnh đã tăng độ tương phản
Hình 1.8. Hình tăng độ tương phản
C D
C. Ảnh gốc D. Ảnh đã tăng độ tương phản
Hình 1.9. Ảnh giảm độ tương phản
Tách nhiễu và phân ngưỡng.
Tách nhiễu là trường hợp đặc biệt của giãn độ tương phản khi hệ số góc a=g=0. Tách nhiễu được ứng dụng trong trường hợp khi biết tín hiệu nằm trên khoảng [a, b].
Phân ngưỡng là trường hợp đặc biệt của tách nhiễu khi a=b=const. Trong trường hợp này ảnh đầu ra là ảnh nhị phân (vì chỉ có hai mức). Phân ngưỡng hay dùng trong kỹ thuật in ảnh hai màu vì ảnh gần nhị phân không thể cho ra ảnh nhị phân khi quét ảnh bởi có sự xuất hiện của nhiễu do bộ cảm biến và sự biến đổi của nền. Thí dụ như trường hợp ảnh vân tay.
Biến đổi âm bản.
f(u) = L – u
Biến đổi âm bản rất có ích khi hiện các ảnh Y học.
Hình 1.10. A - Ảnh gốc; B - Ảnh âm bản
Cắt theo mức.
Kỹ thuật này dùng hai phép ánh xạ khác nhau cho trường hợp có nền và không nền.
a b L
u
v
Có nền
a b
u
v
Không nền
Biến đổi này cho phép phân đoạn một số mức xám từ phần còn lại của ảnh. Nó hữu dụng khi nhiều đặc tính khác nhau của ảnh nằm trên nhiều miền mức xám khác nhau.
Hình 1.11
A- Ảnh gốc
B- Cắt ảnh có nền với L = 20, a = 0 và b = 20;
C- Cắt ảnh có nền với L = 50, a = 30 và b = 255;
D- Cắt ảnh không nền với L = 50, a = 30 và b = 255;
Trích chọn bít
b=64 ={0100 0000}, b=75 ={0100 1111}
Mỗi điểm ảnh được mã hoá trên B bít. Nếu B=8 có ảnh 28=256 mức xám (ảnh nhị phân ứng với B=1). Trong các bít mã hoá này, người ta chia làm hai loại: bít bậc thấp và bít bậc cao. Với bít bậc cao, độ bảo toàn thông tin cao hơn nhiều so với bit bậc thấp.
U = k12B-1 + k22B-2 + ... + kB-1 2 + kB
Nếu ta muốn trích chọn bit thứ n và hiện chúng, ta dùng biến đổi:
Hình 1.12. A- Ảnh gốc; B - Ảnh với bit 5; C - Ảnh với bit 4; D - Ảnh với bit 3
Trừ ảnh
Trừ ảnh dùng để tách nhiễu khỏi nền. Ta quan sát ảnh ở hai thời điểm khác nhau, so sánh chúng để tìm ra sự khác nhau, sau đó dóng thẳng hai hai ảnh rồi trừ đi và thu được ảnh mới. Ảnh mới đó chính là sự khác nhau. Kỹ thuật này hay được dùng trong dự báo thời tiết hay trong y học.
Nén dải độ sáng
Đôi khi do dải động của ảnh lớn, việc quan sát không thuận tiện, cần phải thu nhỏ dải độ sáng lại mà người ta gọi là nén dải độ sáng. Người ta dùng phép biến đổi Loga sau: v(m,n)=c log10 (d+u(m,n)).
Với c là hằng số tỷ lệ, d rất nhỏ so với u(m,n). Thường d chọn cỡ 10-3.
Cải thiện ảnh dùng toán tử không gian
Làm trơn nhiễu bằng lọc tuyến tính
a. Lọc trung bình không gian
Mỗi điểm ảnh được thay thế bằng lọc trung bình trọng số của các điểm lân cận:
Nếu ta dùng các trọng số như nhau, công thức trở thành.
Với ; Nw : là số điểm ảnh trong cửa sổ lọc.
y(m,n) : ảnh đầu vào.
v(m,n): ảnh đầu ra.
w(m,n): cửa sổ lọc.
a(m,n): trọng số lọc.
Lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào với nhân chập H. Nhân chập H trong trường hợp này có dạng:
Trong lọc trung bình đôi khi người ta ưu tiên cho các hướng để bảo vệ biên của ảnh khỏi bị mờ đi do làm trơn ảnh.
b. Lọc thông thấp
Lọc thông thấp thường sử dụng để làm trơn nhiễu.
Sử dụng một số nhân chập sau:
Khi b=1 Hb chính là nhân chập H1 (lọc trung bình).
Để hiểu rõ hơn, ta viết lại phương trình thu nhận ảnh dưới dạng:
Xqs[m,n] = Xgoc[m,n] + h[m,n]
Trong đó h[m,n] là nhiễu cộng có phương sai s2n. Như vậy, theo cách tính của lọc trung bình ta có:
Hay:
Như vậy nhiễu cộng trong ảnh giảm đi Nw lần.
c. Lọc đồng hình
Kỹ thuật lọc này hiệu quả đối với nhiễu nhân. Thực tế ảnh quan sát được gồm ảnh gốc nhân với một hệ số nhiễu. X(m,n) = X (m,n).h(m,n)
X (m,n) : ảnh gốc
X (m,n) : ảnh thu được
h(m,n) : nhiễu
Lọc đồng hình thực hiện lấy logarit của ảnh quan sát.
log(X(m,n)) = log(X (m,n))+log(h(m,n))
Rõ ràng nhiễu nhân có trong ảnh sẽ bị giảm.
Làm trơn nhiễu bằng lọc phi tuyến:
a. Lọc trung vị
v(m,n)= Trung vi(y(m-k,n-l) với (k,l) Î W (1.1)
Kỹ thuật này đòi hỏi giá trị các điểm ảnh trong cửa sổ phải xếp theo thứ tự tăng hay giảm dần so với giá trị trung vị. Kích thước cửa sổ thường được chọn sao cho số điểm ảnh trong cửa sổ là số lẻ. Các cửa sổ hay dùng là cửa sổ 3 x3, 5x5, hay 7x7. Thí dụ:
Nếu y(m)={2,3,8,4,2} và cửa sổ W= (-1,0,1), ảnh kết quả thu được sau lọc trung vị sẽ là v(m)= (2,3,4,4,2).
Thực vậy: mỗi lần ta so sánh một dãy 3 điểm ảnh đầu vào với trung vị, không kể điểm biên. Do đó:
v[0]=2
v[1]= Trung vị(2,3,8)=3
v[2]= Trung vị (3,8,4)=4
v[3]=Trung vị(8,4,2)=4
v[4]=2
Tính chất của lọc trung vị:
- Lọc trung vị là phi tuyến vì:
Trung vị ((x(m) + y (m))# Trung vị(x(m)) + Trung vị(y(m))
- Hữu ích cho việc loại bỏ các điểm các điểm ảnh hay các hàng mà vẫn bảo toàn độ phân giải.
- Hiệu quả giảm khi số điểm nhiễu trong cửa sổ lớn hơn hay bằng một nửa số điểm trong cửa sổ. Điều này dễ giải thích vì trung vị là (Nw+1)/2 giá trị lớn nhất nếu Nw lẻ. Lọc trung vị cho trường hợp 2 chiều coi như lọc trung vị tách được theo từng chiều, có nghĩa là người ta tiến hành lọc trung vị cho cột tiếp theo cho hàng.
b. Lọc ngoài (Outlier Filter)
Giả thiết rằng có một mức ngưỡng nào đó cho các mức nhiễu (có thể dựa vào lược đồ xám). Tiến hành so sánh giá trị của một điểm ảnh với trung bình số học 8 lân cận của nó. Nếu sự sai lệch này lớn hơn ngưỡng, điểm ảnh này được coi như nhiễu. Trong trường hợp này ta thay thế giá trị của điểm ảnh bằng giá trị trung bình 8 lân cận vừa tính được. Các cửa sổ tính toán thường là 3x3. Tuy nhiên cửa sổ có thể mở rộng đến 5x5 hay 7x7 để đảm bảo tính tương quan giữa các điểm ảnh. Vấn đề quan trọng là xác định ngưỡng để loại nhiễu mà vẫn không làm mất thông tin.
BIẾN ĐỔI ẢNH
Biến đổi Fourrier-TF: khái niệm và công thức
Biến đổi Fourrier cho một tín hiệu có thể hình dung như sau:
x(t) TF X(f)
Miền thời gian Miền tần số
Một số ứng dụng cần miền phức, người ta dùng biến đổi phức (biến đổi z) :
x(n) TZ X(z) với z là biến phức
Biến đổi Fourrier cho một tín hiệu một chiều gồm một cặp biến đổi:
- Biến đổi thuận: chuyển sự biểu diễn từ không gian thực sang không gian tần số (phổ và pha). Các thành phần tần số này được gọi là các biểu diễn trong không gian Fourrier của tín hiệu.
- Biến đổi ngược: chuyển đổi sự biểu diễn của đối tượng từ không gian Fourrier sang không gian thực.
Không gian một chiều
Cho một hàm f(x) liên tục. Biến đổi Fourrier của f(x), kí hiệu F(u), u biểu diễn tần số không gian, được định nghĩa:
F(u) = (1.2)
Biến đổi ngược của F(u) cho f(x) được định nghĩa:
f(x) = (1.3)
Không gian hai chiều
Cho f(x,y) hàm biểu diễn ảnh liên tục trong không gian 2 chiều, cặp biến đổi Fourier cho f(x,y) được định nghĩa:
- Biến đổi thuận F(u,v) = (1.4)
u,v biểu diễn tần số không gian.
- Biến đổi ngược f(x,y) = (1.5)
Biến đổi Fourrier rời rạc – DFT
Biến đổi DFT được phát triển dựa trên biến đổi Fourrier cho ảnh số. Ở đây, ta dùng tổng thay cho tích phân. Biến đổi DFT tính các giá trị của biến đổi Fourrier cho một tập các giá trị trong không gian tần số được cách đều.
DFT cho tín hiệu một chiều
Với tín hiệu một chiều, người ta biểu diễn bởi một chuỗi trực giao các hàm cơ sở. Với các hàm liên tục, khai triển chuỗi trực giao sẽ cung cấp chuỗi các hệ số dùng trong nhiều quá trình khác nhau hay trong phân tích hàm. Khai triển Fourrier rời rạc DFT cho một dãy {u(n), n = 0, 1, ..., N-1} định nghĩa bởi:
v(k) = với k =0, 1, ..., N-1 (1.6)
với WN = e-j2p/N
và biến đổi ngược u(n) = WN-kn , k=0, 1, ..., N-1 (1.7)
DFT cho tín hiệu hai chiều (ảnh số)
Cặp DFT đơn vị hai chiều được định nghĩa:
v(k,l) = WN (km + ln) 0 = l, k = N-1 (1.8)
u(m,n) = WN -(km + ln) 0 = m, n = N-1 (1.9)
Ở đây, WN(km+ln) là ma trận ảnh cơ sở. Nhắc lại rằng eja = cos(a) +jsin(a) (công thức Ơle). Do vậy:
WN(km+ln) = e-j2p(km+ln)/N = cos(2p(km+ln)/N) - j sin (2p(km+ln)/N).
Như vậy, các hàm cơ sở trong ma trận ảnh cơ sở của biến đổi Fourier là các hàm cosine và hàm sine. Theo tính toán trên, ta thấy biến đổi Fourrier biểu diễn ảnh trong không gian mới theo các hàm sine và cosine.
Biến đổi KL
a. Định nghĩa và khái niệm:
Cho u là một véc tơ các số thực ngẫu nhiên; véctơ cơ sở của biến đổi KL là các véc tơ riêng trực giao của ma trận hiệp biến R cho bởi phương trình: Rj k = lkj k ; 0 £ k £N-1
Biến đổi KL của u là v = F*Tu (1.10)
và biến đổi ngược u = Fv = v(k) Fk (1.11)
u là véc tơ cột, v là véctơ hàng và Fk là cột thứ k của ma trận F.
Biến đổi F đưa R về dạng đường chéo :
l1
F*TRF = l = l2
. . .
lN
Thường người ta hay làm việc với ma trận A hơn.
b. Biến đổi KL của ảnh:
Nếu một ảnh u(m,n) NxN được biểu diễn bởi trường ngẫu nhiên, ma trận A cho bởi:
E[u(m,n)u(m',n')] = r(m,n;m',n') 0 £ m,m',n,n' £ N-1 (1.12)
thì ảnh cơ sở của biến đổi KL là các hàm riêng, chuẩn và trực giao fk,l là lời giải của phương trình:
r(m,n;m',n') fk,l = lk,l fk,l (1.13)
Theo ký pháp ma trận ta có: RYi = li fi i = 0, 1, ..., N2-1 (1.14)
Với fi là véc tơ N2 x 1 biểu diễn của Yk,l và R là ma trận N2 x N2 ánh xạ vào véc tơ u, R = E[uu].
Nếu R là tách được thì ma trận Y N2 x N2 mà các cột là Yi sẽ tách được:
fk,l(m,n) = f1 Ä f2 hay R = R1 Ä R2 (1.15)
Biến đổi KL của U là V = Y*Tu = f1*T Ä f2*T
và biến đổi ngược U =f1 V f2 (1.16)
LÀM NỔI VÀ TÁCH ĐƯỜNG BIÊN ẢNH
Làm nổi đường biên ảnh qua bộ lọc FIR
Vì đường biên ảnh chiếm ở dải tần số cao trong phổ của ảnh, nên ta có thể làm nổi hoặc tách đường biên ảnh qua bộ lọc thông cao. Dùng cho chức năng này, ta có thể dùng bộ lọc tương phản pha có điểm cắt tần số đủ cao để làm nổi đường biên ảnh và làm mờ các chi tiết khác của ảnh có tần số thấp.
Một phương pháp khác hay dùng để làm nổi đường biên ảnh là dùng bộ lọc Laplace, định nghĩa như sau:
(1.17)
ở đây f(x,y) là hàm cường độ của ảnh. Đặc tính tần số của Laplace được định nghĩa như sau:
(1.18)
Để hiểu hoạt động của phương pháp Laplace trong việc trích ra đường biên, xem sơ đồ ví dụ hình 1.14. Chúng là sự đơn giản hoá sườn âm và sườn dương đường biên.
Hình 1.13. (a) Kết quả sử dụng bộ lọc PCF với . (b) Kết quả sử dụng lọc PCF với .
f(x)
a
b
c
Hình 1.14. Đạo hàm bậc nhất và bậc hai của đường biên.
Rõ ràng là đạo hàm bậc hai có thể dùng để phát hiện đường biên ảnh. Thông thường, các điểm cắt zero của đạo hàm bậ
Các file đính kèm theo tài liệu này:
- Tin10.docx