Những khái niệm cơ bản của Multimedia
Các dạng dữ liệu Multimedia
Văn bản.
Âm thanh.
Hình ảnh tĩnh và đồ họa.
Hình ảnh động.
Nén thông tin đa phương tiện và các chuẩn
Nhu cầu nén đa phương tiện
Nén không mất thông tin và nén mất thông tin
Phương pháp nén văn bản
Phương pháp nén âm thanh
Phương pháp nén ảnh tĩnh
Phương pháp nén ảnh động
192 trang |
Chia sẻ: Mr Hưng | Lượt xem: 1155 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Bài giảng Công cụ Multimedia, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
át tín hiệu điều khiển thanh ghi bộ nhớ
Địa chỉ trở về trên bus dữ liệu được ghi vào vị trí xác định ở ngăn xếp SP
Địa chỉ lệnh đầu tiên của chương trình con điều khiển ngắt được náp vào
PC.
118
3.4 Các kỹ thuật xử lý
Sound Card
Trong máy tính Sound Card là một bo mạch mở rộng các chức năng
về âm thanh, thông qua các phần mềm nó cho phép ghi lại âm thanh
(đầu vào) hoặc trích xuất âm thanh (đầu ra) thông qua các thiết bị
chuyên dụng khác.
Chức năng chính
Trích xuất các tín hiệu âm thanh dạng tín hiệu tương tự hoặc tín hiệu số
tới các loa
Ghi lại âm thanh để lưu trữ như tiếng nói, âm thanh tự nhiên, âm nhạc,
phim thông qua các ngõ đầu vào.
Xử lý và phát lại âm thanh từ các thiết bị khác: Phát âm thanh trực tiếp
từ các ổ đĩa quang, thiết bị phát MIDI.
Kết nối các bọ điểu khiển game như joystick.
Phân loại
Sử dụng bus ISA
Sử dụng bus PCI
Sử dụng bus USB
119
3.4 Các kỹ thuật xử lý
Sound Card
Các đặc điểm
Nhiễu (Noise): nhiễu cho phép trong khoảng -90 dB.
Distortion: nguyên nhân là do sự xuất hiện của những tần số âm thanh
khác trên tần số âm thanh phát ra và gây nhiễu, được tính ra đơn vị %.
THD (Total Harmonic Distortion): 0.005%.
Nhiễu xuyên kênh: xuất hiện do có nhiều kênh âm thanh phát ra cùng
một lúc. Nhiễu cho phép là khoảng -90 dB.
Dynamic range và SNR (Signal-to Noise Ratio): được tính bằng tỉ số của
âm thanh to nhất không bị méo và nhiễu, giá trị cho phép là 90 dB.
120
3.5 Các kỹ thuật hiển thị
Màn hình CRT
Quét mặt màn hình thủy tinh bằng chùm tia điện tử, bản thân mặt
người không nhìn thấy chùm tia quét do sự lưu ảnh trên võng mạc.
Các hạt huỳnh quang trên màn hình phát sáng do va chạm với các
hạt điện tử.
Điểm sáng được hợp thành từ ba điểm đơn sắc: Red, Green và Blue.
121
3.5 Các kỹ thuật hiển thị
Màn hình CRT
Các đặc điểm
Độ phân giải: là số điểm có thể hiển thị.
Kích thước màn hình:
CRT 15” với độ phân giải 800x600
CRT 17” với độ phân giải 1024x768
CRT 19”-21” với độ phân giải 1280x1024 - 1600x1200
Dot pitch: là khoảng cách giữa hai pixel, giá trị thông thường của nó
trong khoảng từ 0.22 – 0.3 mm.
Tần số quét: tương đương số lượng hình ảnh hiển thị trong một đơn vị
thời gian, với tần số > 75 Hz thì mắt người sẽ không cảm nhận thấy màn
hình nháy.
Hai dạng quét: là progressive và interlace.
Interlace quét và hiển thị các dòng chắn sau đó đến các dòng lẻ, do đó hình
ảnh bị nhấp nháy dễ làm mỏi mắt. Màn hình TV làm theo kỹ thuật Interlace.
122
3.5 Các kỹ thuật hiển thị
Màn hình CRT
Một số vấn đề
3 súng bắn tia điện tử cùng hoạt động đồng thời và phải cùng tìm thấy
một điểm duy nhất trên màn hình.
Độ chính xác của hệ thống điều khiển hướng.
Ưu điểm
Sử dụng các hạt huỳnh quang cho chất lượng ảnh tốt.
Góc nhìn 180o
Giá thành thấp
Nhược điểm
Tiêu tốn năng lượng: 150 watt với màn hình 17”.
Vấn đề hội tụ
Tạo ra các tia có hại cho sức khỏe
Cồng kềnh và nặng
123
3.5 Các kỹ thuật hiển thị
Màn hình TFT
Màn hình TFT thông thường gồm có hai bộ lọc phân cực:
Một bộ lọc có hướng phân cực cố định
Một bộ lọc khác được làm từ tinh thể lỏng.
Sự thay đổi của điện trường sẽ dẫn đến sự thay đổi của cấu trúc lớp tinh
thể lỏng và làm thay đổi hướng phân cực. Sự thay đổi điện trường là do
một lưới các bóng bán dẫn (transistor) tạo ra.
124
3.5 Các kỹ thuật hiển thị
Màn hình TFT
TN+Film
Giữa hai tầng phân cực cố định có một lớp tinh thể lỏng. Các tinh thể
lỏng khi tạo thành các đường xoắn có thể cho phép ánh sáng đi qua và
tạo thành một điểm sáng trên màn hình. Tuy nhiên dưới sự tác động của
điện trường, các tinh thể này bị xáo trộn và ngăn ánh sáng lại và tạo
thành các điểm tối.
125
3.5 Các kỹ thuật hiển thị
Màn hình TFT
TN+Film
Ưu điểm:
Là loại màn hình tốc độ làm mới nhanh nhất khoảng 4 ms.
Giá thành thấp
Tiêu thụ điện năng thấp nhất nên có thể được sử dụng cho các màn hình
laptop.
Nhược điểm:
Sự xáo trộn của các tinh thể không phải là hoàn hảo nên nó không tạo thành
màu đen tuyệt đối, do đó độ tương phản của màn hình này thấp.
Không thể điều chỉnh các tinh thể lỏng tối ưu, nên số lượng màu có thể biểu
diễn giảm đi đáng kể. Mỗi một kênh màu chỉ biểu diễn được bằng 6 bit, như
vậy màn hình hiển thị được 264.000 màu sắc khác nhau.
Màn hình thường xuất hiện hiện tượng một bên sáng hơn và một bên tối hơn.
Màn hình LG 1915S – 19” có góc nhìn 140o, độ tương phải 1:500, thời
gian trả lời 12 ms với độ sáng tương đương 250 cd/m2.
126
3.5 Các kỹ thuật hiển thị
Màn hình TFT
ISP/S-ISP
Màn hình này ở trạng thái bình thường các tinh thể lỏng có hướng vuông
góc với hướng của các tầng phân cực. Chính vì thế khi không có tác
động của điện trường, nó sẽ không cho ánh sáng đi qua tạo thanh màu
đen.
127
3.5 Các kỹ thuật hiển thị
Màn hình TFT
MVA/PVA
Ưu điểm:
Có thời gian trả lời lớn.
Góc nhìn thấp hơn so với màn hình IPS và có độ tương phản khoảng 1:300.
Màn hình LG 1910P có góc nhìn 176o, độ tương phải 1:400, cường độ
sáng 250 cd/m2 và thời gian trả lời là 25 ms.
128
3.5 Các kỹ thuật hiển thị
So sánh TFT và CRT
CRT theo quan điểm của nhiều người cho chất lượng hình ảnh tổt
hơn, nhưng trên thực tế TFT cho ảnh tự nhiên hơn rất nhiều.
TFT có góc nhìn kém như trường hợp của TN+film, góc nhìn là 140o.
TFT có thời gian trả lời lâu hơn.
Màn hình Plasma
Màn hình này gồm khí trong đó có các hạt ion và electron. Khi hai hạt
này va chạm với nhau nó sẽ tạo ra tia sáng, thường là các tia cực
tím.
Màn hình này có độ tương phản tốt, có thời gian sử dụng là khoảng
60.000 giờ.
Màn hình Panasonic TH-65PHD7E, 65” có độ phân giải 1366x768,
sử dụng 30 bit cho một kênh. Độ tương phải là 1:3000 và góc nhìn
khoảng 160o.
129
3.6 Các kỹ thuật truyền dẫn
Modem không đồng bộ:
Modulation and Demodulation.
Nhận và gửi thông tin thông qua mạng điện thoại công cộng.
Khi gửi thông tin từ máy tính: phải chuyển đổi thông tin từ dạng số sang
dạng tương tự.
Khi nhận thông tin từ mạng điện thoại: phải chuyển đổi thông tin từ dạng
tương tự sang dạng số.
Tốc độ truyền dữ liệu: 56 Kbps
130
3.6 Các kỹ thuật truyền dẫn
Mạng ISDN
Mạng ISDN – Intergrated Services Digital Network
ISDN là mạng truyền thông số.
Là công nghê truyền thông hoàn toàn dạng số được xây dựng trên cơ sở
hạ tầng của mạng điện thoại công cộng.
Mạng điện thoại tương tự:
Dịch vụ điện thoại tương tự chỉ cho phép sử dụng từng đường điện thoại độc
lập cho thiết bị
Khối lượng thông tin được truyền hạn chế: hiện nay với kỹ thuật tương tự, tốc
độ truyền thông tin chỉ đạt 56Kbps.
ISDN:
Cho phép sử dụng đường điện thoại tiêu chuẩn và chuyển thành đường
truyền số cho phép truyền tải đồng thời dữ liệu âm thanh, hình ảnh và
các dạng dữ liệu khác.
Cung cấp nhiều kênh dữ liệu trên cùng một dây điện thoại tiêu chuẩn.
Mỗi kênh có tốc độ truyền 64Kbps.
Đường truyền số cho phép giảm nhiễu và sự giao thoa của sóng điện từ
trên các kênh mang
131
3.6 Các kỹ thuật truyền dẫn
Các kênh ISDN
Giao diện ISDN
132
3.6 Các kỹ thuật truyền dẫn
Các nhóm chức năng
ASDL (Asymmetric Digital Subriber Line)
Công nghệ bất đối xứng tốc độ tải xuống > tốc độ tải lên
Mạch ADSL được kết nối với một modem ADSL bằng đường dây cáp xoắn
thao tạo ra 3 kênh khác nhau:
Kênh tải xuống tốc độ cao (1.5 – 9 Mbps)
Kênh song công tốc độ trung bình (16-640 kbps)
Kênh cơ bản đề truyền dịch vụ thoại.
ADSL modem truyền tốc độ tương thích với chuẩn Bắc Mỹ T1 – 1.544 Mbps
và Châu Âu E1 – 2.048 Mbps (cho tốc độ tải xuống 6.1 Mbps và 64 kbps kênh
song công).
TE1
S T U
NT2 ET
TA
LTNT1
R
V
USER SIDE Đường kết nối Tổng đài số
133
3.6 Các kỹ thuật truyền dẫn
Mạch Ethernet
134
3.7. Nén dữ liệu
Khái niệm nén dữ liệu.
Các phương pháp nén không mất thông tin.
Các phương pháp nén mất thông tin.
135
Khái niệm về nén dữ liệu
Nhu cầu về nén dữ liệu
Sự phát triển mạnh mẽ của công nghệ truyền thông, kỹ thuật tính toán
và Internet.
Sự mất cân bằng về:
Các khối dữ liệu lớn có thể được xử lý.
Các khối dữ liệu lớn có thể được lưu trữ.
Các khối dữ liệu lớn có thể được truyền.
Vấn đề đặt ra:
Do không đáp ứng được các yêu cầu về xử lý, lưu trữ và truyền thông,
vấn đề đặt ra là: giảm kích thước khối dữ liệu mà không làm giảm lượng
thông tin chứa trong đó.
Ví dụ:Một dòng video: 25 hình /s, mỗi hình chứa 16 triệu màu, độ phân
giải 640x480.
Tốc độ tạo thông tin: 25 x 8 x 3 x640 x 480 =184320000bit/s = 23Mo/s
Với 2h video, lượng dữ liệu sinh ra bằng 162GB
ứng dụng:
Lưu trữ thông tin: trong các ngân hàng ảnh, đĩa DVD.
Truyền thông:truyền ảnh trên mạng Internet, mạng không dây.
136
Khái niệm về nén dữ liệu
Các tiêu chuẩn lựa chọn các phương pháp nén dữ liệu:3 tiêu chuẩn
Tỷ lệ nén: tỷ lệ giữa kích thước khối thông tin sau khi nén với kích thước
trước khi nén.
Chất lượng nén:
Nén mất thông tin.
Nén không mất thông tin.
Chất lượng cảm nhận thông tin
Tốc độ của các thuật toán:
Tốc độ nén.
Tốc độ giải nén.
137
Nén không mất thông tin
Phương pháp nén không mất thông tin cho phép khôi
phục lại hoàn toàn khối dữ liệu ban đầu qua các chu
trình nén – giải nén.
Đòi hỏi phải có thiết bị lưu trữ và đường truyền lớn
Các thuật toán của nén không mất dữ liệu dựa vào
việc thay thế một nhóm các ký tự trùng lặp bởi một
nhóm các ký tự đặc biệt khác ngắn hơn không quan
tâm tới ý nghĩa của dữ liệu
Run-Length Encoding (RLE), Huffman Coding,
Arithmetic coding, Shannon-Fano Coding, LZ78, LZH,
LZW ...
138
Nén không mất thông tin
Ba dạng thuật toán nén không mất thông tin:
Các thuật toán mã hoá thống kê:
Các thuật toán này hoạt động dựa trên tần suất xuất hiện của các ký tự
mã trong khối thông tin. Giảm số lượng bit dùng để biểu diễn các ký tự
mã xuất hiện thường xuyên.
Tăng số lượng bit dùng để biểu diễn những ký tự mã ít xuất hiện.
Các thuật toán dựa trên sự thay thế các chuỗi: các thuật toán này
nén các chuỗi chứa các ký tự đồng nhất.
Các thuật toán dựa trên từ điển:
Giảm số lượng các bit dùng để chứa các từ xuất hiện thường xuyên.
Tăng số lượng các bit để chứa các từ xuất hiện thưa thớt.
Các đặc tính:
Thuật toán đơn giản.
Tỷ lệ nén thấp.
Thích hợp với nén ảnh và văn bản.
139
Các phương pháp nén không mất thông tin
Phương pháp nén Shannon-Fano.
Nguyên lý:
Các từ mã có độ dài biến thiên.
Độ dài mã tỷ lệ nghịch với xác suất xuất hiện của ký tự.
Từ mã được giải mã một cách duy nhất.
Thuật toán:
Xác định các xác suất xuất hiện của các ký tự trong bản tin.
Sắp xếp các ký tự theo trình tự xác suất xuất hiện giảm dần.
Phân chia các ký tự thành hai nhóm có tổng xác suất xấp xỉ(nếu dùng mã nhị phân
thì phân chia làm hai nhóm, nếu mã cơ số m thì chia làm m nhóm).
Gán cho mỗi nhóm ký hiệu mã 0 hoặc 1.
Tiếp tục phân chia cho tới khi trong các nhóm chỉ chứa một ký hiệu.
Từ mã cho ký hiệu là tổ hợp của các ký hiệu của các nhóm chứa ký hiệu tính theo
thứ tự từ lần tạo nhóm đầu tiên.
140
Các phương pháp nén không mất thông tin
Ví dụ:
Cho thông điệp “BBCAACADBDCADAEEEABAC
DBACADCBADABEABEAAA”
Tần suất xuất hiện của các ký tự trong thông điệp lần lượt bằng:
A: 15; B: 8; C: 6; D: 6; E: 5.
A: 00; B: 01; C: 10; D: 110; E: 111.
Số lượng bit dùng để chứa chuỗi mã:
2x15+2x8+2x6+3x6+3x5=91bit.
Nếu dùng mã ASCII: 40x8=320bit.
Tỷ lệ nén: 91/320 = 28%
Mã Fano là mã có tính prefix.
141
Các phương pháp nén không mất thông tin
Phương pháp Huffman.
Nguyên lý: tương tự mã Shannon-Fano.
Thuật toán:
Xây dựng danh sách các ký tự với xác suất xuất hiện giảm dần.
Các ký tự sẽ là các nút của cây Huffman.
Mã hoá bắt đầu với hai ký hiệu có xác suất nhỏ nhất. Hai ký hiệu được hợp lại, hai
nhánh được gán ký hiệu 0 hoặc 1.
Nút của hai nhánh được coi là một ký hiệu mới có xác suất xuất hiện bằng tổng hai
xác suất xuất hiện của hai ký hiệu tạo ra nút.
Tiếp tục quá trình trên với hai nút có xác suất xuất hiện nhỏ nhất.
Từ mã ứng với mỗi ký hiệu nguồn là tổ hợp của các ký hiệu mã ở các nhánh tính
từ gốc.
Các ưu điểm:
Cho phép thực hiện tốt với hình ảnh cũng như text.
Tỷ lệ nén trung bình: 50%.
Tốc độ nén nhanh.
142
Các phương pháp nén không mất thông tin
Ví dụ: với cùng thông điệp trước:
“BCAACADBDCADAEEEABACDBACADCBADABEABEAAA”
A: 17; B: 7; C: 6; D: 6; E: 5.
A: 0; B:100; C: 101;
D: 110; E: 111
Mã Huffman có tính prefix.
Số lượng bit dùng để
chứa chuỗi mã:
1x17+3x7+3x6+3x6+3x5=87
Tỷ lệ nén: 87/320=27%
143
Các phương pháp nén không mất thông tin
Phương pháp thay thế RLE(Run Length Encoding).
Nguyên lý:
Tối ưu hoá mã bằng cách thay thế các chuỗi ký tự giống nhau liên tiếp.
ứng dụng trong các loại ảnh BMP, TIFF. Các điểm ảnh liên tiếp có giá trị
như nhau sẽ được thay thế bằng một điểm ảnh và chỉ rõ số lượng điểm.
Các bước thuật toán:
Tìm trong thông điệp những ký tự liên tiếp lặp lại.
Thay thế chuỗi ký tự đó bằng:
Một ký tự đặc biệt chỉ việc nén.
Số lần lặp lại của ký tự.
Ký tự lặp lại được nén.
Ví dụ:
Cho chuỗi “ABCCCCCCDDEEEE”
Chọn ký tự nén: #
Chuỗi sau khi nén: AB#6CDD#4E
Tỷ lệ nén: 57%
144
Các phương pháp nén không mất thông tin
Phương pháp LWZ
Nguyên lý:
Phân tích thông điệp.
Lần lượt lập bảng chứa vị trí xuất hiện của các từ tìm thấy trong thông điệp.
Giảm số lượng bit để mã hoá những từ xuất hiện thường xuyên.
Tăng số lượng bit để mã hoá những từ ít gặp hơn.
đặc tính:
ít hiệu quả đối với ảnh.
Có hiệu quả cao với text hoặc dữ liệu số. Lỷ lệ nén có thể đạt tới 50%.
Các bước thuật toán:
Thông điệp được phân chia thành những khối có độ dài thay đổi. Các khối này gọi
là các câu.
Một câu mới là một khối của ký tự nguồn và thêm một ký tự cuối.
Các câu được liệt kê trong từ điển kèm theo vị trí xuất hiện.
Để mã hoá một câu mới ta chỉ vị trí của câu trong từ điển và chèn thêm ký hiệu mới
vào cuối.
145
Các phương pháp nén không mất thông tin
Ví dụ:
Chuỗi ký tự: PQPQPQRPQRPQRPQRPQR
Từ điển:
256 PQ
257 QR
258 PQP
259 PQR
260 PQRPQR
Kết quả mã hoá: 256 256 260 260 259
Tỷ lệ nén: 2 x 5 / 1 x 19 = 53%
Để giải mã ta cũng phải lập có từ điển và tra cứu ngược lại trong từ điển
146
Các phương pháp nén mất thông tin
Nhận xét về các phương pháp nén không mất thông tin:
Tỷ lệ nén trung bình của các phương pháp nén không mất thông tin
khoảng 40%.
Các phương pháp này không thích hợp với thông tin Multimedia.
Nguyên lý nén mất thông tin.
Dựa vào khả năng cảm nhận của thị giác và thính giác.
Giữ những thông tin quan trọng trong cảm nhận bằng thị giác và thính
giác.
Loại bỏ những thông tin dư thừa đối với cảm nhận.
Nén âm thanh.
Dựa vào khả năng cảm nhận âm thanh của thính giác:
Từ 20Hz đến 20KHz.
Cảm nhận cực đại trong khoảng: từ 2 KHz – 5KHz
Các phương pháp DPCM, ADPCM, LPC.
147
Nén âm thanh
Một số phương pháp nén âm thanh
PCM (Pulse-Code Modulation)
DPCM (differential pulse-code modulation)
ADPCM (Adaptive Differential PCM)
PASC (Perceptual Audio Sub-band Coding)
LPC (Linear predictive coding)
148
Các phương pháp nén mất thông tin
Phương pháp PCM
PCM(Pulse Code Modulation). Biểu diễn các tín hiệu số bằng chuỗi
các xung.
Dùng để mã hóa tương tự - số
Tuân theo định lý Nyquist-Shannon
149
Nén âm thanh
Phương pháp DPCM
Giảm tỷ lệ dữ liệu của PCM bằng cách mã hoá sự khác biệt giữa giá
trị các mẫu.
Mã hoá dự đoán: dự đoán mẫu thứ n+1 theo tổ hợp tuyến tính của n
mẫu tín hiệu trước đó.
ai là n hệ số dự đoán
1
0
)()(~
n
i
i isans
150
Nén âm thanh
151
Nén âm thanh
Phương pháp DM (Delta Modulation) :
Là trường hợp riêng của phương pháp DPCM
Mã hóa sai khác chỉ dùng 1 bit
Mã hóa 0 hoặc 1 tùy thuộc vào cường độ tín hiệu xung hiện tại so
với xung trước đó
Ưu nhược điểm
Đơn giản
Mã hóa ít bit
Độ chính xác không cao, sai số lớn
Tỉ lệ SNR thấp
Phương pháp tăng cường hiệu năng
Tăng tần số mã hóa
152
Phương pháp DM (tiếp)
153
Nén âm thanh
ADPCM(Adaptive Differential PCM):
Phương pháp DPCM có hạn chế là : bộ dự đoán và lượng tử hóa là
cố định hiệu năng thay đổi tùy vào dữ liệu đầu vào
ADPCM sử dụng các bộ dự đoán và lượng tử hóa thích nghi dựa
vào các dữ liệu đã nhận được trước đó tối thiểu hóa sự sai khác
giữa mẫu dự đoán và mẫu thực tế
Bộ dự đoán thích nghi : thay đổi tham số tùy thuộc đầu vào trước đó
Lượng tử thích nghi : thay đổi các bước lượng tử hóa khác nhau
ADPCM sử dụng trong các thiết bị CD-i và DVI.
Chuẩn ADPCM: CCITT G.721.
Tỷ lệ nén: 4:1 đến 2:1
154
Nén âm thanh
155
Nén âm thanh
Phương pháp PASC (Perceptual Audio Sub-band
Coding)
Là phương pháp dựa trên SBD (Sub-band Coding) : chia một tín hiệu
thành nhiều dải tần con mã hóa mỗi dải tần riêng biệt
Mã hóa dự vào cảm nhận âm thanh của con người
Cảm nhận từ 20Hz – 20kHz
Nhưng cảm nhận âm thanh không đồng đều ở các tần số khác nhau
Hiệu ứng che tần số : âm thanh tần số mạnh che âm thanh tần số yếu
Được sử dụng trong mã hóa âm thanh chuẩn MPEG 1,2,4
MP3 : MPEG-1 or MPEG-2 Audio Layer III
Mã hóa dùng 32 băng tần con, mã hóa cảm nhận và Entropy
156
Nén âm thanh
157
Nén âm thanh
Phương pháp LPC (Linear Predictive Coding)
Mã hóa tiếng nói dựa vào các tham số tổng hợp giọng nói
Dựa vào cấu tạo hình thành âm thanh con người
Dây thanh quản
Vòng họng
Miệng+mũi
Phân tích và tổng hợp lại các âm con người phát ra
Ứng dụng :
Phân tích và tái tạo tiếng nói
Sử dụng trong việc truyền âm thanh số, mã hóa trong điều kiện tốc độ
thấp
Sử dụng kết hợp với các kỹ thuật khác
158
159
Nén mất Thông tin: nén ảnh và video
Ảnh được khôi phục không giống hoàn toàn với ảnh
gốc
Thích hợp cho việc lưu trữ và truyền ảnh tĩnh, video
qua một mạng có băng thông hạn chế
Differential Encoding, Discrete Cosine
Transform(DCT), Vector Quantization, JPEG (Joint
Photographic Experts Group) và MPEG (Motion
Picture Experts Group)
160
Nén ảnh
Các phương pháp nén ảnh có mất tín hiệu gồm có 4
bước như hình .
Sơ đồ cơ bản của bộ mã hoá
Các bộ mã hoá khối có thể dựa trên hai nguyên tắc
biến đổi cơ bản: Discrete Cosine Transform (DCT) và
Vector Quantization (VQ)
161
Nén ảnh
162
Nén ảnh
Phương pháp nén ảnh JPG:
Nguyên lý: 4 bước thực hiện
Biến đổi hệ toạ độ màu.
Thay đổi các bước lấy mẫu: các điểm được nhóm theo các thông tin về
màu thành các nhóm 2 điểm hoặc 4 điểm.
Thực hiện phép biến đổi từ miền không gian về miền tần số không gian.
Lượng tử hóa không đều các hệ số biến đổi
Sử dụng các thuật toán nén RLE và Huffman.
163
Biến đổi hệ màu RGB YCbCr
Do mắt người nhạy với thành phần Y hơn so với Cb,
Cr nên giảm số bit lưu trữ Cb, Cr
164
Nén ảnh
165
Nén ảnh
Ta có thể xác định 64 giá trị chỉ bằng 5 số ngyên nếu ta ap
dụng công thức discrete cosine transform (DCT)
Bộ giải mã có thể tái tạo lại giá trị của các pixel thông qua công
thức inverse discrete cosine transform (IDCT)
c
166
Nén ảnh
167
Nén ảnh – ví dụ
DCT
Tru
128
168
Nén ảnh – ví dụ
169
170
171
Nén ảnh
Chuẩn JPEG 2000
JPEG đã đưa ra một chuẩn nén ảnh mới là JPEG2000. JPEG2000
sử dụng biến đổi Wavelet và các phương pháp mã hoá đặc biệt để
có được ảnh nén ưu việt hơn hẳn JPEG.
JPEG2000 có nhiều chức năng đặc biệt hơn các chuẩn nén ảnh tĩnh
khác như JPEG hay GIF. Dưới đây là các chức năng ưu việt của
JPEG2000 so với các chuẩn nén ảnh tĩnh khác
Cho chất lượng ảnh tốt nhất khi áp dụng nén ảnh tĩnh có tổn thất.
Sử dụng được với truyền dẫn và hiển thị luỹ tiến về chất lượng, độ phân
giải, các thành phần màu và có tính định vị không gian.
Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén.
Truy nhập và giải nén tại mọi thời điểm trong khi nhận dữ liệu.
Giải nén từng vùng trong ảnh mà không cần giải nén toàn bộ ảnh
Có khả năng mã hoá ảnh với tỷ lệ nén theo từng vùng khác nhau
Nén một lần nhưng có thể giải nén với nhiều cấp chất lượng tuỳ theo yêu
cầu của người sử dụng
172
Nén ảnh
173
Nén ảnh
174
Nén ảnh
175
Nén ảnh
So sánh chuẩn JPEG và JPEG2000 với tỉ lệ 0.25 bpp, CR = 32
176
Nén video
Đối với tín hiệu video số, số lượng bit được sử dụng để truyền
tải thông tin đối với mỗi miền tần số khác nhau, có nghĩa là: miền
tần số thấp, nơi chứa đựng nhiều thông tin, được sử dụng số
lượng bít lớn hơn và miền tần số cao, nơi chứa đựng ít thông tin,
được sử dụng số lượng bít ít hơn.
Thực chất của kỹ thuật “nén video số” là loại bỏ đi các thông tin
dư thừa. Các thông tin dư thừa trong nén video số thường là:
Độ dư thừa không gian giữa các pixel;
Độ dư thừa thời gian do các ảnh liên tiếp nhau;
Độ dư thừa do các thành phần màu biểu diễn từng pixel có độ tương quan
cao;
Độ dư thừa thống kê do các kí hiệu xuất hiện trong dòng bít với xác suất xuất
hiện không đều nhau;
Độ dư thừa tâm lý thị giác (các thông tin nằm ngoài khả năng cảm nhận của
mắt).vv
177
Nén video
MJPEG (Motion JPEG) – là việc sử dụng chuẩn mã
hóa video sử dụng các frame được mã hóa bằng
chuẩn nén ảnh JPEG
Đơn giản – các frame độc lập với nhau
Giới hạn mã hóa 1:20
MJPEG được phát triển cho các máy tính cá nhân,
hiện nay dùng các thiết bị khác. Hiện nay MJPEG
được ứng dụng cho
Máy quay số
Thu nhận và chỉnh sửa video
IP Camera
Sử dụng cho các thiết bị hiển thị video
178
Nén video
MPEG (Moving Picture Expert Group) là nhóm chuyên gia về
hình ảnh, được thành lập từ tháng 2 năm 1988 với nhiệm vụ xây
dựng tiêu chuẩn cho tín hiệu Audio và Video số. Ngày nay,
MPEG đã trở thành một kỹ thuật nén Audio và Video phổ biến
nhất
MPEG-1, mã hoá tín hiệu Audio-Video với tốc độ khoảng 1.5Mb/s và lưu trữ
trong đĩa CD.
MPEG-2 (1990) : MPEG-2 với “công cụ ” mã hoá khác nhau đã được phát
triển. (3-15Mbps)
MPEG-4 (10/1998), Là chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng
dụng về đồ hoạ và video tương tác hai chiều (games, videoconferencing) và
các ứng dụng multimedia tương tác hai chiều (World Wide Web, Internet
video...)
MPEG-7: là một chuẩn dùng để mô tả các nội dung Multimedia, chứ không
phải là một chuẩn cho nén và mã hoá audio/ảnh động như MPEG-1, MPEG-2
hay MPEG-4. MPEG-7 sử dụng ngôn ngữ đánh dấu mở rộng XML(Extansible
Markup Language) để lưu trữ các siêu dữ liệu Metadata, đính kèm timecode
để gắn thẻ cho các sự kiện, hay đồng bộ các dữ liệu.
179
180
Nén video
Các cấu trúc lấymẫu vỡ số hoá tín hiệu video
Đối với truyền hình số NTSC vỡ PAL, chuỗi video
gồm các khung hình (frame ảnh) có độ phân giải 576
x 720, các dòng video chứa 720 điểm ảnh đ−ợc lấy
mẫu vỡ số hoá theo các cấu trúc sau :
181
Nén video
182
Nén video
183
Nén video
Các chuẩn nén video hầu hết đều sử dụng 2 kỹ thuật
chính là :
Nén video không dùng kỹ thuật phát hiện và bù chuyển động -
MJPEG
Nén video dùng kỹ thuật phát hiện và bù chuyển động
Nén ảnh tĩnh để giảm độ dư thừa không gian
Đánh giá, ước lượng chuyển động để giảm độ dư thừa về mặt thời gian
184
Nén video
Phân loại các frame video
Frame I : là frame đầu tiên trong chuỗi video
Frame P : (predicted frame) – frame được dự đoán tiếp theo
Frame B (Bi-directional interpolated prediction frame) - frame được
dự đoán nội suy 2 chiều
185
Nén video
Cấu trúc
dòng bit MPEG
186
187
Cấu trúc
dòng bit MPEG
188
Nén video
Mô hình mã hóa MPEG
189
Nén video
Đánh giá chuyển động (Motion Estimation) : xác định
vector chuyển động
Bù chuyển động (Motion Compensation) : khôi phục
ảnh bằng cách sử dụng vector chuyển động và sai số
chuyển động (phần sai lệch giữa 2 frame)
190
Nén video
Quá trình nén frame I
191
Nén video
Quá trình nén frame P
Frame B ?
192
Giải thuật đối sánh, xác định vector
chuyển động
Các file đính kèm theo tài liệu này:
- multimedia_ngoctn_1823.pdf