Bài giảng Công cụ Multimedia

Những khái niệm cơ bản của Multimedia

 Các dạng dữ liệu Multimedia

 Văn bản.

 Âm thanh.

 Hình ảnh tĩnh và đồ họa.

 Hình ảnh động.

 Nén thông tin đa phương tiện và các chuẩn

 Nhu cầu nén đa phương tiện

 Nén không mất thông tin và nén mất thông tin

 Phương pháp nén văn bản

 Phương pháp nén âm thanh

 Phương pháp nén ảnh tĩnh

 Phương pháp nén ảnh động

pdf192 trang | Chia sẻ: Mr Hưng | Lượt xem: 1155 | Lượt tải: 0download
Bạn đang xem trước 20 trang nội dung tài liệu Bài giảng Công cụ Multimedia, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
át tín hiệu điều khiển thanh ghi bộ nhớ  Địa chỉ trở về trên bus dữ liệu được ghi vào vị trí xác định ở ngăn xếp SP  Địa chỉ lệnh đầu tiên của chương trình con điều khiển ngắt được náp vào PC. 118 3.4 Các kỹ thuật xử lý  Sound Card  Trong máy tính Sound Card là một bo mạch mở rộng các chức năng về âm thanh, thông qua các phần mềm nó cho phép ghi lại âm thanh (đầu vào) hoặc trích xuất âm thanh (đầu ra) thông qua các thiết bị chuyên dụng khác.  Chức năng chính  Trích xuất các tín hiệu âm thanh dạng tín hiệu tương tự hoặc tín hiệu số tới các loa  Ghi lại âm thanh để lưu trữ như tiếng nói, âm thanh tự nhiên, âm nhạc, phim thông qua các ngõ đầu vào.  Xử lý và phát lại âm thanh từ các thiết bị khác: Phát âm thanh trực tiếp từ các ổ đĩa quang, thiết bị phát MIDI.  Kết nối các bọ điểu khiển game như joystick.  Phân loại  Sử dụng bus ISA  Sử dụng bus PCI  Sử dụng bus USB 119 3.4 Các kỹ thuật xử lý  Sound Card  Các đặc điểm  Nhiễu (Noise): nhiễu cho phép trong khoảng -90 dB.  Distortion: nguyên nhân là do sự xuất hiện của những tần số âm thanh khác trên tần số âm thanh phát ra và gây nhiễu, được tính ra đơn vị %. THD (Total Harmonic Distortion): 0.005%.  Nhiễu xuyên kênh: xuất hiện do có nhiều kênh âm thanh phát ra cùng một lúc. Nhiễu cho phép là khoảng -90 dB.  Dynamic range và SNR (Signal-to Noise Ratio): được tính bằng tỉ số của âm thanh to nhất không bị méo và nhiễu, giá trị cho phép là 90 dB. 120 3.5 Các kỹ thuật hiển thị  Màn hình CRT  Quét mặt màn hình thủy tinh bằng chùm tia điện tử, bản thân mặt người không nhìn thấy chùm tia quét do sự lưu ảnh trên võng mạc.  Các hạt huỳnh quang trên màn hình phát sáng do va chạm với các hạt điện tử.  Điểm sáng được hợp thành từ ba điểm đơn sắc: Red, Green và Blue. 121 3.5 Các kỹ thuật hiển thị  Màn hình CRT  Các đặc điểm  Độ phân giải: là số điểm có thể hiển thị.  Kích thước màn hình:  CRT 15” với độ phân giải 800x600  CRT 17” với độ phân giải 1024x768  CRT 19”-21” với độ phân giải 1280x1024 - 1600x1200  Dot pitch: là khoảng cách giữa hai pixel, giá trị thông thường của nó trong khoảng từ 0.22 – 0.3 mm.  Tần số quét: tương đương số lượng hình ảnh hiển thị trong một đơn vị thời gian, với tần số > 75 Hz thì mắt người sẽ không cảm nhận thấy màn hình nháy.  Hai dạng quét: là progressive và interlace.  Interlace quét và hiển thị các dòng chắn sau đó đến các dòng lẻ, do đó hình ảnh bị nhấp nháy dễ làm mỏi mắt. Màn hình TV làm theo kỹ thuật Interlace. 122 3.5 Các kỹ thuật hiển thị  Màn hình CRT  Một số vấn đề  3 súng bắn tia điện tử cùng hoạt động đồng thời và phải cùng tìm thấy một điểm duy nhất trên màn hình.  Độ chính xác của hệ thống điều khiển hướng.  Ưu điểm  Sử dụng các hạt huỳnh quang cho chất lượng ảnh tốt.  Góc nhìn 180o  Giá thành thấp  Nhược điểm  Tiêu tốn năng lượng: 150 watt với màn hình 17”.  Vấn đề hội tụ  Tạo ra các tia có hại cho sức khỏe  Cồng kềnh và nặng 123 3.5 Các kỹ thuật hiển thị  Màn hình TFT  Màn hình TFT thông thường gồm có hai bộ lọc phân cực:  Một bộ lọc có hướng phân cực cố định  Một bộ lọc khác được làm từ tinh thể lỏng.  Sự thay đổi của điện trường sẽ dẫn đến sự thay đổi của cấu trúc lớp tinh thể lỏng và làm thay đổi hướng phân cực. Sự thay đổi điện trường là do một lưới các bóng bán dẫn (transistor) tạo ra. 124 3.5 Các kỹ thuật hiển thị  Màn hình TFT  TN+Film  Giữa hai tầng phân cực cố định có một lớp tinh thể lỏng. Các tinh thể lỏng khi tạo thành các đường xoắn có thể cho phép ánh sáng đi qua và tạo thành một điểm sáng trên màn hình. Tuy nhiên dưới sự tác động của điện trường, các tinh thể này bị xáo trộn và ngăn ánh sáng lại và tạo thành các điểm tối. 125 3.5 Các kỹ thuật hiển thị  Màn hình TFT  TN+Film  Ưu điểm:  Là loại màn hình tốc độ làm mới nhanh nhất khoảng 4 ms.  Giá thành thấp  Tiêu thụ điện năng thấp nhất nên có thể được sử dụng cho các màn hình laptop.  Nhược điểm:  Sự xáo trộn của các tinh thể không phải là hoàn hảo nên nó không tạo thành màu đen tuyệt đối, do đó độ tương phản của màn hình này thấp.  Không thể điều chỉnh các tinh thể lỏng tối ưu, nên số lượng màu có thể biểu diễn giảm đi đáng kể. Mỗi một kênh màu chỉ biểu diễn được bằng 6 bit, như vậy màn hình hiển thị được 264.000 màu sắc khác nhau.  Màn hình thường xuất hiện hiện tượng một bên sáng hơn và một bên tối hơn.  Màn hình LG 1915S – 19” có góc nhìn 140o, độ tương phải 1:500, thời gian trả lời 12 ms với độ sáng tương đương 250 cd/m2. 126 3.5 Các kỹ thuật hiển thị  Màn hình TFT  ISP/S-ISP  Màn hình này ở trạng thái bình thường các tinh thể lỏng có hướng vuông góc với hướng của các tầng phân cực. Chính vì thế khi không có tác động của điện trường, nó sẽ không cho ánh sáng đi qua tạo thanh màu đen. 127 3.5 Các kỹ thuật hiển thị  Màn hình TFT  MVA/PVA  Ưu điểm:  Có thời gian trả lời lớn.  Góc nhìn thấp hơn so với màn hình IPS và có độ tương phản khoảng 1:300.  Màn hình LG 1910P có góc nhìn 176o, độ tương phải 1:400, cường độ sáng 250 cd/m2 và thời gian trả lời là 25 ms. 128 3.5 Các kỹ thuật hiển thị  So sánh TFT và CRT  CRT theo quan điểm của nhiều người cho chất lượng hình ảnh tổt hơn, nhưng trên thực tế TFT cho ảnh tự nhiên hơn rất nhiều.  TFT có góc nhìn kém như trường hợp của TN+film, góc nhìn là 140o.  TFT có thời gian trả lời lâu hơn.  Màn hình Plasma  Màn hình này gồm khí trong đó có các hạt ion và electron. Khi hai hạt này va chạm với nhau nó sẽ tạo ra tia sáng, thường là các tia cực tím.  Màn hình này có độ tương phản tốt, có thời gian sử dụng là khoảng 60.000 giờ.  Màn hình Panasonic TH-65PHD7E, 65” có độ phân giải 1366x768, sử dụng 30 bit cho một kênh. Độ tương phải là 1:3000 và góc nhìn khoảng 160o. 129 3.6 Các kỹ thuật truyền dẫn  Modem không đồng bộ:  Modulation and Demodulation.  Nhận và gửi thông tin thông qua mạng điện thoại công cộng.  Khi gửi thông tin từ máy tính: phải chuyển đổi thông tin từ dạng số sang dạng tương tự.  Khi nhận thông tin từ mạng điện thoại: phải chuyển đổi thông tin từ dạng tương tự sang dạng số.  Tốc độ truyền dữ liệu: 56 Kbps 130 3.6 Các kỹ thuật truyền dẫn  Mạng ISDN  Mạng ISDN – Intergrated Services Digital Network  ISDN là mạng truyền thông số.  Là công nghê truyền thông hoàn toàn dạng số được xây dựng trên cơ sở hạ tầng của mạng điện thoại công cộng.  Mạng điện thoại tương tự:  Dịch vụ điện thoại tương tự chỉ cho phép sử dụng từng đường điện thoại độc lập cho thiết bị  Khối lượng thông tin được truyền hạn chế: hiện nay với kỹ thuật tương tự, tốc độ truyền thông tin chỉ đạt 56Kbps.  ISDN:  Cho phép sử dụng đường điện thoại tiêu chuẩn và chuyển thành đường truyền số cho phép truyền tải đồng thời dữ liệu âm thanh, hình ảnh và các dạng dữ liệu khác.  Cung cấp nhiều kênh dữ liệu trên cùng một dây điện thoại tiêu chuẩn. Mỗi kênh có tốc độ truyền 64Kbps.  Đường truyền số cho phép giảm nhiễu và sự giao thoa của sóng điện từ trên các kênh mang 131 3.6 Các kỹ thuật truyền dẫn  Các kênh ISDN  Giao diện ISDN 132 3.6 Các kỹ thuật truyền dẫn  Các nhóm chức năng  ASDL (Asymmetric Digital Subriber Line)  Công nghệ bất đối xứng tốc độ tải xuống > tốc độ tải lên  Mạch ADSL được kết nối với một modem ADSL bằng đường dây cáp xoắn thao tạo ra 3 kênh khác nhau:  Kênh tải xuống tốc độ cao (1.5 – 9 Mbps)  Kênh song công tốc độ trung bình (16-640 kbps)  Kênh cơ bản đề truyền dịch vụ thoại.  ADSL modem truyền tốc độ tương thích với chuẩn Bắc Mỹ T1 – 1.544 Mbps và Châu Âu E1 – 2.048 Mbps (cho tốc độ tải xuống 6.1 Mbps và 64 kbps kênh song công). TE1 S T U NT2 ET TA LTNT1 R V USER SIDE Đường kết nối Tổng đài số 133 3.6 Các kỹ thuật truyền dẫn  Mạch Ethernet 134 3.7. Nén dữ liệu  Khái niệm nén dữ liệu.  Các phương pháp nén không mất thông tin.  Các phương pháp nén mất thông tin. 135 Khái niệm về nén dữ liệu  Nhu cầu về nén dữ liệu  Sự phát triển mạnh mẽ của công nghệ truyền thông, kỹ thuật tính toán và Internet.  Sự mất cân bằng về:  Các khối dữ liệu lớn có thể được xử lý.  Các khối dữ liệu lớn có thể được lưu trữ.  Các khối dữ liệu lớn có thể được truyền.  Vấn đề đặt ra: Do không đáp ứng được các yêu cầu về xử lý, lưu trữ và truyền thông, vấn đề đặt ra là: giảm kích thước khối dữ liệu mà không làm giảm lượng thông tin chứa trong đó.  Ví dụ:Một dòng video: 25 hình /s, mỗi hình chứa 16 triệu màu, độ phân giải 640x480.  Tốc độ tạo thông tin: 25 x 8 x 3 x640 x 480 =184320000bit/s = 23Mo/s  Với 2h video, lượng dữ liệu sinh ra bằng 162GB  ứng dụng:  Lưu trữ thông tin: trong các ngân hàng ảnh, đĩa DVD.  Truyền thông:truyền ảnh trên mạng Internet, mạng không dây. 136 Khái niệm về nén dữ liệu  Các tiêu chuẩn lựa chọn các phương pháp nén dữ liệu:3 tiêu chuẩn  Tỷ lệ nén: tỷ lệ giữa kích thước khối thông tin sau khi nén với kích thước trước khi nén.  Chất lượng nén:  Nén mất thông tin.  Nén không mất thông tin.  Chất lượng cảm nhận thông tin  Tốc độ của các thuật toán:  Tốc độ nén.  Tốc độ giải nén. 137 Nén không mất thông tin  Phương pháp nén không mất thông tin cho phép khôi phục lại hoàn toàn khối dữ liệu ban đầu qua các chu trình nén – giải nén.  Đòi hỏi phải có thiết bị lưu trữ và đường truyền lớn  Các thuật toán của nén không mất dữ liệu dựa vào việc thay thế một nhóm các ký tự trùng lặp bởi một nhóm các ký tự đặc biệt khác ngắn hơn không quan tâm tới ý nghĩa của dữ liệu  Run-Length Encoding (RLE), Huffman Coding, Arithmetic coding, Shannon-Fano Coding, LZ78, LZH, LZW ... 138 Nén không mất thông tin  Ba dạng thuật toán nén không mất thông tin:  Các thuật toán mã hoá thống kê:  Các thuật toán này hoạt động dựa trên tần suất xuất hiện của các ký tự mã trong khối thông tin. Giảm số lượng bit dùng để biểu diễn các ký tự mã xuất hiện thường xuyên.  Tăng số lượng bit dùng để biểu diễn những ký tự mã ít xuất hiện.  Các thuật toán dựa trên sự thay thế các chuỗi: các thuật toán này nén các chuỗi chứa các ký tự đồng nhất.  Các thuật toán dựa trên từ điển:  Giảm số lượng các bit dùng để chứa các từ xuất hiện thường xuyên.  Tăng số lượng các bit để chứa các từ xuất hiện thưa thớt.  Các đặc tính:  Thuật toán đơn giản.  Tỷ lệ nén thấp.  Thích hợp với nén ảnh và văn bản. 139 Các phương pháp nén không mất thông tin  Phương pháp nén Shannon-Fano.  Nguyên lý:  Các từ mã có độ dài biến thiên.  Độ dài mã tỷ lệ nghịch với xác suất xuất hiện của ký tự.  Từ mã được giải mã một cách duy nhất.  Thuật toán:  Xác định các xác suất xuất hiện của các ký tự trong bản tin.  Sắp xếp các ký tự theo trình tự xác suất xuất hiện giảm dần.  Phân chia các ký tự thành hai nhóm có tổng xác suất xấp xỉ(nếu dùng mã nhị phân thì phân chia làm hai nhóm, nếu mã cơ số m thì chia làm m nhóm).  Gán cho mỗi nhóm ký hiệu mã 0 hoặc 1.  Tiếp tục phân chia cho tới khi trong các nhóm chỉ chứa một ký hiệu.  Từ mã cho ký hiệu là tổ hợp của các ký hiệu của các nhóm chứa ký hiệu tính theo thứ tự từ lần tạo nhóm đầu tiên. 140 Các phương pháp nén không mất thông tin  Ví dụ:  Cho thông điệp “BBCAACADBDCADAEEEABAC DBACADCBADABEABEAAA” Tần suất xuất hiện của các ký tự trong thông điệp lần lượt bằng: A: 15; B: 8; C: 6; D: 6; E: 5. A: 00; B: 01; C: 10; D: 110; E: 111. Số lượng bit dùng để chứa chuỗi mã: 2x15+2x8+2x6+3x6+3x5=91bit. Nếu dùng mã ASCII: 40x8=320bit. Tỷ lệ nén: 91/320 = 28% Mã Fano là mã có tính prefix. 141 Các phương pháp nén không mất thông tin  Phương pháp Huffman.  Nguyên lý: tương tự mã Shannon-Fano.  Thuật toán:  Xây dựng danh sách các ký tự với xác suất xuất hiện giảm dần.  Các ký tự sẽ là các nút của cây Huffman.  Mã hoá bắt đầu với hai ký hiệu có xác suất nhỏ nhất. Hai ký hiệu được hợp lại, hai nhánh được gán ký hiệu 0 hoặc 1.  Nút của hai nhánh được coi là một ký hiệu mới có xác suất xuất hiện bằng tổng hai xác suất xuất hiện của hai ký hiệu tạo ra nút.  Tiếp tục quá trình trên với hai nút có xác suất xuất hiện nhỏ nhất.  Từ mã ứng với mỗi ký hiệu nguồn là tổ hợp của các ký hiệu mã ở các nhánh tính từ gốc.  Các ưu điểm:  Cho phép thực hiện tốt với hình ảnh cũng như text.  Tỷ lệ nén trung bình: 50%.  Tốc độ nén nhanh. 142 Các phương pháp nén không mất thông tin  Ví dụ: với cùng thông điệp trước: “BCAACADBDCADAEEEABACDBACADCBADABEABEAAA” A: 17; B: 7; C: 6; D: 6; E: 5. A: 0; B:100; C: 101; D: 110; E: 111 Mã Huffman có tính prefix. Số lượng bit dùng để chứa chuỗi mã: 1x17+3x7+3x6+3x6+3x5=87 Tỷ lệ nén: 87/320=27% 143 Các phương pháp nén không mất thông tin  Phương pháp thay thế RLE(Run Length Encoding).  Nguyên lý:  Tối ưu hoá mã bằng cách thay thế các chuỗi ký tự giống nhau liên tiếp.  ứng dụng trong các loại ảnh BMP, TIFF. Các điểm ảnh liên tiếp có giá trị như nhau sẽ được thay thế bằng một điểm ảnh và chỉ rõ số lượng điểm.  Các bước thuật toán:  Tìm trong thông điệp những ký tự liên tiếp lặp lại.  Thay thế chuỗi ký tự đó bằng:  Một ký tự đặc biệt chỉ việc nén.  Số lần lặp lại của ký tự.  Ký tự lặp lại được nén.  Ví dụ:  Cho chuỗi “ABCCCCCCDDEEEE”  Chọn ký tự nén: #  Chuỗi sau khi nén: AB#6CDD#4E  Tỷ lệ nén: 57% 144 Các phương pháp nén không mất thông tin  Phương pháp LWZ  Nguyên lý:  Phân tích thông điệp.  Lần lượt lập bảng chứa vị trí xuất hiện của các từ tìm thấy trong thông điệp.  Giảm số lượng bit để mã hoá những từ xuất hiện thường xuyên.  Tăng số lượng bit để mã hoá những từ ít gặp hơn.  đặc tính:  ít hiệu quả đối với ảnh.  Có hiệu quả cao với text hoặc dữ liệu số. Lỷ lệ nén có thể đạt tới 50%.  Các bước thuật toán:  Thông điệp được phân chia thành những khối có độ dài thay đổi. Các khối này gọi là các câu.  Một câu mới là một khối của ký tự nguồn và thêm một ký tự cuối.  Các câu được liệt kê trong từ điển kèm theo vị trí xuất hiện.  Để mã hoá một câu mới ta chỉ vị trí của câu trong từ điển và chèn thêm ký hiệu mới vào cuối. 145 Các phương pháp nén không mất thông tin  Ví dụ: Chuỗi ký tự: PQPQPQRPQRPQRPQRPQR Từ điển: 256 PQ 257 QR 258 PQP 259 PQR 260 PQRPQR Kết quả mã hoá: 256 256 260 260 259 Tỷ lệ nén: 2 x 5 / 1 x 19 = 53%  Để giải mã ta cũng phải lập có từ điển và tra cứu ngược lại trong từ điển 146 Các phương pháp nén mất thông tin  Nhận xét về các phương pháp nén không mất thông tin:  Tỷ lệ nén trung bình của các phương pháp nén không mất thông tin khoảng 40%.  Các phương pháp này không thích hợp với thông tin Multimedia.  Nguyên lý nén mất thông tin.  Dựa vào khả năng cảm nhận của thị giác và thính giác.  Giữ những thông tin quan trọng trong cảm nhận bằng thị giác và thính giác.  Loại bỏ những thông tin dư thừa đối với cảm nhận.  Nén âm thanh.  Dựa vào khả năng cảm nhận âm thanh của thính giác:  Từ 20Hz đến 20KHz.  Cảm nhận cực đại trong khoảng: từ 2 KHz – 5KHz  Các phương pháp DPCM, ADPCM, LPC. 147 Nén âm thanh  Một số phương pháp nén âm thanh  PCM (Pulse-Code Modulation)  DPCM (differential pulse-code modulation)  ADPCM (Adaptive Differential PCM)  PASC (Perceptual Audio Sub-band Coding)  LPC (Linear predictive coding) 148 Các phương pháp nén mất thông tin  Phương pháp PCM  PCM(Pulse Code Modulation). Biểu diễn các tín hiệu số bằng chuỗi các xung.  Dùng để mã hóa tương tự - số  Tuân theo định lý Nyquist-Shannon 149 Nén âm thanh  Phương pháp DPCM  Giảm tỷ lệ dữ liệu của PCM bằng cách mã hoá sự khác biệt giữa giá trị các mẫu.  Mã hoá dự đoán: dự đoán mẫu thứ n+1 theo tổ hợp tuyến tính của n mẫu tín hiệu trước đó.  ai là n hệ số dự đoán     1 0 )()(~ n i i isans 150 Nén âm thanh 151 Nén âm thanh  Phương pháp DM (Delta Modulation) :  Là trường hợp riêng của phương pháp DPCM  Mã hóa sai khác chỉ dùng 1 bit  Mã hóa 0 hoặc 1 tùy thuộc vào cường độ tín hiệu xung hiện tại so với xung trước đó  Ưu nhược điểm  Đơn giản  Mã hóa ít bit  Độ chính xác không cao, sai số lớn  Tỉ lệ SNR thấp  Phương pháp tăng cường hiệu năng  Tăng tần số mã hóa 152  Phương pháp DM (tiếp) 153 Nén âm thanh  ADPCM(Adaptive Differential PCM):  Phương pháp DPCM có hạn chế là : bộ dự đoán và lượng tử hóa là cố định  hiệu năng thay đổi tùy vào dữ liệu đầu vào  ADPCM sử dụng các bộ dự đoán và lượng tử hóa thích nghi dựa vào các dữ liệu đã nhận được trước đó  tối thiểu hóa sự sai khác giữa mẫu dự đoán và mẫu thực tế  Bộ dự đoán thích nghi : thay đổi tham số tùy thuộc đầu vào trước đó  Lượng tử thích nghi : thay đổi các bước lượng tử hóa khác nhau  ADPCM sử dụng trong các thiết bị CD-i và DVI.  Chuẩn ADPCM: CCITT G.721.  Tỷ lệ nén: 4:1 đến 2:1 154 Nén âm thanh 155 Nén âm thanh  Phương pháp PASC (Perceptual Audio Sub-band Coding)  Là phương pháp dựa trên SBD (Sub-band Coding) : chia một tín hiệu thành nhiều dải tần con  mã hóa mỗi dải tần riêng biệt  Mã hóa dự vào cảm nhận âm thanh của con người  Cảm nhận từ 20Hz – 20kHz  Nhưng cảm nhận âm thanh không đồng đều ở các tần số khác nhau  Hiệu ứng che tần số : âm thanh tần số mạnh che âm thanh tần số yếu  Được sử dụng trong mã hóa âm thanh chuẩn MPEG 1,2,4  MP3 : MPEG-1 or MPEG-2 Audio Layer III  Mã hóa dùng 32 băng tần con, mã hóa cảm nhận và Entropy 156 Nén âm thanh 157 Nén âm thanh  Phương pháp LPC (Linear Predictive Coding)  Mã hóa tiếng nói dựa vào các tham số  tổng hợp giọng nói  Dựa vào cấu tạo hình thành âm thanh con người  Dây thanh quản  Vòng họng  Miệng+mũi  Phân tích và tổng hợp lại các âm con người phát ra  Ứng dụng :  Phân tích và tái tạo tiếng nói  Sử dụng trong việc truyền âm thanh số, mã hóa trong điều kiện tốc độ thấp  Sử dụng kết hợp với các kỹ thuật khác 158 159 Nén mất Thông tin: nén ảnh và video  Ảnh được khôi phục không giống hoàn toàn với ảnh gốc  Thích hợp cho việc lưu trữ và truyền ảnh tĩnh, video qua một mạng có băng thông hạn chế  Differential Encoding, Discrete Cosine Transform(DCT), Vector Quantization, JPEG (Joint Photographic Experts Group) và MPEG (Motion Picture Experts Group) 160 Nén ảnh  Các phương pháp nén ảnh có mất tín hiệu gồm có 4 bước như hình . Sơ đồ cơ bản của bộ mã hoá  Các bộ mã hoá khối có thể dựa trên hai nguyên tắc biến đổi cơ bản: Discrete Cosine Transform (DCT) và Vector Quantization (VQ) 161 Nén ảnh 162 Nén ảnh  Phương pháp nén ảnh JPG:  Nguyên lý: 4 bước thực hiện  Biến đổi hệ toạ độ màu.  Thay đổi các bước lấy mẫu: các điểm được nhóm theo các thông tin về màu thành các nhóm 2 điểm hoặc 4 điểm.  Thực hiện phép biến đổi từ miền không gian về miền tần số không gian.  Lượng tử hóa không đều các hệ số biến đổi  Sử dụng các thuật toán nén RLE và Huffman. 163  Biến đổi hệ màu RGB  YCbCr  Do mắt người nhạy với thành phần Y hơn so với Cb, Cr nên giảm số bit lưu trữ Cb, Cr 164 Nén ảnh 165 Nén ảnh  Ta có thể xác định 64 giá trị chỉ bằng 5 số ngyên nếu ta ap dụng công thức discrete cosine transform (DCT)  Bộ giải mã có thể tái tạo lại giá trị của các pixel thông qua công thức inverse discrete cosine transform (IDCT) c 166 Nén ảnh 167 Nén ảnh – ví dụ DCT Tru 128 168 Nén ảnh – ví dụ 169 170 171 Nén ảnh  Chuẩn JPEG 2000  JPEG đã đưa ra một chuẩn nén ảnh mới là JPEG2000. JPEG2000 sử dụng biến đổi Wavelet và các phương pháp mã hoá đặc biệt để có được ảnh nén ưu việt hơn hẳn JPEG.  JPEG2000 có nhiều chức năng đặc biệt hơn các chuẩn nén ảnh tĩnh khác như JPEG hay GIF. Dưới đây là các chức năng ưu việt của JPEG2000 so với các chuẩn nén ảnh tĩnh khác  Cho chất lượng ảnh tốt nhất khi áp dụng nén ảnh tĩnh có tổn thất.  Sử dụng được với truyền dẫn và hiển thị luỹ tiến về chất lượng, độ phân giải, các thành phần màu và có tính định vị không gian.  Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén.  Truy nhập và giải nén tại mọi thời điểm trong khi nhận dữ liệu.  Giải nén từng vùng trong ảnh mà không cần giải nén toàn bộ ảnh  Có khả năng mã hoá ảnh với tỷ lệ nén theo từng vùng khác nhau  Nén một lần nhưng có thể giải nén với nhiều cấp chất lượng tuỳ theo yêu cầu của người sử dụng 172 Nén ảnh 173 Nén ảnh 174 Nén ảnh 175 Nén ảnh So sánh chuẩn JPEG và JPEG2000 với tỉ lệ 0.25 bpp, CR = 32 176 Nén video  Đối với tín hiệu video số, số lượng bit được sử dụng để truyền tải thông tin đối với mỗi miền tần số khác nhau, có nghĩa là: miền tần số thấp, nơi chứa đựng nhiều thông tin, được sử dụng số lượng bít lớn hơn và miền tần số cao, nơi chứa đựng ít thông tin, được sử dụng số lượng bít ít hơn.  Thực chất của kỹ thuật “nén video số” là loại bỏ đi các thông tin dư thừa. Các thông tin dư thừa trong nén video số thường là:  Độ dư thừa không gian giữa các pixel;  Độ dư thừa thời gian do các ảnh liên tiếp nhau;  Độ dư thừa do các thành phần màu biểu diễn từng pixel có độ tương quan cao;  Độ dư thừa thống kê do các kí hiệu xuất hiện trong dòng bít với xác suất xuất hiện không đều nhau;  Độ dư thừa tâm lý thị giác (các thông tin nằm ngoài khả năng cảm nhận của mắt).vv 177 Nén video  MJPEG (Motion JPEG) – là việc sử dụng chuẩn mã hóa video sử dụng các frame được mã hóa bằng chuẩn nén ảnh JPEG  Đơn giản – các frame độc lập với nhau  Giới hạn mã hóa 1:20  MJPEG được phát triển cho các máy tính cá nhân, hiện nay dùng các thiết bị khác. Hiện nay MJPEG được ứng dụng cho  Máy quay số  Thu nhận và chỉnh sửa video  IP Camera  Sử dụng cho các thiết bị hiển thị video 178 Nén video  MPEG (Moving Picture Expert Group) là nhóm chuyên gia về hình ảnh, được thành lập từ tháng 2 năm 1988 với nhiệm vụ xây dựng tiêu chuẩn cho tín hiệu Audio và Video số. Ngày nay, MPEG đã trở thành một kỹ thuật nén Audio và Video phổ biến nhất  MPEG-1, mã hoá tín hiệu Audio-Video với tốc độ khoảng 1.5Mb/s và lưu trữ trong đĩa CD.  MPEG-2 (1990) : MPEG-2 với “công cụ ” mã hoá khác nhau đã được phát triển. (3-15Mbps)  MPEG-4 (10/1998), Là chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ hoạ và video tương tác hai chiều (games, videoconferencing) và các ứng dụng multimedia tương tác hai chiều (World Wide Web, Internet video...)  MPEG-7: là một chuẩn dùng để mô tả các nội dung Multimedia, chứ không phải là một chuẩn cho nén và mã hoá audio/ảnh động như MPEG-1, MPEG-2 hay MPEG-4. MPEG-7 sử dụng ngôn ngữ đánh dấu mở rộng XML(Extansible Markup Language) để lưu trữ các siêu dữ liệu Metadata, đính kèm timecode để gắn thẻ cho các sự kiện, hay đồng bộ các dữ liệu. 179 180 Nén video  Các cấu trúc lấymẫu vỡ số hoá tín hiệu video  Đối với truyền hình số NTSC vỡ PAL, chuỗi video gồm các khung hình (frame ảnh) có độ phân giải 576 x 720, các dòng video chứa 720 điểm ảnh đ−ợc lấy mẫu vỡ số hoá theo các cấu trúc sau : 181 Nén video 182 Nén video 183 Nén video  Các chuẩn nén video hầu hết đều sử dụng 2 kỹ thuật chính là :  Nén video không dùng kỹ thuật phát hiện và bù chuyển động - MJPEG  Nén video dùng kỹ thuật phát hiện và bù chuyển động  Nén ảnh tĩnh để giảm độ dư thừa không gian  Đánh giá, ước lượng chuyển động để giảm độ dư thừa về mặt thời gian 184 Nén video  Phân loại các frame video  Frame I : là frame đầu tiên trong chuỗi video  Frame P : (predicted frame) – frame được dự đoán tiếp theo  Frame B (Bi-directional interpolated prediction frame) - frame được dự đoán nội suy 2 chiều 185 Nén video Cấu trúc dòng bit MPEG 186 187 Cấu trúc dòng bit MPEG 188 Nén video  Mô hình mã hóa MPEG 189 Nén video  Đánh giá chuyển động (Motion Estimation) : xác định vector chuyển động  Bù chuyển động (Motion Compensation) : khôi phục ảnh bằng cách sử dụng vector chuyển động và sai số chuyển động (phần sai lệch giữa 2 frame) 190 Nén video  Quá trình nén frame I 191 Nén video  Quá trình nén frame P Frame B ? 192 Giải thuật đối sánh, xác định vector chuyển động

Các file đính kèm theo tài liệu này:

  • pdfmultimedia_ngoctn_1823.pdf
Tài liệu liên quan