Bài giảng truyền thông đa phương tiện

Sản phẩm của công nghệ Multimedia đã và đang xâm nhập ngày càng sâu, rộng vào mọi lĩnh vực của đời sống xã hội. Có thể nói các sản phẩm của công nghệ có mặt ở khắp mọi nơi, từ công sở đến gia đình. Nó xuất hiện trong nhiều lĩnh vực từ giáo dục, y tế, đến vui chơi giải trí, nghiên cứu khoa học v.v.

Sức mạnh của các sản phẩm do công nghệ Multimedia mang lại là sự đa dạng phong phú của các dạng thông tin. Người ta có thể thu nhận, sử lý thông tin thông qua thị giác, thính giác nhờ âm thanh, hình ảnh, văn bản mà công nghệ Multimedia mang lại. Điều này làm cho hiệu quả thu nhận, sử lý thông tin cao hơn so với thông tin chỉ ở dạng văn bản.

Ý tưởng đặt nền móng cho lĩnh vực công nghệ này đã có từ năm 1945. Ông Vanner Brush ,giám đốc cơ quan nghiên cứu phát triển khoa học của chính phủ Mỹ lúc bấy giờ (Director ofthe office Scientific Research and Development in the US Gouverment) đã đưa ra câu hỏi là, liệu có thể chế tạo được loại thiết bị cho phép lưu trữ các dạng thông tin để thay cho sách, nói một cách khác chẳng nhẽ mọi thông tin chỉ có thể lưu trữ ở dạng sách ? Nhận thức được ý nghĩa quan trọng của loại thiết bị có tính chất trên, hàng loạt các nhà khoa học, công nghệ đã tập trung nghiên cứu. Nó là cở sở hay nền tảng của công nghệ Multimedia ngày nay.

Năm 1960 Ted Nelson và Andrries Van Dam đã công bố công trình nói về kỹ thuật truy nhập dữ liệu dưới cái tên gọi Hypertext và Hypermedia. Kỹ thuật này cho đến nay vẫn được giữ nguyên tên và được sử dụng rộng rãi trong dịch vụ Web trên Internet. Năm 1968 Engleband đã đưa ra được hệ thống sử dụng Hypertext trên máy tính với cái tên NLS. Bộ quốc phòng Mỹ thành lập tổ chức DARPA (US deference advanced Research Prọject Agency) để nghiên cứu về công nghệ Multimedia. Năm 1978 phòng thí nghiệm khổng lồ MIT Media Laboratory chuyên nghiên cứu về công nghệ Multimedia được thành lập. Chỉ sau một thời gian ngắn hoạt động, nhận thức được tầm quan trọng và ý nghĩa xã hội của công nghệ Multimedia, người ta đã đầu tư gần 40 triệu USD cho phòng thí nghiệm này. Một loạt các công ty, các hãng lớn đã cho ra đời các phòng thí nghiệm về Multimedia như AT & T, BELL, Olivity.Những nỗ lực không ngừng của các nhà khoa học,công nghệ đã cho phep người ta gặt hái được nhiều kết quả có tính chất nền móng cho lĩnh vực Multimedia .

 

doc161 trang | Chia sẻ: luyenbuizn | Lượt xem: 3320 | Lượt tải: 4download
Bạn đang xem trước 20 trang nội dung tài liệu Bài giảng truyền thông đa phương tiện, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC KINH TẾ - KỸ THUẬT CÔNG NGHIỆP KHOA CÔNG NGHỆ THÔNG TIN BÀI GIẢNG TRUYỀN THÔNG ĐA PHƯƠNG TIỆN Đối tượng: HSSV trình độ Đại học, Cao đẳng, TCCN Ngành đào tạo: Công nghệ thông tin Lưu hành nội bộ MỤC LỤC LỜI GIỚI THIỆU 1 Chương 1. NHẬP MÔN MULTIMEDIA 1.1. Tổng quan 1.2. Mô hình truyền thông con người 1.2.1. Hệ thống vật lý 1.2.2. Sự mã hóa đơn giản 1.2.3. Sự cảm nhận 1.2.4. Bộ nhớ 1.2.5. Hệ thống nhận thức 1.2.6. Hệ thống nhớ 1.3. Ước lượng và hội tụ 1.3.1. Sự hội tụ của viễn thông và tin học 1.3.2. Các kiến trúc cho các ứng dụng mạng 1.3.3. Mạng máy tính 1.3.4. Tích hợp 1.3.5. Tính toán có thể vận chuyển được 1.3.6. Các trình ẩn thông minh 1.3.7. Sự hội tụ Chương 2. KHÁI NIỆM CHUNG VỀ ÂM THANH AUDIO VÀ VIDEO 2.1. Kỹ thuật Audio 2.1.1. Khái niệm 2.1.2. Ứng dụng 2.1.3. Kỹ thuật Audio số 2.1.4. Giới thiệu về âm thanh và hệ thống xử lý âm thanh 2.1.5. Một số khái niệm toán học trong xử lý âm thanh 2.1.6. Các mô hình dùng trong xử lý âm thanh 2.2. Kỹ thuật Video 2.2.1. Tổng quan về xử lý ảnh và video số 2.2.2. Khái niệm cơ bản về xử lý ảnh 2.2.3. Các phần tử cơ bản của hệ thống xử lý ảnh số 2.2.4. Lý thuyết toán ứng dụng trong xử lý ảnh và video số Chương 3. NGUYÊN LÝ, KỸ THUẬT VÀ CÁC CHUẨN NÉN DỮ LIỆU MULTIMEDIA: ÂM THANH, HÌNH ẢNH, VIDEO KỸ THUẬT SỐ 3.1. Công nghệ đường truyền tốc độ cao 3.2. Mạng đa phương tiện, các công nghệ và kiến trúc. 3.3. Các giao thức truyền thông đa phương tiện thời gian thực 3.4. Nguyên lý nén dữ liệu 3.5. Lượng tử hóa ảnh (Image Quantization) 3.6. Các phương pháp mã hóa (Shannon – fano và Huffman) 3.7. Kỹ thuật nén ảnh, video 3.7.1. Kỹ thuật nén ảnh JPEG 3.7.2. Chuẩn nén MPEG, chuẩn H.26X Chương 4. BẢO ĐẢM CHẤT LƯỢNG DỊCH VỤ (QoS) TRUYỀN THÔNG ĐA PHƯƠNG TIỆN 4.1. Các loại dịch vụ cơ bản và yêu cầu chung của chúng về chát lượng dịch vụ. 4.1.1. Dịch vụ thoại/telex/Fax/nhắn tin 4.1.2. Dịch vụ truyền thông đa phương tiện 4.2. Nhu cầu và xu hướng phát triển của các loại dịch vụ truyền thông đa phương tiện 4.2.1. Dịch vụ VoIP 4.2.2. Dịch vụ Video thời gian thực 4.2.3. Dịch vụ VPN 4.2.4. Tích hợp dịch vụ viễn thông trên mạng truyền hình cáp (CATV) 4.2.5. Dịch vụ trực tuyến (Online services) 4.2.6. Thông tin cá nhân toàn cầu - Dịch vụ cho tương lai. Chương 5. MỘT SỐ ỨNG DỤNG MULTIMEDIA 5.1. Mạng thông tin toàn cầu 5.2. Hệ thống hội thảo truyền hình (Videoconference Systems) 5.3. Hệ thống truyền hình theo yêu cầu (Video-on-demand System) TÀI LIỆU THAM KHẢO DANH MỤC TỪ KHÓA Chương 1 : NHẬP MÔN MULTIMEDIA 1.1. Tổng quan Sản phẩm của công nghệ Multimedia đã và đang xâm nhập ngày càng sâu, rộng vào mọi lĩnh vực của đời sống xã hội. Có thể nói các sản phẩm của công nghệ có mặt ở khắp mọi nơi, từ công sở đến gia đình. Nó xuất hiện trong nhiều lĩnh vực từ giáo dục, y tế, đến vui chơi giải trí, nghiên cứu khoa học v..v.. Sức mạnh của các sản phẩm do công nghệ Multimedia mang lại là sự đa dạng phong phú của các dạng thông tin. Người ta có thể thu nhận, sử lý thông tin thông qua thị giác, thính giác nhờ âm thanh, hình ảnh, văn bản mà công nghệ Multimedia mang lại. Điều này làm cho hiệu quả thu nhận, sử lý thông tin cao hơn so với thông tin chỉ ở dạng văn bản. Ý tưởng đặt nền móng cho lĩnh vực công nghệ này đã có từ năm 1945. Ông Vanner Brush ,giám đốc cơ quan nghiên cứu phát triển khoa học của chính phủ Mỹ lúc bấy giờ (Director ofthe office Scientific Research and Development in the US Gouverment) đã đưa ra câu hỏi là, liệu có thể chế tạo được loại thiết bị cho phép lưu trữ các dạng thông tin để thay cho sách, nói một cách khác chẳng nhẽ mọi thông tin chỉ có thể lưu trữ ở dạng sách ? Nhận thức được ý nghĩa quan trọng của loại thiết bị có tính chất trên, hàng loạt các nhà khoa học, công nghệ đã tập trung nghiên cứu. Nó là cở sở hay nền tảng của công nghệ Multimedia ngày nay. Năm 1960 Ted Nelson và Andrries Van Dam đã công bố công trình nói về kỹ thuật truy nhập dữ liệu dưới cái tên gọi Hypertext và Hypermedia. Kỹ thuật này cho đến nay vẫn được giữ nguyên tên và được sử dụng rộng rãi trong dịch vụ Web trên Internet. Năm 1968 Engleband đã đưa ra được hệ thống sử dụng Hypertext trên máy tính với cái tên NLS. Bộ quốc phòng Mỹ thành lập tổ chức DARPA (US deference advanced Research Prọject Agency) để nghiên cứu về công nghệ Multimedia. Năm 1978 phòng thí nghiệm khổng lồ MIT Media Laboratory chuyên nghiên cứu về công nghệ Multimedia được thành lập. Chỉ sau một thời gian ngắn hoạt động, nhận thức được tầm quan trọng và ý nghĩa xã hội của công nghệ Multimedia, người ta đã đầu tư gần 40 triệu USD cho phòng thí nghiệm này. Một loạt các công ty, các hãng lớn đã cho ra đời các phòng thí nghiệm về Multimedia như AT & T, BELL, Olivity...Những nỗ lực không ngừng của các nhà khoa học,công nghệ đã cho phep người ta gặt hái được nhiều kết quả có tính chất nền móng cho lĩnh vực Multimedia . Những kết quả này đa nhanh chóng được triển khai ứng dụng trong các lĩnh vực truyền hình, viễn thông v.v... 1.2. Một vài khái niệm và định nghĩa 1.2.1. Dữ liệu Multimedia Thông thường chúng ta thường ghi nhận thông tin ở dạng văn bản , các văn bản này được mã hoá và lưu giữ trên máy tính, khi đó chúng ta có dữ liệu dạng văn bản. Một câu hỏi đặt ra nếu thông tin chúng ta thu nhận được ở một dạng khác như âm thanh (voice) , hình ảnh (Image) thì dữ liệu của nó ở dạng nào? Chính điều này dẫn đến một khái niệm mới ta gọi đó là dữ liệu Multimedia. Dữ liệu Multimedia là dữ liệu ở các dạng thông tin khác nhau. Ví dụ dữ liệu Multimedia là các dữ liệu ở các dạng thông tin như - Âm thanh (Sound) - Hình ảnh (image) -Văn bản (text). - Kết hợp của cả ba dạng trên. Khi nghiên cứu các dữ liệu ở các dạng thông tin trên, người ta nhận ra rằng cần phải phân chia dữ liệu Multimedia nhỏ hơn nữa. Bởi vì dữ liệu ở các dạng âm thanh, hình ảnh trong quá trình "vận động" theo thời gian có những tính chất rất khác so với dạng tĩnh. Điều này đòi hỏi kỹ thuật, công nghệ xử lý rất khác nhau.Vì vậy trong lĩnh vực công nghệ Multimedia người ta chia dữ liệu multimedia ở các dạng: 1. Văn bản (Text) 2. Âm thanh (sound) 3. Audio (âm thanh động, có làn điệu) 4. Image/ Picture (Hình ảnh) 5. Motion picture (ảnh động) 6. Video (ảnh động kết hợp âm thanh động) 7. Animation (hình ảnh sử dụng theo nguyên tắc chiếu phim) 8. AVI (Audio-Video Interleaved AVI) 9. Kết hợp giữa các dạng trên. 1.2.2. Công nghệ Multimedia Một cách đơn giản công nghệ Multimedia là công nghệ xử lý dữ liệu multimedia Chúng ta cần lưu ý rằng khái niệm xử lý dữ liệu trong công nghệ thông tin bao hàm các công việc sau: mã hóa, lưu trữ, vận chuyển, biến đổi, thể hiện dữ liệu. Với ý nghĩa đó công nghệ Multimedia là công nghệ mã hóa, lưu trữ, vận chuyển, biến đổi, thể hiện dữ liệu multimedia. 1.2.3. Đồng bộ (synchronic) Đồng bộ là khái niệm rất quan trọng trong công nghệ multimedia, vì chúng ta biết rằng dữ liệu multimedia là dữ liệu của thông tin ở các dạng khác nhau, mỗi dạng cần phải có thiết bị và công nghệ xử lý khác nhau, khi kết hợp chúng lại vấn đề đồng bộ luôn được đặt ra. Chẳng hạn người ta không thể chấp nhận nghe tiếng súng nổ trước khi thấy súng bắn. Khái niệm đồng bộ hay đồng bộ hóa (Sychronization) có ý nghĩa quan trọng trong công nghệ multimedia. Vậy thế nào là đồng bộ? hay đồng bộ hóa đó là quá trình sự sắp xếp các "sự kiện" theo trật tự thời gian sao cho các sự kiện ở cùng trật tự thời gian phải xảy ra cùng một thời điểm. Các đối tượng được xem xét trong lĩnh vực Multimedia có thể là các thiết bị vật lý, cơ học và cũng có thể là các đối tượng trìu tượng được xem xét trong lĩnh vực lập trình theo hướng đối tượng. Các "sự kiện" được xem xét trong lĩnh vực Multimedia có thể là âm thanh, ánh sáng, mầu sắc... và thậm chí có thể là các vận động cơ học của các thiết bị. 1.3. Mô hình truyền thông con người Các khái niệm mã hóa Các xúc cảm mã hóa Giải mã các khái niệm Giải mã các xúc cảm Giải mã theo các từ Các giao thức liên quan đến nhận thức Các giao thức xúc cảm Các giao thức lời nói Mã hóa theo các từ Để dẫn nhập mô hình truyền thông của con người, chúng ta hãy xem xét các thành phần hiển nhiên rõ ràng của truyền thông con người. Trong bất kỳ hội thoại/giao tiếp nào giữa mọi người, hai kênh yếu tố khác trong hệ thống truyền thông là bộ nhớ hay văn hóa biểu thị chia sẻ của nó. Mỗi một chúng ta đều có bộ nhớ. Nó cung cấp môi trường suy nghĩ và văn hóa chia sẻ môi trường. Sự nhớ Nhận thức Ký ức Cảm xúc Các ký hiệu Sự nhớ Nhận thức Ký ức Cảm xúc Các ký hiệu Thế giới vật lý 6 5 4 3 2 1 Các kênh truyền thông con người 1998 IEEE Một số ví dụ ứng dụng Multimedia - Hệ thống xây dựng và soạn thảo video số. - Tạp chí điện tử - Trò chơi - Thương mại điện tử - Truyền hình tương tác iTV - Truyền hình hội nghị - Truyền hình theo yêu cầu - Thực tại ảo. … Các dạng môi trường và tín hiệu Dạng môi trường Audio synthesis synthesised digital audio III – CÁC LĨNH VỰC NGHIÊN CỨU ỨNG DỤNG Chúng ta đã biết một cách tổng thể, công nghệ multimedia là công nghệ xử lý dữ liệu multimedia, tuy nhiên chúng ta không biết trong công nghệ giải quyết những vấn đề gì? nó phân chia thành bao nhiêu lĩnh vực nghiên cứu . Trong phần này chúng ta xem xét một cách tổng thể cấu trúc bên trong của lĩnh vực công nghệ này. Sự đa dạng, phong phú và sinh động của các ứng dụng công nghệ Multimedia khiến cho các học giả quan tâm đến Multimedia, đến nay người ta vẫn còn tranh cãi về cách phân chia các lĩnh vực nghiên cứu, ứng dụng của Multimedia. Dựa vào đặc thù của công nghệ và đối tượng nghiên cứu, người ta đã tạm thống nhất cách phân chia công nghệ Multimedia thành hai lĩnh vực chính sau: - Trong các hệ thống thông tin Miltimedia (Multimedia information) lại bao gồm các lĩnh vực: Mô hình hệ thống thông Tin Multimedia (model information multimedia) Trong lĩnh vực này người ta giải quyết các vấn đề sau: - Các cấu trúc logic của các tài liệu Multimedia (logical Structure of media document) - Các phương thức để edit, Browse các tài liệu Multimedia - Các quá trình tạo ra thông tin Multimedia - Các dạng (Form) các công cụ (Tool) phục vụ cho xử lý dữ liệu Multimedia. Mô hình dữ liệu multimedia phân tán (Multimedia distributed processing Model) Trong lĩnh vực này người ta quan tâm đến các mục tiêu sau: - Các ngôn ngữ lập trình thao tác trên dữ liệu là các tài liệu Multimedia. - Kết hợp các chức năng cần thiết với các khái niệm lập trình các khái niệm cho phép lập trình truy nhập vào các dữ liệu lưu trữ trên các thiết bị ngoại vi multimedia (Media device control) - Các dạng dữ liệu Multimedia và các dịch vụ cần trao đổi dữ liệu Multimedia (Interchange) - Quản trị các dịch vụ viễn thông ở mức cao. - Các mô hình dữ liệu hypermedia, các máy chủ (server) đáp ứng dịch vụ hypermedia (hypermedia engine) - Các hệ điều hành mạng đáp ứng dịch vụ multimedia theo thời gian thực -Trong lĩnh vực các hệ thống viễn thông Multimedia (Multimedia Communication Systems) Mô hình các dịch vụ multimedia trên mạng (Multiservice Network multimedia Model) Lĩnh vực này quan tâm nghiên cứu các vấn đề sau: - Mạng đa dịch vụ (Multiservice) trên các hệ thống dữ liệu Multimedia phân tán - Các giao thức (protocol) đáp ứng việc giao lưu giữa các mạng khác nhau có quản lý dữ liệu Multimedia - Trao đổi dữ liệu Multimedia trên internet Mô hình hệ thống Multimedia hội nghị (Multimedia conferencing Model): Mô hình này giải quyết các vấn đề kết nối máy tính với các hệ thống viễn thông, tạo nên một hệ thống mạng không thiết kế trước, có khả năng đáp ứng các cuộc hội thảo, hội nghị theo thời gian thực. Chú ý: Ngoài các mô hình đã nêu còn có mô hình pha trộn kết hợp của các lĩnh vực trên để tạo nên các mô hình đáp ứng các yêu cầu đa dạng của thực tế. Trong lĩnh vực Multimedia còn tồn tại các bài phức tạp còn phải nghiên cứu trong tương lại như nhận dạng tiếng nói, nhận dạng ảnh v.v.... BÀI TẬP CHƯƠNG 1 1. Trình bày khái niệm Multimedia? Các khía cạnh liên quan đến multimedia? Cho ví dụ? 2. Ảnh Bitmap là gì? Nêu đặc điểm của nó? 3. Trình bày các đặc trưng multimedia trên web? 4. Phân loại các phương pháp nén ảnh 5. Nêu các thành phần dữ liệu của multimedia? 6. Ảnh vector là gì? Nêu đặc điểm cảu chúng? 7. Trình bày quá trình phát triển một sản phẩm multimedia? 8. Vẽ sơ đồ khối của một hệ thống nén tiêu biểu, giải thích các thành phần cơ bản trên sơ đồ? 9. Nêu ứng dụng của multimedia (Mua bán giao dịch qua mạng). Hãy nêu ứng dụng của đa phương tiện trong công tác giáo dục, y tế, sản xuất? 10. Lịch sử phát triển của multimedia. (1975-1980-1987-1995) 11. Vẽ biểu đồ so sánh các khuôn dạng dữ liệu multimedia 12. Xác định những nét chính của sản phẩm multimedia. 13. Trình bày những yêu cầu về thử nghiệm sản phẩm? 14. Kịch bản là gì? Có các loại kịch bản nào? So sánh các loại kịch bản và cho ví dụ minh họa về kịch bản chi tiết cho sản phẩm đa phương tiện? 15. Lí do cần đề cập thuật ngữ đa phương tiện? 16. Bố cục có vai trò quan trọng thế nào trong thiết kế sản phẩm đa phương tiện? 17. Hãy bố cục bàn làm việc, có máy tính, màn hình, văn phòng phẩm và tài liệu? 18. Thế nào là quá trình sản xuất đa phương tiện? Khâu nào là đặc biệt quan trọng? 19. Hãy cho biết một số khái niệm đơn giản về bản quyền và vi phạm bản quyền? 20. Vai trò của nội dung đa phương tiện? 21. Hãy cho biết một số mốc phát triển chính của nghiên cứu, ứng dụng về đa phương tiện? 22. Hãy liệt kê một số kết quả nghiên cứu, ứng dụng về đa phương tiện mà các cơ sở trong nước đạt được, trong thời gian 5 năm gần đây? 23. Hãy lấy ví dụ về tính chất đa phương tiện trong giao diện người dùng trong môi trường Windows, với loại giao diện cửa sổ? 24. Hãy lấy ví dụ về tính chất đa phương tiện trong giao diện người dùng trong môi trường Windows, với loại giao diện thực đơn? 25. Thiết kế sản phẩm đa phương tiện có nguyên tắc không? Khi thiết kế giao diện khuôn dạng, người ta tuân theo những nguyên tắc nào? 26. Vai trò của con người trong tương tác với hệ thống sử dụng đa phương tiện? 27. Một số thiết bị dùng trong đa phương tiện, hay trong đa hình thái, như găng điện tử, thiết bị thực ảo … có giá trị gì trong tương tác đa phương tiện? 28. Các loại dữ liệu đa phương tiện có cách thu nhập khác nhau ra sao? 29. Chuẩn bị thiết bị gì đề thu nhập dữ liệu đa phương tiện? 30. Vai trò lãnh đạo đề án đa phương tiện trong việc a. Xây dựng đề án? b. Quản lý tài chính? 31. Vai trò của người dùng trong việc xây dựng các điều khoản thực hiện của đề án đa phương tiện? 32. Vai trò của bản quyền đối với Người dùng đa phương tiện? Người sản xuất đa phương tiện? 33. Việc tổ chức nhóm công tác trong đề án đa phương tiện theo nguyên tắc gì? 34. Một số vai trò trong đề án đa phương tiện? 35. Việc thay đổi nhân sự, đặc biệt các vai chủ chốt … sẽ ảnh hưởng đến quá trình thực hiện đề án đa phương tiện ở khía cạnh nào? 36. Tích hợp dữ liệu đa phương tiện theo một số phần mềm khuyến cáo đáp ứng được các nguyên tắc tích hợp nào? Lấy ví dụ? 37. Dữ liệu âm thanh thu thập khác âm thanh trong video ở đâu? 38. Dữ liệu video được mô tả dưới dạng nén, theo chuẩn thể hiện, và có dữ liệu meta ra sao? 39. Phân biệt tiếp thị sản phẩm đa phương tiện với sản phẩm tin học thông thường? 40. Bố cục hình ảnh, văn bản trên giao diện người – máy có một số loại chính nào? 41. Người ta tạo hình đối tượng 3D theo mô hình nào? 42. Một số yêu cầu đặt ra đối với phòng thu âm, để đảm bảo chất lượng âm thành trong sản phẩm đa phương tiện? 43. Thử nghiệm và đánh giá sản phẩm đa phương tiện có những lưu ý gì? 44. Khi làm tư liệu về đề án đa phương tiện, cần mô tả các khía cạnh nào? Chương 2: KHÁI NIỆM CHUNG VỀ ÂM THANH AUDIO VÀ VIDEO 2.1 Kỹ thuật Audio 2.1.1 Khái niệm Âm thanh (audio): là dao động các sóng âm gây ra áp lực làm dịch chuyển các hạt vật chất trong môi trường đàn hồi làm tai người cảm nhận được các dao động này. Tai người có thể nghe được các dao động trong khoảng tần số 20Hz đến 20kHz. Âm thanh tự nhiên: Là sự kết hợp giữa các sóng âm mang tần số khác nhau. Dải động của tai: Giới hạn bởi ngưỡng nghe thấy (0dB) đến ngưỡng đau (120dB) của người. Ngưỡng nghe tối thiểu: Mức thấp nhất của biên độ mà tai người có thể cảm nhận được âm thanh tùy thuộc vào từng người, mức áp lực và tần số của âm thanh. Hiệu ứng che khuất âm thanh: Hiện tượng âm thanh mà tại đó ngưỡng nghe của một âm tăng lên trong khi có mặt của một âm khác (khó nghe hơn). Được sử dụng trong kỹ thuật nén. Hướng âm thanh: Tai và não có thể giúp ta xác định hướng âm thanh, điều này có thể ứng dụng để tạo các hiệu ứng âm thanh như stereo, surround. Vang và trễ: Vang là hiện tượng kéo dài âm thanh sau khi nguồn âm đã tắt. Trễ là thời gian d âm thanh phản xạ đến đích so với âm thanh trực tiếp. Nếu d>50ms thì trễ đó gọi là tiếng vọng. Biên độ của âm thanh cứ sau một lần phản xạ thì bị suy giảm. 2.1.2 Ứng dụng Âm thanh đóng vai trò quan trọng trong các ứng dụng truyền thông đa phương tiện. Các hiệu ứng đặc biệt của âm thanh như âm nhạc và tiếng nói có thể được đưa vào các ứng dụng, đặc biệt là các ứng dụng trong hệ thống đào tạo và bán hàng tự động hoặc hệ thống điểm thông tin. Một lời chú thích bằng tiếng nói có thể được dùng để diễn tả những gì đang diễn ra trên màn hình hoặc để làm nổi bật và nhấn mạnh những khái niệm then chốt. Âm thanh có thể được sử dụng kết hợp với hình ảnh tĩnh hoặc động để giải thích cho người sử dụng một ý tưởng hay một quy trình hiệu quả hơn theo cách giải thích chỉ đơn giản bằng văn bản hay đồ họa, âm nhạc có thể được sử dụng để thu hút sự chú ý của khách hàng hoặc để tạo ra một phong cách riêng biệt. Trong một số lĩnh vực chuyên dụng tự âm thanh có thể hình thành nên sự lôi cuốn của một ứng dụng truyền thông đa phương tiện, chẳng hạn như các hệ thống chỉ đường cho người khiếm thị,... Một dự án mới đây đã giúp cho việc chuyển nhật báo đến một thiết bị máy tính đặt tại nhà người đọc. Người sử dụng cũng có thể chọn nghe hệ thống xử lý tiếng nói đọc lớn các bài báo đã được chọn lọc. Công nghệ xử lý âm thanh ngày càng được cải tiến, mối quan tâm của người dùng đến các hệ thống xử lý và nhận dạng tiếng nói trong các ứng dụng kinh doanh, an ninh,...ngày càng tăng lên. 2.1.3 Kỹ thuật Audio số Để máy tính làm việc được với âm thanh, chúng phải được chuyển thành tín hiệu số (digital) từ tín hiệu tương tự (analog). Quá trình này gọi là "lấy mẫu" (sampling), mỗi một phần của một thời gian lấy mẫu, tín hiệu tương tự được ghi nhận lại thành những bit. Có 2 yếu tố ảnh hưởng đến chất lượng âm thanh: 1.   Tần số lấy mẫu: Tần số lấy mẫu là số lần mẫu được lấy trong một đơn vị thời gian. Tần số chung nhất là: 11.025 kHz, 22.05 kHz, và 44.1 kHz. Nếu  tần số lấy mẫu cao hơn thì chất lương sẽ tốt hơn. 2.  Số bit mã hoá (kích thước lấy mẫu):      Quyết định tổng lượng thông tin có thể biểu diễn (mã hoá). Minh họa: Tín hiệu analog và digital. Kích thước lấy mẫu thông thường là 8 bit và 16 bit. Kích thước lấy mẫu 8-bit cho 256 giá trị dùng để thể hiện âm thanh, nếu 16-bit  thì cho 65. 536 giá trị. Nếu  kích thước lấy mẫu cao hơn thì chất lượng sẽ tốt hơn. Kích thước file của 10 giây ứng với giá trị tần số và số bit: Tần số Số Bit Kích thước File 44.1 kHz 16 1.76 MB 44.1 kHz 8 882 KB 22.05 kHz 16 882 KB 22.05 kHz 8 440 KB 11.025 kHz 8 220 KB Nguồn tín hiệu (Analog) Chuyển đổi Analog-Digital Xử lý, Lưu trữ, Truyền dẫn (Digital) Chuyển đổi Analog-Digital Xuất âm hiển thị Analog Sóng âm và cảm giác âm 2.1.4 Giới thiệu về âm thanh và hệ thống xử lý âm thanh 2.1.4.1. Âm thanh(Sound) Âm thanh về mặt cảm giác đó là sự cảm nhận của con người thông qua thính giác và bộ não. Âm thanh về mặt khoa học đó là sự vận động vật lý trong môi trường trung gian của các nguyên tử theo dạng sóng, các sóng này có tần số thay đổi theo thời gian. Người ta có thể mô tả chuyển động của sóng âm thanh bằng một đại lượng liên tục theo thời gian, nói cách khác có thể mô tả âm thanh bằng đại lượng analog theo cách sau: Sóng âm thanh lan truyền trong không khí tác động lên vật chắn có nối với nguồn điện, sóng âm thanh tạo nên áp suất thay đổi lên vật chắn làm cho điện thế V của nguồn điện thay đổi liên tục - điện thế chính là biểu diễn sự thay đổi liên tục của sóng âm thanh, người ta nói rằng đại lượng biểu diễn sự thay đổi của sóng âm thanh theo thời gian là đại lượng analog (tương tự). - Chu kỳ và tần số Như chúng ta đã biết, đối với sóng âm có một số thuộc tính quan trọng sau: Chu kỳ (period), tần số (frequence), tốc độ (speed), biên độ (amplitude),… - Chu kỳ là khoảng thời gian xuất hiện liên tiếp của đỉnh sóng tại một điểm; kí hiệu T - Tần số là là số chu kỳ diễn ra trong một đơn vị thời gian tính theo giây. Đơn vị của tần số tính bằng Hertz (Hz). Kí hiệu là f. Giữa chu kỳ và tần số có mối liên hệ sau: T=1/f - Tai người nhậy cảm với một dải rộng các tần số , bình thường từ 22Hz đến 22000 Hz điều này phụ thuộc vào sức khỏe người nghe. Dải tần từ 22Hz đến 22000 Hz gọi là dải nghe được. Tiếng nói con người thường nằm trong giải tần 500Hz đến 22000 Hz. - Tốc độ âm thanh phụ thuộc vào môi trường nó lan truyền ví dụ nhiệt độ không khí, ở nhiệt độ 20c sóng âm thanh lan truyền với tốc độ 343,8 met/s. - độ rộng tần số (Banwithd ) : sự khác nhau giữa tần số cực đại và cực tiểu - Biên độ (amplitude): là giá trị lớn nhất của hàm trong mọi chu kỳ; Biên độ của sóng âm thanh là tính chất quan trọng, nhờ nó người ta cảm nhận được độ to nhỏ (loudness) của âm thanh. - Độ ồn của âm thanh: Độ ồn của âm thanh con người có thể cảm nhận được bằng tai Đơn vị đo tiếng ồn là decibel (db). Nó được xác định bởi Ở đây - P1,P2 là năng lượng được đo bằng watt, jul, gram.cm/s….. hay đại lượng vật lý nào đó mà đơn vị đo của nó là năng lượng trên thời gian (power per time) - Level – là mức độ ồn 2.1.4.2. Đặc tính của âm thanh tương tự Mục đích của lời nói là dùng để truyền đạt thông tin. Có rất nhiều cách mô tả đặc điểm của việc truyền đạt thông tin. Dựa vào lý thuyết thông tin, lời nói có thể được đại diện bởi thuật ngữ là nội dung thông điệp, hoặc là thông tin. Một cách khác để biểu thị lời nói là tín hiệu mang nội dung thông điệp, như là dạng sóng âm thanh. Hình: Dạng sóng của tín hiệu ghi nhận được từ âm thanh của người Kỹ thuật đầu tiên dùng trong việc ghi âm sử dụng các thông số về cơ, điện cũng như trường có thể làm nên nhiều cách thức ghi âm ứng với các loại áp suất không khí khác nhau. Điện áp đến từ một microphone là tín hiệu tương tự của áp suất không khí (hoặc đôi khi là vận tốc). Dù được phân tích bằng cách thức nào, thì các phương pháp khi so sánh với nhau phải dùng một tỉ lệ thời gian. Trong khi các thiết bị tương tự hiện đại trông có vẻ xử lý âm thanh tốt hơn những thiết bị cổ điển, các tiêu chuẩn xử lý thì hầu như không có gì thay đổi, mặc dù công nghệ có vẻ xử lý tốt hơn. Trong hệ thống xử lý âm thanh tương tự, thông tin được truyền đạt bằng thông số liên tục biến thiên vô hạn. Hệ thống xử lý âm thanh số lý tưởng có những tính năng tương tự như hệ thống xử lý âm thanh tương tự lý tưởng: cả hai hoạt động một cách “trong suốt” và tạo lại dạng sóng ban đầu không lỗi. Tuy nhiên, trong thế giới thực, các điều kiện lý tưởng rất hiếm tồn tại, cho nên hai loại hệ thống xử lý âm thanh hoạt động sẽ khác nhau trong thực tế. Tín hiệu số sẽ truyền trong khoảng cách ngắn hơn tín hiệu tương tự và với chi phí thấp hơn. Thông tin dùng để truyền đạt của âm thoại về bản chất có tính rời rạc, và nó có thể được biểu diễn bởi một chuỗi ghép gồm nhiều phần tử từ một tập hữu hạn các ký hiệu (symbol). Các ký hiệu từ mỗi âm thanh có thể được phân loại thành các âm vị (phoneme). Mỗi ngôn ngữ có các tập âm vị khác nhau, được đặc trưng bởi các con số có giá trị từ 30 đến 50. Ví dụ như tiếng Anh được biểu diễn bởi một tập khoảng 42 âm vị. Tín hiệu thoại được truyền với tốc độ như thế nào? Đối với tín hiệu âm thoại nguyên thủy chưa qua hiệu chỉnh thì tốc độ truyền ước lượng có thể tính được bằng cách lưu ý giới hạn vật lý của việc nói lưu loát của người nói tạo ra âm thanh thoại là khoảng 10 âm vị trong một giây. Mỗi một âm vị được biểu diễn bởi một số nhị phân, như vậy một mã gồm 6 bit có thể biểu diễn được tất cả các âm vị của tiếng Anh. Với tốc độ truyền trung bình 10 âm vị/giây, và không quan tâm đến vấn đề luyến âm giữa các âm vị kề nhau, ta có thể ước lượng được tốc độ truyền trung bình của âm thoại khoảng 60bit/giây. Trong hệ thống truyền âm thoại, tín hiệu thoại được truyền lưu trữ và xử lý theo nhiều cách thức khác nhau. Tuy nhiên đối với mọi loại hệ thống xử lý âm thanh thì có hai điều cần quan tâm chung là: 1. Việc duy trì nội dung của thông điệp trong tín hiệu thoại 2. Việc biểu diễn tín hiệu thoại phải đạt được mục tiêu tiện lợi cho việc truyền tin hoặc lưu trữ, hoặc ở dạng linh động cho việc hiệu chỉnh tín hiệu thoại sao cho không làm giảm nghiêm trọng nội dung của thông điệp thoại. Việc biểu diễn tín hiệu thoại phải đảm bảo việc các nội dung thông tin có thể được dễ dàng trích ra bởi người nghe, hoặc bởi các thiết bị phân tích một cá

Các file đính kèm theo tài liệu này:

  • docbaigiangmultimedia_2007_2737.doc