Ứng dụng mạng neuron cho vấn đề nhận dạng tiếng nói
Trong những năm gần đây, người ta thường nhắc đến “Trí tuệ nhân tạo” như là một phương thức mô phỏng trí thông minh của con người từ việc lưu trữ đến xử lý thông tin. Và nó thực sự đã trở thành nền tảng cho việc xây dựng các thế hệ máy thông minh hiện đại. Cũng với mục đích đó, nhưng dựa trên quan điểm nghiên cứu hoàn toàn khác, một môn khoa học đã ra đời, đó là Lý thuyết Mạng neuron. Tiếp thu các thành tựu về thần kinh sinh học, mạng neuron luôn được xây dựng thành một cấu trúc mô phỏng trực tiếp các tổ chức thần kinh trong bộ não con người.
Từ những nghiên cứu sơ khai của McCulloch và Pitts trong những năm 40 của thế kỷ, trải qua nhiều năm phát triển, cho đến thập kỷ này, khi trình độ phần cứng và phần mềm đã đủ mạnh cho phép cài đặt những ứng dụng phức tạp, Lý thuyết Mạng neuron mới thực sự được chú ý và nhanh chóng trở thành một hướng nghiên cứu đầy triển vọng trong mục đích xây dựng các máy thông minh tiến gần tới Trí tuệ con người. Sức mạnh thuộc về bản chất tính toán song song, chấp nhận lỗi của mạng neuron đã được chứng minh thông qua nhiều ứng dụng trong thực tiễn, đặc biệt khi tích hợp cùng với các kỹ thuật khác.
Một trong những ứng dụng kinh điển của mạng neuron là lớp các bài toán nhận dạng mẫu, ở đó mỗi một mẫu là một tập hợp (hay một vector) các tham số biểu thị các thuộc tính của một quá trình vật lý nào đó (ví dụ tín hiệu tiếng nói). Ngoài sức mạnh vốn có, mạng neuron còn thể hiện ưu điểm của mình trong việc nhận dạng thông qua khả năng mềm dẻo, dễ thích nghi với môi trường. Chính vì vậy, có thể coi mạng neuron trước tiên là một công cụ để nhận dạng. Nhiều công trình nghiên cứu, nhiều ứng dụng thực nghiệm đã được thực hiện trên mạng neuron với mục đích nhận dạng và đã thu được những thành công to lớn.
Trước sự quyến rũ của các ứng dụng Trí tuệ nhân tạo, cùng bản tính tò mò trước một lý thuyết mới chưa từng được nghiên cứu và sự động viên khuyến khích của thày giáo hướng dẫn, tôi đã quyết định thực hiện những nghiên cứu ban đầu về Lý thuyết mạng neuron với một mục đích cụ thể là ứng dụng nó vào vấn đề nhận dạng tiếng nói. Do thời gian thực hiện đồ án tốt nghiệp chỉ có hơn ba tháng, tôi không có tham vọng xây dựng được một phần mềm nhận dạng tiếng nói hoàn chỉnh.
Mục đích chính của bản luận văn là:
Trình bày các kết quả nghiên cứu lý thuyết phục vụ cho chủ đề “Ứng dụng mạng neuron cho vấn đề nhận dạng tiếng nói”; đồng thời xây dựng một phần mềm thử nghiệm Nhận dạng nguyên âm với mục đích hiểu sâu hơn về cách thức mà một mạng neuron tiến hành việc phân loại các tín hiệu tiếng nói.
Các file đính kèm theo tài liệu này:
- LUANVAN.DOC
- TIEUDE.DOC