Nhận dạng tiếng nói tiếng Việt theo hướng tiếp cận nhận dạng âm vị tự động
Trong môi trường sinh hoạt hàng ngày, chất lượng tiếng nói biến động rất
lớn do chịu ảnh hưởng của các yếu tốngoại cảnh, tâmvà sinh lý người nói: một câu
của cùng một người nói khi thâuvào máy sẽkhác nhau nếu nói ởhai tâm trạng khác
nhau (lúc vui nói khác, lúc giận nói khác, ), sức khoẻkhác nhau (lúc khoẻnói
khác, lúc bệnh nói khác), tốc độnói khác nhau (nói chậm thì rõ hơn nói nhanh), môi
trường xung quanh khác nhau (môi trường có tiêng ồn thì âmthu vào sẽbịnhiễu),
v.v Và còn nhiều yếu tốkhác nữa tác động lên chất lượng của lờinói nhưthiết bị
thu không tốt, tín hiệu bịnhiễu điện, Do đó,việc nhận dạng trởnên rất khó khăn.
Nói vềnhận dạng tiếng Việt, chúng ta đi sau thếgiới rất lâu. Vì vậy, thành
quả đạt được còn hạn chế: chưa có những hệthống nhận dạng thật sựtốt, chưa có
các kho dữliệu quí nhưtrong tiếng Anh, Tuy nhiên, chúng ta được thừa hưởng
nhiều thành quảcủa thếgiới vềkỹthuật nhận dạng. Hiện nay, trong khi chưa có các
công trình nghiên cứu đầy đủvềngữâm tiếng Việt dưới góc độlàm tin học, hướng
tiếp cận chủyếu đểnhận dạng tiếng nói tiếng Việt vẫn là nhận dạng thống kê. Và
khó khăn của chúng talà xây dựng các kho dữliệu đủlớn và chính xác dùng đểhọc
mẫu và kiểm tra kết quảnhận dạng.
Các file đính kèm theo tài liệu này:
- 0012535.pdf