Khóa luận Xây dựng bộ ngữ liệu để đánh giá bằng Tiếng Việt và chương trình trợ giúp đánh giá hệ tìm kiếm thông tin
Hiện nay, trên thế giới đã có rất nhiều hệ thống đánh giá các hệ thống tìm kiếm
thông tin nhưng chủ yếu là đánh giá các hệ thống tìm kiếm thông tin tiếng Anh,
tiếng Pháp. Đối với tiếng Việt, theo chúng tôi được biết, chưa có một hệ thống nào
được dùng để đánh giá các hệ thống tìm kiếm thông tin tiếng Việt. Nhưng theo xu
hướng phát triển của đất nước và nhu cầu tìm kiếm thông tin thì các hệthống tìm
kiếm thông tin tiếng Việt bắt buộc phải tồn tại và phát triển. Vì vậy, Việt Nam
chúng ta rất cần các hệ thống được dùng để đánh giá hiệu năng, hiệu quảcủa các
hệ thống tìm kiếm thông tin tiếng Việt.
Do ý nghĩa to lớn của lĩnh vực nghiên cứu đánh giá này, chúng tôi đã quyết
định chọn đềtài đánh giá các hệthống tìm kiếm thông tin. Chúng tôi nghĩrằng hệ
thống đánh giá của chúng tôi sẽ là cơ sở để đánh giá tất cả các hệ thống tìm kiếm
thông tin, nhất là hệ thống tìm kiếm thông tin tiếng Việt. Chúng tôi cũng hy vọng
hệ thống của chúng tôi sẽ góp phần vào sự phát triển của các hệ thống tìm kiếm
thông tin, của tìm kiếm thông tin và của công nghệthông tin nước ta.
Thực hiện đánh giá khả năng tìm kiếm, chúng tôi tập trung vào đánh giá hiệu
quả của kết quả tìm kiếm được trả về (cấp độ thứ hai trong khả năng tìm kiếm của
hệ thống thông tin ở trên). Hiệu quả của kết quả trả về được định nghĩa là khả
năng hệ thống tìm kiếm thông tin tìm được các tài liệu liên quan(Relevant
Documents)và loại bỏ đi những tài liệu không liên quan(Irrelevant
Documents). Đây là mô hình hướng hệ thống trong nghiên cứu tìm kiếm thông tin.
Mô hình này mô hình đánh giá được sử dụng nhiều nhất và hiệu quả nhất trên thế
giới.
Các file đính kèm theo tài liệu này:
- [LVIT047] - XD bộ ngữ liệu để đánh giá bằng Tiếng Việt và chương trình trợ giúp đánh giá hệ tìm kiếm tt.pdf