Phương pháp phát hiện các chuyển lia phức tạp dựa trên ước lượng chuyển động trong các khung video

Có một nhận xét là kết thúc của một fade-out và bắt

đầu của một fade-in được đánh dấu bởi một ảnh thuần

một màu. Tuy nhiên, chỉ đơn giản phát hiện những

ảnh nhưvậy không đủ để xác nhận một chuyển đổi

fade vì có thể còn tồn tại các cắt lia tới hoặc từmột

ảnh thuần một màu. Việc phát hiện chính xác các ranh

giới của chuyển đổi fade là rất quan trọng, vì một

khung chính được chọn ở giữa một chuyển đổi fade sẽ

không thể phản ánh đầy đủ nội dung của cảhai lia kế

bên. Do đó, thuật toán cần phân biệt giữa các fades và

cắt lia tới/từ một ảnh thuần một màu, để ranh giới của

chuyển đổi fade được phát hiện một cách chính xác.

pdf11 trang | Chia sẻ: thienmai908 | Lượt xem: 1028 | Lượt tải: 0download
Nội dung tài liệu Phương pháp phát hiện các chuyển lia phức tạp dựa trên ước lượng chuyển động trong các khung video, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
một ảnh thuần một màu, nếu sdn T<σ . Trong trường hợp này sdT là hằng số và bằng 1. Khi một khung ảnh thuần một màu được phát hiện, tại đó hoặc sẽ là một fade-out hoặc là một cắt tới nó. Cho nf là một khung ảnh thuần một màu và 1−nf là khung trước nó, như vậy sdn T≥−1σ . Ðể xác định 22 nếu nf đánh dấu kết thúc của một fade-out hoặc cặp khung chứa một cắt lia, cần tính các số đo nE và nC . Các đặc tính cạnh nE sẽ ít giống nhau. Tuy nhiên, nếu nf đánh dấu kết thúc của một fade-out là một chuyển đổi từ từ, sự sai khác giữa các phân bố màu sẽ nhỏ và hầu như không thay đổi. Ðiều này được minh hoạ trên hình 7, biểu diễn các số đo nE và nC trong một chuỗi phụ video có chứa một fade-out và tiếp sau là một fade-in. Có thể thấy không có thay đổi nào trong nC . Tuy nhiên, nếu cặp khung chứa một cắt lia, cả hai số đo đều thay đổi đáng kể. Hình 8 cho thấy đồ thị của nE và nC trong một đoạn video chứa một cắt lia tới ảnh thuần đen và tiếp sau bởi một fade-in. S è ® o Sù gièng nhau cña ®Æc tÝnh c¹nh En Sù kh¸c nhau biÓu ®å mµu Cn KÕt thóc cña fade-in C C¾t tíi mét ¶nh ®en 1 2 3 2 3 1 2 1.5 1100 1 0.5 0 1120 1140 1160 1180 1200 1220 1240 Sè khung Hình 8. Số đo nE và nC trong một cắt lia Nếu đã tìm thấy khung thuần một màu để đánh dấu bắt đầu/kết thúc của một fade, coi như xác định chắc chắn ranh giới đối diện. Một fade sẽ biểu thị tỷ lệ biến đổi cường độ pixel theo thời gian và có thể quan sát được như một mẫu parabol. Ðiều này được phản ánh bởi tỷ lệ lệch chuẩn của cường độ pixel nσ so với đường thẳng xấp xỉ, như thấy trên hình 9 - minh hoạ nσ trong một fade-in. Chắc chắn không thể phát hiện một fade, khi giả sử tốc độ tăng của thay đổi là hằng số, trong một chuyển đổi. Tuy nhiên, lưu ý rằng kết thúc của fade-in được đánh dấu bằng sự thay đổi đáng kể tốc độ tăng của nσ . Như vậy, có thể phát hiện được kết thúc một fade-in bằng xác định vị trí của cặp khung, nơi mà thay đổi lớn xuất hiện (tương tự có thể phát hiện điểm bắt đầu của một fade-out bằng cách phân tích tốc độ tăng ngược lại từ điểm kết thúc của fade-out). Nhận xét là độ lệch chuẩn tiếp tục tăng không đáng kể sau khi kết thúc fade-in, như vậy nó không đủ để phát hiện cặp khung có tỷ lệ thay đổi nhỏ hơn hoặc bằng 0, khi kết thúc fade-in. § é l Ö c h c h u È n c ñ a c − ê n g ® é p ix e l Sè khung §−êng th¼ng xÊp xØ C¸c ranh giíi cña fade MÉu parabol 1 2 32 3 1 70 3140 60 50 40 30 20 10 0 3160 3180 3200 3220 3240 3260 3280 3300 Hình 9. Tỷ lệ lệch chuẩn cường độ pixel theo thời gian trong một fade so với đường thẳng xấp xỉ Tuy nhiên, nếu một fade là tới hoặc từ một cảnh có độ tương phản khá thấp, chỉ sử dụng độ lệch chuẩn sẽ không thể phát hiện ranh giới một cách chính xác. Hình 10a cho thấy 16 khung trong một lia, khi camera quét lên bầu trời và sau đó kết thúc với một fade-out. Trên đường số 2 trong hình 10b có thay đổi nhỏ độ lệch chuẩn của cường độ pixel, trong một fade-out. Ðộ giảm lớn nhất là trong khoảng thời gian ứng với đoạn camera quét lên trời có độ tương phản thấp. Trong trường hợp này, biểu hiện lớn nhất của chuyển đổi fade là trong khoảng thời gian của trung bình của cường độ pixel, như trên đường số 3 trong hình 10b. Thực tế cho thấy chỉ một số đo là không đủ để phát hiện chắc chắn ranh giới của một fade, cho nên cần kết hợp tuyến tính cả hai số đo, như trên đường số 4 trong hình 10b. Nếu chỉ quan tâm tới fade-in, nσ sẽ luôn gần tới 0 với khung đầu tiên, không kể tới màu của nó. Tuy nhiên, giá trị trung bình có thể là bất kỳ trong dải [0, 255]. Thực vậy, giá trị trung bình có thể giảm trong một fade-in. Do đó, giá trị trung bình của khung đầu tiên trong fade-in và mỗi khung tiếp theo được biến đổi bằng: snn µµµ −=′ với sn ≥ (9) trong đó nµ là trung bình của khung nf , và sf là khung đầu tiên của fade-in. Giờ đây, phát hiện kết thúc fade-in là vấn đề xác định vị trí của khung có sự giảm đáng kể tốc độ thay đổi của khoảng thời gian biểu diễn kết hợp tuyến tính: nnnl σµ +′= (10) 23 (a) VÝ dô mét fade-out víi c¸c khung ¶nh cã ®é t−¬ng ph¶n thÊp (b) Mét fade víi c¶nh cã ®é t−¬ng ph¶n thÊp cã ®é lÖch chuÈn Ýt thay ®æi nh−ng cã ®é lÖch trung b×nh thay ®æi lín Sè khung Ranh giíi cña fade-out §é lÖch chuÈn cña c−êng ®é pixel Trung b×nh cña c−êng ®é pixel Tæng cña ®é lÖch vµ trung b×nh chuÈn 1 2 32 3 1 200 5460 180 160 140 120 100 80 60 40 20 0 5480 5500 5520 5540 5560 5580 5600 S è ® o 4 4 Hình 10. Ðộ lệch chuẩn và độ lệch trung bình với các fade từ/tới các cảnh có độ tương phản thấp Phát hiện điểm bước ngoặt này nhờ sử dụng tốc độ thay đổi trung bình của nl giữa khung bắt đầu và một khung hiện tại, để dự báo giá trị của nl cho khung tiếp theo. Nếu giá trị thực tế với khung tiếp theo nhỏ hơn giá trị dự đoán của nó trong một vài khung liên tiếp, tốc độ tăng coi như thay đổi đáng kể và kết thúc của fade-in được xác nhận. Như vậy, với mỗi khung nf theo sau khung đầu tiên sf sao cho n > s, sẽ tính được tốc độ thay đổi trung bình của của nl , ở đây )/( nsll nn −= . Sau đó, giá trị của nl được dự báo cho khung tiếp theo 1+nf , sử dụng nnn lll +=′+1 . Nếu giá trị thực tế của 1+nl lớn hơn hoặc bằng giá trị thực tế của dự đoán, tức là 11 ++ ′≥ nn ll , fade-in coi như vẫn tiếp tục. Ngược lại, nếu 11 ++ ′< nn ll , khung hiện tại nf được đánh dấu có khả năng là điểm kết thúc của fade-in. Nếu giá trị thực tế của 1+nl nhỏ hơn giá trị dự báo của nó trong một vài khung liên tiếp, fade-in được xác định là đã kết thúc. Nếu số của khung liên tục 1=succN , tương đương với giả sử tốc độ tăng là tuyến tính, kết thúc của fade-in sẽ dễ dàng được xác định. Tuy nhiên, cho phép dùng một hàm tăng không tuyến tính để tính tốc độ thay đổi trung bình giữa khung bắt đầu và mỗi khung hiện tại (sử dụng 1>succN ). Thực tế, nếu succN đặt quá lớn, tốc độ thay đổi trung bình cuối cùng sẽ gần tới 0 và 1+nl có khả năng sẽ lớn hơn hoặc bằng giá trị dự báo của nó, ứng với nhiều khung liên tục. Trường hợp này, sẽ tìm thấy fade-in quá dài. Giá trị thực nghiệm cho thấy 5=succN sẽ cho kết quả xác định chính xác điểm khởi đầu/kết thúc của một fade. V. KẾT LUẬN Phát hiện các chuyển lia, nhất là các chuyển lia phức tạp luôn phải khắc phục vấn đề chuyển động của camera và đối tượng. Bài báo đã giới thiệu một phương pháp phát hiện chuyển đổi fade. Các chuyển đổi fades được phát hiện trước hết bằng xác định vị trí của khung ảnh thuần một màu, sau đó sử dụng thuật toán phát hiện cắt lia để xác định khung này hoặc là một cắt lia tới một ảnh thuần một màu hoặc có thể là điểm bắt đầu hoặc kết thúc của một fade. Nếu xác định khung ảnh thuần một màu là ranh giới của một fade, ranh giới đối diện được phát hiện bằng kiểm tra trung bình pixel và chuỗi thời gian biến đổi, tìm một sự tăng tốc độ thay đổi đủ lớn. Phương pháp này kết hợp hai phép đo: phép đo sự giống nhau dựa trên tương quan đặc tính cạnh của các khối và phép đo sự khác nhau biểu đồ màu. Nhờ đó, độ chính xác của thuật toán được nâng cao do đã bù được những thay đổi gây nên bởi chuyển động của camera và đối tượng. TÀI LIỆU THAM KHẢO [1] A. Giachetti, Matching techniques to compute image motion, Image and Vision Computing, 18 (3), Feb. 2000, pp. 247-260. [2] Ahmed K. Elmagarmid, H. Jiang, A. Helal, A. Joshi, M. Ahmed, Video Database Systems - Issues, Products and Applications, Kulwer Academic Publishers, 2001. [3] Ðỗ Trung Tuấn, Lương Xuân Cương, Khun Piseth, Nguyễn Văn Tảo, Về Xử lý dữ liệu video, Tạp chí khoa học-Khoa học tự nhiên và công nghệ, Ðại học Quốc gia Hà Nội, T.XIX, N3, 2003, tr. 48-56. [4] E. Saez, J.I Benavides, N.Gui, Combining Luminescence and Edge Based Metrics for Robust Temporal Video Segmentation, IEEE Int’l. Conf. on Image Processing (ICIP2004), Singapore, Oct. 24-27, 2004. 24 [5] H. H. Yu, W. Wolf, A hierarchical multiresolution video shot transition detection scheme, Computer Vision and Image Understanding, 75 (1/2), July/Aug. 1999, pp. 196-213. [6] J. P. Lewis, Fast normalized cross-correlation, Vision Interface, 1995, pp. 120-123. zilla/Work/nvisionInterface/nip.html. [7] Lương Xuân Cương, Ðỗ Xuân Tiến, Ðỗ Trung Tuấn (2006), Một kỹ thuật chỉ số hoá tự động dữ liệu video dựa trên đánh dấu vùng nền, Tạp chí khoa học-Khoa học tự nhiên và Công nghệ, Ðại học Quốc gia Hà Nội, T.XXII, No2, tr. 01-11. [8] S. V. Porter (2004), Video Segmentation and Indexing using Motion Estimation, Science and Technology journal of University of Bristol, pp. 9-19. [9] S. V. Porter, M. Mirmehdi, B. T. Thomas, Temporal video segmentation and classification of edit effects, In Image and Vision Computing, vol. 21, Dec. 2003, pp. 1097-1106. [10] Y. Gong, H. Chua, and X. Guo, Image indexing and retrieval based on color histogram, In Proc. Of Int'l Conf. Multimedia Modeling, Singapore, Nov. 1995. Ngày nhận bài: 02/08/2006 SƠ LƯỢC TÁC GIẢ LƯƠNG XUÂN CƯƠNG Sinh năm 1963 tại Bắc Ninh. Tốt nghiệp Ðại học Bách khoa Ðà Nẵng năm 1995, nhận bằng Thạc sĩ chuyên ngành Vô tuyến Điện tử và Thông tin liên lạc tại Học viện Kỹ thuật Quân sự năm 2001. Nơi công tác: Trường Sỹ quan CH-KT Thông tin Nha trang. Hướng nghiên cứu: Xử lý video, vi xử lý. Email: lxcuong2002@yahoo.com ĐỖ XUÂN TIẾN Sinh năm 1951 tại Hà Tây. Tốt nghiệp Ðại học LOLPI (Liên Xô) chuyên ngành Vô tuyến điện năm 1975. Nhận bằng Tiến sĩ năm 1987 tại LETI (Liên Xô), chuyên ngành Thiết kế Vi xử lý. Được công nhận chức danh Phó Giáo sư năm 2002. Hiện nay đang là Chủ nhiệm bộ môn Kỹ thuật Vi xử lý - Học viện Kỹ thuật Quân sự. Hướng nghiên cứu: Kỹ thuật xử lý số, Xử lý song song. Email: doxuantienvxl@yahoo.com ĐỖ TRUNG TUẤN Tốt nghiệp Trường Đại học Bách khoa Hà Nội, 1976. Nhận bằng Thạc sĩ, Tiến sĩ ngành Tin học tại Trường Đại học Pierre et Marie Curie (Paris VI), năm 1984, 1987. Được công nhận chức danh Phó Giáo Sư năm 2003. Hiện công tác tại Khoa Toán Cơ Tin học, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội. Email: tuandt@vnu.edu.vn 25

Các file đính kèm theo tài liệu này:

  • pdfjgkiah;glkwp;kghauiguwkhoahockithuatmaytinh (9).pdf
Tài liệu liên quan