Có một nhận xét là kết thúc của một fade-out và bắt
đầu của một fade-in được đánh dấu bởi một ảnh thuần
một màu. Tuy nhiên, chỉ đơn giản phát hiện những
ảnh nhưvậy không đủ để xác nhận một chuyển đổi
fade vì có thể còn tồn tại các cắt lia tới hoặc từmột
ảnh thuần một màu. Việc phát hiện chính xác các ranh
giới của chuyển đổi fade là rất quan trọng, vì một
khung chính được chọn ở giữa một chuyển đổi fade sẽ
không thể phản ánh đầy đủ nội dung của cảhai lia kế
bên. Do đó, thuật toán cần phân biệt giữa các fades và
cắt lia tới/từ một ảnh thuần một màu, để ranh giới của
chuyển đổi fade được phát hiện một cách chính xác.
11 trang |
Chia sẻ: thienmai908 | Lượt xem: 1016 | Lượt tải: 0
Nội dung tài liệu Phương pháp phát hiện các chuyển lia phức tạp dựa trên ước lượng chuyển động trong các khung video, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
một ảnh thuần một màu, nếu
sdn T<σ . Trong trường hợp này sdT là hằng số và
bằng 1. Khi một khung ảnh thuần một màu được phát
hiện, tại đó hoặc sẽ là một fade-out hoặc là một cắt tới
nó. Cho nf là một khung ảnh thuần một màu và 1−nf
là khung trước nó, như vậy sdn T≥−1σ . Ðể xác định
22
nếu nf đánh dấu kết thúc của một fade-out hoặc cặp
khung chứa một cắt lia, cần tính các số đo nE và nC .
Các đặc tính cạnh nE sẽ ít giống nhau. Tuy nhiên,
nếu nf đánh dấu kết thúc của một fade-out là một
chuyển đổi từ từ, sự sai khác giữa các phân bố màu sẽ
nhỏ và hầu như không thay đổi. Ðiều này được minh
hoạ trên hình 7, biểu diễn các số đo nE và nC trong
một chuỗi phụ video có chứa một fade-out và tiếp sau
là một fade-in. Có thể thấy không có thay đổi nào
trong nC . Tuy nhiên, nếu cặp khung chứa một cắt lia,
cả hai số đo đều thay đổi đáng kể. Hình 8 cho thấy đồ
thị của nE và nC trong một đoạn video chứa một cắt
lia tới ảnh thuần đen và tiếp sau bởi một fade-in.
S
è
®
o
Sù gièng nhau cña ®Æc tÝnh c¹nh En
Sù kh¸c nhau biÓu ®å mµu Cn
KÕt thóc cña fade-in
C C¾t tíi mét ¶nh ®en
1
2
3
2
3
1
2
1.5
1100
1
0.5
0
1120 1140 1160 1180 1200 1220 1240
Sè khung
Hình 8. Số đo nE và nC trong một cắt lia
Nếu đã tìm thấy khung thuần một màu để đánh dấu
bắt đầu/kết thúc của một fade, coi như xác định chắc
chắn ranh giới đối diện. Một fade sẽ biểu thị tỷ lệ biến
đổi cường độ pixel theo thời gian và có thể quan sát
được như một mẫu parabol. Ðiều này được phản ánh
bởi tỷ lệ lệch chuẩn của cường độ pixel nσ so với
đường thẳng xấp xỉ, như thấy trên hình 9 - minh hoạ
nσ trong một fade-in. Chắc chắn không thể phát hiện
một fade, khi giả sử tốc độ tăng của thay đổi là hằng
số, trong một chuyển đổi. Tuy nhiên, lưu ý rằng kết
thúc của fade-in được đánh dấu bằng sự thay đổi đáng
kể tốc độ tăng của nσ . Như vậy, có thể phát hiện
được kết thúc một fade-in bằng xác định vị trí của cặp
khung, nơi mà thay đổi lớn xuất hiện (tương tự có thể
phát hiện điểm bắt đầu của một fade-out bằng cách
phân tích tốc độ tăng ngược lại từ điểm kết thúc của
fade-out). Nhận xét là độ lệch chuẩn tiếp tục tăng
không đáng kể sau khi kết thúc fade-in, như vậy nó
không đủ để phát hiện cặp khung có tỷ lệ thay đổi nhỏ
hơn hoặc bằng 0, khi kết thúc fade-in.
§
é
l
Ö
c
h
c
h
u
È
n
c
ñ
a
c
−
ê
n
g
®
é
p
ix
e
l
Sè khung
§−êng th¼ng xÊp xØ
C¸c ranh giíi cña fade
MÉu parabol
1
2
32
3
1
70
3140
60
50
40
30
20
10
0
3160 3180 3200 3220 3240 3260 3280 3300
Hình 9. Tỷ lệ lệch chuẩn cường độ pixel theo thời gian
trong một fade so với đường thẳng xấp xỉ
Tuy nhiên, nếu một fade là tới hoặc từ một cảnh có
độ tương phản khá thấp, chỉ sử dụng độ lệch chuẩn sẽ
không thể phát hiện ranh giới một cách chính xác.
Hình 10a cho thấy 16 khung trong một lia, khi camera
quét lên bầu trời và sau đó kết thúc với một fade-out.
Trên đường số 2 trong hình 10b có thay đổi nhỏ độ
lệch chuẩn của cường độ pixel, trong một fade-out.
Ðộ giảm lớn nhất là trong khoảng thời gian ứng với
đoạn camera quét lên trời có độ tương phản thấp.
Trong trường hợp này, biểu hiện lớn nhất của chuyển
đổi fade là trong khoảng thời gian của trung bình của
cường độ pixel, như trên đường số 3 trong hình 10b.
Thực tế cho thấy chỉ một số đo là không đủ để phát
hiện chắc chắn ranh giới của một fade, cho nên cần
kết hợp tuyến tính cả hai số đo, như trên đường số 4
trong hình 10b. Nếu chỉ quan tâm tới fade-in, nσ sẽ
luôn gần tới 0 với khung đầu tiên, không kể tới màu
của nó. Tuy nhiên, giá trị trung bình có thể là bất kỳ
trong dải [0, 255]. Thực vậy, giá trị trung bình có thể
giảm trong một fade-in. Do đó, giá trị trung bình của
khung đầu tiên trong fade-in và mỗi khung tiếp theo
được biến đổi bằng:
snn µµµ −=′ với sn ≥ (9)
trong đó nµ là trung bình của khung nf , và sf là
khung đầu tiên của fade-in. Giờ đây, phát hiện kết
thúc fade-in là vấn đề xác định vị trí của khung có sự
giảm đáng kể tốc độ thay đổi của khoảng thời gian
biểu diễn kết hợp tuyến tính:
nnnl σµ +′= (10)
23
(a) VÝ dô mét fade-out víi c¸c khung ¶nh cã ®é t−¬ng ph¶n thÊp
(b) Mét fade víi c¶nh cã ®é t−¬ng ph¶n thÊp cã ®é lÖch chuÈn Ýt thay ®æi
nh−ng cã ®é lÖch trung b×nh thay ®æi lín
Sè khung
Ranh giíi cña fade-out
§é lÖch chuÈn cña c−êng ®é pixel
Trung b×nh cña c−êng ®é pixel
Tæng cña ®é lÖch vµ trung b×nh chuÈn
1
2
32
3
1
200
5460
180
160
140
120
100
80
60
40
20
0
5480 5500 5520 5540 5560 5580 5600
S
è
®
o
4
4
Hình 10. Ðộ lệch chuẩn và độ lệch trung bình với các fade
từ/tới các cảnh có độ tương phản thấp
Phát hiện điểm bước ngoặt này nhờ sử dụng tốc độ
thay đổi trung bình của nl giữa khung bắt đầu và một
khung hiện tại, để dự báo giá trị của nl cho khung tiếp
theo. Nếu giá trị thực tế với khung tiếp theo nhỏ hơn
giá trị dự đoán của nó trong một vài khung liên tiếp,
tốc độ tăng coi như thay đổi đáng kể và kết thúc của
fade-in được xác nhận.
Như vậy, với mỗi khung nf theo sau khung đầu
tiên sf sao cho n > s, sẽ tính được tốc độ thay đổi
trung bình của của nl , ở đây )/( nsll nn −= . Sau đó,
giá trị của nl được dự báo cho khung tiếp theo 1+nf ,
sử dụng nnn lll +=′+1 . Nếu giá trị thực tế của 1+nl lớn
hơn hoặc bằng giá trị thực tế của dự đoán, tức là
11 ++ ′≥ nn ll , fade-in coi như vẫn tiếp tục. Ngược lại,
nếu 11 ++ ′< nn ll , khung hiện tại nf được đánh dấu có
khả năng là điểm kết thúc của fade-in. Nếu giá trị thực
tế của 1+nl nhỏ hơn giá trị dự báo của nó trong một
vài khung liên tiếp, fade-in được xác định là đã kết
thúc. Nếu số của khung liên tục 1=succN , tương
đương với giả sử tốc độ tăng là tuyến tính, kết thúc
của fade-in sẽ dễ dàng được xác định. Tuy nhiên, cho
phép dùng một hàm tăng không tuyến tính để tính tốc
độ thay đổi trung bình giữa khung bắt đầu và mỗi
khung hiện tại (sử dụng 1>succN ). Thực tế, nếu succN
đặt quá lớn, tốc độ thay đổi trung bình cuối cùng sẽ
gần tới 0 và 1+nl có khả năng sẽ lớn hơn hoặc bằng
giá trị dự báo của nó, ứng với nhiều khung liên tục.
Trường hợp này, sẽ tìm thấy fade-in quá dài. Giá trị
thực nghiệm cho thấy 5=succN sẽ cho kết quả xác
định chính xác điểm khởi đầu/kết thúc của một fade.
V. KẾT LUẬN
Phát hiện các chuyển lia, nhất là các chuyển lia
phức tạp luôn phải khắc phục vấn đề chuyển động của
camera và đối tượng. Bài báo đã giới thiệu một
phương pháp phát hiện chuyển đổi fade. Các chuyển
đổi fades được phát hiện trước hết bằng xác định vị trí
của khung ảnh thuần một màu, sau đó sử dụng thuật
toán phát hiện cắt lia để xác định khung này hoặc là
một cắt lia tới một ảnh thuần một màu hoặc có thể là
điểm bắt đầu hoặc kết thúc của một fade. Nếu xác
định khung ảnh thuần một màu là ranh giới của một
fade, ranh giới đối diện được phát hiện bằng kiểm tra
trung bình pixel và chuỗi thời gian biến đổi, tìm một
sự tăng tốc độ thay đổi đủ lớn. Phương pháp này kết
hợp hai phép đo: phép đo sự giống nhau dựa trên
tương quan đặc tính cạnh của các khối và phép đo sự
khác nhau biểu đồ màu. Nhờ đó, độ chính xác của
thuật toán được nâng cao do đã bù được những thay
đổi gây nên bởi chuyển động của camera và đối
tượng.
TÀI LIỆU THAM KHẢO
[1] A. Giachetti, Matching techniques to compute image
motion, Image and Vision Computing, 18 (3), Feb.
2000, pp. 247-260.
[2] Ahmed K. Elmagarmid, H. Jiang, A. Helal, A. Joshi, M.
Ahmed, Video Database Systems - Issues, Products and
Applications, Kulwer Academic Publishers, 2001.
[3] Ðỗ Trung Tuấn, Lương Xuân Cương, Khun Piseth,
Nguyễn Văn Tảo, Về Xử lý dữ liệu video, Tạp chí khoa
học-Khoa học tự nhiên và công nghệ, Ðại học Quốc gia
Hà Nội, T.XIX, N3, 2003, tr. 48-56.
[4] E. Saez, J.I Benavides, N.Gui, Combining
Luminescence and Edge Based Metrics for Robust
Temporal Video Segmentation, IEEE Int’l. Conf. on
Image Processing (ICIP2004), Singapore, Oct. 24-27,
2004.
24
[5] H. H. Yu, W. Wolf, A hierarchical multiresolution
video shot transition detection scheme, Computer
Vision and Image Understanding, 75 (1/2), July/Aug.
1999, pp. 196-213.
[6] J. P. Lewis, Fast normalized cross-correlation, Vision
Interface, 1995, pp. 120-123.
zilla/Work/nvisionInterface/nip.html.
[7] Lương Xuân Cương, Ðỗ Xuân Tiến, Ðỗ Trung Tuấn
(2006), Một kỹ thuật chỉ số hoá tự động dữ liệu video
dựa trên đánh dấu vùng nền, Tạp chí khoa học-Khoa
học tự nhiên và Công nghệ, Ðại học Quốc gia Hà Nội,
T.XXII, No2, tr. 01-11.
[8] S. V. Porter (2004), Video Segmentation and Indexing
using Motion Estimation, Science and Technology
journal of University of Bristol, pp. 9-19.
[9] S. V. Porter, M. Mirmehdi, B. T. Thomas, Temporal
video segmentation and classification of edit effects, In
Image and Vision Computing, vol. 21, Dec. 2003, pp.
1097-1106.
[10] Y. Gong, H. Chua, and X. Guo, Image indexing and
retrieval based on color histogram, In Proc. Of Int'l
Conf. Multimedia Modeling, Singapore, Nov. 1995.
Ngày nhận bài: 02/08/2006
SƠ LƯỢC TÁC GIẢ
LƯƠNG XUÂN CƯƠNG
Sinh năm 1963 tại Bắc Ninh.
Tốt nghiệp Ðại học Bách khoa Ðà Nẵng năm 1995,
nhận bằng Thạc sĩ chuyên ngành Vô tuyến Điện tử và
Thông tin liên lạc tại Học viện Kỹ thuật Quân sự năm
2001.
Nơi công tác: Trường Sỹ quan CH-KT Thông tin
Nha trang.
Hướng nghiên cứu: Xử lý video, vi xử lý.
Email: lxcuong2002@yahoo.com
ĐỖ XUÂN TIẾN
Sinh năm 1951 tại Hà Tây.
Tốt nghiệp Ðại học LOLPI (Liên Xô) chuyên ngành
Vô tuyến điện năm 1975. Nhận bằng Tiến sĩ năm
1987 tại LETI (Liên Xô), chuyên ngành Thiết kế Vi
xử lý. Được công nhận chức danh Phó Giáo sư năm
2002.
Hiện nay đang là Chủ nhiệm bộ môn Kỹ thuật Vi
xử lý - Học viện Kỹ thuật Quân sự.
Hướng nghiên cứu: Kỹ thuật xử lý số, Xử lý song
song.
Email: doxuantienvxl@yahoo.com
ĐỖ TRUNG TUẤN
Tốt nghiệp Trường Đại học Bách khoa Hà Nội,
1976. Nhận bằng Thạc sĩ, Tiến sĩ ngành Tin học tại
Trường Đại học Pierre et Marie Curie (Paris VI), năm
1984, 1987. Được công nhận chức danh Phó Giáo Sư
năm 2003.
Hiện công tác tại Khoa Toán Cơ Tin học, Trường
Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà
Nội.
Email: tuandt@vnu.edu.vn
25
Các file đính kèm theo tài liệu này:
- jgkiah;glkwp;kghauiguwkhoahockithuatmaytinh (9).pdf