Đặc điểm tín hiệu âm thanh
• Mô hình hệ thính giác
• Các phương pháp ADL trên
âm thanh 3
68 trang |
Chia sẻ: Mr hưng | Lượt xem: 1361 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Các phương pháp ấn dữ liệu trên âm thanh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
2• Đặc điểm tín hiệu âm thanh1
• Mô hình hệ thính giác2
• Các phương pháp ADL trên
âm thanh3
• Thảo luận, bài tập, và
seminar4
• Các thành phần cơ bản của tai người và
nguồn phát âm thanh
3
4Nguồn
Dao
động
51 chiều
Các dạng sóng
6
7• Tai có những cảm thụ khác
nhau (âm bổng, âm trầm).
• Giọng nữ bổng và giọng nam
trầm.
• Độ cao của âm thanh mỗi
người khác nhau
Độ cao
(Pitch)
Độ cao được xác định bằng số dao động
của tín hiệu trong 1 giây (tần số - Hz).
8Bước sóng
Độ lớn
Một dao động
Độ cao(Pitch)
Cường độ
Quyết
định
9Pitch caoPitch thấp
Độ cao(Pitch)
Tần số thấp Tần số cao
10
Bước sóng ngắn,
tần số cao
Bước sóng dài,
tần số thấp
Độ cao(Pitch)
Pitch caoPitch thấp
Độ lớn (Loudness)
11
Bước sóng
Độ lớn
Một giao động
Cường độ
Quyết
định
Độ lớn (Loudness)
12
C
ư
ờ
n
g
đ
ộ
13
Độ lớn (Loudness)
• Được đo bằng đơn vị
decibel (dB)
• Âm thanh nhỏ nhất mà
tai có thể cảm nhận được
là 0dB.
• Ngưỡng đau là 120 dB.
Độ lớn (Loudness)
14
Cường độ
Dao động trong không
khí càng lớn thì âm
tạo ra càng to.
Mức áp suất không
khí khi một vật dao
động.
Áp suất không khí này
được xem như cường
độ.
Độ lớn
Tùy thuộc vào cảm
nhận của mỗi người
Mức độ “thính” của
tai người
Tần số cao nghe
lớn tần số thấp
15
- Âm thanh A có cường độ lớn hơn âm thanh B (năng lượng cao hơn).
- Âm thanh B có tần số cao hơn âm thanh A (trong cùng khoảng thời gian,
âm thanh B cho nhiều sóng ).
Độ cao(Pitch)
Âm thanh A Âm thanh B
Độ lớn (Loudness)
16
Họa âm thứ nhất đến thứ năm của
của 1 tiếng đàn
Âm sắc(Timbre)
• Âm sắc quyết định chất
lượng hay màu sắc của âm.
• Âm sắc được quyết định
bởi các họa âm và mối
quan hệ giữa các độ lớn
của các họa âm.
17
Âm sắc(Timbre)
Tần số
Âm cơ
bản
Họa âm
18
Sóng vuông chỉ chứa các họa âm lẻ
Âm sắc(Timbre)
Âm cơ
bản
Âm tổng
hợp
19
Sóng tổng hợp của các họa âm
Âm sắc(Timbre)
20
Âm sắc(Timbre)
21
20 Hz-20kHz
Nhạy cảm:
1kHz-5kHz
Tạp âm
Âm thanh
Tạp âm
22
• Đặc điểm tín hiệu âm thanh1
• Mô hình hệ thính giác2
• Các phương pháp ADL trên
âm thanh3
• Thảo luận, bài tập, và
seminar4
23
Tai người
Các biến
đổi về mặt
thời gian
của áp âm
Đặc tính về cả
thời gian và phổ
tần số
24
25
26
27
Critical band
Được Harvey
Fletcher giới
thiệu vào
1940
Đơn vị: Bark -
tương ứng độ
rộng của 1
critical band
Trong khoảng tần số mà HVS
có thể cảm nhận (20 Hz-
20kHz) được chia thành các
critical band với số lượng
khác nhau (24, 25, 32, 55,
hoặc 109) tùy thuộc vào tần số
ngưỡng
28
Critical band
29
Ngụy trang
tần số
30
Ngưỡng
nghe
31
0 2 4 6 8 10 12 14 16 18 20 22 24
critical band [Barks]
60
40
20
0M
ứ
c
k
íc
h
th
íc
h
[d
B
]
Hàm nghe
Tần số (kHz)
M
ứ
c
k
íc
h
th
íc
h
[d
B
]
32
0 2 4 6 8 10 12 14 16 18 20 22 24
critical band [Barks]
60
40
20
0M
ứ
c
k
íc
h
th
íc
h
[d
B
]
Khoảng lặng
Ngưỡng nghe
Âm thanh
33
0 2 4 6 8 10 12 14 16 18 20 22 24
critical band [Barks]
60
40
20
0M
ứ
c
k
íc
h
th
íc
h
[d
B
]
Tín hiệu
watermark
Tín hiệu âm
thanh chứa
34
Ngụy trang
thời gian
35
masker
maskee
• Tín hiệu âm thanh chứa
• Tín hiệu
• Tín hiệu watermark
• Nhiễu
36
Ngụy trang tín
hiệu âm thanh
Ngụy trang
tần số
Ngụy trang
thời gian
37
Mức độ ngụy trang
38
Vô hình
(Chất lượng)
Dung lượng
chứa
Bền vững
39
HỆ THÍNH GIÁC
Sức
chứa
Vô
hình
Dung
lượng
40
M
ô
h
ìn
h
g
iả
lậ
p
h
ệ
th
ín
h
g
iá
c
41
• Đặc điểm tín hiệu âm thanh1
• Mô hình hệ thính giác2
• Các phương pháp ADL trên
âm thanh3
• Thảo luận, bài tập, và
seminar4
42
Mã hóa bit ít quan trọng nhất
Phương pháp dùng tiếng vang
Mã hóa pha
Phương pháp Patch work
43
Sample Rate Bit depth
1x-bit 2x-bit 4x-bit
44
Sample (Mẫu)
Tập tin
âm thanh 3 4 5 6 5 4 3 2 2 3 1 1 3 4 5 5
101
(watermark)
110
1 0 1
111 000
100001
101
7 0 5
Chọn mẫu
ngẫu nhiên
45
Miền thời gian
Thuật toán đơn giản nhất
Khả năng nhúng cao, chi
phí thấp
46
Quá trình nhúng
Chọn ngẫu nhiên hai tập A = {ai} và B = {bi}Bước 1
• Tính độ lỗi
Tính giá trị mới cho A và BBước 2
Thay thế các giá trị ai và bi bằng các giá trị mớiBước 3
22
1 1
1
N N
i ii i
a a b b
S
N N
*
*
/ 2
/ 2
i i
i i
a a sign a b CS
b b sign a b CS
47
Quá trình trích
Tính giá trị thống kêBước 1
So sánh T2 với ngưỡng τBước 2
• Nếu T2 > τ có nhúng watermark
• Ngược lại không có
2
2
2
a b
T
S
48
1 1
,
j j j
k k k j k
• Phân đoạn tín hiệu
chứa với chiều dài
N
Bước 1
• Mỗi đoạn được biến
đổi bằng DFTBước 2
• Tính sự khác biệt
của một ma trận pha
với các ma trận pha
xung quanh
Bước 3
Ma trận phase
φj [ωk]
Ma trận cường độ
|Aj[ωk]|
0 ≤ k ≤ N/2 – 1, 0 ≤ j ≤ N - 1
49
1
0
1
2
m k
k
1 1 ,j j jk k k j k
• Tín hiệu thủy vân
được nhúng vào
phổ pha đầu tiên
Bước 4
• Tạo ma trận pha
mớiBước 5
• Kết hợp ma trận
pha mới và ma trận
cường độ (cũ)
Bước 6
• Biến đổi DFT
ngượcBước 7
50
• Phân đoạn tín hiệu
chứa với chiều dài N
Bước 1
• Biến đổi DFT cho
đoạn tín hiệu đầu tiên
Bước 2
• Xét ma trận phaBước 3
0 2
k
0 2
k
Bit 0
Bit 1
51
52
Cơ chế tiếng vang
Tham số: độ lớn khởi
tạo, độ trễ, decay rate.
deltaĐộ trễ
Mẫu TH gốc
Mẫu echo‘1’
Mẫu echo‘0’
Độ lớn
ban đầu
Decay
rate
Decay
rate
Bit „1‟
Bit „0‟
53
Định nghĩa các kernel ‘1’ và kernel ‘0’
Quá trình nhúng
01
Mẫu echo cho bit ‘1’
w1= α1 c(t+1) w0=α0 c(t+0)
Mẫu TH gốc Mẫu TH gốc
D
ec
ay
ra
te
α
0
D
ec
ay
ra
te
α
1
Mẫu echo cho bit ‘0’
54
Tín hiệu gốc
Tín hiệu gốc
Tín hiệu echo
00
kernel ‘0’
Quá trình nhúng
( ) ( )* ( )wc t c t h t
a b c d e f g
1 0 1 1 0 0 1
55
Encode
‘1’
a b c d e f g
1
Encode
‘0’
a b c d e f g
0
Quá trình nhúng
56
a b c d e f g
1 0 1 1 0 0 1
Định nghĩa các bộ trộn tín hiệu
Bộ
trộn‘1’
Bộ
trộn‘0’
Quá trình nhúng
1
0
0
( ) (1 ) ( )
M
j j
j
m t b rect t
1
1
0
( ) ( )
M
j j
j
m t b rect t
1
1 if
( )
0 otherwise
j j
j
t t t
rect t
bj = w [j mod l(w)]
Với w là watermark,
l(w) là chiều dài
watermark.
1
0
1
0
1011001
(watermark)
57
Quá trình nhúng
1 0 1 1 0 0 1
58
c(t)
w1=c(t+1)
w0=c(t+0)
w0* m0
w1* m1
cw= c0+w1*m1+w0*m0
Quá trình nhúng
Tín hiệu
gốc
Kernel
‘1’ (w1)
Kernel
‘0’ (w0)
Bộ trộn
‘0’ (m0)
Tín hiệu
đánh dấu
Bộ trộn
‘1’ (m1)
59
init(Block blocks[])
{
for (int i=0; i < blocks.length; i++)
{
if (blocks[i].echoValue() == 0)
blocks[i] = offset0(blocks[i]);
else
blocks[i] = offset1(blocks[i]);
}
}
Block offset0(Block block)
{
return (block + (block - OFFSET_0));
}
Block offset1(Block block)
{
return (block + (block - OFFSET_1));
}
Quá trình nhúng
60
Xác định 1 và 0
từ tín hiệu đã
nhúng
Quá trình trích
Bước 1
• Tìm phổ tín hiệu (cepstrum)
Bước 2
• Tự tương quan tín hiệu x (Rxx) trong miền
phổ
Bước 3
• Xác định thông tin đã nhúng thông qua các
peak của tín hiệu tự tương quan Rxx
61
Quá trình trích
F(x) 2ln F xx CxF-1
F(cx)
2
xF cCx RxxF
-1
62
Hàm tự tương quanQuá trình trích
63
Ví dụ Quá trình nhúng
3 5 2 1 4
Đoạn âm thanh gốc
Echo cho bit ‘0’
Echo cho bit ‘1’
0 0 3 5 2
0 0 0 3 5
Giả sử độ trể
tương ứng với
bit 1 là 2
Giả sử độ
trể tương
ứng với bit
0 là 3
Các tham số
1 = 2
0 = 3
α0 = α1 = 0.5
64
Ví dụ nhúng bit 1
3 5 2 1 4
Echo cho bit ‘1’
0 0 3 5 2
Các tham số
1 = 2
0 = 3
α0 = α1 = 0.5
3 =
3 5 3.5 3.5 5
Kết quả sau khi nhúng
Đoạn âm thanh gốc
+ *
65
Ví dụ nhúng bit 0
3 5 2 1 4
Echo cho bit ‘0’
0 0 0 3 2
Các tham số
1 = 2
0 = 3
α0 = α1 = 0.5
2 =
3 5 2 2.5 6.5
Kết quả sau khi nhúng
Đoạn âm thanh gốc
+ *
66
Ví dụ quá trình nhúng
3 5 2 1 4
Các tham số
1 = 2
0 = 3
α0 = α1 = 0.5Đoạn âm thanh gốc
3 5 3.5 3.5 5
3 5 2 2.5 6.5
Kết quả khi:
Nhúng bit 1
Nhúng bit 0
67
Ví dụ quá trình rút trích
3 5 2 2.5 6.5
Các tham số
1 = 2
0 = 3
α0 = α1 = 0.5Đoạn âm thanh đã nhúng
1 0.1417 0.0483 0.0548 0.2553
Kết quả
FFT ln IFFT autocorr
Echo 1 Echo 0 Bit 0
68
Các file đính kèm theo tài liệu này:
- cac_phuong_phap_an_du_lieu_tren_am_thanh_2375.pdf