Nội dung
1. Giới thiệu
2. Bài toán cây bao trùm tối thiểu (MST)
3. Huffman coding
4. Phủ tập hợp
51 trang |
Chia sẻ: phuongt97 | Lượt xem: 530 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Bài giảng Giải thuật nâng cao: Giải thuật tham lam - Ngô Quốc Việt, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
GIẢI THUẬT THAM LAM
TS. NGÔ QUỐC VIỆT
2015
Nội dung
1. Giới thiệu
2. Bài toán cây bao trùm tối thiểu (MST)
3. Huffman coding
4. Phủ tập hợp
Giải thuật nâng cao-Lý thuyết số 2
Giới thiệu
• Thuật giải tham lam xây dựng giải pháp từng bước,
trong đó chọn lời bước kế tiếp dựa trên tiêu chí có
lợi & hiển nhiên nhất.
• Cách tiếp cận có thể cho lời giải không đúng trong
một số trường hợp, nhưng phần lớn đạt được kết
quả tối ưu.
• Bài giảng minh họa greedy với: MST, Huffman
coding, phủ tập hợp.
Giải thuật nâng cao-Lý thuyết số 3
Cây bao trùm tối tiểu – Minimum spanning tree
• Cho đồ thị G liên thông vô hướng, cây bao trùm (cây
khung) được định nghĩa là đồ thị con dạng cây
(không có chu trình) có mọi đỉnh của G và mọi đỉnh
liên thông nhau. Một đồ thị có thể có nhiều cây bao
trùm.
Graph A Một số Spanning Trees từ A
or or or
4
Cây bao trùm tối tiểu
• Số lượng cây bao trùm của đồ thị G
1 퐺 푙à 푐â푦
푡 퐺 = 푛 퐺 đồ 푡ℎị 푣ò푛𝑔 퐶푛
푛−2
푛 퐺 đồ 푡ℎị đầ푦 đủ 퐾푛
• Đồ thị đầy đủ: mọi cặp đỉnh được nối bởi cạnh duy nhất.
• Bigraph: tập đỉnh trong G chia thành hai tập rời nhau U,
V. Mỗi cạnh chỉ nối giữa điểm trong U với điểm trong V.
• Tìm cây bao trùm: theo chiều rộng, theo chiều sâu
5
Cây bao trùm tối tiểu
• Cây bao trùm nhỏ nhất là cây bao trùm có tổng
trọng số các cạnh nhỏ hơn tất cả các cây bao trùm
khác
Complete Graph Minimum Spanning Tree
7
2 2
5 3 3
4
1 1
• Thuật giải tìm MST trên đồ thị có hoặc không có
trọng số: Prim, Kruskal, Boruvka.
6
MST-Thuật giải Prim
• Tương tự thuật giải Dijkstra, với trọng số cạnh thay
chiều dài đường đi
1. Tạo cây ban đầu với đỉnh bất kỳ thuộc graph.
2. Thêm cạnh vào cây : chọn cạnh có trọng số nhỏ
nhất (chưa có trong cây đang tạo) nối với các
đỉnh của cây và thêm vào cây
3. Lặp lại (đến khi mọi đỉnh trong cây)
7
MST-Thuật giải Prim
• Input: đồ thị trọng số không rỗng với tập đỉnh V và
cạnh E (trọng số có thể âm).
• Khởi tạo: Vnew = {x}, với x is là node bất kỳ(starting
point) từ V, Enew = {}
• Lặp đến khi Vnew = V:
• Chọn cạnh {u, v} với minimal weight sao
cho u thuộc Vnew và v không thuộc (nếu có nhiều cạnh
cùng trọng số, chọn ngãu nhiên một cạnh)
• Thêm v vào Vnew, và {u, v} to Enew
• Output: Vnew và Enew chứa minimal spanning tree
8
MST-Thuật giải Prim
B 4 C
4 B 4 C
2 1 4
2 1
A 4
E F
1 A 4 E
1 F
D 2 3
10 D 2 3
G 5 10
G 5
5 6 3
5 6 3
4
I 4
H I
H
2 3
J 3
2 J
9
MST-Thuật giải Prim
B 4 C
4 B 4 C
2 1 4
2 1
A 4
E F
1 A 4 E
1 F
D 2 3
10 D 2 3
G 5 10
G 5
5 6 3
5 6 3
4
I 4
H I
H
2 3
J 3
2 J
10
MST-Thuật giải Prim
B 4 C
4 B 4 C
2 1 4
2 1
A 4
E F
1 A 4 E
1 F
D 2 3
10 D 2 3
G 5 10
G 5
5 6 3
5 6 3
4
I 4
H I
H
2 3
J 3
2 J
11
MST-Thuật giải Prim
B 4 C
4 B 4 C
2 1 4
2 1
A 4
E F
1 A 4 E
1 F
D 2 3
10 D 2 3
G 5 10
G 5
5 6 3
5 6 3
4
I 4
H I
H
2 3
J 3
2 J
12
MST-Thuật giải Prim
B 4 C
4 B 4 C
2 1 4
2 1
A 4
E F
1 A 4 E
1 F
D 2 3
10 D 2 3
G 5 10
G 5
5 6 3
5 6 3
4
I 4
H I
H
2 3
J 3
2 J
13
MST-Thuật giải Prim
B 4 C
4 B 4 C
2 1 4
2 1
A 4
E F
1 A 4 E
1 F
D 2 3
10 D 2 3
G 5 10
G 5
5 6 3
5 6 3
4
I 4
H I
H
2 3
J 3
2 J
14
MST-Thuật giải Prim
B 4 C
4 B 4 C
2 1 4
2 1
A 4
E F
1 A 4 E
1 F
D 2 3
10 D 2 3
G 5 10
G 5
5 6 3
5 6 3
4
I 4
H I
H
2 3
J 3
2 J
15
MST-Thuật giải Prim
B 4 C
4 B 4 C
2 1 4
2 1
A 4
E F
1 A 4 E
1 F
D 2 3
10 D 2 3
G 5 10
G 5
5 6 3
5 6 3
4
I 4
H I
H
2 3
J 3
2 J
16
MST-Thuật giải Prim
B 4 C
4 B 4 C
2 1 4
2 1
A 4
E F
1 A 4 E
1 F
D 2 3
10 D 2 3
G 5 10
G 5
5 6 3
5 6 3
4
I 4
H I
H
2 3
J 3
2 J
17
MST-Thuật giải Prim
B 4 C
4 B 4 C
2 1 4
2 1
A 4
E F
1 A 4 E
1 F
D 2 3
10 D 2 3
G 5 10
G 5
5 6 3
5 6 3
4
I 4
H I
H
2 3
J 3
2 J
18
MST-Thuật giải Prim-Phân tích
• Running Time: 푂(푚 + 푛 log 푛) (푚 =
푒푑𝑔푒푠, 푛 = 푛표푑푒푠)
• Nếu không dùng heap, the run time sẽ là 푂(푛2).
• Không cần sắp xếp theo trọng số cạnh trước.
• Vì xét theo đỉnh không cần xét khả năng tạo chu
trình
19
MST-Thuật giải Krusal
1. Sắp xếp tăng dần theo trọng số cạnh
2. Chọn cạnh có trọng số nhỏ nhất. Kiểm tra nếu
không tạo thành chu trình, chọn nó. Ngược lại
chọn cạnh khác có trọng số nhỏ và không tạo chu
trình.
3. Lặp bước 2 đến khi có (푉 − 1) cạnh trong cây bao
trùm
20
MST-Thuật giải Krusal
Giải thuật nâng cao-Lý thuyết số 21
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
22
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
23
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
24
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
Accepting edge (E,G) would create a cycle
25
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
26
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
27
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
28
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
29
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
30
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
31
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
32
MST-Thuật giải Krusal
3
F
10 C edge dv edge dv
A 4 3 (D,E) 1 (B,E) 4
8 4
6 (D,G) 2 (B,F) 4
5
4 B D (E,G) 3 (B,H) 4
4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G 3 E (C,F) 3 (A,B) 8
(B,C) 4 (A,F) 10
33
MST-Thuật giải Krusal
3
F
C edge dv edge dv
A 3 (D,E) 1 (B,E) 4
4
(D,G) 2 (B,F) 4
5
B D (E,G) 3 (B,H) 4
H (C,D) 3 (A,H) 5
2 1
3 (G,H) 3 (D,F) 6
G E
(C,F) 3 (A,B) 8 }
(B,C) 4 (A,F) 10
Done
Total Cost = dv = 21
34
MST-Thuật giải Krusal-Phân tích
• Running Time = O(m log n) (m = edges, n =
nodes). QuickSort algorithm
• Kiểm tra cạnh tạo ra chu trình có thể chậm. Tuy
nhiên, sử dụng data structure “union-find” sẽ khắc
phục nhược điểm.
• Trong một số trường hợp (có đỉnh nối với cạnh dài
nhất với đồ thị) phải kiểm tra mọi cạnh.
35
Phủ tập hợp-ví dụ
• Một khu quy hoạch (có nhiều khu phố) cần xác định các
vị trí xây trường với hai ràng buộc
• Trường phải trong khu phố (town)
• Không học sinh/phụ huynh nào phải đi qua xa (vd: 10km) từ
nhà đến trường
Các khu phố Khu phố trong
phạm vi 10km
• Câu hỏi: cần xây tối thiểu bao nhiêu trường?
• Yêu cầu trên có thể giải thông qua khái niệm phủ tập
hợp.
Giải thuật nâng cao-Lý thuyết số 36
Phủ tập hợp-định nghĩa
• Cho tập phổ biến 푈 = 푢1, 푢2, , 푢푛
• Gọi 푆1, 푆2, , 푆푘 ⊆ 푈 là các tập con có các trọng số
tương ứng 푐1, 푐2, , 푐푛
• Mục tiêu: cần tìm 퐼 = 1,2, , 푚 sao cho cực tiểu
푖 푐푖 và 푖 푆푖 = 푈.
• Hỏi: U, Si, ci trong bài toán xây các trường?
• 푈 ={các town trong khu quy hoạch}
• Với mỗi khu phố x, Sx là tập các town trong phạm vi 10km.
Trường tại x sẽ phủ các town này
• cx=1, x ?
Giải thuật nâng cao-Lý thuyết số 37
Phủ tập hợp-giải thuật greedy
• Chọn Si chứa nhiều town nhất chưa được phủ
• Lặp lại cho đến khi các Si được chọn phủ U.
• Ví dụ xây trường
• Chọn Sa, Sa chứa a, b, d, e, k, i, h.
• Chọn Sf hoặc Sg, vì chứa f, g.
• Chọn Sc và Sj chứa chính nó.
• 푖 푐푖 = 4.
• Nhận xét: có thể chọn giải pháp tốt hơn?
• Xây trường tại b, e, và i là giải pháp tốt hơn
Giải thuật nâng cao-Lý thuyết số 38
Phủ tập hợp-giải thuật greedy
1. 퐶 = *+
2. While 퐶 ≠ 푈
Tìm tập S có cost nhỏ nhất
푐(푆)
Đặt 훼 =
푆−퐶
Với mỗi 푒 ∈ 푆\C, đặt 푝푟𝑖푐푒(푒) = 훼
퐶 = 퐶 ∪ 푆
3. Ouput C
Giải thuật nâng cao-Lý thuyết số 39
Phủ tập hợp-giải thuật greedy-ví dụ
• Cho 푈 = *1,2,3,4,5+, 푆 = *푆1, 푆2, 푆3+, 푆1 = *4,1,3+,
퐶표푠푡(푆1) = 5, 푆2 = *2,5+, 퐶표푠푡(푆2) = 10, 푆3 =
*1,4,3,2+, 퐶표푠푡(푆3) = 3. Minh họa với Greedy
• Lần lặp 1: 푆1 = 퐶표푠푡(푆1)/|푆1 – 퐶| = 5/3; 푆2 =
퐶표푠푡(푆2)/|푆2 – 퐶| = 10/2; 푆3 = 퐶표푠푡(푆3)/
|푆3 – 퐶| = ¾ chọn S3.
• Lần lặp 2: S1 = Cost(S1)/|S1 – C| = 5/0; S2 =
Cost(S2)/|S2 – C| = 10/1 chọn S2.
• Trường hợp này greedy có nghiệm tối ưu
Giải thuật nâng cao-Lý thuyết số 40
Phủ tập hợp-giải thuật greedy-ví dụ
• 푈 = *1,2,3,4,5,6,7,8,9,10,11,12,13+; S1 = {1, 2} S2 =
{2, 3, 4, 5} S3 = {6, 7, 8, 9, 10, 11, 12, 13} S4 = {1, 3, 5,
7, 9, 11, 13} S5 = {2, 4, 6, 8, 10, 12, 13}. Giả sử cost
của các subset là giống nhau
• Kết quả của greedy algorithm là C= {S3, S2, S1}, so
với nghiệm tối ưu {S4, S5}.
Giải thuật nâng cao-Lý thuyết số 41
Phủ tập hợp-giải thuật greedy-ví dụ
IBM finds computer viruses (wikipedia)
• Elements: 5000 virus máy tính
• Sets: 9000 substring, mỗi substring khoảng 20++
bytes thể hiện virus.
• Xác định phủ tập hợp khoảng 180 substrings phủ
toàn bộ U.
Chỉ cần search trong 180 substring để xác định có
virus hay không?
Giải thuật nâng cao-Lý thuyết số 42
SC là bài toán NP-complete
• Định lý: Set Cover (SC) là NP-complete
• Chứng minh:
INSTANCE: Given a universe U of n elements, a collection
of subsets of U, S = {S1, , Sm}, and a positive integer b
QUESTION: Is there a , |C| ≤ b,
such that
(Note: The subcollection {Si | } satisfying the above
condition is called a set cover of U
Giải thuật nâng cao-Lý thuyết số 43
SC là bài toán NP-complete (tt)
• Cần chứng minh SC thuộc NP. Cho subcollection C,
dễ dàng kiểm chứng rằng nếu |C| ≤ b và union của
các tập trong C chứa mọi phần tử của U.
• Để chứng minh định lý, cần phải chứng minh Vertex
Cover (VC) ≤p Set Cover (SC)
Cho instance C của VC (undirected graph G=(V,E) và
số nguyên dương j), chúng ta cần xây dựng C’ của SC
trong thời gian đa thức sao cho C là satisfiable iff C’
là satisfiable.
Giải thuật nâng cao-Lý thuyết số 44
SC là bài toán NP-complete (tt)
• Construction: Đặt U = E. Định nghĩa n phần tử của U
và tập S như sau:
• Đánh nhãn mọi đỉnh trong V từ 1 đến n. Đặt Si là tập các
cạnh nối với đỉnh i. Sau đó, đặt b = j. Cách xây dựng này là
poly-time ứng với size của VC instance
• Chú ý: mỗi cạnh ứng với mỗi phần tử trong U và
mỗi đỉnh ứng với and một set trong S.
Giải thuật nâng cao-Lý thuyết số 45
VERTEX-COVER p SET-COVER
one element
for every edge
VC SC
one set for every vertex,
containing the edges it covers
Giải thuật nâng cao-Lý thuyết số 46
SC là bài toán NP-complete (tt)
• Cần chứng minh C là satisfiable iff C’ là satisfiable.
• Nghĩa là, cần chứng minh nếu original instance của
VC là YES instance iff constructed instance of SC là
YES instance.
• (→)
• Giả sử G có phủ đỉnh C kích thước tối đa là j. Theo
cách xây dựng trên, C ứng với collection C’ của các
subsets của U. Vì b = j, |C’| ≤ b. C’ phủ mọi
elements trong U vì C “phủ ” mọi cạnh trong G. Để
thấy điều này, xét bất kỳ phần tử nào của U. Sao cho
một phần tử là cạnh trong G. Vì C là set cover, có ít
nhất một endpoint của cạnh này thuộc C.
Giải thuật nâng cao-Lý thuyết số 47
SC là bài toán NP-complete (tt)
• (←)
• Giả sử có set cover C’ kích thước tối đa b trong
constructed instance. Vì mỗi tập trong in C’ được
kết hợp với đỉnh trong G, đặt C là tập các đỉnh này.
Thì |C| = |C’| ≤ b = j. C là vertex cover của G vì C’ là
set cover.
• Để thấy điều này, xét cạnh bất kỳ e. Vì e thuộc U, nên
C’ phải chứa ít nhất một tập set có chứa e. Theo
cách xây dựng trên, chỉ một tập hợp chứa e ứng với
các là các endpoint của e. Vậy C phải chứa ít nhất
một endpoint của e.
Giải thuật nâng cao-Lý thuyết số 48
Giải pháp
Algorithm 1: (trường hợp uniform cost)
1. C = empty
2. while U is not empty
3. pick a set Si such that Si covers the most
elements in U
4. remove the new covered elements from U
5. C = C union Si
6. return C
Giải thuật nâng cao-Lý thuyết số 49
Solutions
• Trường hợp non-uniform cost
• Phương pháp tương tự. Tại mỗi bước lặp, thay vì chọn
tập Si sao cho Si phủ nhiều nhất các phần tử chưa được
phủ, thì chọn tập Si có cost-effectiveness α nhỏ nhất, với
α được định nghĩa :
푐 푆
훼 = 푖
퐴푖 ∩ 푈
• Câu hỏi: tại sao chọn smallest α? Tạy sao định nghĩa α
như trên
Giải thuật nâng cao-Lý thuyết số 50
Solutions
Algorithm 2: (trường hợp non-uniform cost)
1. C = empty
2. while U is not empty
3. pick a set Si such that Si has the smallest α
4. for each new covered elements e in U
5. set price(e) = α
6. remove the new covered elements from U
7. C = C union Si
8. return C
Giải thuật nâng cao-Lý thuyết số 51
Các file đính kèm theo tài liệu này:
- bai_giang_giai_thuat_nang_cao_giai_thuat_tham_lam_ngo_quoc_v.pdf