Vận trù học (Operations Research) ñược xem là một công cụ ñịnh lượng nền tảng
của Khoa học quản lí mà trong ñó các phương pháp và kĩ thuật của Toán học và các
công cụ tính toán, lưu trữ và xử lí dữ liệu của Tin học ñược áp dụng ñể mô hình hóa,
phân tích và tìm ra lời giải cho các bài toán quyết ñịnh, nhằm hỗ trợ bộ máy quản lí
ñưa ra các quyết ñịnh hợp lí nhất. Trên thế giới việc nghiên cứu và ứng dụng Vận trù
học ngày càng phát triển sâu rộng với nhiều tạp chí chuyên ngành nổi tiếng, môn Vận
trù học ñược giảng dạy với thời lượng khá lớn bao gồm nhiều nội dung phong phú và
cấp thiết trong nhiều chương trình ñào tạo ñại học và cao học
239 trang |
Chia sẻ: phuongt97 | Lượt xem: 544 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Giáo trình Vận trù học (Cho ngành Tin học và Công nghệ thông tin), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
x {E(X/ai)} = ( )33 ij j
i=1 j 1
v PMax θ
=
θ∑
= Max {13,6; 13,2; 12,0} = 13,6 = E(X/a1 ).
Do ñó chúng ta lựa chọn hành ñộng a1, tức là ñặt mua hàng dự trữ ở mức cao nhất.
Trường ðại học Nông nghiệp Hà Nội – Giáo trình Vận trù học ..........170
Các xác suất Pθ(θ1) = 0,2, Pθ(θ2) = 0,5, Pθ(θ3) = 0,3 là các xác suất của các trạng
thái có thể xảy ra ñã ñược ước lượng từ các số liệu thống kê sẵn có trước ñây. Chúng
ñược gọi là các xác suất tiên nghiệm (Prior Probabilities). Còn quy trình ra quyết ñịnh
trên ñây ñược gọi là phân tích quyết ñịnh Bayes dựa trên xác suất tiên nghiệm. Như vậy,
trong mục 1.3 chúng ta ñã áp dụng quy trình ra quyết ñịnh kiểu này ñể ñưa ra quyết ñịnh
trong môi trường rủi ro.
2.2. Phân tích quyết ñịnh Bayes dựa trên xác suất hậu nghiệm
Chúng ta quay lại ví dụ 1 nêu trên và bảng VI.8. Tuy nhiên, trong mục này θ ñược
dùng ñể chỉ kì vọng của nhu cầu thị trường Z.
− Giả sử rằng, Z là biến ngẫu nhiên tuân theo phân phối chuẩn N(θ, 10), trong ñó
E(Z) = θ và D(Z) = 10. Vậy hàm mật ñộ của Z với ñiều kiện θ = θj chính là
( )
2j(z )
2 10
Z j
1f z / e
2 10
−θ
−
×θ = θ =
pi×
− Phân phối xác suất tiên nghiệm của θ là Pθ(θ1) = 0,2, Pθ(θ2) = 0,5, Pθ(θ3) = 0,3
như ñã biết.
− Ngoài ra, sau khi khảo sát chi tiết hơn, giả sử ñã biết thêm ñược thông tin mới Z = 10.
Chúng ta có thể kết hợp thông tin này và phân phối xác suất tiên nghiệm của θ ñể
tìm phân phối xác suất hậu nghiệm của θ khi biết Z nhận một giá trị z nào ñó. Sau ñó
dựa vào các xác suất hậu nghiệm (Posterior Probabilities) tìm ñược, một quyết ñịnh
hợp lí sẽ ñược ñưa ra dựa trên Tiêu chuẩn giá trị kì vọng. Quy trình ra quyết ñịnh như
vậy ñược gọi là phân tích quyết ñịnh Bayes dựa trên xác suất hậu nghiệm.
Kí hiệu hθ(θj/Z=z) là các xác suất hậu nghiệm, j =1, 2,..., n, có thể chứng minh ñược
một cách tổng quát công thức sau ñây (trong ví dụ nêu trên, n = 3):
( ) ( ) ( )
( ) ( )
Z j j
j n
Z k k
k 1
f z / P
h / Z z
f z / P
θ
θ
θ
=
θ = θ θ
θ = =
θ = θ θ∑
(*)
Áp dụng công thức (*) cho ví dụ ñang xét khi z = 10, ta có:
hθ(θ1/Z=10) =
1
2 2,5
1 1
2 2,5 2 2,5
0,2 e
0,2 e 0,5 0,3 e
−
×
− −
× ×
×
× + + ×
= 0,089,
hθ(θ2/Z=10) = 1 1
2 2,5 2 2,5
0,5
0,2 e 0,5 0,3 e
− −
× ×× + + ×
= 0,777,
hθ(θ3/Z=10) =
1
2 2,5
1 1
2 2,5 2 2,5
0,3 e
0,2 e 0,5 0,3 e
−
×
− −
× ×
×
× + + ×
= 0,134.
Căn cứ Tiêu chuẩn kì vọng lợi nhuận tối ña cần quyết ñịnh lựa chọn a2 vì:
3
i=1
Max {E(X/ai)} = ( )33 ij j
i=1 j 1
v h / Z 10Max θ
=
θ =∑
= Max {12,716; 13,644; 12,000} = 13,644 = E(X/a2 ).
Chú ý: Ví dụ trên ñây có tính chất minh họa cho các quy trình quyết ñịnh Bayes dựa
trên xác suất hậu nghiệm. Trong các trường hợp phân phối xác suất của Z là phân phối
rời rạc thì trong công thức (*) có thể thay hàm mật ñộ có ñiều kiện bởi các xác suất có
ñiều kiện.
3. CÂY QUYẾT ðỊNH VÀ CÁC BÀI TOÁN QUYẾT ðỊNH NHIỀU GIAI ðOẠN
3.1. Bài toán quyết ñịnh nhiều giai ñoạn
Chúng ta hãy xét lại ví dụ 1 mục 1.3 và thực hiện việc ra quyết ñịnh dựa trên Tiêu
chuẩn kì vọng lợi nhuận tối ña với sự trợ giúp của cây quyết ñịnh (xem hình VI.1). Trên
cây quyết ñịnh này có một nút quyết ñịnh (hình chữ nhật), mà tại ñó cần ra quyết ñịnh
ñể lựa chọn một trong các hành ñộng a1, a2, a3 hay a4. Ngoài ra, trên cây quyết ñịnh này
còn có bốn nút trạng thái, mà tại ñó chúng ta cần xem xét khả năng xảy ra của mỗi một
trong bốn trạng thái. Các nút trạng thái ñược nối với nút quyết ñịnh bởi các nhánh của
cây quyết ñịnh.
Ta có EV1 = E(X/a1) =
4
1j j
j 1
v p( )
=
θ∑ = 50 × 0,2 + 50 × 0,4 +50 × 0,3 + 50 × 0,1 = 50
USD. Tương tự, EV2 = E(X/a2) = 53,4 USD; EV3 = E(X/a3) = 53,6 USD và EV4 =
E(X/a4) = 51,4 USD. Vậy chúng ta lựa chọn hành ñộng a3, tức là ñặt mua 12 hòm cam
cho mỗi ngày do nút trạng thái số 1 có giá trị kì vọng lớn nhất.
Có thể thấy rằng, cây quyết ñịnh cho phép trình bày việc ra quyết ñịnh một cách
trực quan hơn so với việc sử dụng bảng pay-off như trong mục 1.3. Ngoài ra, cây quyết
ñịnh còn có thể ñược sử dụng cho các bài toán ra quyết ñịnh nhiều giai ñoạn.
Trường ðại học Nông nghiệp Hà Nội – Giáo trình Vận trù học ..........172
a2
a 1
EV1
EV2
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
0
Hình VI.1. Cây quyết ñịnh
Ví dụ 1: Cây quyết ñịnh với nhiều nút quyết ñịnh, bài toán ra quyết ñịnh nhiều giai
ñoạn, ñịnh giá thông tin mới.
Các công ti cần phát triển sản phẩm mới thường muốn xây dựng các nhà máy thử
nghiệm (phát triển) sản phẩm trước khi xây dựng nhà máy sản xuất sản phẩm một cách
ñại trà. Tuy nhiên, việc xây dựng nhà máy thử nghiệm nhiều khi khá tốn kém, nên trong
các ñiều kiện cụ thể cũng cần cân nhắc xem có nên xây dựng nhà máy thử nghiệm hay
không.
Bởi vậy, khi muốn phát triển một sản phẩm mới, có ba phương án hành ñộng cần
xem xét ñể lựa chọn:
- Sản xuất sản phẩm một cách ñại trà ngay không qua giai ñoạn thử nghiệm.
- Xây dựng nhà máy thử nghiệm.
- Dừng, không triển khai việc sản xuất sản phẩm mới.
Ngoài ra, cần cân nhắc xem chi phí xây nhà máy thử nghịêm (ñể thu thập thêm
thông tin mới về quy trình sản xuất hay nhu cấu của thị trường ñối với sản phẩm mới)
cho phép tới mức nào. Nói cách khác, cần tìm hiểu ñể biết thông tin mới do nhà máy
thử nghiệm mang lại ñược ñịnh giá là bao nhiêu?
Cây quyết ñịnh cho bài toán ra quyết ñịnh nhiều giai ñoạn này ñược minh họa trên
hình VI.2.
EV7 =0
EV10 =0
EV 5
= 811
7500
9
EV
=0
6
7
5
2
3
1
4
10
9
8
EV6
=1 01
83750
EV 8
=–
147
000x©y nhµ m¸y thÝ nghiÖm
hq cao
hq cao
12250000, xs 0,7
–1525000, xs 0,3
EV2 =8147000
0, xs 1,0
12250000, xs 0,1
12250000, xs 0,85
–1525000, xs
0,15
–1525000, xs 0,9
0, xs 1,0
0, xs 1,0
xs 0
hq cao
hiÖ
u q
u¶
ca
o
sx
0,
8
s¶n
xuÊ
t ®¹
i trµ
hq thÊp
hq thÊp
hq thÊp
dõng
dõng
dõng
dõng
dõng
hiÖu qu¶ thÊp
dõng
s¶n
xu
Êt ®
¹i t
rµ
s¶n
xu
Êt ®
¹i t
rµ
Hình VI.2. Cây quyết ñịnh với nhiều nút quyết ñịnh
Giải thích: Trên cây quyết ñịnh có ba nút quyết ñịnh (khung hình chữ nhật). Nút 3
và nút 4 sử dụng thông tin do nhà máy thử nghiệm ñem lại ñể quyết ñịnh xem có nên
sản xuất ñại trà hai không. Nút 1 là nút ñưa ra quyết ñịnh lựa chọn một trong ba phương
án hành ñộng: Sản xuất ñại trà, xây nhà máy thử nghiệm hay dừng. Các nút còn lại là
các nút trạng thái (khoanh tròn), mà tại ñó cần tính các giá trị kì vọng (lợi nhuận có thể
ñạt ñược). Hành ñộng theo phương án sản xuất ñại trà (ñi từ nút 1 tới nút 5), phải tính
tới hai trạng thái: sản xuất cho hiệu quả cao với xác suất là 0,7 và giá trị lợi nhuận là
12250000 USD; hiệu quả thấp với xác suất là 0,3 và giá trị lợi nhuận là -1525000 USD
(hay thất thu là 1525000 USD). Hành ñộng theo phương án xây nhà máy thử nghiệm (ñi
từ nút 1 tới nút 2) cũng phải tính tới hai trạng thái: nhà máy thử nghiệm cho hiệu quả
cao hoặc cho hiệu quả thấp với các xác suất tương ứng là 0,8 và 0,2. Ứng với từng trạng
thái ñó cần ñưa ra các quyết ñịnh (tại các nút quyết ñịnh 3 và 4) là có nên sản suất ñại
trà hay dừng hẳn việc sản xuất sản phẩm mới... Phần còn lại của cây quyết ñịnh dành
cho bạn ñọc tự giải thích.
ðể ñưa ra quyết ñịnh lựa chọn theo Tiêu chuẩn kì vọng lợi nhuận tối ña, chúng ta
bắt ñầu từ việc tính kì vọng lợi nhuận của các nút (rễ của cây quyết ñịnh) 5, 6, 7, 8, 9 và
10 và thu ñược các giá trị kì vọng theo thứ tự là: 8117500, 10183750, 0, -147000, 0 và 0
(USD). So sánh các kì vọng lợi nhuận tại nút 6 và nút 7, chúng ta ñưa ra quyết ñịnh
chọn phương án sản xuất ñại trà cho nút 3. Lúc này nút 3 có kì vọng lợi nhuận là
Trường ðại học Nông nghiệp Hà Nội – Giáo trình Vận trù học ..........174
10183750 USD. Tương tự, so sánh các kì vọng lợi nhuận tại nút 8 và nút 9, chúng ta
ñưa ra quyết ñịnh chọn dừng sản xuất cho nút 4 với kì vọng lợi nhuận là 0 USD.
Từ ñó chúng ta xác ñịnh ñược các kì vọng lợi nhuận của các nút trạng thái 5, 2, 10
(là các nút nối trực tiếp tới nút 1) theo thứ tự là là 8117500, 8147000 và 0 USD. Bởi vậy
chúng ta chỉ còn phải cân nhắc ñể lựa chọn hoặc xây nhà máy thử nghiệm hoặc sản xuất
ñại trà. Do việc xây nhà máy thử nghiệm cho lợi nhuận nhiều hơn việc sản xuất ñại trà
một lượng tiền là 8147000 - 8117500 = 29500 USD, nên thông tin mới do nhà máy thử
nghiệm mang lại ñược ñịnh giá là 29500 USD.
Vậy quyết ñịnh cuối cùng ñược ñưa ra như sau: Nếu chi phí xây nhà máy thử
nghiệm thấp hơn 29500 USD thì nên trước tiên xây nhà máy thử nghiệm và sau ñó
tiến hành sản xuất ñại trà. Nếu trái lại, nên sản xuất ñại trà sản phẩm ngay mà không
xây nhà máy thử nghiệm (phương án hành ñộng như vậy sẽ mang lại kì vọng lợi
nhuận 8117500 USD).
3.2. Phân tích Bayes sử dụng cây quyết ñịnh
Ví dụ 2: Trong các ví dụ 1 mục 3.1, việc xây dựng cây quyết ñịnh là dựa trên các
xác suất tiên nghiệm. Trong ví dụ này, cây quyết ñịnh ñược xây dựng dựa trên xác suất
hậu nghiệm, ñược tính toán căn cứ ñịnh lí Bayes, nhằm giúp cho một công ti dầu khí
quyết ñịnh một trong ba lựa chọn: liệu có nên mua tài liệu tư vấn ñịa chất trước khi
khoan hay cứ tiến hành khoan giếng lấy dầu ngay tại một ñịa ñiểm khoan giếng dầu ñã
kí ñược hợp ñồng, hoặc không tiến hành khoan giếng mà nên bán lại hợp ñồng.
Giám ñốc sản xuất của công ti cho rằng khi khoan một giếng dầu tại khu vực này thì
có ba hậu quả sau có khả năng xảy ra: Giếng khô (không dầu), Dầu chua (dầu tạp khó
lọc) và Dầu ngọt (dầu tinh dễ lọc). Tại vùng ñất trên, nơi có khu vực của công ti, nhiều
giếng dầu ñã ñược khoan với số liệu thống kê như sau: tỉ lệ giếng không dầu là 60%,
giếng có dầu chua là 20% và giếng có dầu ngọt là 20%. Theo ñánh giá của bà giám ñốc,
với giếng dầu khô (không dầu) thất thu trung bình là 50000 USD, với giếng dầu chua lợi
nhuận trung bình ñạt ñược là 200000 USD, còn với giếng dầu ngọt lợi nhuận trung bình
là 500000 USD. Trong trường hợp công ti không khoan giếng mà bán lại hợp ñồng thì
thu ñược 80000 USD.
Công ti cũng có thể mua thêm tài liệu ñịa chất từ phía tư vấn với giá 25000 USD.
Qua thống kê, ñã biết ñược thông tin sau ñây về phía tư vấn: Trong các giếng không dầu
ñã khoan có 10% số giếng ñã ñược tư vấn nên khoan, 90% ñã ñược tư vấn không nên
khoan. Trong các giếng dầu chua ñã khoan có 40% số giếng ñã ñược tư vấn nên khoan
và 60% ñã ñược tư vấn không nên khoan. Trong các giếng dầu ngọt ñã khoan có 50% số
giếng ñã ñược tư vấn nên khoan và 50% ñã ñược tư vấn không nên khoan.
Gọi sự kiện giếng khoan lên không có dầu là sự kiện A, có dầu chua là B và có dầu
ngọt là C. Lúc ñó có các xác suất (thực nghiệm) sau: P(A) = 60%, P(B) = 20%, P(C) =
20%. Gọi sự kiện (tư vấn cho là) nên khoan là F, không nên khoan là U. Lúc ñó có thể
coi P(F/A) = 10%, P(F/B) = 40%, P(F/C) = 50%, P(U/A) = 90%, P(U/B) = 60%, P(U/C)
= 50%. Theo ñịnh lí Bayes, các xác suất hậu nghiệm ñược tính như sau (xem hình V.3
với các xác suất tại nút trạng thái số 6)):
P(A/F) = P(F / A)P(A)
P(F / A)P(A) P(F / B)P(B) P(F / C)P(C)+ +
=
0,1 0,6
0,1 0,6 0,4 0, 2 0,5 0,2
×
× + × + ×
=
0,06
0,24
= 0,2500.
Tương tự, ta có: P(B/F) = 0,4 0,2
0,24
×
= 0,3333 và P(C/F) = 0,5 0,2
0,24
×
= 0,4176.
Tiếp tục áp dụng ñịnh lí Bayes, chúng ta cũng có:
P(A/U) = P(U / A) P(A)
P(U / A) P(A) P(U / B) P(B) P(U / C) P(C)
×
× + × + ×
=
0,9 0,6
0,9 0,6 0,6 0, 2 0,5 0, 2
×
× + × + ×
=
0,54
0,76
= 0,7105.
Tương tự, cũng có: P(B/U) = 0,12
0,76
= 0,1579 và P(C/U) = 0,10
0,76
= 0,1316.
Trường ðại học Nông nghiệp Hà Nội – Giáo trình Vận trù học ..........176
EV6 = 262500
7
6
2
5
1
3
8
EV7=
61842
EV8= 110000
khoan
nên
kho
an
không nên khoan
khô
khô
khô
chua
chua
chua
80000 USD
–50000 USD
EV
2
=
12
38
00 80000 USD
200000 USD
500000 USD
xs
0,24
4
khoan
khoan
80000 USD
–50000 USD
–50000 USD
200000 USD
200000 USD
500000 USD
500000 USD
xs 0,16
xs 0,20
xs 0,60
xs 0,25
xs 0,20
xs 0,71
xs 0,33
xs 0,42
xs 0
,76
m
ua
t−
v
Ên
ngät
ngät sx 0,13
ngät
kh«ng mua t− vÊn
Hình VI.3. Cây quyết ñịnh với xác suất hậu nghiệm
Sau khi ñã tính ñược các xác suất hậu nghiệm trên ñây, chúng ta xây dựng ñược cây
xác suất như trên hình VI.3 và tính ñược kì vọng lợi nhuận của các nút 6, 7 và 8 theo
thứ tự là 262500, 61842 và 110000 USD. Do ñó tại nút quyết ñịnh số 3, quyết ñịnh là
tiến hành khoan giếng với kì vọng lợi nhuận là 262000. Tại nút quyết ñịnh số 4, quyết
ñịnh là bán lại hợp ñồng với lợi nhuận là 80000. Còn tại nút quyết ñịnh số 5, quyết ñịnh
là tiến hành khoan giếng với kì vọng lợi nhuận là 110000. Sau ñó tiếp tục tính kì vọng
lợi nhuận tại nút trạng thái số 2 (là 123800). Cuối cùng so sánh các lợi nhuận tại các nút
số 2 và số 5 ñể chọn phương án hành ñộng mang lại kì vọng lợi nhuận lớn hơn: Cần
phải mua tài liệu tư vấn ñể biết có nên khoan hay không trong trường hợp giá mua tài
liệu tư vấn thấp hơn hiệu số 123800 - 110000 = 13800 USD. Nếu giá mua tài liệu tư vấn
ñắt hơn 13800 USD thì nên tiến hành khoan ngay mà không nên mua tài liệu tư vấn.
Như vậy, với giá tài liệu tư vấn là 25000, rõ ràng chúng ta nên tiến hành khoan ngay và
không cần mua tài liệu tư vấn.
Chú ý: Rõ ràng rằng, một khi có thông tin mới thì chúng ta phải xem xét lại quyết
ñịnh. Chẳng hạn, chúng ta có bài toán phân tích ñộ nhạy quyết ñịnh khi lợi nhuận PS
thu ñược khi khoan một giếng dầu ngọt không phải là 500000 USD, mà biến thiên tăng
dần từ 200000 tới 500000 USD (ñể ñơn giản, giả sử mỗi nấc tăng là 2000 USD). Lúc
ñó, với các tính toán tương tự như ñã làm và với giá mua tài liệu tư vấn chẳng hạn là
25000 USD, có thể chỉ ra rằng: Với PS trong khoảng 200000 tới 312000 USD thì nên
lựa chọn việc bán lại hợp ñồng. Với PS trong khoảng 312000 tới 388000 USD thì nên
mua tài liệu tư vấn. Còn nếu PS lớn hơn 388000 USD thì nên khoan ngay mà không cần
mua tài liệu tư vấn.
4. RA QUYẾT ðỊNH DỰA TRÊN TIÊU CHUẨN KÌ VỌNG THỎA DỤNG TỐI ðA
4.1. Khái niệm hàm thỏa dụng
Trong các mục 1.3 và 1.4, quyết ñịnh trong môi trường rủi ro ñược ñưa ra căn cứ
các tiêu chuẩn giá trị kì vọng lợi nhuận tối ña. Khi so sánh ñể lựa chọn một trong hai
phương án hành ñộng A hoặc B, phương án nào cho giá trị kì vọng lợi nhuận lớn hơn sẽ
ñược ưu tiên lựa chọn hơn. Tuy nhiên, việc ñưa ra quyết ñịnh căn cứ vào các giá trị kì
vọng lợi nhuận hay kì vọng thất thu (có tính tiền bạc, vật chất) không phải lúc nào cũng
tỏ ra hợp lí. Nhiều khi quyết ñịnh ñược ñưa ra dựa trên các giá trị thỏa dụng (là các chỉ
số ño ñộ thỏa mãn, tiện dụng của phương án ñược lựa chọn, các giá trị như vậy có thể
ñược coi là các giá trị “tinh thần” ).
Ví dụ 1: Về ñộ thỏa dụng của một phương án hành ñộng.
Chủ một doanh nghiệp có tài sản trị giá 100000 USD với xác suất gặp phải sự cố rủi
ro hàng năm (như hỏa hoạn hay thiên tai làm thiệt hại toàn bộ tài sản trên) là 0,1%. Giả sử
doanh nghiệp có thể mua bảo hiểm toàn bộ từ một trong hai công ti bảo hiểm với giá
tương ứng là 125 USD/năm và 150 USD/năm. Hãy lựa chọn một trong ba phương án: A −
mua bảo hiểm giá 125 USD hay B − mua bảo hiểm giá 150 USD hay phương án C −
không mua bảo hiểm. Nếu không mua bảo hiểm, kì vọng thất thu là 100000 × 0,1% = 100
USD, còn nếu mua bảo hiểm thì chịu chi phí là 125 USD hoặc 150 USD. Do ñó, theo tiêu
chuẩn giá trị kì vọng, rõ ràng nên chọn phương án C (không mua bảo hiểm trực tiếp) với
kì vọng thất thu tối thiểu. Trên thực tế phương án A thường ñược chủ doanh nghiệp lựa
chọn. ðó là vì chủ doanh nghiệp ñánh giá phương án A mang lại ñộ thỏa dụng cao nhất
so với phương án B và phương án C, do cảm thấy phương án A có chi phí thấp và ñảm
bảo tránh ñược rủi ro. ðiều này ñược giải thích chính xác hơn thông qua khái niệm hàm
thoả dụng, cho phép lượng hoá ñược ñộ thoả dụng của các phương án.
Kí hiệu phương án A bởi giá trị xA = −125, phương án B bởi giá trị xB = −150 và
phương án C bởi l1 = (0, 0,999; −125, 0; −150, 0; −100000, 0,001; −150000, 0). Ở ñây,
l1 ñược hiểu giống như một trò chơi xổ số mà người chơi có thể nhận ñược giải 0 USD
(không mất gì) với xác suất 0,999, giải −100000 USD (phải bỏ ra 100000 USD) với
xác suất 0,001, các giải khác là −125, −150 và −150000 USD với xác suất là 0. Cần
ñưa ra quyết ñịnh ñể lựa chọn trong các phương án A hoặc B (mua vé bảo hiểm trực
tiếp) hay phương án C (chơi xổ số “bảo hiểm” ñể có vé bảo hiểm). Giả sử chúng ta có
thêm một phương án D với kí hiệu là l2 = (0, 0,999; −125, 0; −150, 0; −100000, 0;
Trường ðại học Nông nghiệp Hà Nội – Giáo trình Vận trù học ..........178
−150000, 0,001). Phương án D ñược coi là một trò chơi xổ số “bảo hiểm” khác. Lúc
này cần lựa chọn trong các phương án A, B, C, D một phương án mua bảo hiểm hợp lí
nhất. Gọi giá trị thỏa dụng của các phương án A, B, C và D là u(A), u(B), u(C) và
u(D). Phương án nào có giá trị thoả dụng cao nhất sẽ ñược lựa chọn. Vấn ñề ñặt ra là
hàm u(.) nên ñược ñịnh nghĩa như thế nào?
ðịnh nghĩa 1: Xét tập hợp X = {x1, x2,..., xr} là tập hợp các giải thưởng và tập hợp
các xổ số L tương ứng với X gồm các phần tử lj = (x1, p1j; x2, p2j; ...; xr, prj) trong ñó
r
ij ij
i=1
p 1, p 0 i= ≥ ∀∑ . Một hàm số u(.) xác ñịnh trên tập U = X∪L ñược gọi là hàm thỏa
dụng, nếu u là hàm tăng trên tập X và u(lj) =
r
i ij
i=1
u(x )p∑ .
Giá trị u(lj) ñược gọi là giá trị thoả dụng hay kì vọng thỏa dụng của xổ số lj. Dễ
thấy, một giải thưởng xi cũng có thể ñược coi là một cuộc xổ số có dạng l = (x1, 0; x2, 0;
...; xi, 1; ...; xr, 0). Theo ñịnh nghĩa 1 trên ñây, u(l) = u(xi).
4.2. Tiêu chuẩn kì vọng thỏa dụng tối ña
Xét các phương án của tập U. Tiêu chuẩn kì vọng thoả dụng tối ña ñược phát biểu
ñơn giản như sau: Phương án nào có kì vọng thỏa dụng cao hơn thì ñược ưu tiên lựa
chọn hơn. Như vậy khi xét một tập con hữu hạn phần tử của U, chúng ta luôn có thể lựa
chọn ñược một phương án có kì vọng thỏa dụng cao nhất.
Chú ý: Có thể chỉ ra rằng hàm thỏa dụng u(.) luôn tồn tại nếu các tập hợp X và L
thỏa mãn một số tiên ñề. ðây là một vấn ñề có tính chất lí thuyết và phương pháp luận
khá phức tạp, chúng ta không ñi sâu vào chi tiết. ðiều chúng ta quan tâm tới lúc này là
quy trình tính toán ñể xây dựng hàm thoả dụng u(.).
Quay trở lại ví dụ 1 ở trên, ta xét tập X = {x1, x2, x3, x4, x5} = {0, −125, −150,
−100000, −150000} và tập L gồm các cuộc xổ số “bảo hiểm” ứng với X. Trước hết, do
x5 = −150000 là giá trị nhỏ nhất trên tập X nên ñặt u(x5) = 0. Do x1 = 0 là giá trị lớn
nhất trên X, nên ñặt u(x1) = 1. Như vậy dải giá trị của hàm u(.) ñược chọn là [0, 1].
ðể xác ñịnh u(x2) cần tìm ñược một cuộc xổ số l = (x1, p; x2, 0; x3, 0; x4, 0; x5, 1 −
p) với
p cần xác ñịnh sao cho u(l) = u(x1)p + u(x5)(1 − p) = u(x2). ðể xác ñịnh p, cần
ñặt câu hỏi dạng “xác suất”: Tìm xác suất p sao cho việc mua bảo hiểm với giá là 125
USD cũng thu ñược sự thỏa mãn giống như khi tham gia trò chơi xổ số l, trong ñó kết
cục ñược 0 USD xảy ra với xác suất p và kết cục ñược −1500000 USD xảy ra với xác
suất 1 − p? Việc xác ñịnh p có tính chủ quan nhưng phải dựa trên các quy tắc chặt chẽ
(mà do khuôn khổ của giáo trình nên không trình bày ở ñây). Giả sử xác ñịnh ñược p =
0,8 thì u(x2) = u(x1)p + u(x5)(1 − p) = 1×0,8 + 0×0,2 = 0,8. Câu hỏi tương tự ñược ñặt ra
với x3 và x4, ñể xác ñịnh ñược, chẳng hạn, u(x3) = 0,7 và u(x4) = 0,1. Như vậy, chúng ta
ñã xây dựng ñược hàm thỏa dụng u(.) cho ví dụ ñang xét, với ñồ thị u1 trên hình V.4.
Dựa trên ñồ thị u1 và tiêu chuẩn kì vọng thỏa dụng, chúng ta quyết ñịnh lựa chọn
phương án A: mua bảo hiểm toàn bộ tài sản với giá 125 USD/năm.
Có thể chứng minh ñược rằng việc ra quyết ñịnh dựa trên tiêu chuẩn kì vọng thỏa
dụng tối ña không phụ thuộc vào thang tỉ lệ của u(.), tức là nếu hàm u (.) ñã ñược xây
dựng thì ∀ α > 0, ∀ β, hàm w(x) = αu(x) + β cũng là hàm thỏa dụng. Bởi vậy, dải giá
trị ban ñầu của u(.) có thể chọn bất kì, chẳng hạn như [-5, 5] hay [0, 10].
Hình VI.4. ðồ thị hàm thỏa dụng
Tuy nhiên, hình dạng của hàm u(.) lại phụ thuộc vào việc lựa chọn các giá trị p khi trả
lời các câu hỏi “xác suất”. ðiều này có nghĩa là mỗi con người có kiểu xây dựng hàm
thỏa dụng của mình. Hình VI.4, ngoài ñồ thị hàm thỏa dụng u(.) có dạng u1, còn minh họa
hai dạng ñồ thị hàm thỏa dụng khác là u2 và u3. Các ñồ thị này có ý nghĩa gì, vấn ñề này
sẽ ñược phân tích vắn tắt thông qua khái niệm ngưỡng mạo hiểm (Risk Premium).
ðịnh nghĩa 1: Ứng với mỗi cuộc xổ số l = (x1, p1; x2, p2; ...; xr, pr) ∈ U và một hàm
thỏa dụng u(.) xác ñịnh trên U, số sau ñây ñược gọi là ngưỡng mạo hiểm của U(.):
pi = E(x/p) – u−1(E(u/p))
trong ñó E(x/p) là giá trị kì vọng của l ñược tính bởi E(x/p) =
r
i i
i 1
x p
=
∑ , còn E(u/p) là
kì vọng thỏa dụng của l ñược tính như ñã biết E(u/p) = u(l) =
r
i i
i=1
u(x )p∑ .
Xét hàm thỏa dụng ñã xác ñịnh ở trên với ñồ thị u1 và cuộc xổ số C. Dễ dàng tính ñược
E(x/p ) = −100 USD. Do E(u/p) = 0,999 + 0,0001 = 0,9991 nên u−1(E(u/p)) = u−1(0,9991) ≈
−6 (nếu nội suy tuyến tính). Như vậy, pi = E(x/p) − u−1(E(u/p)) ≈ −100 +6 = −94.
u3
u2
u1
u
x
–125
(149875)
–100000
(50000)
–150000
(0)
–150
(149850)
0,7
0,8
0
(150000)
0,1
Trường ðại học Nông nghiệp Hà Nội – Giáo trình Vận trù học ..........180
Chú ý: Có thể chứng minh ñược rằng nếu hàm thỏa dụng u(.) là hàm lồi (lồi ngặt)
thì pi ≤ 0 (< 0) với mọi cuộc xổ số. Còn nếu hàm thỏa dụng u(.) là hàm lõm (lõm ngặt)
thì pi ≥ 0 (> 0) với mọi cuộc xổ số.
Quay lại ví dụ ñang xét, do hàm u(.) với ñồ thị u1 ñã xây dựng là lồi ngặt nên ta luôn
có pi = E(x/p) – u−1(E(u/p)) < 0. ðiều này cũng có nghĩa là u(E(x/p)) < E(u/p), tức là ñộ
thỏa dụng của kì vọng lợi nhuận là nhỏ hơn kì vọng thỏa dụng do cuộc xổ số mang lại.
Trong trường hợp hàm thỏa dụng có ñồ thị u3 (trên hình V.4) thì pi > 0 và do ñó
u(E(x/p)) > E(u/p), tức là ñộ thỏa dụng của kì vọng lợi nhuận là lớn hơn kì vọng thỏa
dụng do cuộc xổ số mang lại. Từ các phân tích trên, ta thấy nếu người ra quyết ñịnh có
hàm thỏa dụng u(.) lồi thì người ñó có tính “hướng mạo hiểm” (Risk Prone), còn nếu
trái lại, u(.) lõm thì có tính “tránh mạo hiểm” (Risk Averse). Với u(.) tuyến tính, người
ra quyết ñịnh có tính hợp lí (Risk Neutral).
ðiều này ñược thể hiện khá trực quan trên hình V.4 nếu ta quy lại thang bậc giải
thưởng: thay vì các cuộc xổ số “bảo hiểm” ñã nói tới trong ví dụ, chúng ta xét các cuộc
xổ số thật sự với giải thưởng (ñược quy lại gốc tọa ñộ) thuộc vào khoảng 0 USD tới
150000 USD. Với ñồ thị u1 ta thấy, ở các giải thưởng khá cao người ra quyết ñịnh có
tính “hướng mạo hiểm” vẫn chỉ có ñộ thỏa dụng (mức ñộ thỏa mãn) thấp, chẳng hạn
giải thưởng 149500 USD chỉ mang lại ñộ thỏa dụng là 0,7 và ñộ thỏa mãn tăng rất
nhanh khi mức giải thưởng tăng sát 150000 USD. ðồ thị u3 cũng có thể ñược phân tích
tương tự ñể thấy tính “tránh mạo hiểm” của người ra quyết ñịnh.
Ví dụ 2: Một nhà ñầu tư có 10000 USD có thể ñầu tư vào thị trường chứng khoán.
Anh ta có thể lựa chọn hai công ti X và Y ñể ñầu tư (giả sử rằng hai công ti X và Y là
hoàn toàn ñộc lập với nhau).
Theo tính toán sơ bộ và dự ñoán của chuyên gia thì nhà ñầu tư có thể nhận ñược gấp
ñôi số tiền ñầu tư với xác suất 0,6 và có thể mất ñi một nửa số tiền ñầu tư với xác suất
0,4 khi ñầu tư vào một trong hai công ti trên. Anh ta xem xét các lựa chọn sau:
- ðầu tư toàn bộ số tiền vào một trong hai công ti (phương án A).
- ðầu tư 5000 USD vào công ti X (phương án B).
- ðầu tư 5000 USD vào công ti X và 5000 USD vào công ti Y (phương án C).
- Không ñầu tư vào hai công ti trên (phương án D).
Ngoài ra, giả sử ñã biết hàm thoả dụng của người ñầu tư tại một số mức lợi nhuận:
u(−5000) = 0; u(−2500) = 0,2; u(0) = 0,4; u(2500) = 0,7; u(5000) = 0,9; u(10000) = 1.
Hãy xác ñịnh phương án ñầu tư dựa trên tiêu chuẩn kì vọng thoả dụng tối ña.
Tính kì vọng thoả dụng cho phương án A: E(u/pA) = 0,6×u(10000) + 0,4×u(−5000)
= 0,6. Tương tự, E(u/pB) = 0,6×u(5000) + 0,4×u(−2500) = 0,6×0,9 + 0,4×0,2 = 0,62
Nhằm tính kì vọng thoả dụng cho phương án C, chúng ta sử dụng hàm sinh
(0,6a1 + 0,4 b1)(0,6a2 + 0,4 b2) = 0,36 a1a2 + 0,24a1b2 + 0,24b1a2 + 0,16b1b2
ñể xác ñịnh ñược các xác suất: xác suất ñầu tư vào cả hai công ti cùng lãi là 0,36; xác
suất ñầu tư vào công ti X lãi và công ti Y lỗ là 0,24; xác suất ñầu tư vào công ti X lỗ và
công ti Y lãi là 0,24; xác suất ñầu tư vào cả hai công ti cùng lỗ là 0,16.
Vậy E(u/pC) = 0,36×u(10000) + 0,24×u(2500) + 0,24×u(2500) + 0,16×u(−5000) =
0,36×1 + 0,24×0,7 + 0,24×0,7 + 0,16×0 = 0,696. Dễ thấy E(u/pD) = 0,4. Do ñó, dựa trên
tiêu chuẩn kì vọng thỏa dụng tối ña, ta chọn phương án C ñể ñầu tư.
Chú ý: Ra quyết ñịnh dựa trên tiêu chuẩn kì vọng thoả dụng tối ña là một phương
pháp ra quyết ñịnh trong môi trường rủi ro. Cái khó nhất trong phương pháp này là thiết
lập ñược hàm thoả dụng.
Ví dụ 3: Một nhà ñầu tư nghiên cứu về cổ phiếu của một công ti và ñánh giá rằng
các cổ phiếu sẽ tăng giá trong thời gian tới. Hiện tại một cổ phiếu ñược bán ra với giá
50 USD. Thông qua ng
Các file đính kèm theo tài liệu này:
- giao_trinh_van_tru_hoc_cho_nganh_tin_hoc_va_cong_nghe_thong.pdf