1.1. Vai trò của Vận trù học
Vận trù học (Operations Research − OR) là ngành học nghiên cứu về các hoạt động
hợp lí. Việc tổ chức và tiến hành các hoạt động trong nhiều lĩnh vực như kinh tế, xã hội,
quốc phòng, kinh doanh, sản xuất, dịch vụ. đòi hỏi các nhà quản lí phải vận dụng một
cách thích hợp các điều kiện cho phép để trù tính và đưa ra các quyết định.
Đối với bộ máy quản lí các cấp trong các doanh nghiệp, tập đoàn, công ti., ra quyết
định chính là trách nhiệm then chốt nhất. Quá trình ra quyết định được bắt đầu khi bộ
máy quản lí phát hiện một vấn đề nào đó cần quan tâm tới. Sau đó, cần xác định rõ vấn
đề, phát biểu mục tiêu phải hướng tới và các điều kiện hạn chế (còn gọi là các điều kiện
ràng buộc) cũng như tìm kiếm và đánh giá các phương án. Cuối cùng, phải chọn ra một
phương án hành động được coi là hợp lí hơn cả nhằm giải quyết vấn đề một cách tốt
nhất. Năng lực của bộ máy quản lí được thể hiện ở khả năng phát hiện vấn đề và giải
quyết bài toán quyết định phát sinh.
245 trang |
Chia sẻ: phuongt97 | Lượt xem: 821 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Giáo trình Vận trù học - Nguyễn Hải Thanh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
= ( )33 ij j
i=1 j 1
v PMax θ=
⎧ ⎫θ∑⎨ ⎬⎩ ⎭ = Max {13,6; 13,2; 12,0} = 13,6 = E(X/a1 ).
Do đó chúng ta lựa chọn hành động a1, tức là đặt mua hàng dự trữ ở mức cao nhất.
Các xác suất Pθ(θ1) = 0,2, Pθ(θ2) = 0,5, Pθ(θ3) = 0,3 là các xác suất của các trạng
thái có thể xảy ra đã được ước lượng từ các số liệu thống kê sẵn có trước đây. Chúng
được gọi là các xác suất tiên nghiệm (Prior Probabilities). Còn quy trình ra quyết định
trên đây được gọi là phân tích quyết định Bayes dựa trên xác suất tiên nghiệm. Như vậy,
trong mục 1.3 chúng ta đã áp dụng quy trình ra quyết định kiểu này để đưa ra quyết định
trong môi trường rủi ro.
2.2. Phân tích quyết định Bayes dựa trên xác suất hậu nghiệm
Chúng ta quay lại ví dụ 1 nêu trên và bảng VI.8. Tuy nhiên, trong mục này θ được
dùng để chỉ kì vọng của nhu cầu thị trường Z.
− Giả sử rằng, Z là biến ngẫu nhiên tuân theo phân phối chuẩn N(θ, 10), trong đó
E(Z) = θ và D(Z) = 10. Vậy hàm mật độ của Z với điều kiện θ = θj chính là
( )
2
j(z )
2 10
Z j
1f z / e
2 10
−θ− ×θ = θ = π×
− Phân phối xác suất tiên nghiệm của θ là Pθ(θ1) = 0,2, Pθ(θ2) = 0,5, Pθ(θ3) = 0,3
như đã biết.
− Ngoài ra, sau khi khảo sát chi tiết hơn, giả sử đã biết thêm được thông tin mới Z = 10.
Chúng ta có thể kết hợp thông tin này và phân phối xác suất tiên nghiệm của θ để
tìm phân phối xác suất hậu nghiệm của θ khi biết Z nhận một giá trị z nào đó. Sau đó
dựa vào các xác suất hậu nghiệm (Posterior Probabilities) tìm được, một quyết định
hợp lí sẽ được đưa ra dựa trên Tiêu chuẩn giá trị kì vọng. Quy trình ra quyết định như
vậy được gọi là phân tích quyết định Bayes dựa trên xác suất hậu nghiệm.
Kí hiệu hθ(θj/Z=z) là các xác suất hậu nghiệm, j =1, 2,..., n, có thể chứng minh được
một cách tổng quát công thức sau đây (trong ví dụ nêu trên, n = 3):
( ) ( ) ( )( ) ( )
Z j j
j n
Z k k
k 1
f z / P
h / Z z
f z / P
θ
θ
θ=
θ = θ θθ = =
θ = θ θ∑
(*)
Áp dụng công thức (*) cho ví dụ đang xét khi z = 10, ta có:
hθ(θ1/Z=10) =
1
2 2,5
1 1
2 2,5 2 2,5
0, 2 e
0,2 e 0,5 0,3 e
− ×
− −× ×
×
× + + ×
= 0,089,
hθ(θ2/Z=10) = 1 1
2 2,5 2 2,5
0,5
0, 2 e 0,5 0,3 e
− −× ×× + + ×
= 0,777,
Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học
174
hθ(θ3/Z=10) =
1
2 2,5
1 1
2 2,5 2 2,5
0,3 e
0,2 e 0,5 0,3 e
− ×
− −× ×
×
× + + ×
= 0,134.
Căn cứ Tiêu chuẩn kì vọng lợi nhuận tối đa cần quyết định lựa chọn a2 vì:
3
i=1
Max {E(X/ai)} = ( )33 ij j
i=1 j 1
v h / Z 10Max θ=
⎧ ⎫θ =∑⎨ ⎬⎩ ⎭
= Max {12,716; 13,644; 12,000} = 13,644 = E(X/a2 ).
Chú ý: Ví dụ trên đây có tính chất minh họa cho các quy trình quyết định Bayes dựa
trên xác suất hậu nghiệm. Trong các trường hợp phân phối xác suất của Z là phân phối
rời rạc thì trong công thức (*) có thể thay hàm mật độ có điều kiện bởi các xác suất có
điều kiện.
3. CÂY QUYẾT ĐỊNH VÀ CÁC BÀI TOÁN QUYẾT ĐỊNH NHIỀU GIAI ĐOẠN
3.1. Bài toán quyết định nhiều giai đoạn
Chúng ta hãy xét lại ví dụ 1 mục 1.3 và thực hiện việc ra quyết định dựa trên Tiêu
chuẩn kì vọng lợi nhuận tối đa với sự trợ giúp của cây quyết định (xem hình VI.1). Trên
cây quyết định này có một nút quyết định (hình chữ nhật), mà tại đó cần ra quyết định
để lựa chọn một trong các hành động a1, a2, a3 hay a4. Ngoài ra, trên cây quyết định này
còn có bốn nút trạng thái, mà tại đó chúng ta cần xem xét khả năng xảy ra của mỗi một
trong bốn trạng thái. Các nút trạng thái được nối với nút quyết định bởi các nhánh của
cây quyết định.
Ta có EV1 = E(X/a1) =
4
1j j
j 1
v p( )
=
θ∑ = 50 × 0,2 + 50 × 0,4 +50 × 0,3 + 50 × 0,1 = 50
USD. Tương tự, EV2 = E(X/a2) = 53,4 USD; EV3 = E(X/a3) = 53,6 USD và EV4 =
E(X/a4) = 51,4 USD. Vậy chúng ta lựa chọn hành động a3, tức là đặt mua 12 hòm cam
cho mỗi ngày do nút trạng thái số 1 có giá trị kì vọng lớn nhất.
Có thể thấy rằng, cây quyết định cho phép trình bày việc ra quyết định một cách
trực quan hơn so với việc sử dụng bảng pay-off như trong mục 1.3. Ngoài ra, cây quyết
định còn có thể được sử dụng cho các bài toán ra quyết định nhiều giai đoạn.
a2
a1
EV1
EV2
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
0
Hình VI.1. Cây quyết định
Ví dụ 1: Cây quyết định với nhiều nút quyết định, bài toán ra quyết định nhiều giai
đoạn, định giá thông tin mới.
Các công ti cần phát triển sản phẩm mới thường muốn xây dựng các nhà máy thử
nghiệm (phát triển) sản phẩm trước khi xây dựng nhà máy sản xuất sản phẩm một cách
đại trà. Tuy nhiên, việc xây dựng nhà máy thử nghiệm nhiều khi khá tốn kém, nên trong
các điều kiện cụ thể cũng cần cân nhắc xem có nên xây dựng nhà máy thử nghiệm hay
không.
Bởi vậy, khi muốn phát triển một sản phẩm mới, có ba phương án hành động cần
xem xét để lựa chọn:
- Sản xuất sản phẩm một cách đại trà ngay không qua giai đoạn thử nghiệm.
- Xây dựng nhà máy thử nghiệm.
- Dừng, không triển khai việc sản xuất sản phẩm mới.
Ngoài ra, cần cân nhắc xem chi phí xây nhà máy thử nghịêm (để thu thập thêm
thông tin mới về quy trình sản xuất hay nhu cấu của thị trường đối với sản phẩm mới)
cho phép tới mức nào. Nói cách khác, cần tìm hiểu để biết thông tin mới do nhà máy
thử nghiệm mang lại được định giá là bao nhiêu?
Cây quyết định cho bài toán ra quyết định nhiều giai đoạn này được minh họa trên
hình VI.2.
Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học
176
EV7 =0
EV10 =0
EV5
=811
7500
9
EV =0
6
7
5
2
3
1
4
10
9
8
EV6
=1 01
83750
EV 8
=–1
47 0
00x©y nhµ m¸y thÝ nghiÖm
hq cao
hq cao
12250000, xs 0,7
–1525000, xs 0,3
EV2 =8147000
0, xs 1,0
12250000, xs 0,1
12250000, xs 0,85
–1525000, xs
0,15
–1525000, xs 0,9
0, xs 1,0
0, xs 1,0
xs 0
hq cao
hiÖ
u q
u¶
ca
o
sx
0,8
s¶n
xuÊ
t ®¹
i trµ
hq thÊp
hq thÊp
hq thÊp
dõng
dõng
dõng
dõng
dõng
hiÖu qu¶ thÊp
dõng
s¶n
xu
Êt ®
¹i t
rµ
s¶n
xu
Êt ®
¹i t
rµ
Hình VI.2. Cây quyết định với nhiều nút quyết định
Giải thích: Trên cây quyết định có ba nút quyết định (khung hình chữ nhật). Nút 3
và nút 4 sử dụng thông tin do nhà máy thử nghiệm đem lại để quyết định xem có nên
sản xuất đại trà hai không. Nút 1 là nút đưa ra quyết định lựa chọn một trong ba phương
án hành động: Sản xuất đại trà, xây nhà máy thử nghiệm hay dừng. Các nút còn lại là
các nút trạng thái (khoanh tròn), mà tại đó cần tính các giá trị kì vọng (lợi nhuận có thể
đạt được). Hành động theo phương án sản xuất đại trà (đi từ nút 1 tới nút 5), phải tính
tới hai trạng thái: sản xuất cho hiệu quả cao với xác suất là 0,7 và giá trị lợi nhuận là
12250000 USD; hiệu quả thấp với xác suất là 0,3 và giá trị lợi nhuận là -1525000 USD
(hay thất thu là 1525000 USD). Hành động theo phương án xây nhà máy thử nghiệm (đi
từ nút 1 tới nút 2) cũng phải tính tới hai trạng thái: nhà máy thử nghiệm cho hiệu quả
cao hoặc cho hiệu quả thấp với các xác suất tương ứng là 0,8 và 0,2. Ứng với từng trạng
thái đó cần đưa ra các quyết định (tại các nút quyết định 3 và 4) là có nên sản suất đại
trà hay dừng hẳn việc sản xuất sản phẩm mới... Phần còn lại của cây quyết định dành
cho bạn đọc tự giải thích.
Để đưa ra quyết định lựa chọn theo Tiêu chuẩn kì vọng lợi nhuận tối đa, chúng ta
bắt đầu từ việc tính kì vọng lợi nhuận của các nút (rễ của cây quyết định) 5, 6, 7, 8, 9 và
10 và thu được các giá trị kì vọng theo thứ tự là: 8117500, 10183750, 0, -147000, 0 và 0
(USD). So sánh các kì vọng lợi nhuận tại nút 6 và nút 7, chúng ta đưa ra quyết định
chọn phương án sản xuất đại trà cho nút 3. Lúc này nút 3 có kì vọng lợi nhuận là
10183750 USD. Tương tự, so sánh các kì vọng lợi nhuận tại nút 8 và nút 9, chúng ta
đưa ra quyết định chọn dừng sản xuất cho nút 4 với kì vọng lợi nhuận là 0 USD.
Từ đó chúng ta xác định được các kì vọng lợi nhuận của các nút trạng thái 5, 2, 10
(là các nút nối trực tiếp tới nút 1) theo thứ tự là là 8117500, 8147000 và 0 USD. Bởi vậy
chúng ta chỉ còn phải cân nhắc để lựa chọn hoặc xây nhà máy thử nghiệm hoặc sản xuất
đại trà. Do việc xây nhà máy thử nghiệm cho lợi nhuận nhiều hơn việc sản xuất đại trà
một lượng tiền là 8147000 - 8117500 = 29500 USD, nên thông tin mới do nhà máy thử
nghiệm mang lại được định giá là 29500 USD.
Vậy quyết định cuối cùng được đưa ra như sau: Nếu chi phí xây nhà máy thử
nghiệm thấp hơn 29500 USD thì nên trước tiên xây nhà máy thử nghiệm và sau đó
tiến hành sản xuất đại trà. Nếu trái lại, nên sản xuất đại trà sản phẩm ngay mà không
xây nhà máy thử nghiệm (phương án hành động như vậy sẽ mang lại kì vọng lợi
nhuận 8117500 USD).
3.2. Phân tích Bayes sử dụng cây quyết định
Ví dụ 2: Trong các ví dụ 1 mục 3.1, việc xây dựng cây quyết định là dựa trên các
xác suất tiên nghiệm. Trong ví dụ này, cây quyết định được xây dựng dựa trên xác suất
hậu nghiệm, được tính toán căn cứ định lí Bayes, nhằm giúp cho một công ti dầu khí
quyết định một trong ba lựa chọn: liệu có nên mua tài liệu tư vấn địa chất trước khi
khoan hay cứ tiến hành khoan giếng lấy dầu ngay tại một địa điểm khoan giếng dầu đã
kí được hợp đồng, hoặc không tiến hành khoan giếng mà nên bán lại hợp đồng.
Giám đốc sản xuất của công ti cho rằng khi khoan một giếng dầu tại khu vực này thì
có ba hậu quả sau có khả năng xảy ra: Giếng khô (không dầu), Dầu chua (dầu tạp khó
lọc) và Dầu ngọt (dầu tinh dễ lọc). Tại vùng đất trên, nơi có khu vực của công ti, nhiều
giếng dầu đã được khoan với số liệu thống kê như sau: tỉ lệ giếng không dầu là 60%,
giếng có dầu chua là 20% và giếng có dầu ngọt là 20%. Theo đánh giá của bà giám đốc,
với giếng dầu khô (không dầu) thất thu trung bình là 50000 USD, với giếng dầu chua lợi
nhuận trung bình đạt được là 200000 USD, còn với giếng dầu ngọt lợi nhuận trung bình
là 500000 USD. Trong trường hợp công ti không khoan giếng mà bán lại hợp đồng thì
thu được 80000 USD.
Công ti cũng có thể mua thêm tài liệu địa chất từ phía tư vấn với giá 25000 USD.
Qua thống kê, đã biết được thông tin sau đây về phía tư vấn: Trong các giếng không dầu
đã khoan có 10% số giếng đã được tư vấn nên khoan, 90% đã được tư vấn không nên
khoan. Trong các giếng dầu chua đã khoan có 40% số giếng đã được tư vấn nên khoan
và 60% đã được tư vấn không nên khoan. Trong các giếng dầu ngọt đã khoan có 50% số
giếng đã được tư vấn nên khoan và 50% đã được tư vấn không nên khoan.
Gọi sự kiện giếng khoan lên không có dầu là sự kiện A, có dầu chua là B và có dầu
ngọt là C. Lúc đó có các xác suất (thực nghiệm) sau: P(A) = 60%, P(B) = 20%, P(C) =
Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học
178
20%. Gọi sự kiện (tư vấn cho là) nên khoan là F, không nên khoan là U. Lúc đó có thể
coi P(F/A) = 10%, P(F/B) = 40%, P(F/C) = 50%, P(U/A) = 90%, P(U/B) = 60%, P(U/C)
= 50%. Theo định lí Bayes, các xác suất hậu nghiệm được tính như sau (xem hình V.3
với các xác suất tại nút trạng thái số 6)):
P(A/F) = P(F / A)P(A)
P(F / A)P(A) P(F / B)P(B) P(F / C)P(C)+ +
= 0,1 0,6
0,1 0,6 0,4 0,2 0,5 0,2
×
× + × + × =
0,06
0,24
= 0,2500.
Tương tự, ta có: P(B/F) = 0,4 0,2
0,24
× = 0,3333 và P(C/F) = 0,5 0,2
0,24
× = 0,4176.
Tiếp tục áp dụng định lí Bayes, chúng ta cũng có:
P(A/U) = P(U / A) P(A)
P(U / A) P(A) P(U / B) P(B) P(U / C) P(C)
×
× + × + ×
= 0,9 0,6
0,9 0,6 0,6 0,2 0,5 0,2
×
× + × + × =
0,54
0,76
= 0,7105.
Tương tự, cũng có: P(B/U) = 0,12
0,76
= 0,1579 và P(C/U) = 0,10
0,76
= 0,1316.
EV6 = 262500
7
6
2
5
1
3
8
EV7= 61842
EV8= 110000
khoan
nên
kho
an
không nên khoan
khô
khô
khô
chua
chua
chua
80000 USD
–50000 USD
EV
2
=1
23
80
0
80000 USD
200000 USD
500000 USD
xs 0
,24
4
khoan
khoan
80000 USD
–50000 USD
–50000 USD
200000 USD
200000 USD
500000 USD
500000 USD
xs 0,16
xs 0,20
xs 0,60
xs 0,25
xs 0,20
xs 0,71
xs 0,33
xs 0,42
xs 0 ,76
m
ua
t−
v
Ên
ngät
ngät sx 0,13
ngät
kh«ng mua t− vÊn
Hình VI.3. Cây quyết định với xác suất hậu nghiệm
Sau khi đã tính được các xác suất hậu nghiệm trên đây, chúng ta xây dựng được cây
xác suất như trên hình VI.3 và tính được kì vọng lợi nhuận của các nút 6, 7 và 8 theo
thứ tự là 262500, 61842 và 110000 USD. Do đó tại nút quyết định số 3, quyết định là
tiến hành khoan giếng với kì vọng lợi nhuận là 262000. Tại nút quyết định số 4, quyết
định là bán lại hợp đồng với lợi nhuận là 80000. Còn tại nút quyết định số 5, quyết định
là tiến hành khoan giếng với kì vọng lợi nhuận là 110000. Sau đó tiếp tục tính kì vọng
lợi nhuận tại nút trạng thái số 2 (là 123800). Cuối cùng so sánh các lợi nhuận tại các nút
số 2 và số 5 để chọn phương án hành động mang lại kì vọng lợi nhuận lớn hơn: Cần
phải mua tài liệu tư vấn để biết có nên khoan hay không trong trường hợp giá mua tài
liệu tư vấn thấp hơn hiệu số 123800 - 110000 = 13800 USD. Nếu giá mua tài liệu tư vấn
đắt hơn 13800 USD thì nên tiến hành khoan ngay mà không nên mua tài liệu tư vấn.
Như vậy, với giá tài liệu tư vấn là 25000, rõ ràng chúng ta nên tiến hành khoan ngay và
không cần mua tài liệu tư vấn.
Chú ý: Rõ ràng rằng, một khi có thông tin mới thì chúng ta phải xem xét lại quyết
định. Chẳng hạn, chúng ta có bài toán phân tích độ nhạy quyết định khi lợi nhuận PS
Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học
180
thu được khi khoan một giếng dầu ngọt không phải là 500000 USD, mà biến thiên tăng
dần từ 200000 tới 500000 USD (để đơn giản, giả sử mỗi nấc tăng là 2000 USD). Lúc
đó, với các tính toán tương tự như đã làm và với giá mua tài liệu tư vấn chẳng hạn là
25000 USD, có thể chỉ ra rằng: Với PS trong khoảng 200000 tới 312000 USD thì nên
lựa chọn việc bán lại hợp đồng. Với PS trong khoảng 312000 tới 388000 USD thì nên
mua tài liệu tư vấn. Còn nếu PS lớn hơn 388000 USD thì nên khoan ngay mà không cần
mua tài liệu tư vấn.
4. RA QUYẾT ĐỊNH DỰA TRÊN TIÊU CHUẨN KÌ VỌNG THỎA DỤNG TỐI ĐA
4.1. Khái niệm hàm thỏa dụng
Trong các mục 1.3 và 1.4, quyết định trong môi trường rủi ro được đưa ra căn cứ
các tiêu chuẩn giá trị kì vọng lợi nhuận tối đa. Khi so sánh để lựa chọn một trong hai
phương án hành động A hoặc B, phương án nào cho giá trị kì vọng lợi nhuận lớn hơn sẽ
được ưu tiên lựa chọn hơn. Tuy nhiên, việc đưa ra quyết định căn cứ vào các giá trị kì
vọng lợi nhuận hay kì vọng thất thu (có tính tiền bạc, vật chất) không phải lúc nào cũng
tỏ ra hợp lí. Nhiều khi quyết định được đưa ra dựa trên các giá trị thỏa dụng (là các chỉ
số đo độ thỏa mãn, tiện dụng của phương án được lựa chọn, các giá trị như vậy có thể
được coi là các giá trị “tinh thần” ).
Ví dụ 1: Về độ thỏa dụng của một phương án hành động.
Chủ một doanh nghiệp có tài sản trị giá 100000 USD với xác suất gặp phải sự cố rủi
ro hàng năm (như hỏa hoạn hay thiên tai làm thiệt hại toàn bộ tài sản trên) là 0,1%. Giả sử
doanh nghiệp có thể mua bảo hiểm toàn bộ từ một trong hai công ti bảo hiểm với giá
tương ứng là 125 USD/năm và 150 USD/năm. Hãy lựa chọn một trong ba phương án: A −
mua bảo hiểm giá 125 USD hay B − mua bảo hiểm giá 150 USD hay phương án C −
không mua bảo hiểm. Nếu không mua bảo hiểm, kì vọng thất thu là 100000 × 0,1% = 100
USD, còn nếu mua bảo hiểm thì chịu chi phí là 125 USD hoặc 150 USD. Do đó, theo tiêu
chuẩn giá trị kì vọng, rõ ràng nên chọn phương án C (không mua bảo hiểm trực tiếp) với
kì vọng thất thu tối thiểu. Trên thực tế phương án A thường được chủ doanh nghiệp lựa
chọn. Đó là vì chủ doanh nghiệp đánh giá phương án A mang lại độ thỏa dụng cao nhất
so với phương án B và phương án C, do cảm thấy phương án A có chi phí thấp và đảm
bảo tránh được rủi ro. Điều này được giải thích chính xác hơn thông qua khái niệm hàm
thoả dụng, cho phép lượng hoá được độ thoả dụng của các phương án.
Kí hiệu phương án A bởi giá trị xA = −125, phương án B bởi giá trị xB = −150 và
phương án C bởi l1 = (0, 0,999; −125, 0; −150, 0; −100000, 0,001; −150000, 0). Ở đây,
l1 được hiểu giống như một trò chơi xổ số mà người chơi có thể nhận được giải 0 USD
(không mất gì) với xác suất 0,999, giải −100000 USD (phải bỏ ra 100000 USD) với
xác suất 0,001, các giải khác là −125, −150 và −150000 USD với xác suất là 0. Cần
đưa ra quyết định để lựa chọn trong các phương án A hoặc B (mua vé bảo hiểm trực
tiếp) hay phương án C (chơi xổ số “bảo hiểm” để có vé bảo hiểm). Giả sử chúng ta có
thêm một phương án D với kí hiệu là l2 = (0, 0,999; −125, 0; −150, 0; −100000, 0;
−150000, 0,001). Phương án D được coi là một trò chơi xổ số “bảo hiểm” khác. Lúc
này cần lựa chọn trong các phương án A, B, C, D một phương án mua bảo hiểm hợp lí
nhất. Gọi giá trị thỏa dụng của các phương án A, B, C và D là u(A), u(B), u(C) và
u(D). Phương án nào có giá trị thoả dụng cao nhất sẽ được lựa chọn. Vấn đề đặt ra là
hàm u(.) nên được định nghĩa như thế nào?
Định nghĩa 1: Xét tập hợp X = {x1, x2,..., xr} là tập hợp các giải thưởng và tập hợp
các xổ số L tương ứng với X gồm các phần tử lj = (x1, p1j; x2, p2j; ...; xr, prj) trong đó
r
ij ij
i=1
p 1, p 0 i= ≥ ∀∑ . Một hàm số u(.) xác định trên tập U = X∪L được gọi là hàm thỏa
dụng, nếu u là hàm tăng trên tập X và u(lj) =
r
i ij
i=1
u(x )p∑ .
Giá trị u(lj) được gọi là giá trị thoả dụng hay kì vọng thỏa dụng của xổ số lj. Dễ
thấy, một giải thưởng xi cũng có thể được coi là một cuộc xổ số có dạng l = (x1, 0; x2, 0;
...; xi, 1; ...; xr, 0). Theo định nghĩa 1 trên đây, u(l) = u(xi).
4.2. Tiêu chuẩn kì vọng thỏa dụng tối đa
Xét các phương án của tập U. Tiêu chuẩn kì vọng thoả dụng tối đa được phát biểu
đơn giản như sau: Phương án nào có kì vọng thỏa dụng cao hơn thì được ưu tiên lựa
chọn hơn. Như vậy khi xét một tập con hữu hạn phần tử của U, chúng ta luôn có thể lựa
chọn được một phương án có kì vọng thỏa dụng cao nhất.
Chú ý: Có thể chỉ ra rằng hàm thỏa dụng u(.) luôn tồn tại nếu các tập hợp X và L
thỏa mãn một số tiên đề. Đây là một vấn đề có tính chất lí thuyết và phương pháp luận
khá phức tạp, chúng ta không đi sâu vào chi tiết. Điều chúng ta quan tâm tới lúc này là
quy trình tính toán để xây dựng hàm thoả dụng u(.).
Quay trở lại ví dụ 1 ở trên, ta xét tập X = {x1, x2, x3, x4, x5} = {0, −125, −150,
−100000, −150000} và tập L gồm các cuộc xổ số “bảo hiểm” ứng với X. Trước hết, do
x5 = −150000 là giá trị nhỏ nhất trên tập X nên đặt u(x5) = 0. Do x1 = 0 là giá trị lớn
nhất trên X, nên đặt u(x1) = 1. Như vậy dải giá trị của hàm u(.) được chọn là [0, 1].
Để xác định u(x2) cần tìm được một cuộc xổ số l = (x1, p; x2, 0; x3, 0; x4, 0; x5, 1 −
p) với p cần xác định sao cho u(l) = u(x1)p + u(x5)(1 − p) = u(x2). Để xác định p, cần
đặt câu hỏi dạng “xác suất”: Tìm xác suất p sao cho việc mua bảo hiểm với giá là 125
USD cũng thu được sự thỏa mãn giống như khi tham gia trò chơi xổ số l, trong đó kết
cục được 0 USD xảy ra với xác suất p và kết cục được −1500000 USD xảy ra với xác
suất 1 − p? Việc xác định p có tính chủ quan nhưng phải dựa trên các quy tắc chặt chẽ
(mà do khuôn khổ của giáo trình nên không trình bày ở đây). Giả sử xác định được p =
0,8 thì u(x2) = u(x1)p + u(x5)(1 − p) = 1×0,8 + 0×0,2 = 0,8. Câu hỏi tương tự được đặt ra
Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học
182
với x3 và x4, để xác định được, chẳng hạn, u(x3) = 0,7 và u(x4) = 0,1. Như vậy, chúng ta
đã xây dựng được hàm thỏa dụng u(.) cho ví dụ đang xét, với đồ thị u1 trên hình V.4.
Dựa trên đồ thị u1 và tiêu chuẩn kì vọng thỏa dụng, chúng ta quyết định lựa chọn
phương án A: mua bảo hiểm toàn bộ tài sản với giá 125 USD/năm.
Có thể chứng minh được rằng việc ra quyết định dựa trên tiêu chuẩn kì vọng thỏa
dụng tối đa không phụ thuộc vào thang tỉ lệ của u(.), tức là nếu hàm u (.) đã được xây
dựng thì ∀ α > 0, ∀ β, hàm w(x) = αu(x) + β cũng là hàm thỏa dụng. Bởi vậy, dải giá
trị ban đầu của u(.) có thể chọn bất kì, chẳng hạn như [-5, 5] hay [0, 10].
Hình VI.4. Đồ thị hàm thỏa dụng
Tuy nhiên, hình dạng của hàm u(.) lại phụ thuộc vào việc lựa chọn các giá trị p khi trả
lời các câu hỏi “xác suất”. Điều này có nghĩa là mỗi con người có kiểu xây dựng hàm
thỏa dụng của mình. Hình VI.4, ngoài đồ thị hàm thỏa dụng u(.) có dạng u1, còn minh họa
hai dạng đồ thị hàm thỏa dụng khác là u2 và u3. Các đồ thị này có ý nghĩa gì, vấn đề này
sẽ được phân tích vắn tắt thông qua khái niệm ngưỡng mạo hiểm (Risk Premium).
Định nghĩa 1: Ứng với mỗi cuộc xổ số l = (x1, p1; x2, p2; ...; xr, pr) ∈ U và một hàm
thỏa dụng u(.) xác định trên U, số sau đây được gọi là ngưỡng mạo hiểm của U(.):
π = E(x/p) – u−1(E(u/p))
trong đó E(x/p) là giá trị kì vọng của l được tính bởi E(x/p) =
r
i i
i 1
x p
=
∑ , còn E(u/p) là
kì vọng thỏa dụng của l được tính như đã biết E(u/p) = u(l) =
r
i i
i=1
u(x )p∑ .
u3
u2
u1
u
x
–125
(149875)
–100000
(50000)
–150000
(0)
–150
(149850)
0,7
0,8
0
(150000)
0,1
•
Xét hàm thỏa dụng đã xác định ở trên với đồ thị u1 và cuộc xổ số C. Dễ dàng tính được
E(x/p ) = −100 USD. Do E(u/p) = 0,999 + 0,0001 = 0,9991 nên u−1(E(u/p)) = u−1(0,9991) ≈
−6 (nếu nội suy tuyến tính). Như vậy, π = E(x/p) − u−1(E(u/p)) ≈ −100 +6 = −94.
Chú ý: Có thể chứng minh được rằng nếu hàm thỏa dụng u(.) là hàm lồi (lồi ngặt)
thì π ≤ 0 (< 0) với mọi cuộc xổ số. Còn nếu hàm thỏa dụng u(.) là hàm lõm (lõm ngặt)
thì π ≥ 0 (> 0) với mọi cuộc xổ số.
Quay lại ví dụ đang xét, do hàm u(.) với đồ thị u1 đã xây dựng là lồi ngặt nên ta luôn
có π = E(x/p) – u−1(E(u/p)) < 0. Điều này cũng có nghĩa là u(E(x/p)) < E(u/p), tức là độ
thỏa dụng của kì vọng lợi nhuận là nhỏ hơn kì vọng thỏa dụng do cuộc xổ số mang lại.
Trong trường hợp hàm thỏa dụng có đồ thị u3 (trên hình V.4) thì π > 0 và do đó
u(E(x/p)) > E(u/p), tức là độ thỏa dụng của kì vọng lợi nhuận là lớn hơn kì vọng thỏa
dụng do cuộc xổ số mang lại. Từ các phân tích trên, ta thấy nếu người ra quyết định có
hàm thỏa dụng u(.) lồi thì người đó có tính “hướng mạo hiểm” (Risk Prone), còn nếu
trái lại, u(.) lõm thì có tính “tránh mạo hiểm” (Risk Averse). Với u(.) tuyến tính, người
ra quyết định có tính hợp lí (Risk Neutral).
Điều này được thể hiện khá trực quan trên hình V.4 nếu ta quy lại thang bậc giải
thưởng: thay vì các cuộc xổ số “bảo hiểm” đã nói tới trong ví dụ, chúng ta xét các cuộc
xổ số thật sự với giải thưởng (được quy lại gốc tọa độ) thuộc vào khoảng 0 USD tới
150000 USD. Với đồ thị u1 ta thấy, ở các giải thưởng khá cao người ra quyết định có
tính “hướng mạo hiểm” vẫn chỉ có độ thỏa dụng (mức độ thỏa mãn) thấp, chẳng hạn
giải thưởng 149500 USD chỉ mang lại độ thỏa dụng là 0,7 và độ thỏa mãn tăng rất
nhanh khi mức giải thưởng tăng sát 150000 USD. Đồ thị u3 cũng có thể được phân tích
tương tự để thấy tính “tránh mạo hiểm” của người ra quyết định.
Ví dụ 2: Một nhà đầu tư có 10000 USD có thể đầu tư vào thị trường chứng khoán.
Anh ta có thể lựa chọn hai công ti X và Y để đầu tư (giả sử rằng hai công ti X và Y là
hoàn toàn độc lập với nhau).
Theo tính toán sơ bộ và dự đoán của chuyên gia thì nhà đầu tư có thể nhận được gấp
đôi số tiền đầu tư với xác suất 0,6 và có thể mất đi một nửa số tiền đầu tư với xác suất
0,4 khi đầu tư vào một trong hai công ti trên. Anh ta xem xét các lựa chọn sau:
- Đầu tư toàn bộ số tiền vào một trong hai công ti (phương án A).
- Đầu tư 5000 USD vào công ti X (phương án B).
- Đầu tư 5000 USD vào công ti X và 5000 USD vào công ti Y (phương án C).
- Không đầu tư vào hai công ti trên (phương án D).
Ngoài ra, giả sử đã biết hàm thoả dụng của người đầu tư tại một số mức lợi nhuận:
u(−5000) = 0; u(−2500) = 0,2; u(0) = 0,4; u(2500) = 0,7; u(5000) = 0,9; u(10000) = 1.
Hãy xác định phương án đầu tư dựa trên tiêu chuẩn kì vọng thoả dụng tối đa.
Tính kì vọng thoả dụng cho phương án A: E(u/pA) = 0,6×u(10000) + 0,4×u(−5000)
= 0,6. Tương tự, E(u/pB) = 0,6×u(5000) + 0,4×u(−2500) = 0,6×0,9 + 0,4×0,2 = 0,62
Nhằm tính kì vọng thoả dụng cho phương án C, chúng ta sử dụng hàm sinh
(0,6a1 + 0,4 b1)(0,6a2 + 0,4 b2) = 0,36 a1a2 + 0,24a1b2 + 0,24b1a2 + 0,16b1b2
Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học
184
để xác định được các xác suất: xác suất đầu tư vào cả hai công ti cùng lãi là 0,36; xác
suất đầu tư vào công ti X lãi và công ti Y lỗ là 0,24; xác suất đầu tư vào công ti X lỗ và
công ti Y lãi là 0,24; xác suất đầu tư vào cả hai công ti cùng lỗ là 0,16.
Vậy E(u/pC) = 0,36×u(10000) + 0,24×u(2500) + 0,24×u(2500) + 0,16×u(−5000) =
0,36×1 + 0,24×0,7 + 0,24×0,7 + 0,16×0 = 0,696. Dễ thấy E(u/pD) = 0,4. Do đó, dựa trên
tiêu chuẩn kì vọng thỏa dụng tối đa, ta chọn phương án C để đầu tư.
Chú ý: Ra quyết định dựa trên tiêu chuẩn kì vọng thoả dụng tối đa là một phương
pháp ra quyết định trong môi trường rủi ro. Cái khó nhất trong phương pháp này là thiết
lập được hàm thoả dụng.
Ví dụ 3: Một nhà đầu tư nghiên cứu về cổ phiếu của một công ti và đánh giá rằng
các cổ phiếu sẽ tăng giá trong thời gian tới. Hiện tại một cổ phiếu được bán ra với giá
50 USD. Thông qua người môi giới, nhà đầu tư được giới thiệu để mua một hợp đồng
như sau: mua 4 USD/quyền mua một cổ phiếu
Các file đính kèm theo tài liệu này:
- giao_trinh_van_tru_hoc_nguyen_hai_thanh.pdf