Giáo trình Vận trù học - Nguyễn Hải Thanh

1.1. Vai trò của Vận trù học

Vận trù học (Operations Research − OR) là ngành học nghiên cứu về các hoạt động

hợp lí. Việc tổ chức và tiến hành các hoạt động trong nhiều lĩnh vực như kinh tế, xã hội,

quốc phòng, kinh doanh, sản xuất, dịch vụ. đòi hỏi các nhà quản lí phải vận dụng một

cách thích hợp các điều kiện cho phép để trù tính và đưa ra các quyết định.

Đối với bộ máy quản lí các cấp trong các doanh nghiệp, tập đoàn, công ti., ra quyết

định chính là trách nhiệm then chốt nhất. Quá trình ra quyết định được bắt đầu khi bộ

máy quản lí phát hiện một vấn đề nào đó cần quan tâm tới. Sau đó, cần xác định rõ vấn

đề, phát biểu mục tiêu phải hướng tới và các điều kiện hạn chế (còn gọi là các điều kiện

ràng buộc) cũng như tìm kiếm và đánh giá các phương án. Cuối cùng, phải chọn ra một

phương án hành động được coi là hợp lí hơn cả nhằm giải quyết vấn đề một cách tốt

nhất. Năng lực của bộ máy quản lí được thể hiện ở khả năng phát hiện vấn đề và giải

quyết bài toán quyết định phát sinh.

pdf245 trang | Chia sẻ: phuongt97 | Lượt xem: 897 | Lượt tải: 0download
Bạn đang xem trước 20 trang nội dung tài liệu Giáo trình Vận trù học - Nguyễn Hải Thanh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
= ( )33 ij j i=1 j 1 v PMax θ= ⎧ ⎫θ∑⎨ ⎬⎩ ⎭ = Max {13,6; 13,2; 12,0} = 13,6 = E(X/a1 ). Do đó chúng ta lựa chọn hành động a1, tức là đặt mua hàng dự trữ ở mức cao nhất. Các xác suất Pθ(θ1) = 0,2, Pθ(θ2) = 0,5, Pθ(θ3) = 0,3 là các xác suất của các trạng thái có thể xảy ra đã được ước lượng từ các số liệu thống kê sẵn có trước đây. Chúng được gọi là các xác suất tiên nghiệm (Prior Probabilities). Còn quy trình ra quyết định trên đây được gọi là phân tích quyết định Bayes dựa trên xác suất tiên nghiệm. Như vậy, trong mục 1.3 chúng ta đã áp dụng quy trình ra quyết định kiểu này để đưa ra quyết định trong môi trường rủi ro. 2.2. Phân tích quyết định Bayes dựa trên xác suất hậu nghiệm Chúng ta quay lại ví dụ 1 nêu trên và bảng VI.8. Tuy nhiên, trong mục này θ được dùng để chỉ kì vọng của nhu cầu thị trường Z. − Giả sử rằng, Z là biến ngẫu nhiên tuân theo phân phối chuẩn N(θ, 10), trong đó E(Z) = θ và D(Z) = 10. Vậy hàm mật độ của Z với điều kiện θ = θj chính là ( ) 2 j(z ) 2 10 Z j 1f z / e 2 10 −θ− ×θ = θ = π× − Phân phối xác suất tiên nghiệm của θ là Pθ(θ1) = 0,2, Pθ(θ2) = 0,5, Pθ(θ3) = 0,3 như đã biết. − Ngoài ra, sau khi khảo sát chi tiết hơn, giả sử đã biết thêm được thông tin mới Z = 10. Chúng ta có thể kết hợp thông tin này và phân phối xác suất tiên nghiệm của θ để tìm phân phối xác suất hậu nghiệm của θ khi biết Z nhận một giá trị z nào đó. Sau đó dựa vào các xác suất hậu nghiệm (Posterior Probabilities) tìm được, một quyết định hợp lí sẽ được đưa ra dựa trên Tiêu chuẩn giá trị kì vọng. Quy trình ra quyết định như vậy được gọi là phân tích quyết định Bayes dựa trên xác suất hậu nghiệm. Kí hiệu hθ(θj/Z=z) là các xác suất hậu nghiệm, j =1, 2,..., n, có thể chứng minh được một cách tổng quát công thức sau đây (trong ví dụ nêu trên, n = 3): ( ) ( ) ( )( ) ( ) Z j j j n Z k k k 1 f z / P h / Z z f z / P θ θ θ= θ = θ θθ = = θ = θ θ∑ (*) Áp dụng công thức (*) cho ví dụ đang xét khi z = 10, ta có: hθ(θ1/Z=10) = 1 2 2,5 1 1 2 2,5 2 2,5 0, 2 e 0,2 e 0,5 0,3 e − × − −× × × × + + × = 0,089, hθ(θ2/Z=10) = 1 1 2 2,5 2 2,5 0,5 0, 2 e 0,5 0,3 e − −× ×× + + × = 0,777, Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học 174 hθ(θ3/Z=10) = 1 2 2,5 1 1 2 2,5 2 2,5 0,3 e 0,2 e 0,5 0,3 e − × − −× × × × + + × = 0,134. Căn cứ Tiêu chuẩn kì vọng lợi nhuận tối đa cần quyết định lựa chọn a2 vì: 3 i=1 Max {E(X/ai)} = ( )33 ij j i=1 j 1 v h / Z 10Max θ= ⎧ ⎫θ =∑⎨ ⎬⎩ ⎭ = Max {12,716; 13,644; 12,000} = 13,644 = E(X/a2 ). Chú ý: Ví dụ trên đây có tính chất minh họa cho các quy trình quyết định Bayes dựa trên xác suất hậu nghiệm. Trong các trường hợp phân phối xác suất của Z là phân phối rời rạc thì trong công thức (*) có thể thay hàm mật độ có điều kiện bởi các xác suất có điều kiện. 3. CÂY QUYẾT ĐỊNH VÀ CÁC BÀI TOÁN QUYẾT ĐỊNH NHIỀU GIAI ĐOẠN 3.1. Bài toán quyết định nhiều giai đoạn Chúng ta hãy xét lại ví dụ 1 mục 1.3 và thực hiện việc ra quyết định dựa trên Tiêu chuẩn kì vọng lợi nhuận tối đa với sự trợ giúp của cây quyết định (xem hình VI.1). Trên cây quyết định này có một nút quyết định (hình chữ nhật), mà tại đó cần ra quyết định để lựa chọn một trong các hành động a1, a2, a3 hay a4. Ngoài ra, trên cây quyết định này còn có bốn nút trạng thái, mà tại đó chúng ta cần xem xét khả năng xảy ra của mỗi một trong bốn trạng thái. Các nút trạng thái được nối với nút quyết định bởi các nhánh của cây quyết định. Ta có EV1 = E(X/a1) = 4 1j j j 1 v p( ) = θ∑ = 50 × 0,2 + 50 × 0,4 +50 × 0,3 + 50 × 0,1 = 50 USD. Tương tự, EV2 = E(X/a2) = 53,4 USD; EV3 = E(X/a3) = 53,6 USD và EV4 = E(X/a4) = 51,4 USD. Vậy chúng ta lựa chọn hành động a3, tức là đặt mua 12 hòm cam cho mỗi ngày do nút trạng thái số 1 có giá trị kì vọng lớn nhất. Có thể thấy rằng, cây quyết định cho phép trình bày việc ra quyết định một cách trực quan hơn so với việc sử dụng bảng pay-off như trong mục 1.3. Ngoài ra, cây quyết định còn có thể được sử dụng cho các bài toán ra quyết định nhiều giai đoạn. a2 a1 EV1 EV2 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 0 Hình VI.1. Cây quyết định Ví dụ 1: Cây quyết định với nhiều nút quyết định, bài toán ra quyết định nhiều giai đoạn, định giá thông tin mới. Các công ti cần phát triển sản phẩm mới thường muốn xây dựng các nhà máy thử nghiệm (phát triển) sản phẩm trước khi xây dựng nhà máy sản xuất sản phẩm một cách đại trà. Tuy nhiên, việc xây dựng nhà máy thử nghiệm nhiều khi khá tốn kém, nên trong các điều kiện cụ thể cũng cần cân nhắc xem có nên xây dựng nhà máy thử nghiệm hay không. Bởi vậy, khi muốn phát triển một sản phẩm mới, có ba phương án hành động cần xem xét để lựa chọn: - Sản xuất sản phẩm một cách đại trà ngay không qua giai đoạn thử nghiệm. - Xây dựng nhà máy thử nghiệm. - Dừng, không triển khai việc sản xuất sản phẩm mới. Ngoài ra, cần cân nhắc xem chi phí xây nhà máy thử nghịêm (để thu thập thêm thông tin mới về quy trình sản xuất hay nhu cấu của thị trường đối với sản phẩm mới) cho phép tới mức nào. Nói cách khác, cần tìm hiểu để biết thông tin mới do nhà máy thử nghiệm mang lại được định giá là bao nhiêu? Cây quyết định cho bài toán ra quyết định nhiều giai đoạn này được minh họa trên hình VI.2. Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học 176 EV7 =0 EV10 =0 EV5 =811 7500 9 EV =0 6 7 5 2 3 1 4 10 9 8 EV6 =1 01 83750 EV 8 =–1 47 0 00x©y nhµ m¸y thÝ nghiÖm hq cao hq cao 12250000, xs 0,7 –1525000, xs 0,3 EV2 =8147000 0, xs 1,0 12250000, xs 0,1 12250000, xs 0,85 –1525000, xs 0,15 –1525000, xs 0,9 0, xs 1,0 0, xs 1,0 xs 0 hq cao hiÖ u q u¶ ca o sx 0,8 s¶n xuÊ t ®¹ i trµ hq thÊp hq thÊp hq thÊp dõng dõng dõng dõng dõng hiÖu qu¶ thÊp dõng s¶n xu Êt ® ¹i t rµ s¶n xu Êt ® ¹i t rµ Hình VI.2. Cây quyết định với nhiều nút quyết định Giải thích: Trên cây quyết định có ba nút quyết định (khung hình chữ nhật). Nút 3 và nút 4 sử dụng thông tin do nhà máy thử nghiệm đem lại để quyết định xem có nên sản xuất đại trà hai không. Nút 1 là nút đưa ra quyết định lựa chọn một trong ba phương án hành động: Sản xuất đại trà, xây nhà máy thử nghiệm hay dừng. Các nút còn lại là các nút trạng thái (khoanh tròn), mà tại đó cần tính các giá trị kì vọng (lợi nhuận có thể đạt được). Hành động theo phương án sản xuất đại trà (đi từ nút 1 tới nút 5), phải tính tới hai trạng thái: sản xuất cho hiệu quả cao với xác suất là 0,7 và giá trị lợi nhuận là 12250000 USD; hiệu quả thấp với xác suất là 0,3 và giá trị lợi nhuận là -1525000 USD (hay thất thu là 1525000 USD). Hành động theo phương án xây nhà máy thử nghiệm (đi từ nút 1 tới nút 2) cũng phải tính tới hai trạng thái: nhà máy thử nghiệm cho hiệu quả cao hoặc cho hiệu quả thấp với các xác suất tương ứng là 0,8 và 0,2. Ứng với từng trạng thái đó cần đưa ra các quyết định (tại các nút quyết định 3 và 4) là có nên sản suất đại trà hay dừng hẳn việc sản xuất sản phẩm mới... Phần còn lại của cây quyết định dành cho bạn đọc tự giải thích. Để đưa ra quyết định lựa chọn theo Tiêu chuẩn kì vọng lợi nhuận tối đa, chúng ta bắt đầu từ việc tính kì vọng lợi nhuận của các nút (rễ của cây quyết định) 5, 6, 7, 8, 9 và 10 và thu được các giá trị kì vọng theo thứ tự là: 8117500, 10183750, 0, -147000, 0 và 0 (USD). So sánh các kì vọng lợi nhuận tại nút 6 và nút 7, chúng ta đưa ra quyết định chọn phương án sản xuất đại trà cho nút 3. Lúc này nút 3 có kì vọng lợi nhuận là 10183750 USD. Tương tự, so sánh các kì vọng lợi nhuận tại nút 8 và nút 9, chúng ta đưa ra quyết định chọn dừng sản xuất cho nút 4 với kì vọng lợi nhuận là 0 USD. Từ đó chúng ta xác định được các kì vọng lợi nhuận của các nút trạng thái 5, 2, 10 (là các nút nối trực tiếp tới nút 1) theo thứ tự là là 8117500, 8147000 và 0 USD. Bởi vậy chúng ta chỉ còn phải cân nhắc để lựa chọn hoặc xây nhà máy thử nghiệm hoặc sản xuất đại trà. Do việc xây nhà máy thử nghiệm cho lợi nhuận nhiều hơn việc sản xuất đại trà một lượng tiền là 8147000 - 8117500 = 29500 USD, nên thông tin mới do nhà máy thử nghiệm mang lại được định giá là 29500 USD. Vậy quyết định cuối cùng được đưa ra như sau: Nếu chi phí xây nhà máy thử nghiệm thấp hơn 29500 USD thì nên trước tiên xây nhà máy thử nghiệm và sau đó tiến hành sản xuất đại trà. Nếu trái lại, nên sản xuất đại trà sản phẩm ngay mà không xây nhà máy thử nghiệm (phương án hành động như vậy sẽ mang lại kì vọng lợi nhuận 8117500 USD). 3.2. Phân tích Bayes sử dụng cây quyết định Ví dụ 2: Trong các ví dụ 1 mục 3.1, việc xây dựng cây quyết định là dựa trên các xác suất tiên nghiệm. Trong ví dụ này, cây quyết định được xây dựng dựa trên xác suất hậu nghiệm, được tính toán căn cứ định lí Bayes, nhằm giúp cho một công ti dầu khí quyết định một trong ba lựa chọn: liệu có nên mua tài liệu tư vấn địa chất trước khi khoan hay cứ tiến hành khoan giếng lấy dầu ngay tại một địa điểm khoan giếng dầu đã kí được hợp đồng, hoặc không tiến hành khoan giếng mà nên bán lại hợp đồng. Giám đốc sản xuất của công ti cho rằng khi khoan một giếng dầu tại khu vực này thì có ba hậu quả sau có khả năng xảy ra: Giếng khô (không dầu), Dầu chua (dầu tạp khó lọc) và Dầu ngọt (dầu tinh dễ lọc). Tại vùng đất trên, nơi có khu vực của công ti, nhiều giếng dầu đã được khoan với số liệu thống kê như sau: tỉ lệ giếng không dầu là 60%, giếng có dầu chua là 20% và giếng có dầu ngọt là 20%. Theo đánh giá của bà giám đốc, với giếng dầu khô (không dầu) thất thu trung bình là 50000 USD, với giếng dầu chua lợi nhuận trung bình đạt được là 200000 USD, còn với giếng dầu ngọt lợi nhuận trung bình là 500000 USD. Trong trường hợp công ti không khoan giếng mà bán lại hợp đồng thì thu được 80000 USD. Công ti cũng có thể mua thêm tài liệu địa chất từ phía tư vấn với giá 25000 USD. Qua thống kê, đã biết được thông tin sau đây về phía tư vấn: Trong các giếng không dầu đã khoan có 10% số giếng đã được tư vấn nên khoan, 90% đã được tư vấn không nên khoan. Trong các giếng dầu chua đã khoan có 40% số giếng đã được tư vấn nên khoan và 60% đã được tư vấn không nên khoan. Trong các giếng dầu ngọt đã khoan có 50% số giếng đã được tư vấn nên khoan và 50% đã được tư vấn không nên khoan. Gọi sự kiện giếng khoan lên không có dầu là sự kiện A, có dầu chua là B và có dầu ngọt là C. Lúc đó có các xác suất (thực nghiệm) sau: P(A) = 60%, P(B) = 20%, P(C) = Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học 178 20%. Gọi sự kiện (tư vấn cho là) nên khoan là F, không nên khoan là U. Lúc đó có thể coi P(F/A) = 10%, P(F/B) = 40%, P(F/C) = 50%, P(U/A) = 90%, P(U/B) = 60%, P(U/C) = 50%. Theo định lí Bayes, các xác suất hậu nghiệm được tính như sau (xem hình V.3 với các xác suất tại nút trạng thái số 6)): P(A/F) = P(F / A)P(A) P(F / A)P(A) P(F / B)P(B) P(F / C)P(C)+ + = 0,1 0,6 0,1 0,6 0,4 0,2 0,5 0,2 × × + × + × = 0,06 0,24 = 0,2500. Tương tự, ta có: P(B/F) = 0,4 0,2 0,24 × = 0,3333 và P(C/F) = 0,5 0,2 0,24 × = 0,4176. Tiếp tục áp dụng định lí Bayes, chúng ta cũng có: P(A/U) = P(U / A) P(A) P(U / A) P(A) P(U / B) P(B) P(U / C) P(C) × × + × + × = 0,9 0,6 0,9 0,6 0,6 0,2 0,5 0,2 × × + × + × = 0,54 0,76 = 0,7105. Tương tự, cũng có: P(B/U) = 0,12 0,76 = 0,1579 và P(C/U) = 0,10 0,76 = 0,1316. EV6 = 262500 7 6 2 5 1 3 8 EV7= 61842 EV8= 110000 khoan nên kho an không nên khoan khô khô khô chua chua chua 80000 USD –50000 USD EV 2 =1 23 80 0 80000 USD 200000 USD 500000 USD xs 0 ,24 4 khoan khoan 80000 USD –50000 USD –50000 USD 200000 USD 200000 USD 500000 USD 500000 USD xs 0,16 xs 0,20 xs 0,60 xs 0,25 xs 0,20 xs 0,71 xs 0,33 xs 0,42 xs 0 ,76 m ua t− v Ên ngät ngät sx 0,13 ngät kh«ng mua t− vÊn Hình VI.3. Cây quyết định với xác suất hậu nghiệm Sau khi đã tính được các xác suất hậu nghiệm trên đây, chúng ta xây dựng được cây xác suất như trên hình VI.3 và tính được kì vọng lợi nhuận của các nút 6, 7 và 8 theo thứ tự là 262500, 61842 và 110000 USD. Do đó tại nút quyết định số 3, quyết định là tiến hành khoan giếng với kì vọng lợi nhuận là 262000. Tại nút quyết định số 4, quyết định là bán lại hợp đồng với lợi nhuận là 80000. Còn tại nút quyết định số 5, quyết định là tiến hành khoan giếng với kì vọng lợi nhuận là 110000. Sau đó tiếp tục tính kì vọng lợi nhuận tại nút trạng thái số 2 (là 123800). Cuối cùng so sánh các lợi nhuận tại các nút số 2 và số 5 để chọn phương án hành động mang lại kì vọng lợi nhuận lớn hơn: Cần phải mua tài liệu tư vấn để biết có nên khoan hay không trong trường hợp giá mua tài liệu tư vấn thấp hơn hiệu số 123800 - 110000 = 13800 USD. Nếu giá mua tài liệu tư vấn đắt hơn 13800 USD thì nên tiến hành khoan ngay mà không nên mua tài liệu tư vấn. Như vậy, với giá tài liệu tư vấn là 25000, rõ ràng chúng ta nên tiến hành khoan ngay và không cần mua tài liệu tư vấn. Chú ý: Rõ ràng rằng, một khi có thông tin mới thì chúng ta phải xem xét lại quyết định. Chẳng hạn, chúng ta có bài toán phân tích độ nhạy quyết định khi lợi nhuận PS Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học 180 thu được khi khoan một giếng dầu ngọt không phải là 500000 USD, mà biến thiên tăng dần từ 200000 tới 500000 USD (để đơn giản, giả sử mỗi nấc tăng là 2000 USD). Lúc đó, với các tính toán tương tự như đã làm và với giá mua tài liệu tư vấn chẳng hạn là 25000 USD, có thể chỉ ra rằng: Với PS trong khoảng 200000 tới 312000 USD thì nên lựa chọn việc bán lại hợp đồng. Với PS trong khoảng 312000 tới 388000 USD thì nên mua tài liệu tư vấn. Còn nếu PS lớn hơn 388000 USD thì nên khoan ngay mà không cần mua tài liệu tư vấn. 4. RA QUYẾT ĐỊNH DỰA TRÊN TIÊU CHUẨN KÌ VỌNG THỎA DỤNG TỐI ĐA 4.1. Khái niệm hàm thỏa dụng Trong các mục 1.3 và 1.4, quyết định trong môi trường rủi ro được đưa ra căn cứ các tiêu chuẩn giá trị kì vọng lợi nhuận tối đa. Khi so sánh để lựa chọn một trong hai phương án hành động A hoặc B, phương án nào cho giá trị kì vọng lợi nhuận lớn hơn sẽ được ưu tiên lựa chọn hơn. Tuy nhiên, việc đưa ra quyết định căn cứ vào các giá trị kì vọng lợi nhuận hay kì vọng thất thu (có tính tiền bạc, vật chất) không phải lúc nào cũng tỏ ra hợp lí. Nhiều khi quyết định được đưa ra dựa trên các giá trị thỏa dụng (là các chỉ số đo độ thỏa mãn, tiện dụng của phương án được lựa chọn, các giá trị như vậy có thể được coi là các giá trị “tinh thần” ). Ví dụ 1: Về độ thỏa dụng của một phương án hành động. Chủ một doanh nghiệp có tài sản trị giá 100000 USD với xác suất gặp phải sự cố rủi ro hàng năm (như hỏa hoạn hay thiên tai làm thiệt hại toàn bộ tài sản trên) là 0,1%. Giả sử doanh nghiệp có thể mua bảo hiểm toàn bộ từ một trong hai công ti bảo hiểm với giá tương ứng là 125 USD/năm và 150 USD/năm. Hãy lựa chọn một trong ba phương án: A − mua bảo hiểm giá 125 USD hay B − mua bảo hiểm giá 150 USD hay phương án C − không mua bảo hiểm. Nếu không mua bảo hiểm, kì vọng thất thu là 100000 × 0,1% = 100 USD, còn nếu mua bảo hiểm thì chịu chi phí là 125 USD hoặc 150 USD. Do đó, theo tiêu chuẩn giá trị kì vọng, rõ ràng nên chọn phương án C (không mua bảo hiểm trực tiếp) với kì vọng thất thu tối thiểu. Trên thực tế phương án A thường được chủ doanh nghiệp lựa chọn. Đó là vì chủ doanh nghiệp đánh giá phương án A mang lại độ thỏa dụng cao nhất so với phương án B và phương án C, do cảm thấy phương án A có chi phí thấp và đảm bảo tránh được rủi ro. Điều này được giải thích chính xác hơn thông qua khái niệm hàm thoả dụng, cho phép lượng hoá được độ thoả dụng của các phương án. Kí hiệu phương án A bởi giá trị xA = −125, phương án B bởi giá trị xB = −150 và phương án C bởi l1 = (0, 0,999; −125, 0; −150, 0; −100000, 0,001; −150000, 0). Ở đây, l1 được hiểu giống như một trò chơi xổ số mà người chơi có thể nhận được giải 0 USD (không mất gì) với xác suất 0,999, giải −100000 USD (phải bỏ ra 100000 USD) với xác suất 0,001, các giải khác là −125, −150 và −150000 USD với xác suất là 0. Cần đưa ra quyết định để lựa chọn trong các phương án A hoặc B (mua vé bảo hiểm trực tiếp) hay phương án C (chơi xổ số “bảo hiểm” để có vé bảo hiểm). Giả sử chúng ta có thêm một phương án D với kí hiệu là l2 = (0, 0,999; −125, 0; −150, 0; −100000, 0; −150000, 0,001). Phương án D được coi là một trò chơi xổ số “bảo hiểm” khác. Lúc này cần lựa chọn trong các phương án A, B, C, D một phương án mua bảo hiểm hợp lí nhất. Gọi giá trị thỏa dụng của các phương án A, B, C và D là u(A), u(B), u(C) và u(D). Phương án nào có giá trị thoả dụng cao nhất sẽ được lựa chọn. Vấn đề đặt ra là hàm u(.) nên được định nghĩa như thế nào? Định nghĩa 1: Xét tập hợp X = {x1, x2,..., xr} là tập hợp các giải thưởng và tập hợp các xổ số L tương ứng với X gồm các phần tử lj = (x1, p1j; x2, p2j; ...; xr, prj) trong đó r ij ij i=1 p 1, p 0 i= ≥ ∀∑ . Một hàm số u(.) xác định trên tập U = X∪L được gọi là hàm thỏa dụng, nếu u là hàm tăng trên tập X và u(lj) = r i ij i=1 u(x )p∑ . Giá trị u(lj) được gọi là giá trị thoả dụng hay kì vọng thỏa dụng của xổ số lj. Dễ thấy, một giải thưởng xi cũng có thể được coi là một cuộc xổ số có dạng l = (x1, 0; x2, 0; ...; xi, 1; ...; xr, 0). Theo định nghĩa 1 trên đây, u(l) = u(xi). 4.2. Tiêu chuẩn kì vọng thỏa dụng tối đa Xét các phương án của tập U. Tiêu chuẩn kì vọng thoả dụng tối đa được phát biểu đơn giản như sau: Phương án nào có kì vọng thỏa dụng cao hơn thì được ưu tiên lựa chọn hơn. Như vậy khi xét một tập con hữu hạn phần tử của U, chúng ta luôn có thể lựa chọn được một phương án có kì vọng thỏa dụng cao nhất. Chú ý: Có thể chỉ ra rằng hàm thỏa dụng u(.) luôn tồn tại nếu các tập hợp X và L thỏa mãn một số tiên đề. Đây là một vấn đề có tính chất lí thuyết và phương pháp luận khá phức tạp, chúng ta không đi sâu vào chi tiết. Điều chúng ta quan tâm tới lúc này là quy trình tính toán để xây dựng hàm thoả dụng u(.). Quay trở lại ví dụ 1 ở trên, ta xét tập X = {x1, x2, x3, x4, x5} = {0, −125, −150, −100000, −150000} và tập L gồm các cuộc xổ số “bảo hiểm” ứng với X. Trước hết, do x5 = −150000 là giá trị nhỏ nhất trên tập X nên đặt u(x5) = 0. Do x1 = 0 là giá trị lớn nhất trên X, nên đặt u(x1) = 1. Như vậy dải giá trị của hàm u(.) được chọn là [0, 1]. Để xác định u(x2) cần tìm được một cuộc xổ số l = (x1, p; x2, 0; x3, 0; x4, 0; x5, 1 − p) với p cần xác định sao cho u(l) = u(x1)p + u(x5)(1 − p) = u(x2). Để xác định p, cần đặt câu hỏi dạng “xác suất”: Tìm xác suất p sao cho việc mua bảo hiểm với giá là 125 USD cũng thu được sự thỏa mãn giống như khi tham gia trò chơi xổ số l, trong đó kết cục được 0 USD xảy ra với xác suất p và kết cục được −1500000 USD xảy ra với xác suất 1 − p? Việc xác định p có tính chủ quan nhưng phải dựa trên các quy tắc chặt chẽ (mà do khuôn khổ của giáo trình nên không trình bày ở đây). Giả sử xác định được p = 0,8 thì u(x2) = u(x1)p + u(x5)(1 − p) = 1×0,8 + 0×0,2 = 0,8. Câu hỏi tương tự được đặt ra Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học 182 với x3 và x4, để xác định được, chẳng hạn, u(x3) = 0,7 và u(x4) = 0,1. Như vậy, chúng ta đã xây dựng được hàm thỏa dụng u(.) cho ví dụ đang xét, với đồ thị u1 trên hình V.4. Dựa trên đồ thị u1 và tiêu chuẩn kì vọng thỏa dụng, chúng ta quyết định lựa chọn phương án A: mua bảo hiểm toàn bộ tài sản với giá 125 USD/năm. Có thể chứng minh được rằng việc ra quyết định dựa trên tiêu chuẩn kì vọng thỏa dụng tối đa không phụ thuộc vào thang tỉ lệ của u(.), tức là nếu hàm u (.) đã được xây dựng thì ∀ α > 0, ∀ β, hàm w(x) = αu(x) + β cũng là hàm thỏa dụng. Bởi vậy, dải giá trị ban đầu của u(.) có thể chọn bất kì, chẳng hạn như [-5, 5] hay [0, 10]. Hình VI.4. Đồ thị hàm thỏa dụng Tuy nhiên, hình dạng của hàm u(.) lại phụ thuộc vào việc lựa chọn các giá trị p khi trả lời các câu hỏi “xác suất”. Điều này có nghĩa là mỗi con người có kiểu xây dựng hàm thỏa dụng của mình. Hình VI.4, ngoài đồ thị hàm thỏa dụng u(.) có dạng u1, còn minh họa hai dạng đồ thị hàm thỏa dụng khác là u2 và u3. Các đồ thị này có ý nghĩa gì, vấn đề này sẽ được phân tích vắn tắt thông qua khái niệm ngưỡng mạo hiểm (Risk Premium). Định nghĩa 1: Ứng với mỗi cuộc xổ số l = (x1, p1; x2, p2; ...; xr, pr) ∈ U và một hàm thỏa dụng u(.) xác định trên U, số sau đây được gọi là ngưỡng mạo hiểm của U(.): π = E(x/p) – u−1(E(u/p)) trong đó E(x/p) là giá trị kì vọng của l được tính bởi E(x/p) = r i i i 1 x p = ∑ , còn E(u/p) là kì vọng thỏa dụng của l được tính như đã biết E(u/p) = u(l) = r i i i=1 u(x )p∑ . u3 u2 u1 u x –125 (149875) –100000 (50000) –150000 (0) –150 (149850) 0,7 0,8 0 (150000) 0,1 • Xét hàm thỏa dụng đã xác định ở trên với đồ thị u1 và cuộc xổ số C. Dễ dàng tính được E(x/p ) = −100 USD. Do E(u/p) = 0,999 + 0,0001 = 0,9991 nên u−1(E(u/p)) = u−1(0,9991) ≈ −6 (nếu nội suy tuyến tính). Như vậy, π = E(x/p) − u−1(E(u/p)) ≈ −100 +6 = −94. Chú ý: Có thể chứng minh được rằng nếu hàm thỏa dụng u(.) là hàm lồi (lồi ngặt) thì π ≤ 0 (< 0) với mọi cuộc xổ số. Còn nếu hàm thỏa dụng u(.) là hàm lõm (lõm ngặt) thì π ≥ 0 (> 0) với mọi cuộc xổ số. Quay lại ví dụ đang xét, do hàm u(.) với đồ thị u1 đã xây dựng là lồi ngặt nên ta luôn có π = E(x/p) – u−1(E(u/p)) < 0. Điều này cũng có nghĩa là u(E(x/p)) < E(u/p), tức là độ thỏa dụng của kì vọng lợi nhuận là nhỏ hơn kì vọng thỏa dụng do cuộc xổ số mang lại. Trong trường hợp hàm thỏa dụng có đồ thị u3 (trên hình V.4) thì π > 0 và do đó u(E(x/p)) > E(u/p), tức là độ thỏa dụng của kì vọng lợi nhuận là lớn hơn kì vọng thỏa dụng do cuộc xổ số mang lại. Từ các phân tích trên, ta thấy nếu người ra quyết định có hàm thỏa dụng u(.) lồi thì người đó có tính “hướng mạo hiểm” (Risk Prone), còn nếu trái lại, u(.) lõm thì có tính “tránh mạo hiểm” (Risk Averse). Với u(.) tuyến tính, người ra quyết định có tính hợp lí (Risk Neutral). Điều này được thể hiện khá trực quan trên hình V.4 nếu ta quy lại thang bậc giải thưởng: thay vì các cuộc xổ số “bảo hiểm” đã nói tới trong ví dụ, chúng ta xét các cuộc xổ số thật sự với giải thưởng (được quy lại gốc tọa độ) thuộc vào khoảng 0 USD tới 150000 USD. Với đồ thị u1 ta thấy, ở các giải thưởng khá cao người ra quyết định có tính “hướng mạo hiểm” vẫn chỉ có độ thỏa dụng (mức độ thỏa mãn) thấp, chẳng hạn giải thưởng 149500 USD chỉ mang lại độ thỏa dụng là 0,7 và độ thỏa mãn tăng rất nhanh khi mức giải thưởng tăng sát 150000 USD. Đồ thị u3 cũng có thể được phân tích tương tự để thấy tính “tránh mạo hiểm” của người ra quyết định. Ví dụ 2: Một nhà đầu tư có 10000 USD có thể đầu tư vào thị trường chứng khoán. Anh ta có thể lựa chọn hai công ti X và Y để đầu tư (giả sử rằng hai công ti X và Y là hoàn toàn độc lập với nhau). Theo tính toán sơ bộ và dự đoán của chuyên gia thì nhà đầu tư có thể nhận được gấp đôi số tiền đầu tư với xác suất 0,6 và có thể mất đi một nửa số tiền đầu tư với xác suất 0,4 khi đầu tư vào một trong hai công ti trên. Anh ta xem xét các lựa chọn sau: - Đầu tư toàn bộ số tiền vào một trong hai công ti (phương án A). - Đầu tư 5000 USD vào công ti X (phương án B). - Đầu tư 5000 USD vào công ti X và 5000 USD vào công ti Y (phương án C). - Không đầu tư vào hai công ti trên (phương án D). Ngoài ra, giả sử đã biết hàm thoả dụng của người đầu tư tại một số mức lợi nhuận: u(−5000) = 0; u(−2500) = 0,2; u(0) = 0,4; u(2500) = 0,7; u(5000) = 0,9; u(10000) = 1. Hãy xác định phương án đầu tư dựa trên tiêu chuẩn kì vọng thoả dụng tối đa. Tính kì vọng thoả dụng cho phương án A: E(u/pA) = 0,6×u(10000) + 0,4×u(−5000) = 0,6. Tương tự, E(u/pB) = 0,6×u(5000) + 0,4×u(−2500) = 0,6×0,9 + 0,4×0,2 = 0,62 Nhằm tính kì vọng thoả dụng cho phương án C, chúng ta sử dụng hàm sinh (0,6a1 + 0,4 b1)(0,6a2 + 0,4 b2) = 0,36 a1a2 + 0,24a1b2 + 0,24b1a2 + 0,16b1b2 Trường Đại học Nông nghiệp Hà Nội – Giáo trình Vận trù học 184 để xác định được các xác suất: xác suất đầu tư vào cả hai công ti cùng lãi là 0,36; xác suất đầu tư vào công ti X lãi và công ti Y lỗ là 0,24; xác suất đầu tư vào công ti X lỗ và công ti Y lãi là 0,24; xác suất đầu tư vào cả hai công ti cùng lỗ là 0,16. Vậy E(u/pC) = 0,36×u(10000) + 0,24×u(2500) + 0,24×u(2500) + 0,16×u(−5000) = 0,36×1 + 0,24×0,7 + 0,24×0,7 + 0,16×0 = 0,696. Dễ thấy E(u/pD) = 0,4. Do đó, dựa trên tiêu chuẩn kì vọng thỏa dụng tối đa, ta chọn phương án C để đầu tư. Chú ý: Ra quyết định dựa trên tiêu chuẩn kì vọng thoả dụng tối đa là một phương pháp ra quyết định trong môi trường rủi ro. Cái khó nhất trong phương pháp này là thiết lập được hàm thoả dụng. Ví dụ 3: Một nhà đầu tư nghiên cứu về cổ phiếu của một công ti và đánh giá rằng các cổ phiếu sẽ tăng giá trong thời gian tới. Hiện tại một cổ phiếu được bán ra với giá 50 USD. Thông qua người môi giới, nhà đầu tư được giới thiệu để mua một hợp đồng như sau: mua 4 USD/quyền mua một cổ phiếu

Các file đính kèm theo tài liệu này:

  • pdfgiao_trinh_van_tru_hoc_nguyen_hai_thanh.pdf