Từ 20 năm nay, lý thuyết tập mờ và mạng nơron nhân tạo đã phát triển rất nhanh và đa dạng. Công nghệ mờ và công nghệ mạng nơron đã cung cấp những công nghệ mới cho các ngành công nghiệp làm ra nhiều sản phẩm thông minh, đáp ứng nhu cầu thị trường cần có những bộ điều khiển linh hoạt hơn. Hệ mờ và mạng nơron được kết hợp với nhau để cùng phát huy những ưu điểm của chúng. Một trong những dạng kết hợp đó là mạng nơron mờ, nhờ có nó mà chúng ta đã giải quyết được rất nhiều bài toán khó mà với thuật giải thông thì không thực hiện được hoặc nếu có thì cũng rất phức tạp và mất nhiều thời gian.
Với bài toán xác định quan hệ giữa không gian vào và không gian ra dựa trên các cặp phần tử vào ra đã biết. Cụ thể cho không gian vào , không gian ra và các cặp phần tử vào ra đã biết , tức là cho một phần tử thì có một phần tử ra tương ứng . Yêu cầu bài toán đặt ra là xác định quan hệ giữa và . Một trong những phương pháp thường được sử dụng để giải quyết bài toán trên đó là phương pháp bình phương bé nhất. Để giảm độ phức tạp và thời gian tính toán trong báo cào này tôi sử dụng một phương pháp mới đó là dùng mạng nơron nhân tạo. Và quan hệ giữa không gian vào và ra xác định được không phải là quan hệ bình thường mà là quan hệ mờ.
32 trang |
Chia sẻ: luyenbuizn | Lượt xem: 1207 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Xác định quan hệ mờ bằng mạng nơron nhân tạo, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
-----------&----------
BÁO CÁO NGHIÊN CỨU KHOA HỌC
Tên đề tài:
XÁC ĐỊNH QUAN HỆ MỜ BẰNG MẠNG NƠRON NHÂN TẠO
Hà Nội 4/2008
Xác định quan hệ mờ bằng mạng nơron nhân tạo
MỤC LỤCPhần mở đầu1. Tên đề tài2. Lý do chọn đề tàiI. Tổng quan lý thuyết tập mờ và quan hệ mờ1.1 Khái niệm tập mờ1.2 Các phép toán về tập mờ1.2.1 Phép hợp1.2.2 Phép giao1.2.3 Phép bù1.3. Quan hệ mờII. Giới thiệu về mạng nơron nhân tạo2.1. Mạng nơron sinh học2.2. Mạng nơron nhân tạo2.2.1 Mô hình nơron nhân tạo2.2.2 Định nghĩa và phân loại mạng nơron nhân tạo2.3. Thủ tục học của mạng nơron nhân tạo2.3.1 Học tham số2.3.2 Học cấu trúc2.4 Thuật toán lan truyền ngược2.5 Mạng nơron mờIII. Bài toán xác định quan hệ mờ bằng mạng nơron nhân tạo3.1 Bài toán3.2 Tôpô mạng3.3 Thủ tục học và thuật toán huấn luyện mạng3.4 Ví dụ3.5 Xây dựng chương trình ứng dụngKết luậnTài liệu tham khảo
PHẦN MỞ ĐẦU
1. Tên đề tài
Xác định quan hệ mờ bằng mạng nơron nhân tạo.
2. Lý do chọn đề tài
Từ 20 năm nay, lý thuyết tập mờ và mạng nơron nhân tạo đã phát triển rất nhanh và đa dạng. Công nghệ mờ và công nghệ mạng nơron đã cung cấp những công nghệ mới cho các ngành công nghiệp làm ra nhiều sản phẩm thông minh, đáp ứng nhu cầu thị trường cần có những bộ điều khiển linh hoạt hơn. Hệ mờ và mạng nơron được kết hợp với nhau để cùng phát huy những ưu điểm của chúng. Một trong những dạng kết hợp đó là mạng nơron mờ, nhờ có nó mà chúng ta đã giải quyết được rất nhiều bài toán khó mà với thuật giải thông thì không thực hiện được hoặc nếu có thì cũng rất phức tạp và mất nhiều thời gian.
Với bài toán xác định quan hệ giữa không gian vào và không gian ra dựa trên các cặp phần tử vào ra đã biết. Cụ thể cho không gian vào , không gian ra và các cặp phần tử vào ra đã biết , tức là cho một phần tử thì có một phần tử ra tương ứng . Yêu cầu bài toán đặt ra là xác định quan hệ giữa và . Một trong những phương pháp thường được sử dụng để giải quyết bài toán trên đó là phương pháp bình phương bé nhất. Để giảm độ phức tạp và thời gian tính toán trong báo cào này tôi sử dụng một phương pháp mới đó là dùng mạng nơron nhân tạo. Và quan hệ giữa không gian vào và ra xác định được không phải là quan hệ bình thường mà là quan hệ mờ.
Bài nghiên cứu gồm những phần sau:
Tổng quan lý thuyết tập mờ và quan hệ mờ
Giới thiệu về khái niệm tập mờ, các phép toán trên tập mờ, quan hệ mờ.
Giới thiệu về mạng nơron nhân tạo.
Giới thiệu cấu trúc của một nơron, định nghĩa và phân loại mạng nơron, các thủ học mạng nơron, thuật toán lan truyền ngược.
III. Bài toán xác định quan hệ mờ bằng mạng nơron nhân tạo
Ánh xạ bài toán xác định quan hệ mờ lên mạng nơron nhân tạo, đưa ra cách huấn luyện mạng. Cuối cùng là demo thuật toán xác định quan hệ mờ bằng mạng nơron nhân tạo.
I. Tổng quan lý thuyết tập mờ và quan hệ mờ
1.1 Khái niệm tập mờ
Tập mờ được xem là sự mở rộng trực tiếp của tập kinh điển. Bây giờ ta xét khái niệm hàm thuộc của tập kinh điển.
Định nghĩa 1.1
Cho một tập hợp . Ánh xạ được định nghĩa như sau:
(1.1)
được gọi là hàm thuộc của tập . Tập là tập kinh điển, là không gian nền. Như vậy hàm thuộc của tập cổ điển chỉ nhận hai giá trị là 0 hoặc 1. Giá trị 1 của hàm thuộc còn được gọi là giá trị đúng, ngược lại 0 là giá trị sai của . Một tập luôn có
, với mọi
được gọi là không gian nền (tập nền).
Một tập có dạng
thì được gọi là có tập nền , hay được định nghĩa trên tập nền . Ví dụ tập
có tập nền là tập các số tự nhiên .
Hàm thuộc định nghĩa trên tập , trong khái niệm kinh điển chỉ có hai giá trị là 1 nếu hoặc 0 nếu . Hình 1.1 mô tả hàm thuộc của hàm , trong đó tập được định nghĩa như sau:
2
x
6
0
. (1.2)
1
Hình 1.1. Hàm thuộc của tập kinh điển .
Cách biểu diễn hàm phụ thuộc như vậy không phù hợp với những tập được mô tả “mờ” như tập gồm các số thực dương nhỏ hơn nhiều so với 6
, (1.3)
có tập nền là , hoặc tập gồm các số thực gần bằng 3 cũng có tập nền
(1.4)
Tập , như vậy được gọi là các tập mờ.
Lý do là với những định nghĩa “mờ” như vậy chưa đủ để xác định được một số chẳng hạn như có thuộc hoặc có thuộc hay không. Nên chúng ta không thể dùng hàm thuộc của tập cổ điển chỉ có hai giá trị 1 và 0 để định nghĩa tập và trong trường hợp này.
Vì vậy người ta nghĩ rằng: tại sao lại không mở rộng miền giá trị cho hàm thuộc của tập cổ điển, tức là hàm thuộc sẽ có nhiều hơn hai giá trị. Khi đó thay vì việc trả lời câu hỏi có thuộc hay không, ngưòi ta sẽ trả lời câu hỏi là: vậy thì thuộc bao nhiêu phần trăm? Giả sử rằng có câu trả lời thì lúc này hàm thuộc tại điểm phải có một giá trị trong đoạn , tức là
(1.5)
Nói cách khác hàm không còn là hàm hai giá trị như đối với tập kinh điển nữa mà là một ánh xạ (hình 1.2)
, (1.6)
trong đó là tập nền của tập “mờ”.
Hình 1.2 a, Hàm phụ thuộc của tập “mờ”
b, Hàm phụ thuộc của tập “mờ”
Định nghĩa 1.2
Tập mờ xác định trên tập kinh điển là một tập mà mỗi phần tử của nó là một cặp các giá trị trong đó và là một ánh xạ
. (1.7)
Ánh xạ được gọi là hàm thuộc (hàm phụ thuộc hay hàm thành viên ) của tập mờ . Tập kinh điển được gọi là tập nền (hay tập vũ trụ) của tập mờ .
Ví dụ một tập mờ của các số tự nhiên nhỏ hơn 6 với hàm phụ thuộc có dạng như hình 1.2a định nghĩa trên nền sẽ chứa các phần tử sau
.
Số tự nhiên 1 và 2 có độ phụ thuộc
,
các số tự nhiên 3 và 4 có độ phụ thuộc nhỏ hơn 1
và ,
Những số tự nhiên không được liệt kê đều có độ phụ thuộc bằng 0.
1.2 Các phép toán về tập mờ
Giống như định nghĩa về tập mờ các phép toán trên tập mờ cũng sẽ được định nghĩa thông qua các hàm thuộc. Nói cách khác, khái niệm xây dựng những phép toán trên tập mờ là việc xác định các hàm thuộc cho phép hợp, giao , bù từ những tập mờ. Một nguyên tắc cơ bản trong việc xây dựng các phép toán trên tập mờ là không được mâu thuẫn với những phép toán đã có trong lý thuyết tập hợp kinh điển.
1.2.1 Phép hợp
Cho hai tập hợp mờ và có cùng không gian nền với hai hàm thuộc tương ứng là và . Hợp của và là một tập mờ cũng xác định trên , kí hiệu là có hàm thuộc thoả mãn:
i. chỉ phụ thuộc vào và .
ii. với = .
iii. Tính giao hoán, tức là .
iv. Tính kết hợp, tức là .
v. Là hàm không giảm: .
Để tính hàm thuộc có nhiều cách khác nhau, sau đây là một công thức được dùng trong báo cáo này:
(Luật lấy max) (1.8)
x
x
a)
x
b)
Hình 1.3. Hàm thuộc của hai tập mờ có cùng không gian nền
Hàm thuộc của hai tập mờ và
Hợp của hai tập mờ và theo luật max.
Một cách tổng quát thì bất cứ một ánh xạ dạng
nếu thoả mãn 5 tiêu chuẩn đã nêu trong định nghĩa hợp hai tập mờ đều được xem như là hợp của hai tập mờ và có chung một không gian nền .
Công thức trên cũng được mở rộng để áp dụng cho việc xác định hợp của hai tập mờ không cùng không gian nền, bằng cách đưa cả hai tập mờ về chung một không gian nền là tích của hai tập nền đã cho.
Ví dụ cho tập mờ xác định trên không gian nền và tập mờ xác định trên không gian nền . Do hai tập nền và độc lập với nhau nên hàm thuộc , của tập mờ sẽ không phụ thuộc vào và ngược lại , của tập cũng sẽ không phụ thuộc vào . Điều đó thể hiện ở chỗ trên không gian nền mới là tập tích hàm phải là một mặt “cong” dọc theo trục và là một mặt “cong” dọc theo trục (hình 1.4). Tập mờ như vậy được định nghĩa trên hai không gian nền và . Để phân biệt được chúng, sau đây kí hiệu sẽ được dùng để chỉ tập mờ trên không gian nền . Đối với các tập mờ khác cũng được kí hiệu tương tự. Với kí hiệu đó thì
với mọi
và với mọi .
y
x
a.
M×N
x
y
x
y
M×N
b.
M×N
x
y
c.
Hình 1.4. Phép hợp hai tập mờ không cùng nền
Hàm thuộc của hai tập mờ và
Đưa hai tập mờ về chung một nền
Hợp hai tập mờ trên nền
Sau khi đã đưa được hai tập mờ và về chung một không gian nền là thành và thì hàm thuộc của tập mờ được xác định theo công thức (1.8).
Hợp hai tập mờ theo luật max
Cho tập mờ xác định trên không gian nền và tập mờ xác định trên không gian nền , có hàm thuộc lần lượt là , . Hợp của hai tập mờ và theo luật max là một tập mờ xác định trên không gian nền với hàm thuộc
. (1.9)
trong đó
với mọi
và với mọi .
Một cách tổng quát, do hàm thuộc của hợp hai tập mờ , không cùng không gian nền chỉ phụ thuộc vào và nên ta có thể xem là hàm của hai biến , được định nghĩa như sau
(1.10)
Ta đi đến định nghĩa về hàm thuộc của hợp hai tập mờ không cùng không gian nền:
Định nghĩa 1.3
Hàm thuộc của hợp giữa hai tập mờ với định nghĩa trên không gian nền và với định nghĩa trên không gian nền là một hàm hai biến xác định trên nền thoả mãn:
.
, tức là có tính giao hoán.
, tức là có tính kết hợp.
, tức là có tính không giảm.
Một hàm hai biến thoả mãn các điều kiện của định nghĩa trên còn được gọi là hàm t-đối chuẩn (t-conorm).
1.2.2 Phép giao
Cho hai tập hợp mờ và có cùng không gian nền với hai hàm thuộc tương ứng là và . Giao của và là một tập mờ cũng xác định trên , kí hiệu là có hàm thuộc thoả mãn:
i. chỉ phụ thuộc vào và .
ii. với = .
iii. Tính giao hoán, tức là .
iv. Tính kết hợp, tức là .
v. Nếu thì hay có tính chất không giảm, tức là .
Tương tự như đã trình bày về phép hợp hai tập mờ, có nhiều công thức khác nhau để tính hàm thuộc của giao hai tập mờ và bất cứ một ánh xạ
nào thoả mãn 5 tiêu chuẩn đã nêu trong định nghĩa trên đều được xem như là hàm thuộc của giao hai tập mờ và có chung một không gian nền . Sau đây là một trong những công thức để tính hàm thuộc của phép giao gồm:
(Luật min) (1.11)
x
a)
x
b)
M×N
y
x
d)
c)
Công thức trên cũng áp dụng được cho hợp hai tập mờ không cùng không gian nền bằng cách đưa cả hai tập mờ về chung một không gian nền là tích của hai không gian nền đã cho.
x
Hình 1.5. Phép giao của hai tập mờ
Hàm thuộc của hai tập mờ và .
Phép giao hai tập mờ cùng không gian nền theo luật min.
Phép giao hai tập mờ cùng không gian nền theo luật tích đại số.
Phép giao hai tập mờ không cùng khôn gian nền
Giao của hai tập mờ theo luật min
Giao của hai tập mờ với hàm thuộc định nghĩa trên không gian nền và với hàm thuộc định nghĩa trên không gian nền là một tập mờ xác định trên không gian nền có hàm thuộc
. (1.12)
Trong đó
với mọi
và với mọi .
Với ví dụ về tập mờ , có hàm đặc tính như trong hình 1.5a thì tập giao của chúng trên tập nền chung sẽ có hàm thuộc mô tả như trong hình 1.5d.
Trong ví dụ trên ta thấy hàm thuộc của giao hai tập mờ , không cùng không gian nền chỉ phụ thuộc vào và . Do đó không mất tính tổng quát nếu ta xem là hàm của hai biến , được định nghĩa như sau
(1.13)
Ta đi đến định nghĩa về hàm thuộc của hợp hai tập mờ không cùng không gian nền như sau:
Định nghĩa 1.4
Hàm thuộc của hợp giữa hai tập mờ với định nghĩa trên không gian nền và với định nghĩa trên không gian nền là một hàm hai biến xác định trên nền thoả mãn:
.
, tức là có tính giao hoán.
, tức là có tính kết hợp.
, tức là có tính không giảm.
Một hàm hai biến thoả mãn các điều kiện của định nghĩa trên còn được gọi là hàm t- chuẩn (t-norm).
1.2.3 Phép bù
Cho tập mờ trên không gian nền . Phép bù của là một tập mờ cũng xác định trên không gian nền , kí hiệu là , nó có hàm thuộc thoả mãn:
i. chỉ phụ thuộc vào .
ii. Nếu thì , hay
iii. Nếu thì , hay
iv.Nếu thì , tức là
.
Do hàm thuộc của chỉ phụ thuộc vào nên ta có thể xem như là một hàm của trong . Từ đó đưa ra định nghĩa tổng quát hơn về phép bù mờ như sau:
Định nghĩa 1.5
Tập bù của tập mờ xác định trên không gian nền là một tập mờ cũng xác định trên không gian nền với hàm thuộc
thoả mãn
i. và
ii, , tức là hàm không tăng.
a)
b)
x
1
Hình 1.6: Tập bù mạnh của tập mờ .
Hàm thuộc của tập mờ .
Hàm thuộc của tập mờ .
1.3. Quan hệ mờ
Định nghĩa 1.6
Cho , là hai không gian nền. gọi là một quan hệ mờ trên nếu là một tập mờ trên , tức là có một hàm thuộc , ở đây là độ thuộc của vào quan hệ .
- Tính bắc cầu
Định nghĩa: Quan hệ mờ R trên gọi là:
Min-chuyển tiếp nếu
Bắc cầu yếu nếu có
và thì .
bắc cầu tham số nếu có một số sao cho:
Nếu và thì
* Phương trình quan hệ mờ
Phương trình quan hệ mờ lần đầu tiên nghiên cứu bởi GS.Sanchez năm 1976, đóng vai trò quan trọng trong các lĩnh vực phân tích các hệ mờ, thiết kế các bộ điều khiển mờ, quá trình lấy quyết định và nhận dạng mờ.Dạng đơn giản nhất có thể diễn đạt như sau:
Cho một hệ mờ biểu diễn dưới dạng một quan hệ mờ nhị nguyên trên không gian tích . Đầu vào (input) của hệ là một tập mờ cho trên không gian nền input . Tác động của đầu vào với hệ sẽ là phép hợp thành sẽ cho ở đầu ra (output) một tập mờ trên không gian nền , kí hiệu là . Khi ấy ta có .
II. Giới thiệu về mạng nơron nhân tạo
Mạng nơron hay mạng nơron nhân tạo là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh con người. Trong quá trình tái tạo không phải tất cả các chức năng của bộ não con người có đều được tái tạo, mà chỉ có những chức năng cần thiết. Bên cạnh đó còn có những chức năng mới được tạo ra nhằm giải quyết một bài toán điều khiển đã định hướng trước. Trước khi tìm hiểu về mạng nơron chúng ta giới thiệu sơ lược về mạng nơron sinh học.
2.1. Mạng nơron sinh học
Não người là tổ chức vật chất cấp cao, có cấu tạo vô cùng phức tạp, dày đặc các mối liên kết giữa các nơron nhưng xử lý thông tin rất linh hoạt trong môi trường bất định.
Hình 2.1. Mô hình mạng nơron sinh học
Trong bộ não người có khoảng tế bào thần kinh được gọi là các nơron và mỗi nơron có thể liên kết với nơron khác thông qua các khớp nối thần kinh (synapse). Dưới con mắt của những người làm tin học cấu tạo của mỗi nơron gồm các thành phần cơ bản sau:
Thân nơron được giới hạn trong một màng membran và trong cùng là nhân. Từ thân nơron còn có rất nhiều đường rẽ nhánh tạm gọi là rễ.
“Bus” liên kết nơron này với các nơron khác được gọi là axon, trên axon có các đường rẽ nhánh. Nơron còn có thể liên kết với các nơron khác qua các rễ. Chính vì cách liên kết đa dạng như vậy nên mạng nơron có độ liên kết rất cao.
Các rễ của noron được chia làm hai loại: loại nhận thông tin từ các nơron khác qua axon, mà ta sẽ gọi là rễ đầu vào và loại đưa thông tin qua axon tới các nơron khác, gọi là rễ đầu ra. Một nơron có thể có nhiều rễ đầu vào, nhưng chỉ có một rễ đầu ra. Bởi vậy nếu coi nơron như một khâu điều khiển thì nó chính là khâu có nhiều đầu vào, một đầu ra. Một nơron sẽ ở trạng thái kích thích khi tại đầu vào xuất hiện một tín hiệu tác động vượt quá ngưỡng cân bằng của nơron.
Một tính chất rất cơ bản của mạng nơron sinh học là các đáp ứng theo kích thích có khả năng thay đổi theo thời gian. Các đáp ứng có thể tăng lên, giảm đi hoặc hoàn toàn biến mất. Qua các nhánh axon liên kết tế bào nơron này với các nơron khác, sự thay đổi trạng thái của một nơron cũng dẫn theo sự thay đổi trạng thái của những nơron khác và do đó là sự thay đổi của toàn bộ mạng nơron. Việc thay đổi trạng thái của mạng nơron có thể thực hiện qua một quá trình “dạy” hoặc do khả năng “học” tự nhiên.
Cấu trúc của mạng nơron luôn luôn phát triển và thay đổi để thích nghi dần với môi trường, làm cho cấu trúc bộ não ngày càng trở nên phức tạp sau mỗi lần học. Một số cấu trúc của nơron được xác định trước, một số sau này mới được hình thành và một số thì bị huỷ bỏ qua quá trình chọn lọc tự nhiên, học và thích nghi.
Các nhà khoa học đã và đang xây dựng và phát triển các mô hình xử lý thông tin mô phỏng hoạt dộng của bộ não người. Đó chính là mô hình mạng nơron nhân tạo.
2.2. Mạng nơron nhân tạo
2.2.1 Mô hình nơron nhân tạo
Một nơron nhân tạo phản ánh các tính chất cơ bản của nơron sinh học. Mỗi nơron nhân tạo là một đơn vị xử lí thông tin làm cơ sở cho hoạt động của một mạng nơron. Nó có chức năng nhận tín hiệu vào, tổng hợp và xử lý các tín hiệu vào để tính tín hiệu ra. Dưới đây là một mô hình của một nơron nhân tạo.
Hình 2.2. Mô hình một nơron nhân tạo
Trong đó:
- với : các tín hiệu đầu vào.
- với : các trọng số tương ứng với đầu vào.
- : ngưỡng kích hoạt của nơron .
- : tín hiệu tổng hợp đầu vào.
- : Hàm kích hoạt.
- : tín hiệu ra của nơron .
Đầu vào của nơron nhân tạo gồm n tín hiệu với . Mỗi tín hiệu đầu vào tương ứng với một trọng số với , nó thể hiện mức độ ảnh hưởng của tín hiệu đến nơron .
Một nơron có thể có nhiều đầu vào nhưng chỉ có một tín hiệu đầu ra. Tín hiệu đầu vào của một nơron có thể là dữ liệu từ bên ngoài mạng, hoặc đầu ra của một nơron khác, hoặc là đầu ra của chính nó.
Nhằm tăng khả năng thích nghi của mạng nơron trong quá trình học, người ta sử dụng gán thêm một tham số (Bias) cho mỗi nơron nhân tạo. Tham số đó còn gọi là trọng số của nơron, ta kí hiệu trọng số của nơron thứ là .
Mỗi một nơron trong một mạng kết hợp các giá trị đưa vào nó thông qua các liên kết với nơron khác, sinh ra một giá trị gọi là . Hàm thực hiện nhiệm vụ này gọi là hàm kết hợp (combination function), được định nghĩa bởi một luật lan truyền cụ thể. Trong phần lớn các mạng nơron, chúng ta giả sử rằng mỗi một nơron cung cấp một bộ cộng như là đầu vào cho đơn vị mà nó liên kết. Để tính tổng hợp tín hiệu đầu vào , ta giả định là hàm của các tín hiệu và các trọng số .
. (2.1)
Có nhiều cách để tính tổng tín hiệu vào của nơron, trên dây là cách khá đơn giản và hữu ích khi chúng ta xây dựng một mạng có nhiều nơron.
Trường hợp , nơron được coi là đang ở trạng thái kích thích. Tương tự, nếu như , nơron ở trạng thái kiềm chế.
Sau khi tổng hợp được tín hiệu đầu vào , sử dụng hàm kích hoạt biến đổi để thu được tín hiệu đầu ra .
(2.2)
Tóm lại có thể xem nơron là một hàm phi tuyến nhiều đầu vào, một đầu ra.
Hàm kích hoạt phải thoả mãn các điều kiện sau:
- Tín hiệu đầu ra phải không âm với mọi giá trị của .
- Hàm phải liên tục và bị chặn trong khoảng .
Hàm kích hoạt hay còn được gọi là hàm nén vì chúng nén tín hiệu đầu ra vào một khoảng nhỏ. Hàm kích hoạt hay được sử dụng là:
Hàm đồng nhất (Linear function, Identity function)
(2.3)
Nếu coi các đầu vào là một đơn vị thì chúng ta sẽ sử dụng hàm này. Đôi khi một hằng số được nhân với để tạo ra một hàm đồng nhất.
1
-1
1
f(x)
1
x
0
1
Hình 2.3. Hàm đồng nhất
Hàm bước nhị phân (Binary step function, Hard limit function)
Hàm này còn được gọi là hàm ngưỡng (Threshold function hay Heaviside function). Đầu ra của hàm này chỉ giới hạn trong hai giá trị:
(2.4)
Dạng hàm này được sử dụng trong các mạng chỉ có một lớp. Trong hình vẽ sau, được chọn bằng 1.
-1
0 1
2
3
4 x
-1
f(x)
Hình 2.4. Hàm bước nhị phân
Hàm sigmoid (Sigmoid function (logsig))
(2.5)
Hàm này đặc biệt thuận lợi khi sử dụng cho các mạng được huấn luyện (trained) bởi thuật toán lan truyền ngược (back-propagation), bởi vì nó dễ lấy đạo hàm, do đó có thể giảm đáng kể tính toán trong quá trình huấn luyện. Hàm này được ứng dụng cho các chương trình ứng dụng mà các đẩu ra mong muốn rơi vào khoảng [0,1].
Hàm sigmoid lưỡng cực (Bipolar sigmoid function (tansig))
(2.6)
Hàm này có các thuộc tính tương tự của hàm sigmoid. Nó làm việc tốt đối với các ứng dụng có đầu ra yêu cầu trong khoảng [-1,1].
2.2.2 Định nghĩa và phân loại mạng nơron nhân tạo.
2.2.2.1 Định nghĩa
Mạng nơron nhân tạo là sự mô phỏng hoạt động của bộ não con người. Nó là sự liên giữa các nơron độc lập với nhau. Không có một định nghĩa tổng quát về mạng nơron, song phần lớn những người làm việc trong lĩnh vực mạng nơron đều có thể đồng ý với định nghĩa sau: “Mạng nơron là một hệ thống bao gồm rất nhiều phần tử xử lý đơn giản hoạt động song song. Tính năng của hệ thống này phụ thuộc vào cấu trúc của hệ thống, cường độ liên kết giữa các phần tử và quá trình xử lý bên trong các phần tử. Hệ thống này có thể học số liệu và có khả năng tổng quát hoá từ các số liệu được học”.
Trong định nghĩa trên, các phần tử xử lý được nhắc đến chính là các nơron.
2.2.2.2 Phân loại
Liên kết các đầu vào và ra của nhiều nơron với nhau ta được một mạng nơron. Nguyên lý cấu tạo của một mạng nơron bao gồm một hoặc nhiều lớp. Mỗi lớp bao gồm nhiều nơron có cùng một chức năng trong mạng.
Mạng nơron nhân tạo có thể được chế tạo bằng nhiều cách khác nhau vì vậy trong thực tế tồn tại rất nhiều kiểu mạng nơron nhân tạo. Dựa vào số lớp hay sự liên kết giữa các lớp trong mạng mà người ta phân mạng nơron nhân tạo thành các nhóm khác nhau.
* Phân loại theo số lớp
Phân loại theo số lớp thì mạng nơron nhân tạo gồm có hai nhóm: mạng một lớp và mạng nhiều lớp.
- Mạng một lớp
Mạng một lớp cấu thành từ một lớp mạng, nó vừa là lớp vào vừa là lớp trung gian và cũng là lớp ra. Một lớp mạng bao gồm một nhóm các nơron được tổ chức theo một cách sao cho tất cả chúng đều nhận cùng một véc tơ đầu vào để xử lý cùng thời điểm. Việc sản sinh ra đầu vào, biến đổi thành tín hiệu đầu ra xuất hiện cùng một lúc trong tất cả các nơron.
Hình 2.5. Mô hình mạng một lớp.
- Mạng nhiều lớp
Mạng nhiều lớp được cấu thành từ nhiều lớp liên kết với nhau, bao gồm một lớp vào, lớp ẩn và một lớp ra. Trong đó, lớp nhận tín hiệu đầu vào được gọi là lớp vào. Các tín hiệu đầu ra của mạng được sản sinh bởi lớp ra của mạng. Các lớp nằm giữa lớp vào và lớp ra được gọi là lớp ẩn. Lớp ẩn là thành phần nội tại của mạng, nó không có bất kỳ tiếp xúc nào với môi trường bên ngoài. Số lượng lớp ẩn có thể dao động từ 0 đến một vài lớp. Tuy nhiên thực tế cho thấy chỉ cần một lớp ẩn là mạng đã đủ để giải quyết được một lớp các bài toán phức tạp nào.
lớp vào
lớp ẩn
lớp ra
Hình 2.6. Mô hình mạng 3 lớp truyền thẳng.
* Phân loại theo sự liên kết giữa các lớp
Sự liên kết trong mạng nơron tuỳ thuộc vào nguyên lý tương tác giữa đầu ra của từng nơron riêng biệt với nơron khác và tạo ra cấu trúc mạng nơron. Về nguyên tắc sẽ có rất nhiều kiểu liên kết giữa các nơron, nhưng chỉ có một số cấu trúc hay gặp trong ứng dụng sau:
- Mạng truyền thẳng (Feedforward neural networks)
Dòng dữ liệu đầu vào từ các nơron đầu vào đến các nơron đầu ra chỉ được truyền thẳng. Việc xử lý dữ liệu có thể mở rộng ra nhiều lớp, nhưng không có các liên kết ngược. Tức là, không có các liên kết từ các đơn vị đầu ra tới các đơn vị đầu vào trong cùng một lớp hay các lớp trước đó.
Nếu mô hình hoá mạng truyền thẳng bằng một đồ thị, thì nó là một đồ thị có hướng hữu hạn không chu trình. Trong đó, mỗi nơron là một nút, các liên liên kết giữa các nơron là các cung của đồ thị. Hình 2.6 là một minh họa về mạng truyền thẳng nhiều lớp.
- Mạng hồi quy (mạng nối ngược) (Recurrent neural network)
Khác với mạng truyền thẳng, mạng hồi quy có chứa các liên kết ngược. Mô hình hoá mạng hồi quy bằng một đồ thị thì nó là một đồ thị có hướng hữu hạn có chu trình. Hình 2.7 minh họa cho một mạng hồi quy.
Hình 2.7. Mô hình mạng nơron nhiều lớp hồi quy
2.3. Thủ tục học của mạng nơron nhân tạo
Mạng nơron khi mới hình thành chưa có tri thức, để có thể giải quyết một bài toán cụ thể nào đó thì phải cho mạng nơron học. Mạng nơron học thông qua quá trình huấn luyện mạng bằng một tập dữ liệu (training data). Tiến trình điều chỉnh các trọng số để mạng “nhận biết ” được mối quan hệ giữa đầu vào và đích mong muốn được gọi là học (learning) hay huấn luyện (training) . Rất nhiều thuật toán học đã được phát minh để tìm ra tập trọng số tối ưu làm giải pháp cho bài toán.
Các nhân tố quyết định tới khả năng của một mạng nơron gồm: cấu trúc của mạng (số lớp, số nơron trên một lớp, và cách mà các lớp được liên kết với nhau) và các trọng số của các liên kết bên trong mạng. Dựa vào điều này, người ta phân các thuật toán học của mạng nơron thành hai nhóm chính: học cấu trúc và học tham số.
2.3.1 Học tham số
Học tham số quan tâm đến chiến lược hiệu chỉnh các trọng số của các nơron trong mạng.
Giả sử có nơron, mỗi nơron có trọng số. Chúng ta có thể kết hợp được lại tạo thành ma trận dạng sau:
(2.7)
Trong đó, là trọng số liên kết từ nơron đến nơron .
Các thủ học tham số nhằm tìm kiếm ma trận trọng só sao cho mạng có khả năng đưa ra các dự báo sát với thực tế. Các thủ học có tham số có thể được chia thành ba lớp nhỏ hơn: học có chỉ đạo (học có thầy), học tăng cường, học không chỉ đạo (học không có thầy hay học tự tổ chức).
- Học có chỉ đạo
Mạng nơron
Sản sinh sai số
Véc tơ vào
Tín hiệu ra out
Hình 2.8. Sơ đồ học có chỉ đạo
Mỗi lần véc tơ tín hiệu vào được cấp cho mạng, ta cũng cấp luôn cho mạng véc tơ đầu ra mong muốn . Mạng phải sản sinh ra tín hiệu đầu ra sao cho nó gần với nhất. Cụ thể, nếu ta cấp một tập ngẫu nhiên . Khi véc tơ đi vào mạng, véc tơ đầu ra cũng được cung cấp. (Hình 2.8) Độ lệch tín hiệu giữa đầu ra và véc tơ đầu ra sẽ được bộ sản sinh sai số thu nhận và sản sinh ra tín hiệu sai số. Tín hiệu sai số này sẽ đi vào mạng và mạng sẽ hiệu chỉnh các trọng số của mình sao cho tín hiệu đầu ra sẽ gần với véc tơ đầu ra mong muốn .
Nếu tín hiệu ra = thì lúc đó mạng nơron đã bão hoà, ta nói thủ tục học của mạng đã hội tụ.
- Học tăng cường
Mạng nơron
Sản sinh tín hiệu tăng cường
Véc tơ vào
Tín hiệu ra out
Tín hiệu tăng cường
Hình 2.9. Sơ đồ học tăng cường.
Học tăng cường cũng là một dạng của học có chỉ đạo vì mạng nơron vẫn nhận tín hiệu ngoài môi trường. Tuy nhiên, tín hiệu ngoài môi trường chỉ là những tín hiệu mang tính phê phán, chứ không phải là các chỉ dẫn cụ thể như trong học có chỉ đạo. Nghĩa là, tín hiệu tăng cường chỉ có thể nói cho mạng b
Các file đính kèm theo tài liệu này:
- xd qhe mo mang noron nhan tao.doc