Trong thời đại ngày nay, ngành công nghiệp đóng vai trò quan trọng trong nền kinh tế, khoa học những ROBOT tự động, sẽ giúp cho con người rất nhiều, chúng đã thay thế sức con người một cách hiệu quả nhất. ROBOT được sử dụng rộng rãi cuộc sống, nơi mà môi trường có tính độc hại , nguy hiểm cũng như các công việc yêu cầu có độ chính xác cao. Do vậy ROBOT có tầm quan trọng rất lớn trong thời đại ngày nay.
Là sinh viên chuyên ngành điện tử tự động, để bổ sung những kiến thức đã học cũng như nghiên cứu những vấn đề mới trong lĩnh vực điều khiển tự động nên chúng em quyết định chọn đề tài “ROBOT DI DỘNG BÁM THEO VẬT”.
Mặc dù đã cố gắng hoàn thành đồ án đúng thời hạn nhưng trong quá trình thực hiện không tránh khỏi những thiếu sót. Chúng em rất mong nhận được sự đóng góp ý kiến từ quý Thầy cô và các bạn.
95 trang |
Chia sẻ: oanh_nt | Lượt xem: 1304 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Đồ án Robot di dộng bám theo vật, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Trong thời đại ngày nay, ngành công nghiệp đóng vai trò quan trọng trong nền kinh tế, khoa học… những ROBOT tự động, sẽ giúp cho con người rất nhiều, chúng đã thay thế sức con người một cách hiệu quả nhất. ROBOT được sử dụng rộng rãi cuộc sống, nơi mà môi trường có tính độc hại , nguy hiểm cũng như các công việc yêu cầu có độ chính xác cao. Do vậy ROBOT có tầm quan trọng rất lớn trong thời đại ngày nay.
Là sinh viên chuyên ngành điện tử tự động, để bổ sung những kiến thức đã học cũng như nghiên cứu những vấn đề mới trong lĩnh vực điều khiển tự động nên chúng em quyết định chọn đề tài “ROBOT DI DỘNG BÁM THEO VẬT”.
Mặc dù đã cố gắng hoàn thành đồ án đúng thời hạn nhưng trong quá trình thực hiện không tránh khỏi những thiếu sót. Chúng em rất mong nhận được sự đóng góp ý kiến từ quý Thầy cô và các bạn.
Chúng em xin chân thành cảm ơn:
Thầy PHẠM THÀNH DANH đã tận tình hướng dẫn chúng em trong quá trình chuẩn bị cũng như thực hiện đề tài này.
NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN:
Chữ ký giáo viên:
NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN:
Chữ ký giáo viên:
MỤC LỤC
PHẦN Trang
Phần 1.Lý thuyết định vị robot 6
Phần 2.Thiết kế mạch điều khiển 9
Phần 3. Thiết kế phần cơ Robot 18
Phần 4. Điều khiển Robot 20
Phần 5. Xử lý ảnh 25
Phần 6.Tổng quan về OPENCV 30
Phần 7. Truyền dữ liệu bằng module RF 40
Phần 8. Chương trình điều khiển 46
Phần 1: LÝ THUYẾT VỀ ĐỊNH VỊ ROBOT
Định vị cho robot:
Có 2 cách: định vị tương đối và tuyệt đối
Định vị tương đối
Là một phương pháp phổ biến dùng để xác định vị trí tương đối của robot di động trong mặt phẳng sau một quá trình duy chuyển nào đó so với vị trí ban đầu. Việc giải bài toán định vị tương đối thực ra là giải bài toán động học cho robot di động, nhằm xác định vị trí và hướng tức thời của robot sau một quá trình chuyển động trong gốc tọa độ với bề mặt sàn của robot ở thời điểm ban đầu.
Việc khó khăn là robot liên kết với sàn thi đấu bằng bánh xe và lớp cao su, vì vậy việc chuyển động là nhờ vào lực ma sát, do đó việc chính xác không cao lắm vì phục thuộc tương đối vào hai bánh xe, sự trượt của bánh.....Sai số hệ thống là do những cơ cấu chấp hành,những thiết kế không chính xác như: hai bánh xe không bằng nhau,không cân bằng…
Phương pháp định vị tương đối chủ yếu dựa vào số vòng quay của motor, để xác định vị trí tương đối của robot sau một quá trình chuyển động. Phương pháp này thì đơn giản, nhưng có khuyết điểm lớn nhất là bán kính sai số lớn và là sai số tích lũy.
Sau đây là 1 ví dụ đơn giản:
Hình 1.1: Mô hình robot đơn giản
Trong hình hai bánh xe được truyền động bằng hai motor giảm tốc riêng biệt và có hai encorder hồi tiếp xung cho mỗi motor. Đặt vấn đề là bài toán yêu cầu cho robot chạy một đoạn thẳng 10 cm thì có sai số không và sai số là bao nhiêu. Để giải quyết bài toán trên ta giả sử dùng 2 encoder cho hai bánh xe với độ phân giải là 100 xung/vòng quay và encoder được gắn trên bánh xe có đường kính 5cm,
Gọi D là đường kính của bánh xe Encorder
S là chu vi của bánh xe encorder
P là độ phân giải của encoder
D=50mm è S=2*3.14*25= 157 mm (1 vòng quay)
P=100 è 1góc =3.60 và 1xung=1.57mm
100 xung=64 xung
Yêu cầu bài toán là cho robot chạy 1 đoạn 10cm(100mm) è robot phải chạy sao cho bánh xe encoder phải quay hết 64 xung
Trên đây chỉ là tính toán tuyệt đối và encorder xoay trong điều kiện lý tưởng,nhưng thực tế thì thường có sai số vì:
Bánh xe không tròn
Đường kính bánh xe thực tế không bằng với bánh xe dùng trong tính toán
Bánh xe lệch trục
Vị trí lắp bánh xe không thích hợp dẫn đến bánh xe có thể không tiếp xúc nền
Tần số lấy mẫu của encoder
Mặt sàn không cân bằng
Trượt bánh xe so với nền
Khi quay quá nhanh làm bánh xe bị trượt một khoảng
Định vị tuyệt đối:
Định vị tuyệt đối là phương pháp xác định vị trí chính xác của robot, phương pháp này được thực hiện không thể thiếu các cảm biến, encoder, công tắc hành trình ... những phần tử này tạo cơ sở cho robot nhận biết đang ở đâu, toạ độ bao nhiêu. Điểm khác so với định vị tương đối là:
Các phần thiết kế cơ khí không cần tuyệt đối chính xác
Luôn luôn đọc giá trị hiện tại
Điều khiển theo cơ sở logic
Ưu điểm của phương pháp định vị tuyệt đối:
Định vị chính xác
Vị trí sai số nhỏ,không đáng kể
Cơ khí không cần thiết kế tuyệt đối chính xác
b. Nhược điểm của phương pháp này:
Tốn kém kinh phí đầu tư
Mạch thiết kế phức tạp, để đáp ứng yêu cầu điều khiển
Cần cập nhật giá trị cảm biến liên tục
Phần 2: THIẾT KẾ PHẦN MẠCH ĐIỀU KHIỂN
Tìm hiểu encoder:
Hình 2.1 Mô hình Encoder và encoder đang sử dụng E6B2
Ngõ ra của encoder có thể được xem như kênh A và kênh B như hình dưới.
Hình2.2: Trạng thái ngõ ra kênh A và kênh B
Ngõ ra của kênh A là điện áp được khuếch đại bởi transisstor Q1 và tương thích TTL với thời gian tăng và giảm bằng mạch kích Schmittriger L1. Hoạt động tương tự ở kênh B qua Q2 và L2. Rõ ràng là mạch kích Schmitt kênh A tạo ra xung clock để chốt và mạch kích Schmitt kênh B nối với ngõ vào diode của chốt. Với cấu hình này, trạng thái của ngõ ra Q của chốt sẽ cho biết chiều quay của đĩa mã hoá.
Giả sử trạng thái logic của ngõ ra Q của SN7474 là mức cao. Thế thì kênh B được ưu tiên dẫn trước kênh A. Nói cách khác, khi chốt được kích cạnh, có 1 tín hiệu logic ở ngõ vào diode của nó. Dưới các điều kiện này, bảng sự thật của mạch chốt sẽ biểu diễn ngõ ra Q của nó sẽ lên mức cao. Chiều quay ngược chiều kim đồng hồ tồn tại dưới điều kiện kênh B dẫn trước kênh A. Các điều kiện ngược lại làm quay theo chiều kim đồng hồ và ngõ raQ của mạch chốt ở mức thấp.
Mạch điều khiển động cơ:
Hình 2.3: Mạch điều khiển động cơ
Giản đồ trạng thái điện áp:
Hình 2.4: Giản đồ trạng thái điện áp ngõ ra
Nếu cho động cơ chạy thì chân 1 Opto(PWM1) phải ở mức logic 1,lúc này nội trở hai chân 3 và 4 của Opto sẽ thấp, nguồn 12v qua R5(do Opto) dẫn nên tại chân B của Q2 sẽ đạt mức logic thấpè Q2 tắt è Q3 dẫn bão hoà è Q4 tắt è Q5 dẫn è Động cơ chạy.
Ngược lại, khi Opto tắt è Q2 dẫn bão hòa è Q3 tắt è Q4 dẫn(nếu có điện áp rơi trên chân E của Q4) è Q5 tắt è Động cơ tắt
Khi muốn đảo chiều động cơ ta chỉ cần xuất mức logic 0 tại chân DKRL1, lúc này role 2 sẽ ON, nhờ vào những tiếp điểm của role ta sẽ đảo chiều cấp nguồn của động cơ è Động cơ chạy ngược chiều
Mạch Detect màu trên sân thi đấu:
Hình 2.5: Mạch detect màu trên sân thi đấu
Nguyên lý hoạt động: Dựa vào sự thay đổi nội trở của Photo Resistor khi được chiếu sáng hay che tối, điều này làm thay đổi nội trở (dạng analog) tại chân (-) của Opam.Chân (+) là áp ngưỡng so sánh cho ngõ vào (-).Vì vậy ở ngõ ra chỉ tồn tại hai trạng thái 1 nếu áp chân (-) nhỏ hơn áp tại chân (+) và ngược lại là mức 0.
Trong sân thi đấu có hai màu, xanh và trắng, nếu led phát vào màu trắng thì ánh sáng phản chiếu vào quang trở sẽ mạnh hơn khi đi vào màu xanh vì vậy khi vào vạch trắng thì điện áp tại chân (-) nhỏ hơn áp tại chân (+) è ngõ ra = 1.Ngược lại khi ra khỏi vạch trắng thì áp tại chân (-) lớn hơn áp tại chân (+) è ngõ ra = 0,lấy mức logic này đưa vào mạch đảo tín hiệu để tạo mức logic chính xác trước khi đưa vào vi điều khiển để nhận biết màu và đưa ra điều khiển thích hợp. Ta có dạng trạng thái xung trong hình sau:
Hình 2.6: Trạng thái xung
Mạch chọn kênh chương trình:
Dùng vi mạch 4067 chúng ta có thể chọn được 16 chương trình từ 5 chân của vi điều khiển
Bảng hoạt động như sau:
Select 4
Select 3
Select 2
Select 1
EN
Output
0
0
0
0
0
Pro_1
0
0
0
1
0
Pro_2
0
0
1
0
0
Pro_3
0
0
1
1
0
Pro_4
0
1
0
0
0
Pro_5
0
1
0
1
0
Pro_6
0
1
1
0
0
Pro_7
0
1
1
1
0
Pro_8
1
0
0
0
0
Pro_9
1
0
0
1
0
Pro_10
1
0
1
0
0
SW1
1
0
1
1
0
SW2
1
1
0
0
0
SW3
1
1
0
1
0
SW4
1
1
1
0
0
SW5
1
1
1
1
0
SW6
X
X
X
X
1
No(*)
No(*) không kết nối với bất kỳ ngõ input nào,lúc này ngõ ra ở mức 1,nếu được tích cực thì ứng với mỗi trạng thái select X thì ngõ ra output sẽ kết nối với 1 input mà ta vừa mới select X.
Mạch nạp chương trình vào vi điều khiển:
Mạch trên dùng vi mạch Max232 dùng để chuyển từ chuẩn RS232 sang mức logic 0 ;1.Nhờ vi điều khiển có chức năng nạp trực tiếp từ max 232 nên ta đưa trực tiếp hai chân TXD,RXD từ max232 vào vi điều khiển (Dùng phần mềm Flash Magic của Phillips để load chương trình vào,ra vi điều khiển)
Mạch tổng quát:
A. Sơ đồ mạch Layout:
Sơ đồ mạch Capture:
Phần 3: THIẾT KẾ PHẦN CƠ CHO ROBOT
Các hình chiếu của robot:
a. Hình chiếu đứng:
Hình 3.a: Hình chiếu đứng robot tự động
b. Hình chiếu bằng:
Hình 3.b: Hình chiếu bằng robot tự động
c. Hình chiếu cạnh:
Hình 3.c: Hình chiếu cạnh robot tự động
Phần 4: ĐIỀU KHIỂN ROBOT
Vi xử lý và các ngõ vào ra:
Vi điều khiển P89V51RB2FN
16KB chương trình,5 kênh điều rộng xung,hai thanh ghi DPTR,Watch dog timer,Brown out detect
16 CTHT tương ứng cho 16 chương trình hoặc 16 công tắc hành trình
8 ngõ vào sensor dò đường
2 ngõ vào encoder, 2 ngõ vào ngắt ngoài
5 motor điều rộng xung
2 SW tổ hợp chọn chế độ hoạt động,1 nút chọn màu của đội đỏ/xanh
Lập trình cho robot:
Đọc tín hiệu từ máy tính:
Phân vùng cảm biến : 8 led được chia thành 16 vùng (8 vùng trái và 8 vùng phải)
L3 L2 L1 CL CR R1 R2 R3
Với:
L3 sensor trái thứ 3 so với sensor trung tâm
L2 sensor trái thứ 2 so với sensor trung tâm
L1 sensor trái thứ 1so với sensor trung tâm
CL sensor trung tâm bên trái
CR sensor trung tâm bên phải
R1 sensor phải thứ 1 so với sensor trung tâm
R2 sensor phải thứ 2 so với sensor trung tâm
R3 sensor phải thứ 3 so với sensor trung tâm
Đọc cảm biến theo nguyên tắc : đọc từ trong ra ngoài, tức là kiểm tra giá trị sensor từ CL,CR è L1,R1 è L2,R2 è L3,R3 è Vùng error
Vùng Error sẽ được thực thi khi và chỉ khi robot đang chạy dò đường nhưng bất ngờ không có sensor nào tích cực è đã chạy sai vạch è tăng tốc bánh bên trái nếu trước đó rẽ phải hoặc tăng tốc bánh bên phải nếu trước đó rẽ trái
Bảng phân vùng :
L3
L2
L1
CL
CR
R1
R2
R3
Phân vùng
1
1
1
0
0
1
1
1
Vùng trung tâm
(Clr 00,01H)
1
1
1
0
1
1
1
1
Vùng trái 1
1
1
0
0
1
1
1
1
Vùng trái 2
1
1
0
1
1
1
1
1
Vùng trái 3
1
0
0
1
1
1
1
1
Vùng trái 4
1
0
1
1
1
1
1
1
Vùng trái 5
0
0
1
1
1
1
1
1
Vùng trái 6
(Setb 00H,Clr 01H)
0
1
1
1
1
1
1
1
Vùng trái 7
1
1
1
1
0
1
1
1
Vùng phải 1
1
1
1
1
0
0
1
1
Vùng phải 2
1
1
1
1
1
0
1
1
Vùng phải 3
1
1
1
1
1
0
0
1
Vùng phải 4
1
1
1
1
1
1
0
1
Vùng phải 5
1
1
1
1
1
1
0
0
Vùng phải 6
(Setb 01H,Clr 01H)
1
1
1
1
1
1
1
0
Vùng phải 7
1
1
1
1
1
1
1
1
XXX
00H
01H
Vùng lạc
0
1
Lạc phải
1
0
Lạc trái
(XXX) nếu không có sensor nào tích cực thì phải xét thêm hai bit 00H,01H
Ứng với mỗi vùng có 1 tốc độ riêng biệt è robot không thể lạc vạch được
B: Bảng tốc độ: ta có 4 hàm tốc độ ứng vời mỗi hàm có 16 tốc độ khác nhau
Vùng
Tốc độ
Chậm
Bánh trái
Bánh phải
Speed 1
Vùng trung tâm
60
60
Vùng trái 1
55
60
Vùng trái 2
50
60
Vùng trái 3
45
60
Vùng trái 4
40
60
Vùng trái 5
30
60
Vùng trái 6
20
60
Vùng trái 7
10
60
Vùng phải 1
60
55
Vùng phải 2
60
50
Vùng phải 3
60
45
Vùng phải 4
60
40
Speed 1
Vùng phải 5
60
30
Vùng phải 6
60
20
Vùng phải 7
60
10
Lạc trái
00
60
Lạc phải
60
00
Vùng trung tâm
Vừa
120
120
Speed 2
Vùng trái 1
100
120
Vùng trái 2
80
120
Vùng trái 3
60
120
Vùng trái 4
40
120
Vùng trái 5
30
120
Vùng trái 6
20
120
Vùng trái 7
10
120
Vùng phải 1
120
100
Vùng phải 2
120
80
Vùng phải 3
120
60
Vùng phải 4
120
40
Vùng phải 5
120
30
Vùng phải 6
120
20
Vùng phải 7
120
10
Lạc trái
00
120
Lạc phải
120
00
Vùng trung tâm
Nhanh
180
180
Speed 3
Vùng trái 1
140
180
Vùng trái 2
100
180
Vùng trái 3
80
180
Vùng trái 4
60
180
Vùng trái 5
40
180
Vùng trái 6
30
180
Vùng trái 7
20
180
Vùng phải 1
180
140
Vùng phải 2
180
100
Vùng phải 3
180
80
Vùng phải 4
180
60
Vùng phải 5
180
40
Vùng phải 6
180
30
Vùng phải 7
180
20
Lạc trái
00
180
Lạc phải
180
00
Vùng trung tâm
Nhanh Nhất
255
255
Speed 4
Vùng trái 1
230
255
Vùng trái 2
200
255
Vùng trái 3
170
255
Vùng trái 4
140
255
Vùng trái 5
100
255
Vùng trái 6
50
255
Vùng trái 7
20
255
Vùng phải 1
255
230
Vùng phải 2
255
200
Vùng phải 3
255
170
Vùng phải 4
255
140
Vùng phải 5
255
100
Vùng phải 6
255
50
Vùng phải 7
255
20
Lạc trái
00
200
Lạc phải
200
00
Giải thuật đọc tín hiệu:PHẦN 5: XỬ LÝ ẢNH
3.1.1 Các khái niệm cơ bản:
3.1.1.1 Điểm ảnh:
Ảnh trong tự nhiên là ảnh liên tục về không gian và độ sáng. Khi ảnh được lưu vào máy tính thì ảnh đã được số hóa. Số hóa là sự biến đổi gần đúng của một ảnh liên tục thành một tập hợp điểm phù hợp với ảnh thật về vị trí không gian và độ sáng. Mỗi điểm như vậy gọi là một điểm ảnh ( PEL : Picture Element ) hay còn gọi là Pixel. Điểm ảnh Pixel là là một phần tử của ảnh số tại tọa độ (x,y) với độ sáng hoặc màu nhất định. Tập hợp những điểm ảnh tạo thành ma trận ảnh.
3.1.1.2 Độ phân giải của ảnh:
Độ phân giải ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị. Khoảng cách các điểm ảnh được chọn sao cho mắt người thấy được sự liên tục của ảnh và tạo nên mật độ phân bố theo hai trục x và y trong không gian hai chiều.
3.1.1.3 Mức xám:
Mỗi điểm ảnh được đặc trưng cơ bản bởi tọa độ x, y của điểm ảnh và độ xám. Mức xám của điểm ảnh là cường độ sáng của nó được gán giá trị số tại điểm đó. Các thang mức xám thường dùng là: 16, 32, 64, 128, 256.Trong đó mức 256 thường dùng nhất vì máy tính dùng 1 byte ( 2^8=256) để biểu diễn từ 0 đến 255 mức.
3.1.2 Các loại ảnh:
3.1.2.1 Ảnh đen trắng:
Ảnh đen chỉ bao gồm hai màu: màu đen và màu trắng. Người ta phân biệt thành nhiều mức khác nhau. Nếu chỉ có hai mức: mức 0 và mức 1 hay còn gọi là ảnh nhị phân. Mức 1 ứng với màu sáng và mức 0 ứng với màu tối. Nếu số mức lớn hơn 2 người ta gọi là ảnh đa cấp xám. Việc xác định số mức là phụ thuộc vào tiêu chí lượng hóa.
Với ảnh nhị phân, mỗi Pixel mã hóa trên một bit, còn với ảnh 256 mức mỗi Pixel được mã hóa trên 8 bit. Ảnh nhị phân khá đơn giản, các phân tử ảnh có thể coi như các phần tử logic, ứng dụng chính là tính toán logic để phân biệt đối tượng ảnh với nền hoặc phân biệt điểm biên với các điểm khác.
3.1.2.2 Ảnh cường độ:
Ảnh cường độ là một ma trận dữ liệu ảnh, mà giá trị của nó đại diện cho cường độ trong một số vùng nào đó của ảnh . Matlab chứa một ảnh cường độ như một ma trận dơn , với mỗi phần tử của ma trận tương ứng với một pixel của ảnh . Ma trận có thể thuộc lớp double , uint8 hay uint16 . Trong khi ảnh cường độ hiếm khi được lưu với bản đồ màu , Matlab sử dụng bản đồ màu để hiển thị chúng .
Những phần tử trong ma trận cường độ đại diện cho các cường độ khác nhau hoặc độ xám . Những điểm có cường độ bằng 0 thường được đại diện bằng màu đen và cường độ 1,255 hoặc 65535 thường đại diện cho cường độ cao nhất hay màu trắng .
3.1.2.3 Ảnh màu:
Ảnh màu là ảnh tổ hợp từ 3 màu cơ bản: đỏ (Red), lục (Green), xanh lơ (Blue) và thường thu nhận trên các dải tầng khác nhau. Mỗi Pixel ảnh màu gồm 3 thành phần. Mỗi thành phần cũng được chia thành L cấp khác nhau( thường là 256). Do vậy để lưu ảnh màu, người ta lưu trữ từng mặt màu riêng biệt, mỗi màu lưu trữ như một ảnh xám đa cấp. Do đó không gian nhớ cho ảnh màu lớn gấp 3 lần một ảnh đa cấp xám cùng kích thước.
Một mảng ảnh RGB có thể thuộc lớp double , uint8 hoặc uint16 . Trong một mảng RGB thuộc lớp double , mỗi thành phần màu có giá trị giữa 0 và 1 . Một pixel mà thành phần màu của nó là (0,0,0) được hiển thị với màu đen và một pixel mà thành phần màu là (1,1,1 ) được hiển thị với màu trắng . Ba thành phần màu của mỗi pixel được lưu trữ cùng với chiều thứ 3 của mảng dữ liệu . Ví dụ giá trị màu R,G,B của pixel (2,5) được lưu trữ trong RGB(2,5,1) , RGB(2,5,2) và RGB(2,5,3) tương ứng . Mô hình ảnh màu dựa trên hệ tọa độ Decac.
Không gian ảnh màu RGB
Ngoài ra trong các camera số, máy chụp ảnh số người ta còn thường dùng mô hình màu HSV, mô hình YcbCr và mô hình YIQ:
H: Hue –đặc trưng cho màu sắc.
S: Saturation – đặc trưng cho mức độ đậm nhạt của màu sắc.
V: Value – đặc trưng cho cường độ ánh sáng.
Mô hình màu HSV.
Mô hình màu YCbCr
Mô hình màu YIQ.
Phần 6: TỒNG QUAN VỀ OPENCV
Tổng quan về OpenCV:
OpenCV (Open Source Computer Vision Library) là một thư viện xử lý hình ảnh nguồn mở của Intel. Nó có rất nhiều tác dụng như: tương tác giữa người và máy tính, nhận dạng vật, phân đoạn và nhận dạng, nhận dạng khuôn mặt, nhận biết, hiểu về cử chỉ, cấu trúc của vận động, và trong Robot di động. Thêm vào đó nó cải thiện rất nhiều các thuật toán cở bản của thị giác máy như các hàm API cấp thấp hơn.
Intel đưa ra phiên bản OpenCV đầu tiên vào năm 1999. Ban đầu nó yêu cầu phải có thư viện xử lý ảnh của Intel. Sau đó vì sự lệ thuộc này mà họ đã phải gỡ bỏ và bây giờ chúng ta có thể sử dụng thư viện này hoàn toàn độc lập. OpenCV rất đa dạng, nó hỗ trợ rất nhiểu hệ điểu hành như: Window, Linux và MacOSX.
Những điểm đặc trưng:
Open CV có rất nhiều chức năng bạn có thể bị bất ngờ khi lần đầu tiên tiếp xúc nhưng chỉ sau vài lần sử dụng bạn sẽ thấy dễ dàng hơn.
Sau đây là tóm tắt các chức năng cơ bản của openCV 1.0
Image and video I/O:
Những giao tiếp này cho phép đọc dữ liệu ảnh từ các file, hoặc từ những video. Bạn cũng có thể tạo những files hình ảnh và video nữa.
Thị giác máy tính và thuật toán xử lý( mức trung bình và thấp):
Sử dụng giao tiếp này bạn có thể thử nghiệm với rất nhiều thuật toán về thị giác máy tính mà không cần viết thêm code. Nó bao gồm đường mép, đường thẳng và góc phát hiện, hình elip, hình ảnh kim tụ tháp cho xử lý đa tỉ lệ, mẫu phù hợp, biến đổi đa dạng và nhiều hơn nữa.
Module thị giác máy tính cấp cao:
OpenCV chứa đựng vài chức năng cao cấp. như nhận dạng khuôn mặt, nhận dạng vật thể và tracking, nó bao gồm luồng quang học ( sử dụng camera để xác định cấu trúc 3D), camera xác định kich thước và âm thanh stereo.
AI và phương pháp học của máy:
Thị giác máy tính thường đòi hỏi phương pháp học của máy hay phương pháp AI khác một vài phương pháp đó có trong OpenCV.
Lấy mẫu hình ảnh và sự chuyển đổi:
Nó rất có ích để xử lý một nhóm pixels thành một đơn vị. Open CV có giao tiếp để trích những phân miền ảnh, lấy mẫu ngẫu nhiên, chỉnh sửa kích cỡ ảnh, làm cong, xoay, và cho phép tạo hiệu ứng cho ảnh.
Phương pháp để tạo và phân tích ảnh nhị phân:
ảnh nhị phân thường được dùng trong hệ thông kiểm tra, nó quét để tìm ra sự thay đổi hình dạng hoặc đếm các phần trên ảnh. Sự biểu diễn ảnh cũng rất thuận tiện khi chúng ta biết rõ vật thể cần bắt.
Cách thức tính toán thông tin 3D:
Những hàm này rất có ích khi cần sắp xếp và xác định một vật thể với âm thanh stereo hoặc không gian đa chiều phức tạp từ một camera.
Mã lệnh toán để xử lý ảnh, thị giác máy tính và biên dịch ảnh:
OpenCV sử dụng các phép toán thông dụng như: đại số, thống kê, hình học.
Đồ họa:
Những giao diện này cho phép bạn viết chữ và vẽ trên hình ảnh, thêm vào đó những chức năng thú vị có thể tạo ảnh, và những tính năng này còn được dùng để tạo nhãn và đánh dấu. ví dụ nếu bạn muốn viết một chương trình nhận dạng vật thể, nó sẽ giúp bạn tạo nhãn ảnh với kích thước và vị trí định sẵn.
Phương thức GUI:
OpenCV có cửa sổ giao diện riêng trong khi đó nó bị giới hạn khi làm việc trong mỗi môi trường, chúng cung cấp đa môi trường API để hiển thị hình ảnh và cho phép người dùng nhập dữ liệu thông qua chuột hoặc bàn phím và điều khiển quá trình.
Cấu trúc dữ liệu và thuật toán
Với những giao diện này bạn có thể lưu, tìm kiếm, và cách danh mục điều khiển, các tuyển tập(cũng như các tập hợp lệnh được gọi ), đồ họa và sơ đồ nhánh một cách hiệu quả.
Khả năng tồn tại của dữ liệu
Những phương pháp này cung cấp các giao diện một cách thuận lợi để lưu trữ các dạng khác nhau của dữ liệu vào đĩa để có thể khôi phục khi cần thiết.
Cấu tạo
Những hàm của OpenCV có chứa ở trong vài modules.
CXCORE chứa đựng các định nghĩa về kiểu dữ liệu cơ bản. ví dụ, cấu trúc dữ liệu của ảnh, các điểm và các hình chữ nhật được xác định trong file cxtypes.h. CXCORE cũng chứa đựng các phép toán đại số tuyến tính,thống kê,các hàm lâu dài và lỗi thao tác. Có một chút kỳ cục o đây là các hàm đồ họa phục vụ cho vẽ trên ảnh được giữ ở đây.
CV chứa đựng quá trình xử lý ảnh và các phương pháp đánh giá sơ bộ kích thước ảnh. Những hàm tính toán hình học cũng được lưu trữ tại đây.
CVAUX được mô tả trong văn bản của OpenCV như là modul cũ và chỉ dùng để thí nghiệm. Tuy nhiên, giao diện đơn giản nhất cho nhận dạng mặt được nằm trong modul này. Những mã nguồn nằm trong module này rất phù hợp cho việc nhận dạng mặt và chúng được sử dụng rộng rãi cho mục đích này.
ML chứa đựng giao diện mechine-learning
Những hàm còn lại được nằm trong HighGUI và CVCAM. Cả hai đều nẳm ở thư mục có tên “otherlibs”, sử dụng chúng rất dễ gặp lỗi. Vì rằng HighGUI chứa các thư viện vào ra cơ bản , bạn sẽ muốn chắc chắn hơn, đừng bỏ sót nó.Nó cũng chứa đựng nhiều cửa sổ đa chức năng.
CVCAM là thư viện chứa các hàm truy nhập video thông qua DirectX trên môi trường Window 32 bit. Tuy nhiên, HighGUI cũng có các giao diện video.Trong bài báo này, tôi chỉ xem xét HighGUI. Chúng đơn giản, làm việc trên nhiều môi trường. Nếu bạn sử dụng Window XP hoặc 2000, bạn có thể làm tăng hiểu quả của nó bằng cách chuyển qua giao diện CVCAM, nhưng học OpenCV sẽ đơn giản hơn khi dùng HighGUI.
Cài đặt OpenCV
Cài đặt cơ bản
OpenCV cho Linux và MacOSX được đóng gói như một gói mã nguồn lưu trữ. Bạn sẽ phải xây dựng cả thư viện tĩnh và cả những đối tượng chia sẻ (shared-object). Bạn cần xây dựng RPM trước tiên và cài đặt từ nó, hoặc biên dịch và cài đặt nó ngay.Cấu trúc cho cả hai được nằm trong INSTALL.
Với Window ta khi cài đặt OpenCV,nó sẽ cop file OpenCV vào thư mục mà bạn chọn.Cách thức lựa chọn trong đường dẫn hệ thống của bạn chứa mã nhị phân OpenCV, đăng kí một vài bộ lọc DirectX.Mặc định nó cài đặt đến C:/Program Files/OpenCV/
Những yêu cầu khi cài đặt trong windows
Đối với người dùng xài Windows, OpenCV rất dễ dàng cài đặtvà luôn hoạt động. nhưng một chút cải tiến nhỏ sẽ cho bạn kết quả tốt hơn. Sau đây là một vài đề nghị.
OpenCV chỉ là một công cụ hỗ trợ cho người lập trình không phải là một chương trình bạn có thể lưu giữ nó ở một nơi nào đó khác thư mục Progam files. Nếu bạn thích cài vào một nơi khác hãy chọn thư mục đó trước khi nó hỏi.
Tôi đề nghị bạn cũng quyết định trước khi cài đặt – bạn muốn windows tìm kiếm những files dll của OpenCV như thế nào. Bạn có thể chỉnh sửa đường dẫn của hệ thống của bạn thay vì của hệ thống, hoặc bạn có thể di chuyển chúng sau khi cài đặt từ thư mục “bin” của OpenCV bằng thư mục gốc của bạn.
Nếu bạn muốn di chuyển các files dll nhưng bạn không chắc thư mục gốc của bạn nằm ở đâu, bạn có thể lưu chúng bằng cách chạy tiện ích Sysinfo có sẵn ở địa chỉ www.cognotics.com/utilities.
Nếu bạn thích chỉnh đường dẫn hơn di chuyển các file dll, bạn có thể cài đặt bằng cách lựa chọn các check box “ Add bin directory to path”.
Sau khi cài đặt
Thư mục OpenCV có chứa và thư mục con. Thư mục “docs” có chứa các tài liệu html cho tất cả các hàm và kiểu dữ liệu. từ các tài liệu này bạn có thể làm các ví dụ, bạn cũng có thể duyệt (browse) thư mục “samples”.
Bạn cũng cần đến những file header khi biên dịch chương trình nó có ở trong các module của OpenCv. Mặc dù bạn không cần làm việc này. Tôi thích tập hợp chúng lại với nhau vào trong một thư mục.
Trên cả Linux và Windows, bạn có thể xác định vị trí của những header bằng cách tìm kiếm thư mục cài đặt và các thư mục con của nó với các file có đuôi mở rộng là *.h, *.hpp. sẽ có rất nhiều file được tìm thấy. bạn sẽ không cần tất cả các file. Header cho tất cả các modules ngoại trừ HighGUI đã được đính sẵn trong mỗi module. Bạn có thể bỏ các header trong thư mục “src” cho nhưng module này. Với HighGUI bạn sẽ cần đến file highgui.h được lưu ở otherlibs/highgui.
Lập trình với OpenCV: vài điều cơ bản
Những điều cần biết về Header và Libraries
Hầu hết chương trình OpenCV cần cv.h và highgui.h.Sau đó để nhận dạng mặt chúng ta cần thêm cvaux.h. Phần còn lại của file header được thêm vào bởi những header cao nhất ( high-level headers).
Nếu bạn để các file header trong các thư mục khác nhau( cài đặt mặc định), hãy chắc chắn rằng đường dẫn của trình biên dịch có các thư mục đó. Nếu bạn gom chúng lại một thư mục hãy chắc chắn rằng nó trùng với đường dẫn của trình biên dịch của bạn.
Figure 1:Ví dụ chương trình đọc một ảnh từ file và ghi nó vào một file khác với dịnh dạng khác
Mối liên kết của bạn sẽ cần cả hai thư viện và tên của thư viện tĩnh để sử dụng. thư viện tĩnh bạn cần liên kết đến file cxcore.lib, cv.lib, và highgui.lib. và sau đó bạn cần thêm file cvaux.lib để nhận dạng gương mặt. tất cả các file này đều nằm trong thư mục “lib”.
Đọc và ghi ảnh
Xuất nhập ảnh rất dễ dàng với OpenCV/ hình 1 chỉ cho chúng ta thấy một chương trình hoàn chỉnh để đọc một ảnh và ghi ảnh đó sang một file thứ hai trong một định dạng khác.
Để đọc một file ảnh đơn giản ta chỉ cần gọi cvloadImage(), trong ví dụ nó nằm ở dòng thứ 14. OpenCV hỗ trợ hầu hết các định dạng ảnh phổ biến