Ứng dụng mô hình YOLO trong phát hiện súng cầm tay

Tình hình an ninh, trật tự xã hội diễn biến phức tạp trong thời gian gần đây, không chỉ trong

nước m cả trên thế giới. Trong đó, các loại t&i phạm liên quan đến sử dụng, trao đổi, mua bán vũ khí

“nóng” có chiều hướng gia tăng. Bi báo đề xuất giải pháp sử dụng mô hình YOLO nhEm xây dựng

phần mềm HandGunDetector-C500 phát hin vũ khí “nóng”, cụ thF l sGng cầm tay thông qua h thHng

camera giám sát nhEm đF phát hin v cảnh báo sớm các vấn đề liên quan đến t&i phạm sử dụng sGng.

6 trang | Chia sẻ: Thục Anh | Lượt xem: 514 | Lượt tải: 0

Nội dung tài liệu Ứng dụng mô hình YOLO trong phát hiện súng cầm tay, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2020 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” Ứng Dụng Mô Hình YOLO Trong Phát Hiện Sng Cm Tay TS. Đon Trung Sơn, Nguyễn Thị Khánh Trâm Khoa An ninh thông tin Hc vin An ninh nhân dân son.doantrung@gmail.com Tóm tắt. Tình hình an ninh, trật tự x hi diễn biến phức tạp trong thời gian gần đây, không chỉ trong nước m cả trên thế giới. Trong đó, các loại ti phạm liên quan đến sử dụng, trao đổi, mua bán vũ khí “nóng” có chiều hướng gia tăng. Bi báo đề xuất giải pháp sử dụng mô hình YOLO nhm xây dựng phần mềm HandGunDetector-C500 phát hin vũ khí “nóng”, cụ th l sng cầm tay thông qua h thng camera giám sát nhm đ phát hin v cảnh báo sớm các vấn đề liên quan đến ti phạm sử dụng sng . T khóa: Vũ khí nóng, Nhận din sng cầm tay, Mô hình hc sâu CNN, Mô hình YOLO. Abstract. The situation of security and social order has been complicated in recent times, not only in our country but also in the world. In particular, crimes related to the use, exchange and trading of "hot" weapons tend to increase. The paper proposes a solution to use the YOLO model to develop software HandGunDetector-C500 recognizing "hot" weapons, more specific hand guns, through surveillance cameras to early warn problems related to crimes owning hand guns. Keywords: Hot Weapons, Hand Gun Recognition, Deep Learning Model, YOLO Model. 1 Đặt Vấn Đề Camera an ninh đang trở nên phổ biến tại nhiều thnh ph trên khắp thế giới v cả trong nước [7], chính vic tăng nhanh về s lượng camera đặt yêu cầu nghiên cứu, quản lý, sử dụng mt cách có hiu quả hạ tầng có sẵn v giải quyết những nhu cầu thực tiễn. Camera giám sát (Closed Circuit Television- CCTV) được sử dụng lm công cụ giám sát ti phạm v các vấn đề x hi, ví dụ CCTV được lắp đặt trên đường ph đ giám sát các hoạt đng x hi nhm tìm kiếm người mất tích, xác nhận hnh vi chng đi x hi, thu thập bng chứng ti phạm. Đ camera an ninh trở nên thông minh, trí tu nhân tạo được ứng dụng nhm tăng khả năng phân tích các hoạt đng, hnh vi của con người v các sự kin bất thường trong x hi trong phạm vi rng mt cách tự đng, định vị đi tượng chuyn đng trong h thng CCTV. Các ứng dụng trong phân tích video thông minh không chỉ gip phát hin, cảnh báo sự c kịp thời m cn h trợ phân tích hnh vi khách hng, gip giảm chi phí, tăng doanh thu kinh doanh. Trên thế giới đ có nhiều công trình nghiên cứu, giải pháp thương mại về giám sát qua camera sử dụng trí tu nhân tạo như camera tích hợp hc sâu v tìm kiếm ni dung video dựa trên ngôn ngữ tự nhiên của công ty IC Realtime (Hoa K) [11], camera quan sát tích hợp trí tu nhân tạo hoạt đng không cần kết ni Internet của công ty Boulder AI (Hoa K) [12], camera v các thiết bị tính toán thông minh đầu cui v xu hướng giải pháp đưa trí tu nhân tạo lên đám mây của công ty HikVision (Trung Quc) [13]. Các giải pháp ny có th được ứng dụng trong thnh ph thông minh, giao thông thông minh, an ninh cng đng v nhiều bi toán an ninh của lực lượng Công an. Mt s h thng camera thông minh đin hình có th k tới như: h thng giám sát camera của IBM [1] tự đng theo di, phát hin đi tượng chuyn đng trong mt khu vực giám sát, h thng VSAM [2] phát hin đi tượng di chuyn như phương tin giao thông v người cũng như phát hin tương tác giữa các đi tượng, h thng KNIGHT [3] đặc bit cho php theo vết đi tượng t nhiều camera giám sát. Tuy nhiên, giá thnh của các giải pháp ny khá cao hoặc chưa h trợ trin khai nhiều bi toán đặc thù ở Vit Nam như đổ trm rác, đái bậy Thực tế khảo sát cho thấy, ở Vit Nam hin nay, h thng camera giám sát đ v đang được sử dụng ở nhiều đơn vị, tổ chức nhưng chức năng thông minh v tự đng khai thác thông tin hình ảnh cn nhiều hạn 152 Đoàn Trung Sơn, Nguyễn Thị Khánh Trâm chế. Đa s các h thng camera giám sát đều chỉ phục vụ mục đích lưu trữ, quan sát trực tiếp, v xem lại video khi cần. Theo mt nghiên cứu trên tạp chí Security Oz thì quan sát video sử dụng con người thường bỏ qua tới 45% các hoạt đng đang diễn ra trên mn hình sau 12 pht. Do đó, nhu cầu phát trin h thng giám sát xử lý video mt cách tự đng đang l yêu cầu cấp thiết v đặt ra nhiều bi toán cần xử lý trong đó có các vấn đề liên quan đến lực lượng an ninh. Không th phủ nhận, tình hình an ninh trong những năm gần đây diễn biến hết sức phức tạp [8]. Ti phạm sử dụng vũ khí “nóng” đ thực hin hnh vi phạm ti như đánh nhau, bạo loạn, khủng b, buôn bán ma ty diễn ra theo chiều hướng gia tăng v gây nhiều bức xc trong x hi [9]. Theo [6] thì “Vũ khí là thiết bị, phương tiện hoặc tổ hợp những phương tiện được chế tạo, sản xuất có khả năng gây sát thương, nguy hại cho tính mạng, sức khỏe con người, phá hủy kết cấu vật chất bao gồm: Vũ khí quân dụng, súng săn, vũ khí thô sơ, vũ khí thể thao và các vũ khí khác có tính năng, tác dụng tương tự”. Khái nim vũ khí nóng chỉ đến những loại vũ khí đặc bit nguy him, có tính ứng dụng cao v phổ biến như sng, dao, gậy Trong đó, sng cầm tay chính l vũ khí nguy him nhất thường được các loại ti phạm sử dụng thực hin hnh vi phạm ti như cướp của, giết người, hiếp dâm, buôn bán ma ty Chính vì lý do đó, nghiên cứu về sng cầm tay có ý ngha đặc bit cho lực lượng công an. Trong phần mềm, tác giả nhận din sng cầm tay bao gm sng ngắn v sng di: sng ngắn (Shot-Gun), sng cầm tay (Hand-Gun) v sng di gm sng trường (Rifle), sng carb (Carbine), sng máy (Sub-Machine-Gun), sng trường hạng nặng (Assault-Rifle), sng trường hạng nh (Light-Machine-Gun), liên quan đến các vụ án v ti phạm, mô hình nhận din thêm dao (Knife) và đạn sng (Bullet) h trợ trong các trường hợp khó nhận din sng cầm tay. Sng cầm tay thường có nhiều mu sắc phổ biến như mu đen, vng, bạc, Hình dạng của sng cầm tay gần ging như ba v được thay đổi ở nhiều góc đ dựa vo đ xoay theo chiều dc, ngang, cho thì hình dạng cũng thay đổi về tỷ l sng do góc quay camera, góc nhìn, t đó gây ra đ lch nhất định. Đặt vấn đề nhận din súng cầm tay qua camera giám sát nhận thấy, khả năng nhận din phụ thuc nhiều yếu t trong đó có ánh sáng, đ nhiễu, s lượng vật th trong khung hình. Trong phần lớn các tình hung, trước khi mang sng cầm tay ra sử dụng thì các đi tượng thường đ sng kín trong tay, ti quần hoặc bao da nên rất khó trong vic phát hin sớm. Do đó, đ khai thác ti nguyên dữ liu hình ảnh t các camera giám sát nhm nhận din súng cầm tay mt cách tự đng l mt nhim vụ đầy thử thách, đi hỏi đ chính xác v đặc bit yêu cầu k thuật xử lý theo thời gian thực đ cảnh báo kịp thời chính xác cho các cơ quan, lực lượng chức năng sớm phát hin đi tượng đang sử dụng vũ khí nóng, qua đó có các bin pháp đấu tranh kịp thời, hiu quả cũng như đáp ứng nhu cầu thông tin x hi mt cách hiu quả. Thực tế, mô hình YOLO (You Only Look Once) l mô hình mạng nơron tích chập (Convolutional Neural Network- CNN) được sử dụng phổ biến như l vic ứng dụng trí tu nhân tạo trong nhận din đi tượng, vật th có đ chính xác cao, tc đ nhanh theo thời gian thực. Vì lý do đó, tác giả bài báo đặt vấn đề ứng dụng mô hình YOLO trong giải quyết nhiều bi toán của lực lượng Công an như nhận biết đám đông, phát hin tai nạn giao thông, cướp bóc, buôn bán ma ty Vic nhận din vũ khí nóng gip cảnh báo sớm cho lực lượng Công an các vụ vic xảy ra. Ngoài ra, cũng cần k tới vic ứng dụng mô hình YOLO trong giám sát tự đng lưu lượng truy cập đ phát hin tấn công mạng, thng kê lưu lượng tham gia giao thông đ cảnh báo tình trạng ùn tắc, phát hin các vi phạm luật giao thông của các phương tin, phát hin đi tượng xâm nhập vo các khu vực trng yếu hay cảnh báo các hnh vi khả nghi liên quan đến khủng b, trm cắp, hỏa hoạn 2 Nội Dung 2.1 Mô hình CNN Mô hình CNN được sử dụng nhiều trong các bi toán nhận dạng đi tượng trong ảnh, nhận din khuôn mặt, phát trin xe tự hnh, giao hng tự đng Hạn chế của các h thng cũng như trở ngại khi trin khai h thng liên quan đến bảo mật, dữ liu đưởng truyền mạng v yêu cầu xử lý thời gian thực. Mt xu thế công ngh l tích hợp đám mây trong lưu trữ v xử lý dữ liu. Hin tại, phần lớn các h thng giám sát đều tiếp cận khả năng nn dữ liu v gửi về máy chủ đin toán đám mây đ giải quyết vấn đề đường truyền mạng. Trong trường hợp ny, hạ tầng đ được đầu tư với các thiết bị nhng cấu hình thấp, giá rẻ vẫn có th vận hnh được. Vic xử lý trên máy chủ đám mây các mô hình mạng nơron tích chập sẽ gip hạn chế phải xử lý dữ liu trên các camera giám sát, điều ny đng ngha với vic giảm được giá thnh đầu tư. Tuy nhiên, 153 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2020 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” khả năng mở rng bi toán trong trường hợp trin khai s lượng camera giám sát lớn, trong phạm vi rng gặp nhiều khó khăn. Hin tại, các h thng giám sát trong nước với khả năng công ngh chỉ trin khai được dưới 1000 camera hoặc giải pháp của nước ngoi thì giá thành cao. Ví dụ như h thng camera giám sát tại TP H Chí Minh dự kiến chi 1600 tỷ cho 10000 camera. Mt cách tiếp cận mới trong mô hình đin toán đám mây phân tán được đề xuất, cung cấp tính linh hoạt v có th mở rng với s lượng camera giám sát ngy cng tăng. Mô hình đin toán đám mây phân tán h trợ xử lý với s lượng camera lớn. Đ giải quyết vấn đề băng thông, thuật toán trí tu nhân tạo không chỉ xử lý trên máy chủ m cn có th trên các máy cục b hoặc trên các thiết bị nhng. Ví dụ như bi toán phát hin đám đông, thì không cần thiết đẩy dữ liu về máy chủ đám mây đ xử lý, thay vo đó, dữ liu có th được xử lý ngay tại các thiết bị nhng. Mô hình đin toán đám mây phân tán l mt xu hướng, tuy nhiên sẽ gặp nhiều thách thức vì hin tại các thuật toán trí tu nhân tạo liên quan đến nhận din v phân tích hnh vi đi hỏi khi lượng tính toán lớn. Vic đưa các thuật toán ny xung các thiết bị nhng giá rẻ sẽ mất nhiều thời gian v công sức ti ưu. Mt trong các vấn đề lớn trong bất cứ h thng giám sát ứng dụng trí tu nhân tạo gm: - Nghiên cứu phương pháp xử lý hình ảnh, thị giác máy tính, hc máy nhm phân tích hình ảnh, video t cơ sở dữ liu lớn thu được. - Phát trin ứng dụng thông minh tự đng phân tích hoạt đng, hnh vi của đi tượng v các sự kin bất thường nhm h trợ ra quyết định, cảnh báo kip thời đi tượng, sự kin, giải quyết các vấn đề x hi. Đ xử lý hình ảnh v video trong thời gian thực đi hỏi có mt giải pháp ti ưu hóa cao chạy trên các máy tính có cấu hình mạnh. Vì hầu hết các camera giám sát đều chứa 25 khung hình trên mi giây, thời gian xử lý hình ảnh cần ít hơn 0,04s. Khi đó mô hình YOLO dựa trên mạng nơron tích chập đáp ứng được đ chính xác, tc đ xử lý v nhận din theo thời gian thực. 2.2 Ứng dụng mô hình YOLO nhận diện vũ khí nóng Mô Hình YOLO. Bài toán phát hin đi tượng (Object Detection) có đầu vo l ảnh mu v đầu ra là các đi tượng cũng như vị trí của các đi tượng trong ảnh. Phát hin đi tượng l bi toán quan trng trong lnh vực thị giác máy tính (Computer Vision). Thuật toán phát hin đi tượng trong ảnh được chia thnh 2 nhóm chính: - Mô hình R-CNN (Region- Based Convolutional Neural Networks) đ giải quyết các bi toán về định vị v nhận din vật th. - Mô hình YOLO dùng đ nhận din đi tượng theo thời gian thực. Mô hình YOLO dù không phải l phương pháp chính xác nhất nhưng l phương pháp nhanh nhất đến thời đim hin tại cho bi toán nhận din đi tượng [4]. Mô hình YOLO đ phát trin được 4 phiên bản: YOLO v1 sử dụng Framework Darket được huấn luyn trên tập dữ liu huấn luyn ImageNet-1000. Mô hình ny hạn chế trong vic nhận din các đi tượng có kích thước nhỏ v đặc bit nếu chng xuất hin dưới dạng mt nhóm các đi tượng ví dụ trong đám đông. Phiên bản ny gặp khó khăn trong vic phát hin đi tượng nếu hình ảnh có kích thước khác với hình ảnh được huấn luyn. YOLO v2 cn có tên khác là YOLO9000, phiên bản cải tiến ny tăng tc đ thực hin nhm đạt được tc đ xử lý của mô hình Fast R- CNN, v giải quyết những hạn chế của phiên bản YOLO v1. Phiên bản YOLO v3 phát hin v phân loại mt cách chính xác hơn các đi tượng trong ảnh và tăng cường khả năng xử lý theo thời gian thực. Phiên bản cải tiến YOLO v4 đạt được kết quả vượt tri so với các phiên bản cũ về cả hiu suất lẫn tc đ thực hin. Phát hin đi tượng theo thời gian thực với đ chính xác cao l yêu cầu cho bi toán nhận din vũ khí nóng. Đặc bit, YOLO v3 chạy 22ms ở đ chính xác trung bình (Mean Average Precision) 28.2 mAP. Đ chính xác ny tương đương với vic sử dụng mô hình SSD (Single Shot Detecter) sử dụng mạng VGG16 đ trích rt các đặc trưng. Mô hình YOLO v3 tăng tc đ nhanh gấp 3 lần so với YOLO v2 v gấp hng nghìn lần so với R-CNN, gấp hng trăm lần so với Fast R-CNN. Vì những lý do nêu trên, tác giả lựa chn v ứng dụng mô hình YOLO v3 cho bi toán nhận din sng cầm tay. Ứng Dụng Mô Hình YOLO Nhận Diện Sng Cm Tay Và Kết Quả Thực Nghiệm. Mô hình YOLO v3 được ứng dụng ci đặt cho bi toán nhận din vũ khí nóng. Phần cứng cấu hình thiết bị chạy mô hình sử 154 Đoàn Trung Sơn, Nguyễn Thị Khánh Trâm dụng con chíp Cpu i9-9900k, Cpu gtx 1080ti, bo mạch Z490 v b nhớ Ram 32GB DDR4-3200. Đ huấn luyn dữ liu cho mô hình YOLO v3 cho bi toán nhận din đi tượng l các vũ khí nóng, các bước thực hin như sau: Bước 1: Tải Source Code Darknet của YOLO v3 về v hiu chỉnh tham s. Sau đó tiến hnh biên dịch ra tp thực thi. Thực hin lnh git clone https://github.com/pjreddie/darknet đ tải m của YOLO v3 về h thng. Sau đó biên dịch bng vic thực thi lnh Makefile. Lưu ý: thiết lập tham s GPU nhận giá trị 0 hoặc 1 tùy thuc h thng có GPU hay không. Tham s OPENCV phụ thuc vo vic có sử dụng thư vin Opencv hay không. Bước 2: Chuẩn bị dữ liu huấn luyn v gán nhn. Dữ liu huấn luyn được thu thập t ngun công khai trên Internet tại địa chỉ fdb.org/wiki/Main_Page. Đây l dữ liu các video liên quan sng cầm tay được cung cấp miễn phí (Internet Movie Firearms Database) được thu thập t các camera giám sát với s lượng lớn bao gm hơn 100.000 bức ảnh về sng cầm tay (bao gm các loại sng đ nêu trên). Ngoi ra, tác giả thu thập trên Internet hơn 1000 ảnh chứa đạn sng (Bullet). Sử dụng headless requess đ crawl data của wiki sau đó lấy được ảnh v tên nhãn. Tất cả các dữ liu ảnh đ được gán nhãn. Bước kế tiếp, công cụ VOTT (Visual Object Tagging Tool), được tải tại địa chỉ Web https://vott.z22.web.core.windows.net/ được sử dụng đ khoanh vùng vũ khí nóng xuất hin trong ảnh. Vì Vott đ tự đng đếm s lượng class nên không cần có thay đổi các tham s trong quá trình train. Bước 3: Chuẩn bị các tp cần thiết phục vụ quá trình huấn luyn. Hin tại, chúng ta có 6 tp: YOLO.data; YOLO.names; train.txt; val.txt; YOLOv3.cfg; darknet53.conv.74. Tự các tp ứng với các loại sng cầm tay l sng ngắn, sng trường, sng carb, sng máy, sng trường hạng nặng, sng trường hạng nh, dao v đạn được lưu trong tp trong thư mục /darknet/. Sửa tp YOLO.names bng cách lit kê những dữ liu cần huấn luyn. Bước tiếp theo, tạo ra 2 tp train.txt và val.txt. Trong đó, tp train.txt chứa danh sách các tp dùng đề huấn luyn v tp val.txt chứa danh sách các tp dùng đ kim tra mô hình. Hai tp cùng được lưu vào thư mục /darknet/. Cấu hình quá trình huấn luyn trong tp YOLO.data bao gm: tham s classses = 8 (s lượng lớp); train = train.txt (trỏ đến tp chứa các tên tp dùng đ huấn luyn); valid = val.txt (trỏ đến tp chứa các tên tp dùng đ kim tra); names = YOLO.names; backup = backup (đường dẫn lưu các trng s tp phục vụ quá trình huấn luyn). Bước 4: Tiến hnh huấn luyn Vo thư mục darknet, dùng lnh chmod +x darknet đ biến file darknet thành file executable, tiếp tục mở file cfg/yolov3.cfg và sửa max_bathches=900000 đ h thng chạy. Cui cùng, chạy lnh ./darknet detector train yolo.data cfg/yolov3.cfg darknet53.conv.74 đ train. Bước 5: Kim thử Kim thử bng cách phát hin ảnh chứa đi tượng sử dụng sng cầm tay. Trong quá trình huấn luyn, nếu đ li của vng lặp hin tại loss và độ lỗi loss trung bình của mô hình avg loss biến đổi ít thì dng quá trình huấn luyn. Thử nghim được thực hin trên mt s ảnh chứa các đi tượng sử dụng sng cầm tay v kết quả các đi tượng được phát hin trong các ảnh l phần hình chữ nhật có biên mu đỏ trong các hình kết quả sau: Hình. a. Hình. b. 155 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2020 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” Hình. c. Hình. d. Hình. 1. Các kết quả nhận din sng cầm tay của phần mềm HandGunDetector-C500 Kết quả thu được cho đ chính xác tt trên tất cả các b dữ liu thử nghim với tc đ trung bình thực hin là 40ms ứng với đ chính xác trung bình trong khoảng t 63.4 đến 77.8 trong trường hợp video có 25 khung hình trên giây. Phần mềm nhận din tt loại sng ngắn Shot-Gun (Hình a) mảnh v di hơn so với Hand-Gun (Hình d). Tác giả cũng detect với video t Internet thì phần mềm vẫn có kết quả tt (Hình c). So với mô hình nhận din vũ khí nóng được thiết lập trong [13] thì tác giả đ xây dựng mô hình trên YOLO v3 với đầy đủ hơn về s lượng lớp với hơn 100.000 ảnh đầu vo các loại sng. Thực tế, trong [13] Yolo v3 chỉ sử dụng 5000-6000 dữ liu huấn luyn chỉ với sng ngắn. Trong bi báo, tác giả sử dụng cách gán nhn dữ liu, cách huấn luyn mô hình với các bước thực thi đơn giản v dễ thao tác, dễ chính xác hơn so với bi viết ở [13] đ trình by. Kết quả thực nghim tt phản ánh thời gian xử lý v đ chính xác YOLO v3 cho bi toán phát hin vũ khí nóng l các loại sng cầm tay. Kết quả mô hình dự kiến trin khai sử dụng trong lực lượng công an nhm cảnh báo sớm trong các vấn đề liên quan đến ti phạm sử dụng sng cầm tay. Hạn chế của phần mềm HandGunDetector-C500 hin tại vẫn chưa th nhận din được trường hợp đặc bit của vị trí của sng gi l Gun-Point như trong Hình 2. Khi đó hình dạng cơ bản của sng không được th hin đ có th nhận din qua mô hình. a. Sng ngắn bị nhiễu b. Sng ngắn v nt Hình. 2. Trường hợp ảnh chứa sng trong trạng thái Gun-Point Do dữ liu chứa sng cầm tay được quan sát dưới góc nghiêng v t xa nên tập dữ liu huấn luyn không đủ đ nhận din được đi tượng sng trong trường hợp ny. Cũng có mt s trường hợp, sng cầm tay bị che gần như ton b hoặc mt phần bởi tay của người sử dụng như Hình 3 hoặc bị che v lm nhiễu bởi bi cảnh xung quang thì đ chính xác của quá trình nhận dạng bị ảnh hưởng tùy mức đ v có th không nhận din được đi tượng sng. Đ giải quyết vấn đề trên, D.M. Sheen đ đề xuất CWD cho sân bay v vị trí an ton dựa trên ba chiều kỹ thuật hình ảnh sóng milimet (mm). Ở [5] đề xuất phương pháp phát hin sng bng cách sử dụng phân đoạn dựa trên phân đoạn mu sắc v phát hin đim qua tâm. 156 Đoàn Trung Sơn, Nguyễn Thị Khánh Trâm Hình. 3. Trường hợp sng cầm tay bị che gần ton b hoặc mt phần Trong mt s trường hợp, kết quả nghiên cứu của Lucas-Kanade Optical Flow trong [10] được áp dụng đ nhận biết được hướng di chuyn của vũ khí v t đó ước lượng được vị trí của chng mặc dù không có khả năng nhận din. Kết Luận Bài báo mô tả kết quả ứng dụng mô hình YOLO v3 cho bi toán nhận din sng cầm tay với hơn 100.000 dữ liu huấn luyn. Phần mềm HandGunDetector-C500 cho kết quả thực nghim phản ánh sự hiu quả, chính xác v tc đ thực hin đáp ứng được yêu cầu trong các trường hợp dữ liu ảnh về sng cầm tay thông thường. Mở rng mô hình phát hin sng cầm tay trong những trường hợp đặc bit như sng bị nhiễu, bị che mt phần hoặc trong trạng thái Gun-Point cũng như tiếp cận phát hin các loại vũ khí nóng khác: gậy, m tấu, các loại dao, kiếm sẽ được xem xt thực hin trong thời gian tới. Về phương din lý thuyết đ cải tiến mô hình, tác giả dự định phát trin mô hình hc tăng cường hoặc sử dụng kết hợp YOLO và Mask R-CNN nhm đạt được tc đ thực hin cũng như đ chính xác của quá trình nhận din mong mun. Tài Liệu Tham Khảo 1. Tian Y. and al e. (2008), IBM smart surveillance system (s3): Event based video surveillance system with an open and extensible framework, Machine Vision and Application, 19 (5-6), pp: 315-327. 2. Collins R.T. and al e. (2000), A system for visual surveillance and monitoring, Carnegie Mellon University. 3. Shah M., Javed O., and Shafique K. (2007), Automated visual surveillance in realistic sceanarios, IEEE Trans- actions on Multimedia, 14(1), pp:30-39. 4. Tony Wang, Recognizing Firearms from Images and Videos in Real-Time with Deep Learning and Computer Vision 5. Rohit Kumar Tiwari and Gyanendra K. Verma, A Computer Vision based Framework for Visual Gun Detection using Harris Interest Point Detector, IMCIP-2015 6. Điều 3 Luật quản lý, sử dụng vũ khí, vật liu nổ v công cụ h trợ năm 2017 (có hiu lực t ngy 01/7/2018) 7. 8. tap-dac-biet-la-toi-pham-co-to-chuc_24135.html 9. 10. 11. 12. 13. https://www.miai.vn/2019/08/09/yolo-series-2-cach-train-yolo-de-detect-cac-object-dac-thu/ 157

Các file đính kèm theo tài liệu này:

ung_dung_mo_hinh_yolo_trong_phat_hien_sung_cam_tay.pdf