Trong tuyển dụng, hàng ngày nhà tuyển dụng nhận được rất nhiều hồ sơ ứng tuyển. Để có
thể tìm được hồ sơ phù hợp, nhà ứng tuyển mất khá nhiều thời gian tìm và lọc hồ sơ. Một
website tuyển dụng truyền thống chỉ dựa vào một số thuộc tính mà người dùng chọn lựa trên
thanh tìm kiếm để trả về kết quả. Để tăng tính hiệu quả của website, ngoài việc dựa vào
những thuộc tính mà người dùng lựa chọn trên thanh công cụ, còn dựa vào những thông tin
mà người dùng cung cấp qua việc điền hồ sơ để tiến hành lọc danh sách tin tuyển dụng cho
phù hợp với mong muốn của từng ứng viên.
7 trang |
Chia sẻ: Thục Anh | Lượt xem: 441 | Lượt tải: 0
Nội dung tài liệu Hệ thống gợi ý hỗ trợ tuyển dụng và ứng tuyển ngành Công nghệ thông tin, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
71
HỆ THỐNG GỢI Ý HỖ TRỢ TUYỂN DỤNG
VÀ ỨNG TUYỂN NGÀNH CÔNG NGHỆ THÔNG TIN
Phạm Mai Hương, Trương Văn Ninh
Khoa Công nghệ Thông tin, Trường Đại học Công nghệ TP. Hồ Chí Minh
GVHD: ThS. Võ Hoàng Khang
TÓM TẮT
Trong tuyển dụng, hàng ngày nhà tuyển dụng nhận được rất nhiều hồ sơ ứng tuyển. Để có
thể tìm được hồ sơ phù hợp, nhà ứng tuyển mất khá nhiều thời gian tìm và lọc hồ sơ. Một
website tuyển dụng truyền thống chỉ dựa vào một số thuộc tính mà người dùng chọn lựa trên
thanh tìm kiếm để trả về kết quả. Để tăng tính hiệu quả của website, ngoài việc dựa vào
những thuộc tính mà người dùng lựa chọn trên thanh công cụ, còn dựa vào những thông tin
mà người dùng cung cấp qua việc điền hồ sơ để tiến hành lọc danh sách tin tuyển dụng cho
phù hợp với mong muốn của từng ứng viên.
Từ khóa: gợi ý, kết nối, nhà tuyển dụng, tuyển dụng, ứng viên.
1 GIỚI THIỆU
1.1 Tổng quan về hệ thống gợi ý
Hệ thống gợi ý là một dạng của hệ hỗ trợ ra quyết định, cung cấp giải pháp mang tính cá
nhân hóa mà không phải trải qua quá trình tìm kiếm phức tạp. Hệ gợi ý học từ người dùng
và gợi ý các sản phẩm tốt nhất trong số các sản phẩm phù hợp. Hệ thống gợi ý sử dụng các
tri thức về sản phẩm, các tri thức của chuyên gia hay tri thức khai phá học được từ hành vi
con người dùng để đưa ra các gợi ý.
1.2 Các phương pháp gợi ý chủ yếu
Gợi ý dựa theo lọc cộng tác, gợi ý dựa theo nội dung, gợi ý dựa trên sự tương đồng.
2 CÁC BƯỚC TIẾN HÀNH
2.1 Thu thập dữ liệu
- Thông tin ứng viên lấy từ CV có sẵn, về sở thích, kỹ năng, công việc đã làm...
- Thông tin công việc lấy từ các website tuyển dụng.
2.2 Chọn các thuộc tính
- Ứng viên: tuổi, giới tính, tình trạng hôn nhân, bằng cấp, điểm số, ngành, kinh nghiệm, kỹ
năng...
- Thông tin công việc: bằng cấp, kinh nghiệm, kỹ năng, thông tin nhà tuyển dụng, lĩnh vực...
72
2.3 Phân loại dữ liệu
Ứng viên (6 nhóm): giới tính (2 nhóm), tình trạng hôn nhân (3 nhóm), bằng cấp (4 nhóm),
điểm số (3 nhóm), chuyên ngành (8 nhóm), kinh nghiệm (6 nhóm), kỹ năng, vị trí địa lý (5
nhóm).
Nhà tuyển dụng (4 nhóm): lĩnh vực (8 nhóm), vị trí tuyển dụng (4 nhóm), mức lương (3
nhóm), vị trí địa lý (5 nhóm), xếp hạng nhà tuyển dụng (5 nhóm).
2.4 Khai phá dữ liệu và tìm luật kết hợp với thuật toán Apriori
Bước 1: áp dụng thuật toán Apriori để khai phá luật kết hợp dựa vào các thuộc tính của ứng
viên để tìm ra các tập phổ biến của ứng viên từ đó có thể đưa ra được xu hướng lựa chọn
công việc của các tập ứng viên. (Ví dụ: Những ứng viên trên 30 tuổi thường đã kết hôn và
kinh nghiệm lớn hơn 4 năm thường có xu hướng chọn những công việc có mức thu nhập
cao để lo cho gia đình, con cái.)
Item: tuổi, kinh nghiệm, giới tính, tình trạng hôn nhân, điểm, vị trí địa lý của tất cả các ứng
viên. Itemset: danh sách các Item của ứng viên. Transaction: tập hợp các Itemset của ứng
viên. Với: min_confidence là 80% và min_support = 50%.
Bước 2: sau đó xây dựng 1 ma trận đơn vị giữa các luật kết hợp tìm được và tất cả các
công việc sao cho: Matrix [i, j] = 1 (nếu công việc j có tồn tại trong luật thứ i) (ngược lại = 0)
=> ma trận yêu thích
Bước 3: dựa vào ma trận yêu thích tìm được, tính ma trận trọng số cho tất cả các nhóm luật
với từng thuộc tính: vị trí tuyển dụng (4 gr), mức lương (3 gr), xếp hạng nhà tuyển dụng (5
gr) cách tính:
a) Tính véc tơ trọng số cho các thuộc tính vị trí tuyển dụng (4 gr), mức lương (3 gr), xếp
hạng nhà tuyển dụng (5 gr) với mỗi nhóm luật dựa trên ma trận yêu thích.
Ví dụ: trong nhóm luật 1 có n công việc ta tính vecto trọng số cho vị trí tuyển dụng [A,B,C,D].
Với nA là số lần xuất hiện của A trong n công việc ta có: pA=nA/n,
P(1) = [pA pB pC pD],
P(n) = [pA pB pC pD], với P(n): vecto trọng số cho vị trí công việc trong nhóm n.
b) Đưa ra 1 ma trận trọng số cho vị trí tuyển dụng (V) với tất cả các nhóm luật.
Matrix [i, j] = p(i,j) (trọng số của vị trí thứ j trong nhóm luật thứ i); i: n nhóm luật;
j: 4 nhóm trong vị trí[A,B,C,D]
c) Làm tương tự ta được ma trận trọng số cho mức lương (L), xếp hạng nhà tuyển dụng (R).
2.5 Tiến hành các bước thực hiện để đưa ra gợi ý
2.5.1 Lọc những ứng cử viên phù hợp với những thuộc tính ưu tiên
Các trường được xem xét cho việc lọc danh sách các công việc thích hơp (danh sách thu
gọn) là: trình độ chuyên môn, bằng cấp tối thiểu và kinh nghiệm tối thiểu. Điều này
được thực hiện để thu gọn danh sách công việc phù hợp và giảm bớt thời gian xử lý các
công việc không liên quan đến ứng viên. Vì xét tất cả các công việc đối với lọc dựa trên nội
dung, dẫn đến độ phức tạp về thời gian cao hơn trong trường hợp tập dữ liệu lớn.
73
H nh 1. Lọc những ứng cử viên phù hợp với những thuộc tính cơ bản
2.5.2 Tính toán độ giống nhau giữa kỹ năng ứng viên và kỹ năng nhà tuyển dụng yêu
cầu
Bây giờ hãy tính toán độ giống nhau cho các công việc trong danh sách thu gọn liên quan
đến ứng cử viên. Độ giống nhau được tính toán giữa các trường kỹ năng yêu cầu của công
việc và của ứng viên. Ở đây độ giống nhau về cosine giữa hai trường kỹ năng trên được
xem xét theo công thức Cosine similarity: Cosine similarity (a, b) = (a . b) / (|a| |b|). Độ giống
nhau cosin càng lớn thì mức độ tương đồng giữa các trường càng cao, suy ra kỹ năng của
ứng viên càng phù hợp với kỹ năng nhà tuyển dụng yêu cầu. Biểu diễn vecto kỹ năng:
- Đầu tiên, vectơ ma trận cho yêu cầu kỹ năng công việc của nhà tuyển dụng được tạo
ra với số chiều tương ứng với số kỹ năng yêu cầu, trọng số là 1 cho tất cả các trường
(không yêu cầu mức độ thông thạo).
- Sau đó, vectơ kỹ năng của ứng cử viên được tạo ra, sao cho số chiều bằng với vecto
kỹ năng nhà tuyển dụng. Với những kỹ năng tương đồng sẽ có trọng số là 1 và không
tương đồng sẽ có trọng số 0.
H nh 2. Tính toán độ giống nhau
2.5.3 Tính trọng số về độ yêu thích của ứng viên đối với công việc dựa vào ma trận
yêu thích
Với ma trận trọng số tìm được cho: vị trí, mức lương, xếp hạng nhà tuyển dụng. Ta tìm trọng
số cho mỗi công việc trong danh sách thu gọn ứng viên sao cho:
74
rwi = w(V) + w(L) + w(R), với w(V)
là trọng số cả công việc j trong ma
trận trọng số vị trí td(V), w(L) là
trọng số cả công việc j trong ma
trận trọng số mức lương (L) và
w(R) là trọng số cả công việc j
trong ma trận trọng số xếp hạng
nhà tuyển dụng (R).
H nh 3. Ứng dụng luật kết hợp và cây quyết định để phân
loại ứng viên
2.5.4 Tính toán tổng trọng số
Bây giờ hãy tính điểm trọng số cuối cùng bằng cách tính tổng các giá trị của độ tương tự
cosin và trọng số về mức độ yêu thích theo công thức Final Weight (Final Weight(i) (Tổng
trọng số) = w1 . simi + w2 . rwi). Ở đây cả tính độ tương tự cosine cũng như trọng số trọng số
về mức độ yêu thích đều có trọng số như nhau. Việc chỉ định trọng số không phù hợp cho
chúng dẫn đến kết quả mơ hồ vì trọng số cao hơn của một bên sẽ lấn át mức độ ưu tiên của
bên kia và do đó gây ra sự mơ hồ trong kết quả. Quản lý website được quyền chọn thông số
cho w1, w2 sao cho w1 + w2 = 1 dựa vào mức độ ưu tiên của hệ thống (ưu tiên phù hợp về kỹ
năng hoặc ưu tiên dựa trên mức độ yêu thích của ứng viên).
H nh 4. Tính toán tổng trọng số
2.5.5 Sắp xếp và đưa ra gợi ý
Theo điểm số cuối cùng thu được, hãy sắp xếp các công việc theo thứ tự giảm dần, tức là
công việc với điểm tối đa có trọng số cuối cùng ở vị trí 1 và công việc có trọng số cuối cùng ít
nhất điểm cuối cùng.
H nh 5. Sắp xếp công việc theo trọng số và tiến hành gợi ý
75
2.6 Công thức
Cosine similarity (a, b) = (a . b) / (|a| |b|), Final Weight(i) (Tổng trọng số) = w1 . simi + w2. rwi
Trong đó i đại diện cho công việc trong danh sách lựa chọn thứ i, simi là viết tắt của cosine
tương tự cho công việc thứ i, rwi đại diện cho trọng số quy tắc được chỉ định cho công việc
thứ i, w1 và w2 đại diện cho trọng số được chỉ định theo độ ưu tiên.
3 THỰC NGHIỆM
Áp dụng khai phá luật kết hợp để biểu diễn ma trận các quy tắc đã khai phá với các danh
mục công việc khác nhau. Tìm luật kết hợp với Apriori với min_support = 50% và
min_confident = 80%.
Để đưa ra ma trận mối quan hệ như sau:
Giải thích: những người nhóm tuổi từ A, kinh nghiệm E2 thường chọn những công việc J1,
J3
Bước 1: lọc những ứng cử viên phù hợp dựa trên các tiêu chí chính.
Ví dụ: thông tin ứng viên: {F, I2, E3, G3, U, H1, M1, Q6, C++ Oracle Algorithms English Js}.
Job Qualification Major Experience
J1 Q1 M1 E2
J2 Q2 M2 E6
J3 Q3 M3 E2
J4 Q4 M1 E3
76
Job Qualification Major Experience
J5 Q1 M4 E5
J6 Q1 M5 E2
J7 Q3 M1 E3
J8 Q3 M8 E3
J9 Q2 M1 E6
J10 Q2 M1 E4
Sau khi lọc ta được bảng thu gọn gồm J1, J2, J4, J6, J7, J8 phù hợp với profile ứng viên.
Bước 2: tính độ tương đồng về kỹ năng
Job Skill Skill Vector
Candidate
Vector
Cosin Similirity
J1
MySQL, PHP, Data
structure, English.
[1,1,1,1] [0,0,0,1] 0.5
J2
OpenCL, Networking,
English, German.
[1,1,1,1] [0,0,1,0] 0.866
J7
C++, SQL, Algorithm,
JS, English.
[1,1,1,1,1] [1,0,1,1,1] 0.894
J9
C++, Oracle, Algorithms,
English, JAVA.
[1,1,1,1,1] [1,1,1,1,0] 0.894
J10
HTML, CSS, Data
Structure, Algorithm,
English.
[1,1,1,1,1] [0,0,0,1,1] 0.63
Bước 3: áp dụng khai phá luật kết hợp để phân loại ứng viên. Ví dụ với ứng viên: {F, I2, E3,
G3, U, H1, M1, Q6, C++ Oracle Algorithms English Js}. Dựa vào ma trận khai phá ta có: F
tuổi, kinh nghiệm E6 năm thường hay chọn các công việc: J2, J9. Ta có ma trận khai phá
sau:
Company Ranking [R1, R2, R3, R4, R5] = [0, 0, ½, 0, ½]
Impotant position [ID1, ID2, ID3, ID4] = [0, 1, 0, 0]; Pay scale [P1, P2, P3] = [0, ½, ½]
Ta có Rules Weight bằng tổng của các tham số tương ứng với ma trận ví dụ:
Company Rank là R1, Impotant postion là ID1, Pay scale là P3: rwi = {0 + ½ + 0} = ½
Bước 4: tính toán tổng trọng số.
- Normalized Weight= (Wi - Wmin) / (Wmax - Wmin) (Chuẩn hóa dữ liệu)
- Tính tổng trọng số (Final Weight (i)) (chọn w1 = w2 = 0.5).
Job
Cosin
Similarity
Company
Ranking
Important
Position
Pay
Scale
Rules Weight
Normalized
Rules
Weight
Final
Weight
J2 0.866 R3 ID2 P2 {½+1+½} = 2 1 0.933
J9 0.894 R5 ID2 P3 {½+1+½} = 2 1 0.947
77
Bước 5: sắp xếp theo tổng trọng số và đưa ra gợi ý.
Kết quả: thứ tự gợi ý sẽ là {J9, J2}.
4 KẾT LUẬN VÀ KIẾN NGHỊ
4.1 Kết luận
Hệ thống gợi ý được xây dựng cơ bản hoàn thiện về cơ sở lý thuyết. Thông tin được sắp
xếp và lưu trữ có hệ thống. Áp dụng khai phá luật kết hợp vào trong quá trình đưa ra gợi ý.
Thuật toán đưa ra gợi ý dựa vào hai yếu tố: độ phù hợp kỹ năng của ứng viên với công việc,
mức độ tương đương giữa các ứng viên được khai phá dựa trên các luật kết hợp giúp cho
quá trình tuyển dụng thực tế khách quan.
4.2 Kiến nghị
Để thuật toán đưa ra gợi ý một cách hiệu quả cần một số lượng dữ liệu đủ lớn để áp dụng
khai phá luật kết hợp. Việc xác định các chỉ số đầu vào của thuật toán sẽ ảnh hưởng đến
toàn bộ quá trình gợi ý, do đó nên cân nhắc và đưa ra những chỉ số phù hợp giúp hệ thống
hoạt động hiệu quả nhất.
TÀI LIỆU THAM KHẢO
Online document (Tài liệu trực tuyến):
[1] Khóa học Khai phá dữ liệu, trường ĐH. Khoa học Tự nhiên, ĐH Quốc gia TP.HCM.
[2] Khóa học online Machine Learning with Andrew Ng.
Book (Sách):
[3] M.J. Pazzani, “A framework for collaborative, content-based and demographic filtering”,
Artific Intell Rev, 13 (1999), pp. 393-408.
Journal article (Bài báo):
[4] https://gdeepak.com/thesisme/Applying%20Data%20Mining%20For%20Job%20Reco
mmendations.pdf
Các file đính kèm theo tài liệu này:
- he_thong_goi_y_ho_tro_tuyen_dung_va_ung_tuyen_nganh_cong_ngh.pdf