Các hàm R cơ bản
Biểu đồ phân bố (histogram)
Biểu đồ hộp (box plot)
Biểu đồ thanh (bar plot)
Biểu đồ tương quan (scatter plot)
25 trang |
Chia sẻ: phuongt97 | Lượt xem: 401 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Bài giảng Phân tích và xử lý dữ liệu với R - Phần 4: Phân tích dữ liệu bằng biểu đồ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Phân tích dữ liệu với RChương 2 _ phần 4Phân tích dữ liệu bằng biểu đồCác hàm R cơ bảnBiểu đồ phân bố (histogram)Biểu đồ hộp (box plot)Biểu đồ thanh (bar plot)Biểu đồ tương quan (scatter plot)Đọc dữ liệu> setwd("D:/")> ob = read.csv ("salary.csv", header = T)> attach(ob)> head(ob) id salbeg sex time age salnow edlevel work jobcat minority sexrace1 7 6900 0 79 28.00 16080 15 3.17 1 0 12 8 5400 0 67 28.75 14100 15 0.50 1 0 13 9 5040 0 96 27.42 12420 15 1.17 1 0 14 11 6300 0 84 33.50 15720 15 6.00 1 0 15 12 6000 0 88 54.33 8880 12 27.00 1 0 16 18 6900 0 72 32.67 10380 15 6.92 1 0 1Mục đíchMuốn mô tả phân bố biến salnowPhân bố salnow có khác nhau giữa nam và nữ (sex)Biểu đồ phân bốHàm hist ()Hist(var, xlab, ylab, main, xlim, ylim, col, border, prob)Hist(salnow)> hist(salnow, col= "blue", border = "white")hist(salnow, col= "blue", border = "white", xlab = "lương hiện tại ($)", ylab = "tỉ lệ", prob = T, main = "Phân bố mức lương hiện tại của nhân viên")Biểu đồ hộpHàm boxplotBoxplot(var, xlab, ylab, main, xlim, ylim, col, border, horizontal)Boxplot(var ~ group, xlab, ylab, main, xlim, ylim, col, border, horizontal)boxplot(salnow)boxplot (salnow, xlab ="lương hiện tại", main = "lương hiện tại", col = "blue")boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue")boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = c("blue","red"), horizontal=T)Biểu đồ thanhHàm barplottable (groupA, GroupB)means = with(data,tapply(var,group, mean))barplot(table, horiz)barplot(mean, horiz) f = table(sex)barplot(f)barplot(means, horiz = T, xlab ="số nhân viên", ylab = "nhóm nghề")Biểu đồ tương quanHàm plot()plot(varx~vary, pch, main, xlab, ylab, xlim, ylim, col, lwd)abline(lm(varX~varY),col = , lwd) plot(salnow~edlevel,ch =16, col = "blue")abline(lm(salnow~edlevel),col ="red" , lwd=2)
Các file đính kèm theo tài liệu này:
- bai_giang_phan_tich_va_xu_ly_du_lieu_voi_r_phan_4_phan_tich.pptx