Để hiểu việc biểu diễn các tính chất và mô tả các thông tin như thế nào?
Để biết việc vẽ minh họa về một tổng thể lớn mà chỉ dựa trên thông tin thu được từ các mẫu ra sao?
Để biết các dự báo thu được chắc chắn đến mức độ nào?
Để biết bằng cách nào cải tiến quy trình
55 trang |
Chia sẻ: Mr Hưng | Lượt xem: 867 | Lượt tải: 0
Bạn đang xem trước 20 trang nội dung tài liệu Thống kê depocen - Chương 1: Giới thiệu chung và cách thu thập số liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Giới thiệu về thống kêDEPOCEN Chương 1 Giới thiệu chung và cách thu thập số liệuCác phương pháp thống kê là gì?Tại sao chúng ta lại cần các phương pháp thống kê? Các phương pháp thống kê được mô tả như việc định nghĩa các phương pháp sử dụng trong việc thu thập số liệu, biểu diễn, phân tích và làm sáng tỏ dữ liệu (Weinberg and Schumaker 1962)Để hiểu việc biểu diễn các tính chất và mô tả các thông tin như thế nào?Để biết việc vẽ minh họa về một tổng thể lớn mà chỉ dựa trên thông tin thu được từ các mẫu ra sao?Để biết các dự báo thu được chắc chắn đến mức độ nào?Để biết bằng cách nào cải tiến quy trìnhMột công ty có kế hoạch giới thiệu một sản phẩm mới.Lợi tức của một sản phẩm trong công ty giảm xuống nghiêm trọng trong sáu tháng gần đây.Công ty muốn thay đổi mẫu mã của sản phẩm đã có. Giám đốc Marketing muốn kiểm tra xem mẫu mã mới ảnh hưởng đến thái độ của khách hàng với sản phẩm mới như thế nào?Cổ điển và Bayesian Cổ điển: Fisher and Pearson Bayesian: Thomas BayesTham số và phi tham số (nửa tham số)Nguyên nhân (causal) và tương quanBước 1: Xác định bài toán Bước 2: Thiết lập các đối tượng nghiên cứu.Bước 3: Xác định dạng dữ liệu cần thu thập.Bước 4: Xác định nguồn lấy thông tin.Bước 5: Xác định cỡ mẫu và cách lấy mẫu.Bước 6: Xác định phương pháp thu thập số liệu.Bước 7: Tiến hành thu thập số liệu.Bước 8: Mô tả số liệu.Bước 9: Phân tích số liệu. Bước 10: Chuẩn bị và diễn giải báo cáo kết quả.Phân loại Thống kêThống kê mô tả: Lấy số liệu từ mẫu. Mô tả số liệu.Thống kê suy luận:Phân tích số liệu.Đưa ra kết luận.Thống kê mô tảThu thập số liệu (khảo sát)Biểu diễn số liệu (bảng, đồ thị)Đặc trưng của số liệu: mức ý nghĩaMột đặc trưng: tổng thể: là một tham số Mẫu: là một thống kêCác bước xác định bài toán:(1) Các vấn đề liên quan.(2) Thông tin về công ty như:sản phẩm, dịch vụ, thị trường, khách hàng.(3) Những thay đổi gần đây có thể làm ảnh hưởng đến công ty.(4) Các hoạt động có thể làm giảm nhẹ bài toán.Để thu được thông tin cơ bản, xác định giới hạn, làm rõ bài toán và giả thuyết, xác định nguyên nhân và tạo các câu “nếu thì”.Các loại kế hoạch nghiên cứu: - Thăm dò - Mô tả - Nguyên nhânThiết kế cấu trúc số liệu thu thập được dựa trên các đối tượng nghiên cứu.Bước 4: Các số liệu gốcChínhThu thập số liệuPhụSố liệu phức tạpQuan sátThí nghiệmKhảo sátBản in hoặc điện tửTổng thể: là tất cả các đối tượng được quan sát.Mẫu: là một phần của tổng thể được chọn để phân tích.Các phương pháp lấy mẫuMẫuMẫu không có xác suấtMẫu có xác suấtMẫu ngẫu nhiên đơn giảnMẫu hệ thốngMẫu phân tầngMẫu chùmMẫu có xác suấtMẫu có xác suấtMẫu ngẫu nhiên đơn giảnMẫu hệ thốngMẫu phân tầngMẫu chùmCác đối tượng mẫu được chọn dựa trên những khả năng đã biết.Mẫu ngẫu nhiên đơn giản Mọi đối tượng có khả năng được chọn như nhau. Việc chọn có thể hoàn lại hoặc không hoàn lại. Một trong các cách là sử dụng bảng số liệu ngẫu nhiên thu thập được từ mẫu.Mẫu hệ thốngN = 64n = 8k = 8Nhóm 1Mẫu phân tầng Tổng thể được chia thành 2 hoặc nhiều nhóm tùy theo một vài đặc trưng thông dụng. Mẫu ngẫu nhiên đơn giản được chọn từ các nhóm vừa phân chia. Hai hoặc nhiều mẫu được kết nối với nhau.Mẫu chùm tổng thể được chia thành một vài “chùm”, mỗi chùm biểu diễn lại tổng thể. Mẫu ngẫu nhiên đơn giản được chọn từ các chùm. Các mẫu đơn giản được kết nối làm một.tổng thể chia làm 4 “chùm”.Phương pháp định tínhPhương pháp định lượngQuan sátNhóm trọng tâmPhân tích ban đầuXác định kỹ thuậtĐược sử dụng với cỡ mẫu lớnCác câu hỏi được xây dựng với các câu trả lời đã có từ trước.Phương pháp suy luậnQuản lý chất lượngDự báoKiểm định giả thuyếtƯớc lượngHồi quyChuỗi thời gianBước 10: Báo cáo kết quảGiới thiệu về thống kêDEPOCEN Chương 2 Biểu diễn số liệu bằng bảng và biểu đồCác chủ đềTổ chức số liệu: theo thứ tự mảng và hiển thị bằng biểu đồ hình cây-láBảng và đồ thị số liệu:Phân phối tần xuất : bảng, biểu đồ, đường gấp khúcPhân phối tích lũy: bảng, biểu đồ, hình cung Tổ chức số liệu định tính một chiều: tổng hợp các bảngĐồ thị của số liệu định tính 1 chiều: cột, trònBảng số liệu định tính 2 chiều:Cột, bảng ngẫu nhiên2 1446773 0284 1Tổ chức số liệuSố liệuThứ tự mảngBiểu diễn hình cây-láPhân phối tần xuấtPhân phối tích lũyBiểu đồĐường gấp khúcHình cungBảng41, 24, 32, 26, 27, 27, 30, 24, 38, 2121, 24, 24, 26, 27, 27, 30, 32, 38, 41Biểu diễn hình cây-lá: là một kỹ thuật thống kê để hiển thị một tập số liệu. Mỗi giá trị số liệu được chia thành hai phần: phần chính là cây và phần phụ là lá cây. 2 1 4 4 6 7 7 Tổ chức số liệu:Số liệu biểu diễn hàng ngang: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38Số liệu biểu diến theo thứ tự từ nhỏ đến lớn: 21, 24, 24, 26, 27, 27, 30, 32, 38, 41Biểu diễn cây-lá:3 0 2 84 1Một phân phối tần xuất là việc nhóm các số liệu thành các mục riêng biệt để chỉ ra số quan sát trong mỗi lớp.Bảng số liệu: Phân phối tần xuấtSố liệu theo thứ tự mảng:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Lớp Tần xuất 10 đến 20 3 .15 15 20 đến 30 6 .30 30 30 đến 40 5 .25 25 40 đến 50 4 .20 20 50 đến 60 2 .10 10 Tổng số 20 1 100Tỉ lệ tần xuất Phần trămTỉ lệ tần xuất: Là phần trăm của các quan sát trong mỗi lớp trong tổng thể. Ta lấy số lượng trong mỗi lớp chia cho tổng số quan sát.Note: Tác dụng của biểu diễn cây-lá với một bảng phân phối tần xuất là không làm mất đi tính đồng nhất của mỗi quan sát.Có ba dạng đồ thị thường được sử dụng là: biểu đồ, đường gấp khúc, và phân phối tần xuất tích lũy (dạng đường cong).Biểu đồ: tạo nên bằng cách các lớp nằm trên trục ngang và tần xuất nằm trên trục thẳng đứng, tần xuất của mỗi lớp biểu diễn độ cao của hình cột và mỗi cột được vẽ cạnh nhau.Một đường gấp khúc gồm các đoạn thẳng nối các điểm nằm chính giữa các lớp và tần xuất của lớp đó.Được sử dụng để xác định tỉ lệ của các giá trị số liệu là nằm trên hay dưới một giá trị chắc chắn nào đó là bao nhiêu. Đồ thị số liệu: Biểu đồ Số liệu theo hàng ngang:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58Đồ thị số liệu :Đường gấp khúcSố liệu:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Lớp Tần số % 10 đến 20 3 1520 đến 30 9 4530 đến 40 14 70 40 đến 50 18 9050 đến 60 20 100 Bảng số liệu:Tần số tích lũySố liệu:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58Đồ thị số liệu:Dạng hình cungSố liệu:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58Tổ chức số liệu định tínhSố liệu định tínhBảng số liệuTổng kết thành bảngĐồ thị số liệuHình quạtDạng khácDạng cộtVí dụ: Tổng kết số liệu bằng bảng 1 chiều(với một nhà đầu tư)Danh mục đầu tư Số lượng % (ngàn đôla)Dự trữ 46.5 42.27Cổ phần 32 29.09Tiết kiệm 16 14.55Chi phí khác 15.5 14.09Tổng cộng 110 100 Biến định tínhRất hữu ích trong việc thể hiện mối quan hệ của một phân phối tần: một hình tròn được chia tỉ lệ với các tần xuất của số liệu.Dạng hình quạtTiết kiệm 15%CP K 14%Cổ phần 29%Dự trữ42%Tổ chức số liệu định tính dạng bảng 2 chiều Bảng ngẫu nhiênDạng cộtTổ chức số liệu định tính dạng bảng 2 chiều: Bảng ngẫu nhiênDanh mục Nhà đầu tư A Nhà đầu tư B Nhà đầu tư C Tổng số đầu tư Dự trữ 46.5 55 27.5 129 Cổ phần 32 44 19 95Tiết kiệm 16 28 7 51Chi phí khác 15.5 20 13.5 49 Tổng số 110 147 67 324 Biểu diễn số liệu được thiết kế tốt nếu:Bản chấtThống kêLiên kết các ý tưởng với sự rõ ràng, chính xác và hiệu quả.Yêu cầu đưa ra thông tin chính xác về số liệu. Sử dụng ‘Biểu đồ gãy khúc’ Không liên hệ với giá trị chuẩn khi so sánh các mảng số liệu Co các trục Không có số 0 trên trụcBiểu diễn đúng1960: $1.001970: $1.601980: $3.101990: $3.80Minimum WageMinimum Wage0241960197019801990$Biểu diễn saiBiểu diễn đúngBiểu diễn sai0200300FRSOJRSRFreq.10%30%FRSOJRSR%FR = Freshmen, SO = Sophomore, JR = Junior, SR = SeniorBiểu diễn đúngBiểu diễn sai02550Q1Q2Q3Q4$0100200Q1Q2Q3Q4$Biểu diễn đúngBiểu diễn sai 0394245JFMAMJ$36394245JFMAMJ$Graphing the first six months of sales.36
Các file đính kèm theo tài liệu này:
- lesson1_5458.ppt