Tiểu luận học phần Thống kê ứng dụng | Trường Đại học Bách khoa Hà Nội
Tiểu luận học phần Thống kê ứng dụng | Trường Đại học Bách khoa Hà Nội. Tài liệu được biên soạn dưới dạng file PDF gồm 18 trang, giúp bạn tham khảo, ôn tập và đạt kết quả cao trong kì thi sắp tới. Mời bạn đọc đón xem!
Preview text:
lOMoARcPSD| 41967345
TRƯỜNG ĐẠ I H Ọ C BÁCH KHOA HÀ N Ộ I
VI Ệ N KINH T Ế VÀ QU Ả N LÝ --- o0o ---
TI Ể U LU Ậ N H Ọ C PH Ầ N
TH Ố NG KÊ Ứ NG D Ụ NG
Gi ảng viên hướ ng d ẫ n
: Ths. Lê Văn Hòa Nhóm sinh viên
: Ph ạ m H ồng Thương 20136566
: Nguy ễ n Th ị Thùy Linh 20135898
: Tr ầ n Th ị Th ả o 20136440
: Dương Văn Thắ ng 20136451
: T ống Bá Đạ t 20135323
: Đỗ Ng ọc Sơn 20136314
Hà N ộ i – Tháng 10/2015 1 lOMoARcPSD| 41967345
LỜI CẢM ƠN
Thống kê ứng dụng là môn học rất cần thiết trong học tập và giảng dạy ối với giáo
dục ại học Việt Nam nói chung và sinh viên các ngành kinh tế nói riêng. Đặc biệt là ối
với sinh viên của các chuyên ngành khối kinh tế - xã hội.
Những tình huống thực tế sẽ giúp sinh viên hiểu sâu và hiểu kĩ lý thuyết hơn, có thể vận
dụng những gì ã học vào tình huống cụ thể mà sau này có thể sẽ gặp trong công việc.
Làm quen với những thách thức cần phải ưa ra một quyết ịnh trong dự án kinh doanh
của chính mình hoặc của doanh nghiệp mà mình công tác.
Để hoàn thành ược bài tiểu luận này, nhóm chúng em ã nỗ lực rất nhiều và chúng em
xin gửi lời cảm ơn sâu sắc tới thầy giáo, Thạc sĩ Lê Văn Hòa, bộ môn Quản trị kinh
doanh Viện Kinh tế và Quản lý, Trường Đại học Bách khoa Hà Nội ã ồng hành cùng
chúng em suốt quá trình nghiên cứu và học tập, cảm ơn thầy ã tận tình giảng dạy và
truyền thụ kiến thức, kinh nghiệm cũng như phong cách trình bày, ể chúng em có thêm những bài học quý báu.
Do chưa có cơ hội va chạm và tiếp xúc với môi trường thực tế trong kinh doanh nên
nhóm có thể chưa hiểu rõ hoặc hiểu sai những yêu cầu trong tình huống, bài làm còn
những sai sót, rất mong nhận ược sự góp ý và sửa chữa của thầy và các bạn.
Chúng em xin trân trọng cảm ơn!
Hà Nội ngày 5 tháng 10 năm 2015 Nhóm thực hiện MỤC LỤC
Lời cảm ơn ....................................................................................................................... 1
Tình huống 1:Công ty sô-cô-la Heavenly Chocolates ..................................................... 4 1 lOMoARcPSD| 41967345
1. Tóm tắt dữ liệu bằng ồ thị và bằng tham số thống kê mô tả .................................. 4
1.1.Đối với thời gian truy cập website công ty ......................................................... 4
1.2.Đối với số trang ã ọc ...................................................................................... 5
1.3.Đối với số tiền chi tiêu bình quân một giao dịch ................................................ 7
2. Tóm tắt tần số số tiền ã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo
từng ngày thứ trong tuần .............................................................................................. 8
3.Tóm tắt tần số số tiền ã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo
loại trình duyệt web ã sử dụng ................................................................................... 9
4.Sự liên hệ giữa thời gian truy cập website và số tiền ã chi tiêu .............................. 9
4. 1.Biểu ồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền chi tiêu .
...................................................................................................................... 10
5.Mối liên hệ giữa số trang ã xem trên website và số tiền ã chi tiêu ..................... 10
5. 1.Biểu ồ thể hiện mối liên hệ giữa số trang ã xem trên website và
số tiền chi mua hàng ............................................................................................... 11
6.Sự liên hệ giữa thời gian truy cập website với số trang ã xem ............................. 11
6. 1.Biểu ồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang ã xem..
...................................................................................................................... 11
Tình huống 2:................................................................................................................. 12
Công ty sản xuất ồ chơi trẻ em Specialty Toys ........................................................... 12
1.Đồ thị phân phối ...................................................................................................... 12
2.Xác suất hết hàng ối với các phương án ặt hàng ược ề ra .............................. 13
3.Lơi nhuận kì vọng ................................................................................................... 14
3.1. Giả ịnh bán ược 10000 sản phẩm ................................................................ 14
3.2. Giả ịnh bán ược 20000 sản phẩm ................................................................ 14
3.3. Giả ịnh bán ược 30000 sản phẩm ................................................................ 14
4.Lợi nhuận dự kiến ................................................................................................... 15
5.Khuyến nghị ............................................................................................................ 16 lOMoARcPSD| 41967345
Tình huống 3:Công ty nghiên cứu thị trường Metropolitan Research(Chapter 8, Auto)
....................................................................................................................................... 17
1.Phân tích thông kê mô tả ......................................................................................... 17
2.Ước lượng trung bình khoảng ................................................................................. 18
3. Thảo luận hàm ý ..................................................................................................... 18
4.Xác ịnh cỡ mẫu ..................................................................................................... 19
5)Thông tin thêm ........................................................................................................... 19
Tình huống4:Thu nhập của nhân viên bán hàng(Chapter 13, SalesSalary) .................. 20
1.Phân tích thống kê mô tả. ........................................................................................ 20
2.Ước lượng khoảng trung bình ................................................................................. 20
3.Ước lượng khoảng trung bình của các nhân viên bán hàng tại doanh nghiệp ........ 21
4.Ước lượng khoảng trung bình của các nhân viên bán hàng tại thực ịa ................. 21
5.Kiểm ịnh giả thuyết. .............................................................................................. 22
6.Kiểm ịnh giả thuyết. .............................................................................................. 23
7.Kiểm ịnh giả thuyết. .............................................................................................. 25
Tình huống 5:Chi tiêu qua thẻ tín dụng của người tiêu dùng(Chapter 15, Consumer) . 27
1.Thống kê mô tả. ....................................................................................................... 27
2.Xây dựng phương trình hồi qui mẫu. ...................................................................... 27
3.Xây dựng phương trình hồi quy bội. ....................................................................... 34
4.Dự báo ..................................................................................................................... 36
5.Thông tin thêm ........................................................................................................ 36
TÀI LIỆU THAM KHẢO ............................................................................................. 37
Tình huống 1: Công ty sô-cô-la Heavenly Chocolates (Chapter 3, Shopper) 3 lOMoARcPSD| 41967345 Bài làm
1. Tóm tắt dữ liệu bằng ồ thị và bằng tham số thống kê mô tả
1.1. Đối với thời gian truy cập website công ty Cumulative % Bin Frequency 4-10 17 34.00% 10-16 22 78.00% 16-22 6 90.00% 22-28 3 96.00% 28-34 2 100.00% More 0 100.00% Histogram 25 120.00% 100.00% 20 80.00% 15 60.00 % 10 Frequency 40.00% 5 20.00% Cumulative % 0 % 0.00 Descriptive statistics Time (min) Count 50 Mean 12.810 sample standard deviation 6.063 lOMoARcPSD| 41967345 sample variance 36.764 minimum 4.3 maximum 32.9 Range 28.6 Sum 640.500 sum of squares 10,006.230
deviation sum of squares (SSX) 1,801.425 standard error of the mean 0.857 skewness 1.450 kurtosis 2.404 coefficient of variation (CV) 47.33% 1st quartile 8.650 Median 11.400 3rd quartile 14.900 interquartile range 6.250 Mode 11.400 low extremes 0 low outliers 0 high outliers 4 high extremes 0
Nhận xét: Thời gian truy cập website của khách hàng chủ yếu dưới 16 phút, chiếm tới 78% 1.2.
Đối với số trang ã ọc Bin
Frequency Cumulative % 2-4 25 50.00% 4-6 15 80.00% 6-8 7 94.00% 8-10 3 100.00% 5 lOMoARcPSD| 41967345 More 0 100.00% Histogram 30 150.00 % 20 100.00 % 10 50.00 % Frequency Cumulative % 0 0.00 % 2-4 4-6 6-8 8-10 More Bin Descriptive statistics Pages Viewed count 50 mean 4.82 sample standard deviation 2.04 sample variance 4.15 minimum 2 maximum 10 range 8 sum 241.00 sum of squares 1,365.00
deviation sum of squares (SSX) 203.38 standard error of the mean 0.29 skewness 0.65 kurtosis 0.17 coefficient of variation (CV) 42.27% 1st quartile 3.25 median 4.50 3rd quartile 6.00 interquartile range 2.75 mode 4.00 lOMoARcPSD| 41967345 low extremes 0 low outliers 0 high outliers 0 high extremes 0
Nhận xét: Số lượng trang mà khách hàng ã xem là khá khiêm tốn, chủ yếu là từ 2 ến 6 trang, chiếm 80%.
1.3. Đối với số tiền chi tiêu bình quân một giao dịch Bin
Frequency Cumulative % 17-46 14 27.45% 46-75 23 72.55% 75-104 7 86.27% 104-133 4 94.12% 133-162 3 100.00% More 0 100.00% Histogram 30 150.00% 20 100.00 % 10 50.00 % 0 0.00% Frequency Cumulative % Bin Descriptive statistics Amount Spent ($) count 50 mean 68.1282 sample standard deviation 32.3438 sample variance 1,046.1187 minimum 17.84 maximum 158.51 7 lOMoARcPSD| 41967345 range 140.67 sum 3,406.4100 sum of squares 283,332.3967 deviation sum of squares (SSX) 51,259.8149 standard error of the mean 4.5741 skewness 1.0490 kurtosis 0.8765 coefficient of variation (CV) 47.47% 1st quartile 45.5600 median 62.1500 3rd quartile 82.7350 interquartile range 37.1750 mode #N/A low extremes 0 low outliers 0 high outliers 2 high extremes 0
Nhận xét: Khách hàng chi tiêu chủ yếu ở mức dưới 75$, chiếm 72.55% tổng lượng tiền
ã chi tiêu cho mua hàng online.
2. Tóm tắt tần số số tiền ã chi tiêu và số tiền chi tiêu bình quân một giao dịch
theo từng ngày thứ trong tuần Thứ
Số giao dịch Tổng số tiền($) Tần số(%)
Số tiền bình quân($) Mon 9 813.38 25.88 90.38 Tue 7 414.86 13.20 59.27 Wed 6 341.82 10.87 56.97 Thu 5 294.03 9.35 58.81 Fri 11 682.24 21.71 62.02 Sat 7 378.74 12.05 54.11 lOMoARcPSD| 41967345 Sun 5 218.15 6.94 43.63 Tổng 50 3143.22 100.00 Nhận xét:
Qua bảng số liệu trên, ta thấy lượng khách mua hàng vào các ngày thứ 2 và thứ 6 là khá
lớn, kéo theo số tiền ã chi tiêu cũng lớn. Trong khi ó, các ngày chủ nhật và thứ 5, số lần
giao dịch ít hơn, vì vậy lượng tiền chi tiêu ít hơn những ngày khác.
3. Tóm tắt tần số số tiền ã chi tiêu và số tiền chi tiêu bình quân một giao dịch
theo loại trình duyệt web ã sử dụng Số giao dịch Loại trình duyệt
Tổng số tiền($) Tần số(%) Số tiền bình quân($) Internet Explorer 27 1656.81 48.64 61.36 Firefox 16 1228.21 36.05 76.76 Other 7 521.39 15.31 74.48 Tổng 50 3406.41 100.00 Nhận xét:
Khách hàng chủ yếu sử dụng trình duyệt Internet Explorer ể truy cập website, do ó số
tiền khách hàng ã chi tiêu cho mua hàng online ở trình duyệt web này lớn hơn các trình
duyệt còn lại. Tuy nhiên số tiền chi bình quân cho mỗi giao dịch lại thấp hơn Firefox và
các trình duyệt web khác.
4. Sự liên hệ giữa thời gian truy cập website và số tiền ã chi tiêu 9 lOMoARcPSD| 41967345
4.1. Biểu ồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền chi tiêu
Hệ số tương quan mẫu r = 0.580048
Nhận xét: Giữa thời gian truy cập website và số tiền chi tiêu có mối liên hệ tương quan
tuyến tính thuận chiều, thời gian truy cập website càng nhiều thì số tiền chi tiêu càng cao.
5. Mối liên hệ giữa số trang ã xem trên website và số tiền ã chi tiêu
5.1. Biểu ồ thể hiện mối liên hệ giữa số trang ã xem trên website và số tiền chi mua hàng
Hệ số tương quan r = 0.7236 lOMoARcPSD| 41967345
Nhận xét: Thông qua ồ thị tán xạ và hệ số tương quan r = 0.7236, ta nhận thấy có một
mối liên hệ tương quan tuyến tính mạnh giữa số trang ã xem trên website và số tiền chi
mua hàng, tức là số lượng trang của website ược xem càng nhiều thì số lượng tiền khách
hàng ã chi tiêu ể mua hàng của công ty càng lớn.
6. Sự liên hệ giữa thời gian truy cập website với số trang ã xem
6.1. Biểu ồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang ã xem
Hệ số tương quan mẫu r = 0.5956 Nhận xét:
Qua ồ thị tán xạ và hệ số tương quan tuyến tính mẫu r, ta thấy có 1 mối liên hệ tuyến
tính thuận chiều giữa thời gian truy cập website và số trang ã xem, khách hàng xem càng
nhiều trang thì thời gian truy cập website càng nhiều. Tình huống 2:
Công ty sản xuất ồ chơi trẻ em Specialty Toys Bài làm
1.Đồ thị phân phối
Với doanh số kỳ vọng là : 𝜇𝑜 = 200000 sản phẩm Từ giả thiết ta có : 11 lOMoARcPSD| 41967345
1 – α = 0.95 => α =0.05 =>Zα/2 = 1.96
Mặt khác, nhu cầu 10000 <= 𝜇<= 30000.
Đồ th ị phân ph ố i nhu c ầ u mua hàng
Ta có P(xbar - Zα/2 . 𝜎xbar <= 𝜇<= xbar + Zα/2 . 𝜎xbar ) = 1 – α = 0.95
P(10000 <= 𝜇<= 30000) = 1 – α = 0.95
Xbar - Zα/2 .𝜎xbar = 10000
Xbar + Zα/2 .𝜎xbar =30000 2xbar = 40000 2.Zα/2 . 𝜎xbar =20000 => Xbar =20000 𝜎xbar = 5102
Vậy giá trị TB và ộ lệch chuẩn của phân phối lần lượt là: Xbar=20000; 𝜎xbar = 5102
2. Xác suất hết hàng ối với các phương án ặt hàng ược ề ra
Phương án 1 : 15000 sản phẩm P( X>= 15000) = P ( 𝑋− 𝜇 𝑂
>= 15000− 𝜇 𝑂 ) = P( Z >= -0.98) = 𝜎xbar 𝜎xbar
= P(Z> 0) + P( -0.98 <= Z <0)
= P(Z> 0) + P( 0 < Z <= 0.98) = 0.5 + 0.3365 lOMoARcPSD| 41967345 =0.8365
Vậy xác suất hết hàng ối với trường hợp ặt 15000 sản phẩm là 0.8365.
Phương án 2 : 18000 sản phẩm P( X>= 18000) = P ( 𝑋− 𝜇 𝑂
>= 18000− 𝜇 𝑂 ) = P( Z >= -0.39) 𝜎xbar 𝜎xbar
= P(Z> 0) + P( -0.392 <= Z <0)
= P(Z> 0) + P( 0 < Z <= 0.39) = 0.5 + 0.1517 = 0.6517
Vậy với phương án ặt mua 18000 sản phẩm, xác xuất bán hết hàng là 0.6517
Phương án 3 : 24000 sản phẩm P( X>= 24000) = P ( 𝑋− 𝜇 𝑂
>= 24000− 𝜇 𝑂 ) = P( Z >= 0.78) 𝜎xbar 𝜎xbar
= P(Z> 0) - P( 0 = 0.5 – 0.2823 = 0.2177
Xác suất bán hết 24000 sản phẩm là 0.2177
Phương án 4 : 28000 sản phẩm P( X>= 28000) = P ( 𝑋− 𝜇 𝑂
>= 28000− 𝜇 𝑂 ) = P( Z >= 1.57) 𝜎xbar 𝜎xbar
= P(Z> 0) - P( 0 = 0.5 – 0.4418 = 0.0582
Xác suất bán hết 28000 sản phẩm là 0.0582
3. Lơi nhuận kì vọng
3.1. Giả ịnh bán ược 10000 sản phẩm Tổng tiền Tổng tiền Tổng tiền Lợi nhuận bán ược ầu tư mua Mua bán ược giá ($) giá 5$($) sản phẩm (sảnphẩm) 24$ ($) giá 16$ ($) 15000 240000 25000 240000 -25000 13 lOMoARcPSD| 41967345 18000 240000 40000 288000 -8000 24000 240000 70000 384000 -74000 28000 240000 90000 448000 -118000
3.2. Giả ịnh bán ược 20000 sản phẩm Mua
Tổng tiền bán Tổng tiền bán Tổng tiền ầu Lợi nhuận giá 24$ ($) giá 5$ ($) (sản phẩm) tư giá 16$ ($) ($) 15000 360000 0 240000 120000 18000 432000 0 288000 144000 24000 480000 20000 384000 116000 28000 480000 40000 448000 72000
3.3. Giả ịnh bán ược 30000 sản phẩm Mua Tổng tiền bán
Tổng tiền bán Tổng tiền ầu tư Lợi nhuận giá 24$ ($) giá 5$ ($) giá 16$ ($) (sản phẩm) ($) 15000 360000 0 240000 120000 18000 432000 0 288000 144000 24000 576000 0 384000 192000 28000 672000 0 448000 224000
Vậy lợi nhuận kì vọng khi ặt mua: • 15000 sản phẩm là
(-25000+120000+120000).P(X>15000)=179740($)
• 18000 sản phẩm là (-8000+144000+144000).P(X>18000)=182476($) • 24000 sản phẩm là
(-74000+192000+116000).P(X>240000)=51480($) • 30000 sản phẩm là
(-118000+72000+224000).P(X>28000)=10324($)
4. Lợi nhuận dự kiến
Gọi số lượng hàng cần ặt mua là S( sản phẩm ). Vì lượng hàng cần ặt phải áp ứng 70%
nhu cầu người mua và chỉ nên 30% hết hàng.
Tương tự những phần tính xác suất hết hàng ta có: lOMoARcPSD| 41967345 P( X>=S) = 0.3
P(𝑋− 𝜇 𝑂>= 𝑆− 𝜇 𝑂 ) =0.3 𝜎xbar 𝜎xbar P ( Z>= Z’) =0.3
Với S >𝜇𝑜 = 20000 => Z’ > 0.
P ( Z>= Z’) = P( Z>0) – P( 0< Z<= Z’) =0.3
0.5 - P( 0< Z<= Z’) = 0.3
P( 0< Z<= Z’) = 0.2 Z’ = 0.0793
𝑆− 𝜇 𝑂 = 0.0793 𝜎xbar S = 20404.5886
Hay lượng hàng ta cần ặt mua là 20404 sản phẩm.
Lợi nhuận dự kiến thu ược là: phương doanh hàng tồn doanh thu kì tiền bán hàng số tiền mua lợi nhuận án (x1) số (x2) kho (x3)
giáng sinh (x4) tồn kho (x5) hàng (x6) ( x7) X3= x1-x2 X4 =x2 *24 $ X5= x3 * 5$ X6= x1*16$ X7= x4+x5 –x6 20405 10000 10405 489720 52025 326480 215265 20405 20000 405 489720 2025 326480 165265 20405 30000 -9595 489720 -47975 326480 115265
Vậy lợi nhuận dự kiến theo 3 phương án lần lượt là: 215265;165265; 115265. 5. Khuyến nghị
Trước khi ặt hàng ta cần tính toán kỹ xem mức tổn thất hay lợi nhuận nhận dược là bao
nhiêu ể có thể ưa ra con số gây ít tổn thất nhất.
Nên ặt mua số lượng là 18000sản phẩm .Dự báo lợi nhuận là 182476($) Vì P(X>18000)=0,652
Lợi nhuận kì vọng là lớn nhất trong 4 trường hợp ặt mua hàng là 182476($) 15 lOMoARcPSD| 41967345 Tình huống 3:
Công ty nghiên cứu thị trường Metropolitan Research (Chapter 8, Auto)
1) Phân tích thông kê mô tả Column1 Column2 Descriptive statistics Miles Count 50 Mean 73,340.30 sample variance 619,946,014.05 sample standard deviation 24,898.72 Minimum 25066 Maximum 138114 Range 113048 Sum 3,667,015.00 sum of squares 299,317,334,893.00 deviation sum of squares (SSX) 30,377,354,688.50 Skewness 0.26 Kurtosis 0.17 coefficient of variation (CV) 33.95% 1st quartile 60,421.00 Median 72,705.00 3rd quartile 86,575.00 interquartile range 26,154.00 Mode #N/A lOMoARcPSD| 41967345
• Trung bình mẫu: mean = 73 340.30 • Cỡ mẫu: n = 50
• Phương sai: S^2 = 619 946 014.05
• Độ lệch chuẩn: s = 24 898.72 • Tổng = 3 667 015 • Trung vị: Me = 72 705 Biểu ồ hộp và râu: BoxPlot 0
20000 40000 60000 80000 100000120000140000160000180000 Miles
2) Ước lượng trung bình khoảng n=50;
s=24898.72; ͞x =73340.30; 1-α=0.95; Giả sử X là số
dặm lái ược ến khi bộ truyền ộng bị lỗi.
1-α = 0.95 => α=0.05 => α/2=0.025 => Zα/2= Z0.025=1.96
N=50>30 nên mẫu có phân phối xấp xỉ phân phối bình thường,
e = Zα/2*s/√n = 1.96*24898.72/√50 = 6901.57 L = ͞x –e =
73340.30 – 6901.57 = 66438.73
U= ͞x +e = 73340.30 + 6901.57 = 80241.87
Khoảng ước lượng cho µ là: L ≤ µ ≤ U
Vậy với ộ tin cậy 95%, số dặm trung bình tổng thể lái ược ến khi bộ truyền ộng bị lỗi
ược ước lượng trong khoảng từ 66438.73 miles ến 80241.87 miles.Vì giá trị 73340.30
thuộc khoảng ước lượng này nên ta có thể khẳng ịnh bộ truyền ộng hoạt ộng bình thường.
3) Thảo luận hàm ý Từ bảng thống kê ta thấy: 17