lOMoARcPSD| 61184739
SELF STUDY PROBLEM
1󰊯 High-Low Method / Phương pháp Cao-Thp
ớc 1: Xác định mức cao nhất và thấp nhất của số lần giao hàng:
Cao nhất: 7,433 deliveries (December)
Thấp nhất: 5,166 deliveries (March)
ớc 2: Xác định chi phí tương ng:
Cao nhất: $201,783 (December)
Thấp nhất: $123,245 (March)
ớc 3: Tính biến phí đơn vị (Variable cost per delivery):slope
= (Chi phí cao – Chi phí thấp) / (Số giao hàng cao – Số giao hàng thấp)
= (201,783 – 123,245) / (7,433 – 5,166)
= 78,538 / 2,267 ≈ $34.65 per delivery
ớc 4: Tính chi phí cố định (Fixed cost):
Sử dụng dliệu tháng cao hoặc thấp đều được, ví dụ dùng tháng December:
Total cost = (Variable cost per unit × Number of deliveries) + Fixed cost
201,783 = (34.65 × 7,433) + Fixed cost
201,783 = 257,624 + Fixed cost
Fixed cost ≈ 201,783 – 257,624 ≈ –$55,841 (Âm do chi phí trên mỗi delivery cao làm tổng vượt)
👉 Kết quả:
Variable cost per delivery: $34.65
Fixed cost: –$55,841 (âm nghĩa là chi phí thực tế biến đổi gần như chiếm hết)
2󰊯 Regression Analysis / Phân tích hồi quy
So sánh 2 mô hình:
Chỉ tiêu
Regression 1 (labor-hours only)
Regression 2 (labor + machine)
R-squared
0.65
0.58
Standard error
12,554
13,793
Standard error (%)
12%
14%
lOMoARcPSD| 61184739
Labor-hours t-value
4.5 (significant)
3.8 (significant)
Machine-hours t-value
-
1.4 (not significant)
👉 Nhn xét:
Regression 1 có R² cao hơn (0.65 > 0.58) → giải thích tốt hơn.
Standard error thấp hơn (12,554 < 13,793) → chính xác hơn.
Labor-hours có t-value cao (4.5), chứng tỏ có ý nghĩa thống kê.
Trong Regression 2, machine-hours có t-value = 1.4 (không ý nghĩa), làm mô hình yếu hơn.
Kết luận: Regression 1 tốt hơn vì giải thích nhiều hơn (R² cao hơn), sai sthấp hơn, và
biến labor-hours có ý nghĩa thống kê mạnh hơn. Regression 2 thêm biến machine-hours
nhưng không cải thiện mô hình.
Tóm tắt nhanh:
1󰊯 High-Low: Variable cost ≈ $34.65/delivery; Fixed cost ≈ –$55,841.
2󰊯 Regression: Regression 1 tốt hơn vì R² cao hơn (0.65 vs. 0.58), sai sthp hơn, và labor-hours có
ý nghĩa.
Vâng! Bây giờ mình đã hiểu rõ yêu cầu của bạn: không dùng mã lệnh, không nói đến code, mà
viết lại toàn bộ bài làm với các phép tính thủ công đầy đ như học sinh/sinh viên trình bày trong
vở hoặc bài kiểm tra.
ới đây là toàn bộ bài làm được viết lại đúng theo yêu cầu:
PHÂN TÍCH VÀ ƯỚC LƯỢNG SẢN PHẨM LI – JOHN MEEKS COMPANY
Sure! Here’s the translation for the High-Low Method and Regression Analysis:
I. High-Low Method
1. Identify the highest and lowest activity points based on production units
Highest point: October 2010
Units Produced = 101,000
Defective Units = 2,787
Lowest point: January 2009
Units Produced = 55,000
lOMoARcPSD| 61184739
Defective Units = 856
2. Calculate the variable cost per unit (slope)
Difference in defective units = 2,787 – 856 = 1,931 defective units
Difference in units produced = 101,000 – 55,000 = 46,000 units
Variable cost per unit = 1,931 / 46 = 42 defective units per 1,000 units produced
3. Calculate fixed cost (Intercept)
Apply the formula:
Total defective units = (Variable cost per unit × Units Produced) + Fixed cost
Using the high point (October 2010):
2,787 = (42 × 101) + Intercept
2,787 = 4,242 + Intercept
Intercept = 2,787 – 4,242 = –1,455
High-Low equation:
Defective Units = 42 × Units Produced – 1,455
II. Regression Analysis
1. Identify the variables
Independent variable: Units Produced
Dependent variable: Defective Units
2. Apply the simple linear regression formula Defective Units = a + b × (Units Produced)
Where:
b (slope) is calculated using:
b = (n∑XY – ∑X∑Y) / (n∑X² – (∑X)²)
a (intercept) is calculated using:
a = (∑Y – b∑X) / n
(The sums of X, Y, XY, and X² are obtained from an Excel summary of 24 months.)
After calculations, we get:
b = 28.54 a = –346.91
Regression equation:
Defective Units = 28.54 × Units Produced – 346.91
III. Comparison of the two methods
Criteria
Linear Regression
lOMoARcPSD| 61184739
Data used
All 24 data points
Accuracy
Higher, stable, uses all data
Resulting equation
28.54 × Units Produced – 346.91
IV. Conclusion
The linear regression method is the optimal choice because it uses all the data to provide more
accurate estimates, less influenced by outliers. Therefore, the company should use the regression
model to predict defective units in the upcoming months.
Would you like me to continue and help you forecast the number of defects for future months if the
production volume is known?
ới đây là cách trình bày lại các phép tính mà không sử dụng mã lệnh, giúp bạn có thể sao chép
trực tiếp:
Bài 8-29: Maribeth’s Cafe – Ước tính Chi phí Trung bình (Average Cost Estimation) D
liu:
500 đơn vị → Chi phí trung bình = $0.55 → Tổng chi phí = 500 × $0.55 = $275
600 đơn vị → Chi phí trung bình = $0.50 → Tổng chi phí = 600 × $0.50 = $300
Vì hàm chi phí là tuyến tính, có thể viết dưới dạng:
Tổng chi phí = F + V × Q Trong đó:
F: Chi phí cố định
lOMoARcPSD| 61184739
V: Chi phí biến đổi mỗi đơn vị
Q: Sng đơn vị
ớc 1: Sử dụng hai điểm dữ liệu đgiải quyết V (Chi phí biến đi mỗi đơn vị):
300 - 275 = V × (600 - 500)
25 = 100V
V = 0.25
ớc 2: Thay giá trị V vào một trong các điểm dữ liệu để tìm F (Chi phí cố định):
275 = F + 0.25 × 500
275 = F + 125
F = 150
Hàm chi phí:
Tổng chi phí = 150 + 0.25Q
ớc 3: Tính chi phí trung bình cho 560 đơn vị:
Tổng chi phí = 150 + 0.25 × 560 = 150 + 140 = 290
Chi phí trung bình = 290 / 560 ≈ $0.52 (làm tròn đến hai chữ sthập phân)
Bài 8-32: Horton Manufacturing – Phương pháp High-Low & MAPE Bước
1: Xác định điểm cao và thp:
Điểm cao: 1,880 giờ → $3,005
Điểm thấp: 1,405 giờ → $2,890
ớc 2: Tính chi phí biến đổi mỗi giờ máy (V):
V = (3,005 - 2,890) / (1,880 - 1,405)
V = 115 / 475 ≈ 0.2421
lOMoARcPSD| 61184739
ớc 3: Tính chi phí cố định (F):
Sử dụng điểm thấp (1,405 giờ và $2,890):
2,890 = F + 0.2421 × 1,405
F = 2,890 - 340.2
F ≈ 2,549.8
Hàm chi phí:
Chi phí ước tính = 2,549.80 + 0.2421 × Giờ máy
ớc 4: Tính MAPE (Mean Absolute Percentage Error):
MAPE được tính theo công thức:
MAPE = (1/n) × Σ |(Thực tế - Dự báo) / Thực tế| × 100
Các dự báo chi phí cho mỗi tháng sđược tính sử dụng hàm chi phí đã tìm được, và sau đó tính
MAPE.
Kết quả MAPE là 6.39%.
ới đây là bản viết lại toàn bộ bài giải 8-36 bằng ngôn ngữ tự nhiên, không dùng ký hiệu công
thc đặc biệt, đ bạn dễ sao chép và sử dụng:
Bài 8-36 – Interpreting Regression Results
Thông tin từ đề bài:
Jamison Construction sử dụng phân tích hồi quy (regression analysis) để ước lượng tổng chi phí nằm
vin của bệnh nhân, với công thức hồi quy như sau:
Tổng chi phí = Hằng số + a × số ngày nằm viện + b × biến chứng (1 nếu có, 0 nếu không) + c ×
nội soi (1 nếu có, 0 nếu không)
Kết quả nghiên cứu (trên 57 bệnh nhân):
R-squared: 53%
Hằng số (constant): 3,719 đô
lOMoARcPSD| 61184739
Các hệ số (coefficients) và giá trị t:
Biến
Hệ số (coefficient)
t-value
Length of stay
861
10.76
Complication
1,986
4.89
Laparoscope
908
2.54
Câu hỏi 1:
Tính tổng chi phí ước tính cho mt bệnh nhân:
Có biến chứng
Ở lại bệnh viện 2 ngày
Có sử dụng nội soi
Giải:
Tổng chi phí = 3,719 + (861 × 2) + (1,986 × 1) + (908 × 1)
Tổng chi phí = 3,719 + 1,722 + 1,986 + 908
Tổng chi phí = 8,335 đô
Câu hỏi 2: Dummy variables là gì và có biến nào là dummy?
Dummy variables là các biến định tính được mã hóa thành số 0 hoặc 1.
Trong mô hình này, có 2 dummy variables:
Complication: bằng 1 nếu có biến chứng, 0 nếu không
Laparoscope: bằng 1 nếu có dùng nội soi, 0 nếu không
Câu hỏi 3: Đánh giá mô hình qua R-squared và t-value
R-squared = 53% → mô hình giải thích được 53% biến đng chi phí giữa các bệnh nhân. Đây
là mức chấp nhận được trong lĩnh vực chăm sóc sức khỏe.
t-value cho mỗi biến:
Length of stay: t = 10.76 → rất có ý nghĩa thống kê
Complication: t = 4.89 → có ý nghĩa thống kê cao
lOMoARcPSD| 61184739
Laparoscope: t = 2.54 → vẫn có ý nghĩa thống kê, nhưng yếu hơn
Kết luận: Mô hình này có ý nghĩa thống kê tương đối tốt. Biến "số ngày nằm viện" là yếu tảnh
ởng mạnh nhất đến tng chi phí, tiếp theo là biến chứng và việc dùng nội soi.
Nếu bạn muốn mình tạo bản PDF sạch đẹp của bài giải này để học offline, mình có thể gửi ngay cho
bạn!
Bài 8-38: Albedo Inc. – Phương pháp High-Low Dữ
liệu cao nhất:
Chi phí = $5,175 (tháng 3), Giờ = 4,050
Dữ liệu thấp nht:
Chi phí = $2,900 (tháng 7), Giờ = 2,300
Hy vọng bài trình bày này đã giúp bạn dễ dàng sao chép và áp dụng vào bài làm của mình!
👉 Kết quả phương trình chi phí bảo trì:
(Tổng chi phí bảo trì = −90 + 1.30 × số giờ máy)
8-39 Cost Estimation, High-Low Method
1. Using the high-low cost estimation technique, determine the cost of painting a 3,300-
square-foot house with 14 openings. Also determine the cost for a 2,400-square-foot house
with 8 openings.
First, let's use the high-low method to calculate the cost function for painting a house. We need to find
the variable cost per unit (square feet or openings) and the fixed cost.
Step 1: Identify the highest and lowest levels of activity (square feet or openings).
lOMoARcPSD| 61184739
Highest level of activity: House 5 with 4,050 square feet and 19 openings, cost = $4,700.
Lowest level of activity: House 7 with 2,375 square feet and 11 openings, cost = $2,800.
Step 4: Calculate the costs for the two houses.
1. For a 3,300-square-foot house with 14 openings:
Cost=1.13×3,300+120.25=3,729+120.25=3,849.25\text{Cost} = 1.13 \times 3,300 + 120.25 =
3,729 + 120.25 = 3,849.25
2. For a 2,400-square-foot house with 8 openings:
Cost=1.13×2,400+120.25=2,712+120.25=2,832.25\text{Cost} = 1.13 \times 2,400 + 120.25 =
2,712 + 120.25 = 2,832.25
2. Plot the cost data against square feet and against openings. Which variable is a better
cost driver? Why?
You should plot the cost data against square feet and against openings to visually analyze the
relationship.
A better cost driver would be the one that shows a stronger, more linear correlation with the
cost. Typically, the number of openings is expected to have a stronger relationship with cost
due to the more labor-intensive painting involved with preparing and painting around windows
and doors.
8-40 Cost Estimation, Machine Replacement, Ethics
1. Use the High-Low method to determine the cost equations for each machine, and then
to determine if SpectroGlass’s output is expected to be 22,000 square yards, which machine
should it purchase? At 15,000 square yards? Is the High-Low method useful here? Why or why
not?
Machine A (High-Low Method):
lOMoARcPSD| 61184739
Highest level of activity: 24,000 square yards, total cost = $210,000.
Lowest level of activity: 4,000 square yards, total cost = $54,600.
Machine B (High-Low Method):
Highest level of activity: 24,000 square yards, total cost = $192,000.
Lowest level of activity: 4,000 square yards, total cost = $70,000.
Step 3: Determine the total costs for 22,000 and 15,000 square yards.
For 22,000 square yards:
Machine A: 7.77×22,000+23,520=170,940+23,520=194,460
Machine B: 6.10×22,000+45,600=134,200+45,600=179,800 ●
Conclusion: Machine B should be purchased for 22,000 square
yards.
For 15,000 square yards:
lOMoARcPSD| 61184739
Machine A: 7.77×15,000+23,520=116,550+23,520=140,070
Machine B: 6.10×15,000+45,600=91,500+45,600=137,100
Conclusion: Machine A should be purchased for 15,000 square yards.
Is the High-Low method useful here?
The High-Low method is useful for providing a simple cost estimation but may not be accurate for all
output levels. For example, at 22,000 square yards, the High-Low method suggests Machine B is
cheaper, but the estimates might not hold well at intermediate levels of output.
2. As a cost analyst at SpectroGlass, you have been assigned to complete requirement 1.
A production supervisor comes to you to say that the nature of the defect is really very difficult
to detect and that most customers will not notice it, so he questions replacing it. He suggests
that you modify your calculations to justify keeping the present machine to keep things the
way they are and save the company some money. What do you say?
As a cost analyst, your responsibility is to provide accurate and unbiased data to aid in decision-
making. It is important to emphasize that replacing the machine should be based on a rational
analysis of cost-effectiveness, including potential future costs of maintaining the current machine, the
long-term savings from the new machine, and the impact on product quality. Modifying calculations to
justify keeping the current machine would be unethical and not in the company's best interest.
3. Assume that machine A is manufactured in Germany and machine B is manufactured in
Canada. As a U.S.–based firm, what considerations are important to SpectroGlass, in addition
to those already mentioned in your answer to requirement 1?
In addition to cost considerations, SpectroGlass should consider:
Import tariffs and shipping costs: Machines from Germany (Machine A) may incur higher
import duties and shipping costs compared to those from Canada (Machine B).
Warranty and service availability: Machine A might have limited or slower service options
due to being overseas.
Currency fluctuations: The cost of Machine A may be subject to exchange rate fluctuations,
potentially increasing costs.
Regulatory compliance: Different countries have varying regulations, and compliance costs
may differ for machines from different regions.
8-47
Question 1: Which cost function should Pilot Shop adopt and why?
lOMoARcPSD| 61184739
You are given two regressions:
Regression 1 (DL – labor hours)
Regression 2 (NR – number of cartons)
Equation
SC = 804.3 + 15.68 × DL
SC = 642.9 + 3.92 × NR
R-squared
0.365
0.729 ← higher is better
Standard error
2.652
1.884 ← lower is better
t-value
1.89
3.46 ← higher is better
Recommendation:
Pilot Shop should choose Regression 2 (cartons shipped) because:
Higher R-squared (0.729) → explains more variability in cost
Lower standard error (1.884) → predictions will be closer to actuals
Higher t-value (3.46) → more statistically significant model
📘 Tiếng Việt:
Pilot Shop nên chn Regression 2 (dùng số thùng hàng) vì mô hình này:
Giải thích được tốt hơn (R² cao hơn)
Sai số dự đoán thấp hơn
Biến độc lập có ý nghĩa thống kê cao hơn
Question 2: Estimate total cost if 600 cartons will be shipped next week (NR = 600)
Use Regression 2 equation:
SC = 642.9 + 3.92 × NR
→ NR = 600
SC = 642.9 + (3.92 × 600)
= 642.9 + 2,352 = 2,994.9
Total estimated shipping cost = $2,994.90
📘 Tổng chi phí ước tính: $2,994.90 khi giao 600 đơn hàng.
lOMoARcPSD| 61184739
Question 3: Limitations of Regression 2 and how to address them
🔹 Limitation 1: Linear assumption
The model assumes a straight-line (linear) relationship between cost and cartons shipped.
In real life, there might be step costs or nonlinear effects.
Solution:
Try nonlinear regression, or test different cost behaviors at different volumes (e.g., <500 vs >1000
units).
🔹 Limitation 2: Only one cost driver
Regression 2 uses only the number of cartons shipped, but cost could also be influenced
by:
Distance
Weight
Shipping zone (domestic vs international)
Solution:
Use multiple regression analysis to include more variables.
🔹 Limitation 3: Global business variation
Since Pilot Shop serves customers worldwide, costs may vary significantly due to:
International shipping fees
Customs/duties
Currency fluctuations
Solution:
Segment the data by region or shipping type (domestic vs international) and build separate
models.
🧠 Summary in English and Vietnamese:
Issue Limitation Solution
lOMoARcPSD| 61184739
1. Linearity Real cost might not increase perfectly Test nonlinear models or use
assumption linearly step-cost logic
2. Single cost driver Other factors like distance and weight Use multiple regression with more
matter too variables
3. Global variability International costs differ greatly Build region-specific models or segment by
zone
📘 Tóm lại: mô hình hồi quy 2 là tốt nhất, nhưng vẫn cn cẩn thận với tính tuyến tính,
số biến quá ít, và sphức tạp toàn cầu trong logistics.
8-48
Question 1: Predict attendance for a specific performer
📌 Regression equation (based on given data):
Predicted Attendance =
= Intercept
3,445 × Prior Appearance (dummy: 1 if yes, 0 if no)
0.113 × Advertising Spending
0.00044 × CD Sales
898 × TV Appearances
1,233 × Other Public Performances
🎯 Given data:
Prior Appearance: Yes → dummy = 1
Advertising: $35,000
CD Sales: $10 million = 10,000,000
TV Appearances: 0
Other Public Performances: 6
lOMoARcPSD| 61184739
🧮 Now substitute into the equation:
Predicted Attendance =
= 1,224
(3,445 × 1)
(0.113 × 35,000)
(0.00044 × 10,000,000)
(898 × 0)
(1,233 × 6)
Now calculate step by step:
3,445 × 1 = 3,445
0.113 × 35,000 = 3,955
0.00044 × 10,000,000 = 4,400
898 × 0 = 0
1,233 × 6 = 7,398
Add everything up:
1,224 + 3,445 + 3,955 + 4,400 + 0 + 7,398 = 20,422
Final Answer: Predicted attendance = 20,422 people
📘 Tiếng Việt:
Dự báo sngười tham dự: 20,422 người, dựa trên các yếu tquảng cáo, số buổi biểu
diễn, CD đã bán, và lịch sử từng biểu diễn tại địa điểm.
Question 2: Evaluate precision and suggest improvements
🔹 R-squared = 0.88 → Excellent
88% of variation in attendance is explained by the model → very strong.
lOMoARcPSD| 61184739
🔹 Standard error = 2,447
This means actual attendance may vary by ±2,447 around predictions — not bad, but could be better.
🔹 Look at t-values to judge variable usefulness:
Variable
t-value
Meaning
Prior appearance
4.11
Strong predictor
Advertising
1.88
Borderline – weak but maybe useful
CD sales
1.22
Not significant – could be removed
TV appearances
2.4
Useful
Public performances
3.7
Strong predictor
Suggestions:
1. Delete or reevaluate "CD Sales"
→ Low t-value = 1.22 → not statistically significant.
→ Possibly outdated or weak proxy for interest.
2. Keep "Advertising", but monitor it
→ t = 1.88 is borderline → may vary by artist or campaign.
3. Add variables?
Ticket price: Higher prices may reduce attendance.
Day of the week: Weekend vs. weekday shows.
Weather forecast (since it’s an outdoor venue).
Genre popularity trends (e.g., pop vs jazz)
lOMoARcPSD| 61184739
📘 Tiếng Việt:
Nên loi bỏ CD sales vì t quá thấp
Quảng cáo có thể giữ lại, nhưng cần kiểm tra thêm
Có thể thêm các yếu tố như giá vé, thời điểm trong tuần, thời tiết, hoc dòng nhạc
🧠 Summary:
Use current model (R² = 88%) but consider simplifying by dropping low t-value
variables.
Track more relevant and up-to-date predictors (like streaming stats or social media
following instead of CD sales).
Aim to improve prediction accuracy (lower standard error).
Bạn có muốn mình làm mẫu bảng Excel hồi quy với dliệu giả định tương tự để bạn luyện tập chạy
phân tích và đọc kết quả không?
8-50 Regression Analysis – United States Motors Inc. (USMI)
Phân tích hồi quy – Công ty United States Motors Inc. (USMI)
Thông tin đã cho:
Mô hình tài chính trung bình của đại lý bán xe:
Hạng mục
Số tiền
Doanh thu (Sales)
$30,000,000
Giá vốn hàng bán (COGS)
$24,750,000
Lợi nhuận gộp (Gross Profit)
$5,250,000
Chi phí vận hành (Operating Costs)
- Chi phí biến đổi (Variable expenses)
$862,500
lOMoARcPSD| 61184739
- Chi phí hỗn hợp (Mixed expenses)
$2,300,000
- Chi phí cố định (Fixed expenses)
$1,854,000
Lợi nhuận vận hành (Operating Income)
$233,500
Yêu cầu:
1. Tính lợi nhuận của đại lý bán xe nếu bán được 2,000 chiếc xe.
2. Giải thích các câu hỏi liên quan đến phân tích hồi quy đối với chi phí hỗn hợp.
3. Tính khoảng tin cậy 95% cho dự báo doanh thu bán xe.
4. Xác định vai trò chiến lược của phân tích hồi quy đối với USMI.
Giải bài toán:
1. Tính lợi nhuận của đại lý bán xe nếu bán được 2,000 chiếc xe.
Để tính lợi nhuận ca đại lý khi bán 2,000 chiếc xe, ta cần tính doanh thu, chi phí hàng bán, và chi
phí vận hành.
Doanh thu:
Mỗi chiếc xe bán được $30,000,000 / 1,500 = $20,000.
Nếu bán 2,000 chiếc xe, doanh thu = 2,000 × 20,000 = $40,000,000.
Giá vốn hàng bán (COGS):
Giá vốn mỗi chiếc xe = 24,750,000 / 1,500 = $16,500.
Nếu bán 2,000 chiếc xe, giá vốn hàng bán = 2,000 × 16,500 = $33,000,000.
Lợi nhuận gộp (Gross Profit):
Lợi nhuận gộp = Doanh thu - Giá vốn hàng bán = 40,000,000 - 33,000,000 = $7,000,000.
Chi phí vận hành:
Chi phí biến đổi: (862,500 / 1,500) × 2,000 = $1,150,000.
lOMoARcPSD| 61184739
Chi phí hỗn hợp: 2,300,000 (90% là biến đổi, nên chi phí hỗn hợp biến đổi = 2,300,000 × 0.9
= $2,070,000).
Chi phí cố định: Không thay đổi, vẫn là $1,854,000.
Tổng chi phí vận hành:
Tổng chi phí = Chi phí biến đổi + Chi phí hỗn hợp biến đổi + Chi phí cố định =
1,150,000 + 2,070,000 + 1,854,000 = $5,074,000.
Lợi nhuận vận hành:
Lợi nhuận vận hành = Lợi nhuận gp - Tổng chi phí vận hành =
7,000,000 - 5,074,000 = $1,926,000.
2. Phân tích hồi quy và các câu hỏi liên quan:
a. Định nghĩa về phạm vi liên quan (Relevant Range):
Phạm vi liên quan là khoảng giá trị của một yếu tố đầu vào (như sản lượng hoặc doanh thu) trong
đó các giả định của mô hình phân tích vẫn có hiệu lực. Ví dụ, trong trường hợp này, phạm vi liên
quan có thể là số ợng xe được bán từ 1,500 đến 2,500 chiếc, vì các chi phí và mối quan hệ gia
chúng có thể thay đổi khi sợng vượt ra ngoài phạm vi này.
b. Ý nghĩa của giá trị R-squared là 0.60 trong phân tích hồi quy của USMI:
Giá trị R-squared (hệ số xác định) cho biết mức độ phù hợp ca mô hình hồi quy với dữ liu thực tế.
Nếu R-squared = 0.60, điều này có nghĩa là 60% biến động trong chi phí hn hợp có thể được giải
thích bởi sự thay đổi trong các yếu tố đầu vào (như sản lượng). Mô hình này có thể giúp dự đoán chi
phí hỗn hợp nhưng vẫn có 40% sự biến động chưa được giải thích.
c. Các giới hạn khi áp dụng các mối quan hệ dựa trên mô hình tổng hợp cho các đại lý mới:
Các đại lý mới có thể có đặc thù về chi phí vận hành khác so với các đại lý trung bình (ví dụ:
vị trí địa lý, quy mô, mức độ hiệu quả của quy trình làm việc).
Mối quan hệ giữa chi phí và sản lượng có thể không hoàn toàn chính xác cho mỗi đại lý mới
nếu họ không hoạt động trong phạm vi tương tự.
Mô hình này chỉ có thể áp dụng chính xác trong phạm vi liên quan đã được xác định và
không nên dùng cho các tình huống ngoại lệ.
d. Định nghĩa về sai số chuẩn của ưc tính (Standard Error of the Estimate):
Sai số chuẩn của ước tính là độ lệch chun của các sai số dự đoán trong mô hình hồi quy. Nó cho
biết mức độ chính xác của dự đoán so với dữ liệu thực tế. Sai số chuẩn càng nh, dự đoán càng
chính xác.
lOMoARcPSD| 61184739
3. Tính khoảng tin cậy 95% cho dự báo doanh thu.
R-squared = 0.60 (60% sự biến động được giải thích bởi mô hình).
Sai số chuẩn (Standard error of estimate) = 4,500,000.
Dự báo doanh thu = 28,500,000.
Khoảng tin cậy 95% cho dự báo được tính bằng công thức:
4. Vai trò chiến lược ca phân tích hồi quy đối với USMI:
Phân tích hồi quy giúp USMI:
Dự báo các chi phí hn hp dựa trên dữ liệu thực tế, giúp đưa ra các quyết định kinh doanh
chính xác hơn.
Xác định mối quan hệ giữa chi phí và các yếu tố sản xuất như số ợng xe bán ra, từ đó ti
ưu hóa chiến lược sản xuất và phân phối.
Đánh giá rủi ro khi mở rộng mạng lưới đại lý mới, dự báo chi phí vận hành, và đưa ra các
quyết định tài chính phù hp.
Đáp án cuối cùng:
1. Lợi nhuận khi bán 2,000 xe là $1,926,000.
2. Giải thích về phạm vi liên quan, R-squaredgii hạn của mô hình tổng hợp đã đưc
đưa ra.
3. Khoảng tin cậy 95% cho dự báo doanh thu là [19,680,000, 37,320,000].
4. Vai trò chiến lược của phân tích hồi quy là dự báo chi phí, tối ưu hóa sản xuất và đánh giá
rủi ro.

Preview text:

lOMoAR cPSD| 61184739 SELF STUDY PROBLEM
1 High-Low Method / Phương pháp Cao-Thấp
Bước 1: Xác định mức cao nhất và thấp nhất của số lần giao hàng:
● Cao nhất: 7,433 deliveries (December)
● Thấp nhất: 5,166 deliveries (March)
Bước 2: Xác định chi phí tương ứng:
● Cao nhất: $201,783 (December)
● Thấp nhất: $123,245 (March)
Bước 3: Tính biến phí đơn vị (Variable cost per delivery):slope
= (Chi phí cao – Chi phí thấp) / (Số giao hàng cao – Số giao hàng thấp)
= (201,783 – 123,245) / (7,433 – 5,166)
= 78,538 / 2,267 ≈ $34.65 per delivery
Bước 4: Tính chi phí cố định (Fixed cost):
Sử dụng dữ liệu tháng cao hoặc thấp đều được, ví dụ dùng tháng December:
Total cost = (Variable cost per unit × Number of deliveries) + Fixed cost
201,783 = (34.65 × 7,433) + Fixed cost
201,783 = 257,624 + Fixed cost
Fixed cost ≈ 201,783 – 257,624 ≈ –$55,841 (Âm do chi phí trên mỗi delivery cao làm tổng vượt) 👉 Kết quả:
● Variable cost per delivery: $34.65
● Fixed cost: –$55,841 (âm nghĩa là chi phí thực tế biến đổi gần như chiếm hết)
2 Regression Analysis / Phân tích hồi quy So sánh 2 mô hình: Chỉ tiêu
Regression 1 (labor-hours only)
Regression 2 (labor + machine) R-squared 0.65 0.58 Standard error 12,554 13,793 Standard error (%) 12% 14% lOMoAR cPSD| 61184739 Labor-hours t-value 4.5 (significant) 3.8 (significant) Machine-hours t-value - 1.4 (not significant) 👉 Nhận xét:
● Regression 1 có R² cao hơn (0.65 > 0.58) → giải thích tốt hơn.
● Standard error thấp hơn (12,554 < 13,793) → chính xác hơn.
● Labor-hours có t-value cao (4.5), chứng tỏ có ý nghĩa thống kê.
● Trong Regression 2, machine-hours có t-value = 1.4 (không ý nghĩa), làm mô hình yếu hơn.
Kết luận: Regression 1 tốt hơn vì giải thích nhiều hơn (R² cao hơn), sai số thấp hơn, và
biến labor-hours có ý nghĩa thống kê mạnh hơn. Regression 2 thêm biến machine-hours
nhưng không cải thiện mô hình.
Tóm tắt nhanh:
1⃣ High-Low: Variable cost ≈ $34.65/delivery; Fixed cost ≈ –$55,841.
2⃣ Regression: Regression 1 tốt hơn vì R² cao hơn (0.65 vs. 0.58), sai số thấp hơn, và labor-hours có ý nghĩa.
Vâng! Bây giờ mình đã hiểu rõ yêu cầu của bạn: không dùng mã lệnh, không nói đến code, mà
viết lại toàn bộ bài làm với các phép tính thủ công đầy đủ như học sinh/sinh viên trình bày trong vở hoặc bài kiểm tra.
Dưới đây là toàn bộ bài làm được viết lại đúng theo yêu cầu:
PHÂN TÍCH VÀ ƯỚC LƯỢNG SẢN PHẨM LỖI – JOHN MEEKS COMPANY
Sure! Here’s the translation for the High-Low Method and Regression Analysis: I. High-Low Method
1. Identify the highest and lowest activity points based on production units
○ Highest point: October 2010 Units Produced = 101,000 Defective Units = 2,787
○ Lowest point: January 2009 Units Produced = 55,000 lOMoAR cPSD| 61184739 Defective Units = 856
2. Calculate the variable cost per unit (slope)
○ Difference in defective units = 2,787 – 856 = 1,931 defective units
○ Difference in units produced = 101,000 – 55,000 = 46,000 units
○ Variable cost per unit = 1,931 / 46 = 42 defective units per 1,000 units produced
3. Calculate fixed cost (Intercept) ○ Apply the formula:
Total defective units = (Variable cost per unit × Units Produced) + Fixed cost
○ Using the high point (October 2010):
2,787 = (42 × 101) + Intercept 2,787 = 4,242 + Intercept
⇒ Intercept = 2,787 – 4,242 = –1,455 ✅ High-Low equation:
Defective Units = 42 × Units Produced – 1,455
II. Regression Analysis
1. Identify the variables
○ Independent variable: Units Produced
○ Dependent variable: Defective Units
2. Apply the simple linear regression formula Defective Units = a + b × (Units Produced) Where:
b (slope) is calculated using:
b = (n∑XY – ∑X∑Y) / (n∑X² – (∑X)²)
a (intercept) is calculated using: a = (∑Y – b∑X) / n
(The sums of X, Y, XY, and X² are obtained from an Excel summary of 24 months.) After calculations, we get: b = 28.54 a = –346.91
Regression equation:
Defective Units = 28.54 × Units Produced – 346.91
III. Comparison of the two methods Criteria High-Low Method Linear Regression lOMoAR cPSD| 61184739 Data used 2 extreme points All 24 data points Accuracy Lower, sensitive to outliers Higher, stable, uses al data Resulting equation
42 × Units Produced – 1,455
28.54 × Units Produced – 346.91 IV. Conclusion
The linear regression method is the optimal choice because it uses all the data to provide more
accurate estimates, less influenced by outliers. Therefore, the company should use the regression
model to predict defective units in the upcoming months.
Would you like me to continue and help you forecast the number of defects for future months if the production volume is known?
Dưới đây là cách trình bày lại các phép tính mà không sử dụng mã lệnh, giúp bạn có thể sao chép trực tiếp:
Bài 8-29: Maribeth’s Cafe – Ước tính Chi phí Trung bình (Average Cost Estimation) Dữ liệu:
● 500 đơn vị → Chi phí trung bình = $0.55 → Tổng chi phí = 500 × $0.55 = $275
● 600 đơn vị → Chi phí trung bình = $0.50 → Tổng chi phí = 600 × $0.50 = $300
Vì hàm chi phí là tuyến tính, có thể viết dưới dạng:
Tổng chi phí = F + V × Q Trong đó:
F: Chi phí cố định lOMoAR cPSD| 61184739
V: Chi phí biến đổi mỗi đơn vị
Q: Số lượng đơn vị
Bước 1: Sử dụng hai điểm dữ liệu để giải quyết V (Chi phí biến đổi mỗi đơn vị):
● 300 - 275 = V × (600 - 500) ● 25 = 100V ● V = 0.25
Bước 2: Thay giá trị V vào một trong các điểm dữ liệu để tìm F (Chi phí cố định): ● 275 = F + 0.25 × 500 ● 275 = F + 125 ● F = 150 Hàm chi phí:
Tổng chi phí = 150 + 0.25Q
Bước 3: Tính chi phí trung bình cho 560 đơn vị:
● Tổng chi phí = 150 + 0.25 × 560 = 150 + 140 = 290
● Chi phí trung bình = 290 / 560 ≈ $0.52 (làm tròn đến hai chữ số thập phân)
Bài 8-32: Horton Manufacturing – Phương pháp High-Low & MAPE Bước
1: Xác định điểm cao và thấp:
● Điểm cao: 1,880 giờ → $3,005
● Điểm thấp: 1,405 giờ → $2,890
Bước 2: Tính chi phí biến đổi mỗi giờ máy (V):
● V = (3,005 - 2,890) / (1,880 - 1,405)
● V = 115 / 475 ≈ 0.2421 lOMoAR cPSD| 61184739
Bước 3: Tính chi phí cố định (F):
● Sử dụng điểm thấp (1,405 giờ và $2,890):
○ 2,890 = F + 0.2421 × 1,405 ○ F = 2,890 - 340.2 ○ F ≈ 2,549.8 Hàm chi phí:
Chi phí ước tính = 2,549.80 + 0.2421 × Giờ máy
Bước 4: Tính MAPE (Mean Absolute Percentage Error):
MAPE được tính theo công thức:
MAPE = (1/n) × Σ |(Thực tế - Dự báo) / Thực tế| × 100
Các dự báo chi phí cho mỗi tháng sẽ được tính sử dụng hàm chi phí đã tìm được, và sau đó tính MAPE.
Kết quả MAPE là 6.39%.
Dưới đây là bản viết lại toàn bộ bài giải 8-36 bằng ngôn ngữ tự nhiên, không dùng ký hiệu công
thức đặc biệt, để bạn dễ sao chép và sử dụng:
Bài 8-36 – Interpreting Regression Results
Thông tin từ đề bài:
Jamison Construction sử dụng phân tích hồi quy (regression analysis) để ước lượng tổng chi phí nằm
viện của bệnh nhân, với công thức hồi quy như sau:
Tổng chi phí = Hằng số + a × số ngày nằm viện + b × biến chứng (1 nếu có, 0 nếu không) + c ×
nội soi (1 nếu có, 0 nếu không)
Kết quả nghiên cứu (trên 57 bệnh nhân): ● R-squared: 53%
● Hằng số (constant): 3,719 đô lOMoAR cPSD| 61184739
● Các hệ số (coefficients) và giá trị t: Biến
Hệ số (coefficient) t-value Length of stay 861 10.76 Complication 1,986 4.89 Laparoscope 908 2.54 Câu hỏi 1:
Tính tổng chi phí ước tính cho một bệnh nhân: ● Có biến chứng
● Ở lại bệnh viện 2 ngày ● Có sử dụng nội soi Giải:
Tổng chi phí = 3,719 + (861 × 2) + (1,986 × 1) + (908 × 1)
Tổng chi phí = 3,719 + 1,722 + 1,986 + 908
Tổng chi phí = 8,335 đô
Câu hỏi 2: Dummy variables là gì và có biến nào là dummy?
Dummy variables là các biến định tính được mã hóa thành số 0 hoặc 1.
Trong mô hình này, có 2 dummy variables:
● Complication: bằng 1 nếu có biến chứng, 0 nếu không
● Laparoscope: bằng 1 nếu có dùng nội soi, 0 nếu không
Câu hỏi 3: Đánh giá mô hình qua R-squared và t-value
● R-squared = 53% → mô hình giải thích được 53% biến động chi phí giữa các bệnh nhân. Đây
là mức chấp nhận được trong lĩnh vực chăm sóc sức khỏe. ● t-value cho mỗi biến:
○ Length of stay: t = 10.76 → rất có ý nghĩa thống kê
○ Complication: t = 4.89 → có ý nghĩa thống kê cao lOMoAR cPSD| 61184739
○ Laparoscope: t = 2.54 → vẫn có ý nghĩa thống kê, nhưng yếu hơn
Kết luận: Mô hình này có ý nghĩa thống kê tương đối tốt. Biến "số ngày nằm viện" là yếu tố ảnh
hưởng mạnh nhất đến tổng chi phí, tiếp theo là biến chứng và việc dùng nội soi.
Nếu bạn muốn mình tạo bản PDF sạch đẹp của bài giải này để học offline, mình có thể gửi ngay cho bạn!
Bài 8-38: Albedo Inc. – Phương pháp High-Low Dữ liệu cao nhất:
● Chi phí = $5,175 (tháng 3), Giờ = 4,050
Dữ liệu thấp nhất:
● Chi phí = $2,900 (tháng 7), Giờ = 2,300
Hy vọng bài trình bày này đã giúp bạn dễ dàng sao chép và áp dụng vào bài làm của mình!
👉 Kết quả phương trình chi phí bảo trì:
(Tổng chi phí bảo trì = −90 + 1.30 × số giờ máy)
8-39 Cost Estimation, High-Low Method 1.
Using the high-low cost estimation technique, determine the cost of painting a 3,300-
square-foot house with 14 openings. Also determine the cost for a 2,400-square-foot house with 8 openings.
First, let's use the high-low method to calculate the cost function for painting a house. We need to find
the variable cost per unit (square feet or openings) and the fixed cost.
Step 1: Identify the highest and lowest levels of activity (square feet or openings). lOMoAR cPSD| 61184739
Highest level of activity: House 5 with 4,050 square feet and 19 openings, cost = $4,700.
Lowest level of activity: House 7 with 2,375 square feet and 11 openings, cost = $2,800.
Step 4: Calculate the costs for the two houses.
1. For a 3,300-square-foot house with 14 openings:
Cost=1.13×3,300+120.25=3,729+120.25=3,849.25\text{Cost} = 1.13 \times 3,300 + 120.25 = 3,729 + 120.25 = 3,849.25
2. For a 2,400-square-foot house with 8 openings:
Cost=1.13×2,400+120.25=2,712+120.25=2,832.25\text{Cost} = 1.13 \times 2,400 + 120.25 = 2,712 + 120.25 = 2,832.25 2.
Plot the cost data against square feet and against openings. Which variable is a better cost driver? Why?
● You should plot the cost data against square feet and against openings to visual y analyze the relationship.
● A better cost driver would be the one that shows a stronger, more linear correlation with the
cost. Typically, the number of openings is expected to have a stronger relationship with cost
due to the more labor-intensive painting involved with preparing and painting around windows and doors.
8-40 Cost Estimation, Machine Replacement, Ethics 1.
Use the High-Low method to determine the cost equations for each machine, and then
to determine if SpectroGlass’s output is expected to be 22,000 square yards, which machine
should it purchase? At 15,000 square yards? Is the High-Low method useful here? Why or why not?

Machine A (High-Low Method): lOMoAR cPSD| 61184739
Highest level of activity: 24,000 square yards, total cost = $210,000.
Lowest level of activity: 4,000 square yards, total cost = $54,600.
Machine B (High-Low Method):
Highest level of activity: 24,000 square yards, total cost = $192,000.
Lowest level of activity: 4,000 square yards, total cost = $70,000.
Step 3: Determine the total costs for 22,000 and 15,000 square yards.
For 22,000 square yards:
○ Machine A: 7.77×22,000+23,520=170,940+23,520=194,460
○ Machine B: 6.10×22,000+45,600=134,200+45,600=179,800 ●
Conclusion: Machine B should be purchased for 22,000 square yards.
For 15,000 square yards: lOMoAR cPSD| 61184739
○ Machine A: 7.77×15,000+23,520=116,550+23,520=140,070
○ Machine B: 6.10×15,000+45,600=91,500+45,600=137,100
Conclusion: Machine A should be purchased for 15,000 square yards.
Is the High-Low method useful here?
The High-Low method is useful for providing a simple cost estimation but may not be accurate for al
output levels. For example, at 22,000 square yards, the High-Low method suggests Machine B is
cheaper, but the estimates might not hold wel at intermediate levels of output. 2.
As a cost analyst at SpectroGlass, you have been assigned to complete requirement 1.
A production supervisor comes to you to say that the nature of the defect is really very difficult
to detect and that most customers will not notice it, so he questions replacing it. He suggests
that you modify your calculations to justify keeping the present machine to keep things the
way they are and save the company some money. What do you say?

As a cost analyst, your responsibility is to provide accurate and unbiased data to aid in decision-
making. It is important to emphasize that replacing the machine should be based on a rational
analysis of cost-effectiveness, including potential future costs of maintaining the current machine, the
long-term savings from the new machine, and the impact on product quality. Modifying calculations to
justify keeping the current machine would be unethical and not in the company's best interest. 3.
Assume that machine A is manufactured in Germany and machine B is manufactured in
Canada. As a U.S.–based firm, what considerations are important to SpectroGlass, in addition
to those already mentioned in your answer to requirement 1?

In addition to cost considerations, SpectroGlass should consider:
Import tariffs and shipping costs: Machines from Germany (Machine A) may incur higher
import duties and shipping costs compared to those from Canada (Machine B).
Warranty and service availability: Machine A might have limited or slower service options due to being overseas.
Currency fluctuations: The cost of Machine A may be subject to exchange rate fluctuations, potentially increasing costs.
Regulatory compliance: Different countries have varying regulations, and compliance costs
may differ for machines from different regions. 8-47
Question 1: Which cost function should Pilot Shop adopt and why? lOMoAR cPSD| 61184739
You are given two regressions:
Regression 1 (DL – labor hours)
Regression 2 (NR – number of cartons) Equation SC = 804.3 + 15.68 × DL SC = 642.9 + 3.92 × NR R-squared 0.365
0.729 ← higher is better Standard error 2.652
1.884 ← lower is better t-value 1.89
3.46 ← higher is better ✅ Recommendation:
Pilot Shop should choose Regression 2 (cartons shipped) because:
Higher R-squared (0.729) → explains more variability in cost
Lower standard error (1.884) → predictions will be closer to actuals
Higher t-value (3.46) → more statistically significant model 📘 Tiếng Việt:
Pilot Shop nên chọn Regression 2 (dùng số thùng hàng) vì mô hình này:
● Giải thích được tốt hơn (R² cao hơn)
● Sai số dự đoán thấp hơn
● Biến độc lập có ý nghĩa thống kê cao hơn
Question 2: Estimate total cost if 600 cartons will be shipped next week (NR = 600)
Use Regression 2 equation:
SC = 642.9 + 3.92 × NR → NR = 600
SC = 642.9 + (3.92 × 600)
= 642.9 + 2,352 = 2,994.9
Total estimated shipping cost = $2,994.90
📘 Tổng chi phí ước tính: $2,994.90 khi giao 600 đơn hàng. lOMoAR cPSD| 61184739
Question 3: Limitations of Regression 2 and how to address them
🔹 Limitation 1: Linear assumption
● The model assumes a straight-line (linear) relationship between cost and cartons shipped.
In real life, there might be step costs or nonlinear effects. Solution:
Try nonlinear regression, or test different cost behaviors at different volumes (e.g., <500 vs >1000 units).
🔹 Limitation 2: Only one cost driver
● Regression 2 uses only the number of cartons shipped, but cost could also be influenced by: ○ Distance ○ Weight
○ Shipping zone (domestic vs international) Solution:
Use multiple regression analysis to include more variables.
🔹 Limitation 3: Global business variation
● Since Pilot Shop serves customers worldwide, costs may vary significantly due to:
○ International shipping fees ○ Customs/duties ○ Currency fluctuations Solution:
Segment the data by region or shipping type (domestic vs international) and build separate models.
🧠 Summary in English and Vietnamese: Issue Limitation Solution lOMoAR cPSD| 61184739 1. Linearity
Real cost might not increase perfectly Test nonlinear models or use assumption linearly step-cost logic
2. Single cost driver Other factors like distance and weight Use multiple regression with more matter too variables 3. Global variability
International costs differ greatly Build region-specific models or segment by zone
📘 Tóm lại: mô hình hồi quy 2 là tốt nhất, nhưng vẫn cần cẩn thận với tính tuyến tính,
số biến quá ít, và sự phức tạp toàn cầu trong logistics. 8-48
Question 1: Predict attendance for a specific performer
📌 Regression equation (based on given data): Predicted Attendance = = Intercept
● 3,445 × Prior Appearance (dummy: 1 if yes, 0 if no)
● 0.113 × Advertising Spending ● 0.00044 × CD Sales ● 898 × TV Appearances
● 1,233 × Other Public Performances 🎯 Given data:
Prior Appearance: Yes → dummy = 1
Advertising: $35,000
CD Sales: $10 mil ion = 10,000,000 ● TV Appearances: 0
Other Public Performances: 6 lOMoAR cPSD| 61184739
🧮 Now substitute into the equation: Predicted Attendance = = 1,224 ● (3,445 × 1) ● (0.113 × 35,000) ● (0.00044 × 10,000,000) ● (898 × 0) ● (1,233 × 6) Now calculate step by step: ● 3,445 × 1 = 3,445 ● 0.113 × 35,000 = 3,955
● 0.00044 × 10,000,000 = 4,400 ● 898 × 0 = 0 ● 1,233 × 6 = 7,398 Add everything up:
1,224 + 3,445 + 3,955 + 4,400 + 0 + 7,398 = 20,422
Final Answer: Predicted attendance = 20,422 people 📘 Tiếng Việt:
Dự báo số người tham dự: 20,422 người, dựa trên các yếu tố quảng cáo, số buổi biểu
diễn, CD đã bán, và lịch sử từng biểu diễn tại địa điểm.
Question 2: Evaluate precision and suggest improvements
🔹 R-squared = 0.88 → Excellent
88% of variation in attendance is explained by the model → very strong. lOMoAR cPSD| 61184739
🔹 Standard error = 2,447
This means actual attendance may vary by ±2,447 around predictions — not bad, but could be better.
🔹 Look at t-values to judge variable usefulness: Variable t-value Meaning Prior appearance 4.11 ✅ Strong predictor Advertising 1.88
⚠ Borderline – weak but maybe useful CD sales 1.22
❌ Not significant – could be removed TV appearances 2.4 ✅ Useful Public performances 3.7 ✅ Strong predictor ✅ Suggestions:
1. Delete or reevaluate "CD Sales"
→ Low t-value = 1.22 → not statistically significant.
→ Possibly outdated or weak proxy for interest.
2. Keep "Advertising", but monitor it
→ t = 1.88 is borderline → may vary by artist or campaign. 3. Add variables?
Ticket price: Higher prices may reduce attendance.
Day of the week: Weekend vs. weekday shows.
Weather forecast (since it’s an outdoor venue).
Genre popularity trends (e.g., pop vs jazz) lOMoAR cPSD| 61184739 📘 Tiếng Việt:
● Nên loại bỏ CD sales vì t quá thấp
Quảng cáo có thể giữ lại, nhưng cần kiểm tra thêm
● Có thể thêm các yếu tố như giá vé, thời điểm trong tuần, thời tiết, hoặc dòng nhạc 🧠 Summary:
● Use current model (R² = 88%) but consider simplifying by dropping low t-value variables.
● Track more relevant and up-to-date predictors (like streaming stats or social media
following instead of CD sales).
● Aim to improve prediction accuracy (lower standard error).
Bạn có muốn mình làm mẫu bảng Excel hồi quy với dữ liệu giả định tương tự để bạn luyện tập chạy
phân tích và đọc kết quả không?
8-50 Regression Analysis – United States Motors Inc. (USMI)
Phân tích hồi quy – Công ty United States Motors Inc. (USMI) Thông tin đã cho:
Mô hình tài chính trung bình của đại lý bán xe: Hạng mục Số tiền Doanh thu (Sales) $30,000,000 Giá vốn hàng bán (COGS) $24,750,000
Lợi nhuận gộp (Gross Profit) $5,250,000
Chi phí vận hành (Operating Costs)
- Chi phí biến đổi (Variable expenses) $862,500 lOMoAR cPSD| 61184739
- Chi phí hỗn hợp (Mixed expenses) $2,300,000
- Chi phí cố định (Fixed expenses) $1,854,000
Lợi nhuận vận hành (Operating Income) $233,500 Yêu cầu:
1. Tính lợi nhuận của đại lý bán xe nếu bán được 2,000 chiếc xe.
2. Giải thích các câu hỏi liên quan đến phân tích hồi quy đối với chi phí hỗn hợp.
3. Tính khoảng tin cậy 95% cho dự báo doanh thu bán xe.
4. Xác định vai trò chiến lược của phân tích hồi quy đối với USMI. Giải bài toán:
1. Tính lợi nhuận của đại lý bán xe nếu bán được 2,000 chiếc xe.
Để tính lợi nhuận của đại lý khi bán 2,000 chiếc xe, ta cần tính doanh thu, chi phí hàng bán, và chi phí vận hành. Doanh thu:
● Mỗi chiếc xe bán được $30,000,000 / 1,500 = $20,000.
● Nếu bán 2,000 chiếc xe, doanh thu = 2,000 × 20,000 = $40,000,000.
Giá vốn hàng bán (COGS):
● Giá vốn mỗi chiếc xe = 24,750,000 / 1,500 = $16,500.
● Nếu bán 2,000 chiếc xe, giá vốn hàng bán = 2,000 × 16,500 = $33,000,000.
Lợi nhuận gộp (Gross Profit):
● Lợi nhuận gộp = Doanh thu - Giá vốn hàng bán = 40,000,000 - 33,000,000 = $7,000,000. Chi phí vận hành:
Chi phí biến đổi: (862,500 / 1,500) × 2,000 = $1,150,000. lOMoAR cPSD| 61184739
Chi phí hỗn hợp: 2,300,000 (90% là biến đổi, nên chi phí hỗn hợp biến đổi = 2,300,000 × 0.9 = $2,070,000).
Chi phí cố định: Không thay đổi, vẫn là $1,854,000.
Tổng chi phí vận hành:
Tổng chi phí = Chi phí biến đổi + Chi phí hỗn hợp biến đổi + Chi phí cố định =
1,150,000 + 2,070,000 + 1,854,000 = $5,074,000.
Lợi nhuận vận hành:
Lợi nhuận vận hành = Lợi nhuận gộp - Tổng chi phí vận hành =
7,000,000 - 5,074,000 = $1,926,000.
2. Phân tích hồi quy và các câu hỏi liên quan:
a. Định nghĩa về phạm vi liên quan (Relevant Range):
Phạm vi liên quan là khoảng giá trị của một yếu tố đầu vào (như sản lượng hoặc doanh thu) trong
đó các giả định của mô hình phân tích vẫn có hiệu lực. Ví dụ, trong trường hợp này, phạm vi liên
quan có thể là số lượng xe được bán từ 1,500 đến 2,500 chiếc, vì các chi phí và mối quan hệ giữa
chúng có thể thay đổi khi số lượng vượt ra ngoài phạm vi này.
b. Ý nghĩa của giá trị R-squared là 0.60 trong phân tích hồi quy của USMI:
Giá trị R-squared (hệ số xác định) cho biết mức độ phù hợp của mô hình hồi quy với dữ liệu thực tế.
Nếu R-squared = 0.60, điều này có nghĩa là 60% biến động trong chi phí hỗn hợp có thể được giải
thích bởi sự thay đổi trong các yếu tố đầu vào (như sản lượng). Mô hình này có thể giúp dự đoán chi
phí hỗn hợp nhưng vẫn có 40% sự biến động chưa được giải thích.
c. Các giới hạn khi áp dụng các mối quan hệ dựa trên mô hình tổng hợp cho các đại lý mới:
● Các đại lý mới có thể có đặc thù về chi phí vận hành khác so với các đại lý trung bình (ví dụ:
vị trí địa lý, quy mô, mức độ hiệu quả của quy trình làm việc).
● Mối quan hệ giữa chi phí và sản lượng có thể không hoàn toàn chính xác cho mỗi đại lý mới
nếu họ không hoạt động trong phạm vi tương tự.
● Mô hình này chỉ có thể áp dụng chính xác trong phạm vi liên quan đã được xác định và
không nên dùng cho các tình huống ngoại lệ.
d. Định nghĩa về sai số chuẩn của ước tính (Standard Error of the Estimate):
Sai số chuẩn của ước tính là độ lệch chuẩn của các sai số dự đoán trong mô hình hồi quy. Nó cho
biết mức độ chính xác của dự đoán so với dữ liệu thực tế. Sai số chuẩn càng nhỏ, dự đoán càng chính xác. lOMoAR cPSD| 61184739
3. Tính khoảng tin cậy 95% cho dự báo doanh thu.
R-squared = 0.60 (60% sự biến động được giải thích bởi mô hình).
Sai số chuẩn (Standard error of estimate) = 4,500,000.
Dự báo doanh thu = 28,500,000.
Khoảng tin cậy 95% cho dự báo được tính bằng công thức:
4. Vai trò chiến lược của phân tích hồi quy đối với USMI:
Phân tích hồi quy giúp USMI:
● Dự báo các chi phí hỗn hợp dựa trên dữ liệu thực tế, giúp đưa ra các quyết định kinh doanh chính xác hơn.
● Xác định mối quan hệ giữa chi phí và các yếu tố sản xuất như số lượng xe bán ra, từ đó tối
ưu hóa chiến lược sản xuất và phân phối.
● Đánh giá rủi ro khi mở rộng mạng lưới đại lý mới, dự báo chi phí vận hành, và đưa ra các
quyết định tài chính phù hợp.
Đáp án cuối cùng:
1. Lợi nhuận khi bán 2,000 xe là $1,926,000.
2. Giải thích về phạm vi liên quan, R-squaredgiới hạn của mô hình tổng hợp đã được đưa ra.
3. Khoảng tin cậy 95% cho dự báo doanh thu là [19,680,000, 37,320,000].
4. Vai trò chiến lược của phân tích hồi quy là dự báo chi phí, tối ưu hóa sản xuất và đánh giá rủi ro.