Phân tích D liu trong Kinh tế & Kinh doanh
Trnh Q. Long <longtq@hub.edu.vn>
11/2025
Ni dung
Đnh v Phân tích d liu trong kinh tế & kinh doanh trong
doanh nghip và các t chc.
Hiu mi quan h gia Phân tích d liu & Thng kê; vì sao cn c
hai.
Nm quy trình SOAR/DCOVA, ngun & cht lưng d liu, đo
đc d liu.
Tư duy phân tích d liu
Các vn đ cơ bn v thng kê
Khái nim cơ bn
Phân tích d liu là gì? Phân tích d liu (Data Analytics) là quá
trình kim tra, làm sch, biến đi và mô hình hóa d liu nhm:
Tìm kiếm thông tin hu ích (insights);
H tr ra quyết đnh trong kinh tế, tài chính, qun lý;
Chuyn d liu thành kiến thc hành đng đưc (actionable
intelligence).
Phân tích kinh doanh (Business Analytics) Là vic kết hp IT, thng
kê, mô hình toán và k năng qun tr đ:
Hiu rõ tình hình hot đng;
D đoán xu hưng;
Ti ưu hóa ra quyết đnh trong doanh nghip.
Mc tiêu ct lõi ca phân tích d liu
Phân tích d liu giúp nhà qun lý tr li ba nhóm câu hi:
What happened? Điu gì đã xy ra? (Mô t)
Why did it happen? Ti sao? (Gii thích, chn đoán)
What will / should happen? D báo và hành đng ti ưu (D
đoán Đ xut)
Vai trò ca phân tích d liu
PTDL cung cp mt khuôn kh đ hiu và din gii DL mt cách có ý
nghĩa, nhm
Quyết đnh thông minh: da trên d liu thc nghim thay vì gi đnh
hay trc giác Kết qu chính xác & đáng tin cy hơn.
Hiu s biến đng: Phân tích phân b DL xác đnh xu hưng và
bt thưng
Din gii DL: tóm tt các b DL ln thành các s liu d hiu như
trung bình, phn trăm, và tương quan, giúp d dàng rút ra kết lun.
Kh năng d đoán/d báo: Phát trin các mô hình có th d
đoán/d báo tương lai da trên DL lch s giúp lp kế hoch và
phân b ngun lc tt hơn.
Kim soát cht lưng: Các k thut TK giúp giám sát quy trình sn
xut, phát hin li và đm bo sn phm đáp ng tiêu chun cht
lưng.
K thut phân tích d liu
Loi phân tích Mc tiêu chính K thut đin hình
Mô t (Descrip-
tive)
Hiu điu đã xy ra Thng kê tóm tt, pivot ta-
ble, dashboard.
Chn đoán (Diag-
nostic)
Ti sao xy ra Drill-down, kim đnh t, F,
phân tích tương quan.
D đoán (Predic-
tive)
D đoán xu hưng Hi quy tuyến tính, Logistic,
chui thi gian, cây quyết
đnh.
Đ xut (Prescrip-
tive)
Ti ưu hành đng Ti ưu hóa (Linear Program-
ming), phân tích What-if.
Phân tích d liu: ng dng
Tài chính Kế toán: Phân tích ri ro, phát hin gian ln (Benfords
Law), d báo li nhun.
Marketing: Phân khúc khách hàng, d đoán hành vi tiêu dùng.
Nhân s: HR Analytics d đoán kh năng ngh vic.
Vn hành Logistics: Ti ưu hóa lch trình, tn kho.
Kinh tế và chính sách: Phân tích nhân qu, mô hình tăng trưng,
chui thi gian kinh tế vĩ mô.
ng dng: Kế toán
Ly mu thng kê: Chn mt mu ngu nhiên các giao dch đ xác
minh đ chính xác ca h sơ tài chính, giúp gim thi gian và chi phí
kim toán.
Ư c tính n xu: D liu v t l v n trong quá kh đưc s dng
đ ưc tính khon d phòng cho các khon phi thu khó đòi, giúp
các công ty qun lý ri ro tín dng.
Phân tích xu hưng: Các kế toán viên phân tích xu hưng doanh thu
và chi phí theo thi gian đ xác đnh các bt thưng hoc nhng khu
vc cn đưc chú ý.
ng dng: Tài chín h
Phân tích đu tư: NĐT s dng d liu giá c phiếu trong quá kh
và các t s tài chính (như t l P/E) đ đánh giá hiu sut ca c
phiếu và đưa ra các khuyến ngh mua/bán.
Đánh giá ri ro: D liu v biến đng th trưng và li nhun trong
quá kh đưc s dng đ tính toán ri ro liên quan đến các danh
mc đu tư khác nhau.
Đi chiếu hiu sut: D liu tài chính đưc so sánh vi các tiêu chun
ngành đ đánh giá hiu sut ca mt công ty so vi các đi th cùng
ngành.
ng dng: Marketing
Phân tích hành vi ngưi tiêu dùng: D liu t các h thng đim bán
hàng (POS) đưc phân tích đ hiu các mô hình và s thích mua
sm, các chiến dch tiếp th mc tiêu.
Kim tra A/B: S dng d liu t các th nghim A/B đ so sánh
hiu qu ca các chiến lưc qung cáo hoc cách sp xếp sn phm
khác nhau.
D báo doanh s: D liu trong quá kh đưc phân tích đ d đoán
xu hưng doanh s trong tương lai lp kế hoch tn kho và chiến
lưc marketing.
ng dng: Sn xut
Biu đ kim soát cht lưng: giám sát quy trình sn xut và phát
hin các thay đi có th gây ra vn đ cht lưng.
Ti ưu hóa quy trình: xác đnh các nút c chai và nhng đim không
hiu qu.
Lp kế hoch sn sut: D liu v tc đ sn xut và d báo nhu cu
xác đnh công sut ti ưu cn có nhm đáp ng nhu cu khách
hàng mà không sn xut dư tha.
ng dng: Kinh tế hc
D báo kinh tế: Các nhà kinh tế phân tích d liu v các ch s như
GDP, t l tht nghip và lm phát đ d đoán tình hình kinh tế
trong tương lai.
Phân tích tác đng chính sách: D liu đưc s dng đ đánh giá tác
đng ca các chính sách kinh tế (như thay đi thuế, tr cp) lên các
ngành khác nhau ca nn kinh tế.
Nghiên cu th trưng: Kho sát và thu thp d liu v tâm lý và thói
quen chi tiêu ca ngưi tiêu dùng giúp doanh nghip và chính ph
hiu rõ xu hưng kinh tế và hành vi tiêu dùng.
ng dng: Ví d
Sam: Qun lý bán hàng ca công ty nưc gii khát.
Thách thc: Đi th cnh tranh và sn phm mi t chính công ty
chiếm th phn.
Gii pháp: Thay đi công thc hương v đ ung da trên kho sát.
Alex: Nhà qun lý ti hãng hàng không ln.
Thách thc: Mt khách hàng vào đi th có cht lưng cao hơn.
Gii pháp: Ci thin ghế ngi, ba ăn, và dch v da trên kho sát.
Case Sam & Alex Bài hc phân tích đúng biến
Sam đi hương v doanh s gim vì khách trung thành coi trng
hương v cũ.
Alex nâng ghế/ba ăn khách vn ri vì lch bay & loyalty program
mi là driver.
Bài hc: tránh tunnel vision; đt câu hi đúng, chn biến đúng,
kim đnh gi thuyết.
Phân tích d liu vs. Thng kê
Thng kê
Thng kê là h thng các phương pháp thu thp, tng hp, trình bày và
phân tích s liu nhm phc v ra quyết đnh.
Thng kê là mt phn quan trng ca Phân tích d liu.
Thng kê (Statistics)
Ngành toán hc chuyên sâu
Trng tâm: Suy lun, tính bt
đnh
Công c: Kim đnh gi
thuyết, khong tin cy, hi quy
Câu hi: "Có ý nghĩa thng
kê không?"
Phân tích d liu (Data Analysis)
Lĩnh vc liên ngành rng
Trng tâm: Insights, d đoán,
ra quyết đnh
Công c: Thng kê + ML +
Programming + Visualization
Câu hi: "Nên làm gì tiếp
theo?"
Phân tích d liu
Thng kê
Machine Learning
Lp trình
Visualization
Kiến thc nn tng cn hc
Trong kinh tế và kinh doanh, thng kê giúp:
Tóm tt d liu (Descriptive Statistics);
Suy lun cho tng th (Inferential Statistics);
Phân tích mi quan h và d báo (Regression, Time Series).
Thng kê và Toán hc
Thng kê mô t: trung bình, đ lch chun, phân phi, biu đ.
Thng kê suy lun: ưc lưng, kim đnh gi thuyết, ANOVA.
Hi quy và tương quan: phân tích quan h gia các biến.
Các loi d liu và x lý d liu
D liu đnh tính đnh lưng, chui thi gian chéo.
K năng Data Wrangling: làm sch, x lý giá tr thiếu, chun hóa
biến.
Quy trình phân tích d liu: SOAR / DCOVA
SOAR = Specify (vn đ/câu hi) Obtain (d liu/ETL)
Analyze (EDA & mô hình) Report (k chuyn d liu).
DCOVA = Define Collect Organize Visualize Analyze.
Công c xác đnh vn đ: POPIT, 5 Whys, Fishbone/Ishikawa, RCA,
VMOST/SWOT.
Quy trình phân tích d liu: SOAR Framework
Specify the question: Xác đnh câu hi KD c th cn gii quyết.
Obtain the data: Thu thp và đánh giá cht lưng d liu (đ tin
cy, đy đ, nht quán).
Analyze the data: Áp dng các k thut phù hp (mô t, hi quy,
kim đnh gi thuyết...).
Report the results: Truyn đt các phát hin/bài hc qua
dashboard, biu đ, báo c áo.
Ví d
Trong kim đnh gi thuyết:
H
0
: µ = 5000, H
1
: µ > 5000
s dng giá tr p đ ra quyết đnh đây là phn Analyze trong quy trình
SOAR.
Xác đnh vn đ (Problem Definition)
Vì sao quan trng?
Là nn tng ca S Specify the Question trong SOAR.
Xác đnh đúng vn đ trưc khi chn phương pháp/gii pháp.
Quy trình gii quyết vn đ (rút gn):
Nhn din vn đ
Xác đnh vn đ
Cu trúc
Phân tích
Din gii & Quyết đnh
Thc thi
Đnh nghĩa vn đ
Tn ti khi có khong cách (gap) gia thc tế và k vng/chun mc.
Nhn din vn đ
Du hiu nhn din:
Ch s vưt ngưng (KPIs, benchmark ngành).
So sánh xu hưng theo thi gian hoc vi đi th.
Phn hi khách hàng/nhân viên; chi phí tăng bt thưng.
Ví d: Chi phí phân phi tăng nhanh hơn doanh thu nghi vn v tn
kho, tuyến giao hàng, hoc chiết khu vn chuy n.
Lưu ý
Nhn din mi là tín hiu/triu chng; chưa phi vn đ ct lõi.

Preview text:

Phân tích Dữ liệu trong Kinh tế & Kinh doanh Trịnh Q. Long 11/2025 Nội dung
Định vị Phân tích dữ liệu trong kinh tế & kinh doanh trong
doanh nghiệp và các tổ chức.
Hiểu mối quan hệ giữa Phân tích dữ liệu & Thống kê; vì sao cần cả hai.
Nắm quy trình SOAR/DCOVA, nguồn & chất lượng dữ liệu, đạo đức dữ liệu.
Tư duy phân tích dữ liệu
Các vấn đề cơ bản về thống kê Khái niệm cơ bản
Phân tích dữ liệu là gì? Phân tích dữ liệu (Data Analytics) là quá
trình kiểm tra, làm sạch, biến đổi và mô hình hóa dữ liệu nhằm:
Tìm kiếm thông tin hữu ích (insights);
Hỗ trợ ra quyết định trong kinh tế, tài chính, quản lý;
Chuyển dữ liệu thành kiến thức hành động được (actionable intel igence).
Phân tích kinh doanh (Business Analytics) Là việc kết hợp IT, thống
kê, mô hình toán và kỹ năng quản trị để:
Hiểu rõ tình hình hoạt động; Dự đoán xu hướng;
Tối ưu hóa ra quyết định trong doanh nghiệp.
Mục tiêu cốt lõi của phân tích dữ liệu
Phân tích dữ liệu giúp nhà quản lý trả lời ba nhóm câu hỏi:
What happened? – Điều gì đã xảy ra? (Mô tả)
Why did it happen? – Tại sao? (Giải thích, chẩn đoán)
What wil / should happen? – Dự báo và hành động tối ưu (Dự đoán – Đề xuất)
Vai trò của phân tích dữ liệu
PTDL cung cấp một khuôn khổ để hiểu và diễn giải DL một cách có ý nghĩa, nhằm
Quyết định thông minh: dựa trên dữ liệu thực nghiệm thay vì giả định
hay trực giác → Kết quả chính xác & đáng tin cậy hơn.
Hiểu sự biến động: Phân tích phân bố DL → xác định xu hướng và bất thường
Diễn giải DL: tóm tắt các bộ DL lớn thành các số liệu dễ hiểu như
trung bình, phần trăm, và tương quan, giúp dễ dàng rút ra kết luận.
Khả năng dự đoán/dự báo: Phát triển các mô hình có thể dự
đoán/dự báo tương lai dựa trên DL lịch sử → giúp lập kế hoạch và
phân bổ nguồn lực tốt hơn.
Kiểm soát chất lượng: Các kỹ thuật TK giúp giám sát quy trình sản
xuất, phát hiện lỗi và đảm bảo sản phẩm đáp ứng tiêu chuẩn chất lượng.
Kỹ thuật phân tích dữ liệu Loại phân tích Mục tiêu chính Kỹ thuật điển hình
Mô tả (Descrip- Hiểu điều đã xảy ra
Thống kê tóm tắt, pivot ta- tive) ble, dashboard.
Chẩn đoán (Diag- Tại sao xảy ra
Dril -down, kiểm định t, F, nostic) phân tích tương quan.
Dự đoán (Predic- Dự đoán xu hướng
Hồi quy tuyến tính, Logistic, tive)
chuỗi thời gian, cây quyết định.
Đề xuất (Prescrip- Tối ưu hành động
Tối ưu hóa (Linear Program- tive) ming), phân tích What-if.
Phân tích dữ liệu: ứng dụng
Tài chính – Kế toán: Phân tích rủi ro, phát hiện gian lận (Benford’s Law), dự báo lợi nhuận.
Marketing: Phân khúc khách hàng, dự đoán hành vi tiêu dùng.
Nhân sự: HR Analytics – dự đoán khả năng nghỉ việc.
Vận hành – Logistics: Tối ưu hóa lịch trình, tồn kho.
Kinh tế và chính sách: Phân tích nhân quả, mô hình tăng trưởng,
chuỗi thời gian kinh tế vĩ mô. Ứng dụng: Kế toán
Lấy mẫu thống kê: Chọn một mẫu ngẫu nhiên các giao dịch để xác
minh độ chính xác của hồ sơ tài chính, giúp giảm thời gian và chi phí kiểm toán.
Ước tính nợ xấu: Dữ liệu về tỷ lệ vỡ nợ trong quá khứ được sử dụng
để ước tính khoản dự phòng cho các khoản phải thu khó đòi, giúp
các công ty quản lý rủi ro tín dụng.
Phân tích xu hướng: Các kế toán viên phân tích xu hướng doanh thu
và chi phí theo thời gian để xác định các bất thường hoặc những khu vực cần được chú ý. Ứng dụng: Tài chính
Phân tích đầu tư: NĐT sử dụng dữ liệu giá cổ phiếu trong quá khứ
và các tỷ số tài chính (như tỷ lệ P/E) để đánh giá hiệu suất của cổ
phiếu và đưa ra các khuyến nghị mua/bán.
Đánh giá rủi ro: Dữ liệu về biến động thị trường và lợi nhuận trong
quá khứ được sử dụng để tính toán rủi ro liên quan đến các danh mục đầu tư khác nhau.
Đối chiếu hiệu suất: Dữ liệu tài chính được so sánh với các tiêu chuẩn
ngành để đánh giá hiệu suất của một công ty so với các đối thủ cùng ngành. Ứng dụng: Marketing
Phân tích hành vi người tiêu dùng: Dữ liệu từ các hệ thống điểm bán
hàng (POS) được phân tích để hiểu các mô hình và sở thích mua
sắm, → các chiến dịch tiếp thị mục tiêu.
Kiểm tra A/B: Sử dụng dữ liệu từ các thử nghiệm A/B để so sánh
hiệu quả của các chiến lược quảng cáo hoặc cách sắp xếp sản phẩm khác nhau.
Dự báo doanh số: Dữ liệu trong quá khứ được phân tích để dự đoán
xu hướng doanh số trong tương lai → lập kế hoạch tồn kho và chiến lược marketing. Ứng dụng: Sản xuất
Biểu đồ kiểm soát chất lượng: giám sát quy trình sản xuất và phát
hiện các thay đổi có thể gây ra vấn đề chất lượng.
Tối ưu hóa quy trình: xác định các nút cổ chai và những điểm không hiệu quả.
Lập kế hoạch sản suất: Dữ liệu về tốc độ sản xuất và dự báo nhu cầu
→ xác định công suất tối ưu cần có nhằm đáp ứng nhu cầu khách
hàng mà không sản xuất dư thừa. Ứng dụng: Kinh tế học
Dự báo kinh tế: Các nhà kinh tế phân tích dữ liệu về các chỉ số như
GDP, tỷ lệ thất nghiệp và lạm phát để dự đoán tình hình kinh tế trong tương lai.
Phân tích tác động chính sách: Dữ liệu được sử dụng để đánh giá tác
động của các chính sách kinh tế (như thay đổi thuế, trợ cấp) lên các
ngành khác nhau của nền kinh tế.
Nghiên cứu thị trường: Khảo sát và thu thập dữ liệu về tâm lý và thói
quen chi tiêu của người tiêu dùng giúp doanh nghiệp và chính phủ
hiểu rõ xu hướng kinh tế và hành vi tiêu dùng. Ứng dụng: Ví dụ
Sam: Quản lý bán hàng của công ty nước giải khát.
Thách thức: Đối thủ cạnh tranh và sản phẩm mới từ chính công ty chiếm thị phần.
Giải pháp: Thay đổi công thức hương vị đồ uống dựa trên khảo sát.
Alex: Nhà quản lý tại hãng hàng không lớn.
Thách thức: Mất khách hàng vào đối thủ có chất lượng cao hơn.
Giải pháp: Cải thiện ghế ngồi, bữa ăn, và dịch vụ dựa trên khảo sát.
Case Sam & Alex — Bài học phân tích đúng biến
Sam đổi hương vị → doanh số giảm vì khách trung thành coi trọng hương vị cũ.
Alex nâng ghế/bữa ăn → khách vẫn rời vì lịch bay & loyalty program mới là driver.
Bài học: tránh tunnel vision; đặt câu hỏi đúng, chọn biến đúng, kiểm định giả thuyết.
Phân tích dữ liệu vs. Thống kê Thống kê
Thống kê là hệ thống các phương pháp thu thập, tổng hợp, trình bày và
phân tích số liệu nhằm phục vụ ra quyết định.
Thống kê là một phần quan trọng của Phân tích dữ liệu. Thống kê (Statistics)
Phân tích dữ liệu (Data Analysis)
Ngành toán học chuyên sâu
Lĩnh vực liên ngành rộng
Trọng tâm: Suy luận, tính bất
Trọng tâm: Insights, dự đoán, định ra quyết định
Công cụ: Kiểm định giả Công cụ: Thống kê + ML +
thuyết, khoảng tin cậy, hồi quy Programming + Visualization
Câu hỏi: "Có ý nghĩa thống
Câu hỏi: "Nên làm gì tiếp kê không?" theo?" Machine LearnP inhgânT thíc ố h ngdữ kê liệu Lập trình Visualization
Kiến thức nền tảng cần học
Trong kinh tế và kinh doanh, thống kê giúp:
Tóm tắt dữ liệu (Descriptive Statistics);
Suy luận cho tổng thể (Inferential Statistics);
Phân tích mối quan hệ và dự báo (Regression, Time Series). Thống kê và Toán học
Thống kê mô tả: trung bình, độ lệch chuẩn, phân phối, biểu đồ.
Thống kê suy luận: ước lượng, kiểm định giả thuyết, ANOVA.
Hồi quy và tương quan: phân tích quan hệ giữa các biến.
Các loại dữ liệu và xử lý dữ liệu
Dữ liệu định tính – định lượng, chuỗi thời gian – chéo.
Kỹ năng “Data Wrangling”: làm sạch, xử lý giá trị thiếu, chuẩn hóa biến.
Quy trình phân tích dữ liệu: SOAR / DCOVA
SOAR = Specify (vấn đề/câu hỏi) — Obtain (dữ liệu/ETL) —
Analyze (EDA & mô hình) — Report (kể chuyện dữ liệu).
DCOVA = Define — Col ect — Organize — Visualize — Analyze.
Công cụ xác định vấn đề: POPIT, 5 Whys, Fishbone/Ishikawa, RCA, VMOST/SWOT.
Quy trình phân tích dữ liệu: SOAR Framework
Specify the question: Xác định câu hỏi KD cụ thể cần giải quyết.
Obtain the data: Thu thập và đánh giá chất lượng dữ liệu (độ tin
cậy, đầy đủ, nhất quán).
Analyze the data: Áp dụng các kỹ thuật phù hợp (mô tả, hồi quy,
kiểm định giả thuyết...).
Report the results: Truyền đạt các phát hiện/bài học qua
dashboard, biểu đồ, báo cáo. Ví dụ
Trong kiểm định giả thuyết: H0 : µ = 5000, H1 : µ > 5000
sử dụng giá trị p để ra quyết định – đây là phần “Analyze” trong quy trình SOAR.
Xác định vấn đề (Problem Definition) Vì sao quan trọng?
Là nền tảng của S — Specify the Question trong SOAR.
Xác định đúng vấn đề trước khi chọn phương pháp/giải pháp.
Quy trình giải quyết vấn đề (rút gọn): Nhận diện vấn đề Xác định vấn đề Cấu trúc Phân tích
Diễn giải & Quyết định Thực thi
Định nghĩa “vấn đề”
Tồn tại khi có khoảng cách (gap) giữa thực tế và kỳ vọng/chuẩn mực. Nhận diện vấn đề Dấu hiệu nhận diện:
Chỉ số vượt ngưỡng (KPIs, benchmark ngành).
So sánh xu hướng theo thời gian hoặc với đối thủ.
Phản hồi khách hàng/nhân viên; chi phí tăng bất thường.
Ví dụ: Chi phí phân phối tăng nhanh hơn doanh thu → nghi vấn về tồn
kho, tuyến giao hàng, hoặc chiết khấu vận chuyển. Lưu ý
Nhận diện mới là tín hiệu/triệu chứng; chưa phải vấn đề cốt lõi.