CHƯƠNG 1: GIỚI THIỆU VỀ KINH DOANH, DOANH NGHIỆP PHÂN TÍCH
KINH DOANH
1.1. Định nghĩa về Kinh doanh Doanh nghiệp
Kinh doanh (Business)
hoạt động mua bán hàng hóa dịch vụ.
một công ty cụ thể thực hiện hoạt động mua bán hàng hóa dịch vụ.
(Nguồn: Cambridge Dictionary)
Kinh doanh thể thuộc s hữu nhân, phi lợi nhuận hoặc thuộc sở hữu nhà nước.
một doanh nghiệp nhân.
Doanh nghiệp (Enterprise)
một doanh nghiệp hoặc công ty.
hoạt động kinh doanh tinh thần khởi xướng sáng tạo.
(Nguồn: Business Dictionary)
1.2. Các chức năng quản trong doanh nghiệp
Quản (Management)
Bao gồm các quy trình chức năng: Lập kế hoạch, Tổ chức, Lãnh đạo, Kiểm soát.
Vai trò của quản lý:
Giám sát hướng dẫn nhân viên thực hiện nhiệm vụ lợi ích của công ty.
Đảm bảo công việc vận hành hiệu quả thông qua các nhà quản cấp cao, trung
vận hành.
Các chức năng chính của quản lý:
1. Lập kế hoạch (Planning): Đặt mục tiêu kế hoạch cho tương lai.
2. Tổ chức (Organizing): Sắp xếp nguồn lực phân bổ nhiệm vụ.
3. Lãnh đạo (Leading): Chỉ đạo, động viên quản nhân sự.
4. Kiểm soát (Controlling): Giám sát đánh giá hiệu suất, điều chỉnh khi cần thiết.
1.3. Môi trường kinh doanh (Business Environment)
Môi trường kinh doanh hiện đại:
Kinh doanh một lĩnh vực năng động.
Môi trường kinh doanh bao gồm tất cả các lực lượng bên ngoài ảnh hưởng đến hoạt
động của doanh nghiệp.
Các hình phân tích môi trường kinh doanh phổ biến:
1. hình PESTE (Phân tích các yếu tố mô):
Political (Chính trị): Ảnh hưởng từ luật pháp, quy định.
Economic (Kinh tế): Tình trạng kinh tế, tỷ giá, lạm phát.
Social (Xã hội): Văn hóa, hành vi người tiêu dùng.
Technological (Công nghệ): Ứng dụng công nghệ vào sản xuất/kinh doanh.
Environmental (Môi trường): Các yếu tố môi trường tự nhiên bền vững.
2. : hình Michael Porter
Đánh giá sức cạnh tranh của ngành thông qua 5 lực lượng (như đối thủ cạnh
tranh, khách hàng, nhà cung cấp, hàng thay thế, đối thủ mới).
1.4. Định nghĩa nội dung của Phân tích Kinh doanh (Business Analytics)
Khái niệm Phân tích Kinh doanh (BA):
quy trình khoa học chuyển đổi dữ liệu thành thông tin chi tiết để đưa ra quyết định tốt
hơn.
BA được sử dụng cho việc ra quyết định dựa trên dữ liệu hoặc thực tế, giúp tăng tính
khách quan.
Các lĩnh vực liên quan:
Toán học ứng dụng, xác suất, thống kê, khoa học máy tính.
Tập trung vào việc biến dữ liệu thành hiểu biết kinh doanh lập kế hoạch.
Mục tiêu:
Phân tích dữ liệu để đưa ra quyết định chiến lược, chiến thuật vận hành, dụ:
Chiến lược: Định hướng tổng thể (ví dụ: Chuyển đổi từ bán hàng qua catalog
sang trực tuyến).
Chiến thuật: Cách thức thực hiện chiến lược (ví dụ: Mở bao nhiêu cửa hàng
mới trong năm nay).
Vận hành: Hoạt động hàng ngày (ví dụ: Xác định lịch làm việc cho nhân viên
bán hàng).
1.5. Vai trò ứng dụng của Phân tích Kinh doanh
Tầm quan trọng của Phân tích Kinh doanh:
mối liên hệ mạnh mẽ với:
Lợi nhuận: Tăng hiệu quả tài chính.
Doanh thu: Cải thiện doanh số bán hàng.
Lợi ích cổ đông: Tăng giá trị cho nhà đầu tư.
Giúp doanh nghiệp duy trì tính cạnh tranh tạo các báo cáo thông tin.
Các ứng dụng chính:
Quản khách hàng: Phân tích hành vi mức độ hài lòng.
Quản chuỗi cung ứng: Tối ưu hóa vận hành, giảm lãng phí.
Phân tích nguồn nhân lực: Đánh giá hiệu suất nhân viên, cải thiện môi trường làm
việc.
Phân tích tài chính: Dự báo tài chính, phân tích chi phí-lợi ích.
CHƯƠNG 2: NỘI DUNG BẢN CÁC THUẬT NGỮ TRONG PHÂN TÍCH
KINH DOANH
2.1. Nội dung bản của Phân tích Kinh doanh
Phạm vi Phân tích Kinh doanh (Spectrum of Business Analytics):
Phân tích kinh doanh được chia thành ba loại chính:
1. Phân tích tả (Descriptive Analytics):
Tập trung vào việc tả những đã xảy ra trong quá khứ.
Các dụ bao gồm:
Truy vấn dữ liệu: Truy vấn thông tin từ sở dữ liệu.
Báo cáo: Tóm tắt thông tin lịch sử liên quan để quản lý.
Thống tả: Tính toán trung bình, phương sai, v.v.
Trực quan hóa dữ liệu: Sử dụng bảng, biểu đồ, bản đồ.
Bảng điều khiển (Dashboards): Cập nhật dữ liệu theo thời gian thực.
dụ thực tế:
Công ty phân tích số liệu bán hàng năm qua để xác định sản phẩm hoặc
khu vực hoạt động tốt nhất.
Theo dõi lượt truy cập trang web để hiểu phần nội dung được truy cập
nhiều nhất.
2. Phân tích dự đoán (Predictive Analytics):
Sử dụng các hình dựa trên dữ liệu quá khứ để dự đoán tương lai.
dụ thực tế:
Dự báo doanh số bán hàng dựa trên các xu hướng trong quá khứ.
Ước tính tác động của các sự kiện khuyến mãi hoặc phiếu giảm giá lên
doanh số.
Lợi ích của phân tích dự đoán:
Cải thiện ra quyết định bằng cách hiểu khả năng xảy ra các sự kiện trong
tương lai.
Tối ưu hóa quy trình giảm thiểu rủi ro.
3. Phân tích đề xuất (Prescriptive Analytics):
Tập trung vào việc đề xuất hành động dựa trên kết quả phân tích.
Đi xa hơn phân tích dự đoán, trả lời câu hỏi: "Chúng ta nên làm gì?"
Ứng dụng thực tế:
Tối ưu hóa chuỗi cung ứng: Xác định tuyến đường hiệu quả nhất cho
logistics.
Chiến lược định giá động: Các công ty hàng không, khách sạn sử dụng
để thiết lập giá tối ưu dựa trên dự báo nhu cầu.
Marketing nhân hóa: Thiết kế các chiến dịch dựa trên hành vi khách
hàng.
Chăm sóc sức khỏe: Đề xuất kế hoạch điều trị nhân hóa cho bệnh
nhân.
Lợi ích của phân tích đề xuất:
Ra quyết định chủ động, tăng hiệu quả tiết kiệm chi phí.
Cải thiện trải nghiệm khách hàng thông qua các khuyến nghị được tùy chỉnh.
Quy trình phân tích dữ liệu
Quy trình phân tích dữ liệu gồm 5 bước:
1. Xác định vấn đề:
Đặt câu hỏi kinh doanh hoặc nghiên cứu cụ thể.
dụ: "Làm thế nào để tăng doanh số sản phẩm X thêm 10%?"
2. Thu thập dữ liệu:
Từ nguồn nội bộ (hồ bán hàng, báo cáo tài chính) nguồn bên ngoài (dữ
liệu thị trường, mạng hội).
Chia thành:
Dữ liệu định tính (Qualitative Data): dụ: ý kiến khách hàng, khảo sát
mở.
Dữ liệu định lượng (Quantitative Data): Số liệu thống kê, doanh thu.
3. Làm sạch dữ liệu:
Loại bỏ dữ liệu không hợp lệ, chuẩn hóa định dạng, xử giá trị bị thiếu.
4. Phân tích dữ liệu:
Sử dụng các phương pháp như phân tích khám phá (Exploratory Data Analysis -
EDA), xác định mẫu, xu hướng.
5. Trực quan hóa chia sẻ kết quả:
Sử dụng đồ thị, biểu đồ, bảng điều khiển để trình bày dữ liệu.
Kết hợp kể chuyện dữ liệu (Data Storytelling) để truyền đạt thông tin dễ hiểu.
2.1. Nội dung bản của Phân tích Kinh doanh (tiếp tục)
Bước 1: Xác định vấn đề (Define the Problem)
Quy trình này yêu cầu:
Xác định câu hỏi hoặc mục tiêu kinh doanh.
Đặt mục tiêu theo nguyên tắc :SMART
1. Cụ thể (Specific): Mục tiêu phải ràng, dụ: “Tăng doanh số sản phẩm X
thêm 10%” thay “Cải thiện doanh số”.
2. Đo lường được (Measurable): Mục tiêu cần chỉ số để đo lường, dụ: “Tăng
tỷ lệ giữ chân khách hàng lên 15% trong quý 4”.
3. Khả thi (Achievable): Đặt mục tiêu thực tế, dụ: Tăng doanh số 100% trong 1
tháng không khả thi.
4. Liên quan (Relevant): Mục tiêu phải phù hợp với chiến lược kinh doanh chung.
5. thời hạn (Time-bound): Xác định thời gian hoàn thành, dụ: “Tăng
tương tác mạng hội lên 20% trong 3 tháng”.
Bước 2: Thu thập dữ liệu (Collect the Data)
Nguồn dữ liệu:
1. Nội bộ (Internal):
Dữ liệu bán hàng, sở dữ liệu khách hàng, báo cáo tài chính.
2. Bên ngoài (External):
Nghiên cứu thị trường, dữ liệu công khai, mạng hội, dữ liệu từ đối thủ cạnh
tranh.
Phân loại dữ liệu:
Định tính (Qualitative): Thông tin tả như phản hồi khách hàng, phỏng vấn.
Định lượng (Quantitative): Số liệu cụ thể như doanh thu, số lượng bán hàng.
Phương pháp thu thập dữ liệu:
Khảo sát: Câu hỏi trắc nghiệm, câu hỏi mở.
Web Scraping: Thu thập dữ liệu từ các trang web.
Phân tích mạng hội: Dữ liệu từ Facebook, Twitter, LinkedIn.
Nhà cung cấp dữ liệu bên thứ ba: Báo cáo ngành, dữ liệu nhân khẩu học.
Cân nhắc chất lượng dữ liệu:
Độ chính xác (Accuracy): Dữ liệu phải đáng tin cậy.
Tính đầy đủ (Completeness): Không thiếu thông tin quan trọng.
Tính nhất quán (Consistency): Đảm bảo dữ liệu đồng bộ, tránh xung đột.
Bước 3: Làm sạch dữ liệu (Clean the Data)
Mục tiêu: Đảm bảo dữ liệu chính xác phù hợp để phân tích.
Các vấn đề thường gặp:
1. Giá trị không hợp lệ (Invalid Values): dụ, giới tính phải “Nam” hoặc “Nữ,” nhưng
dữ liệu sai như “A.”
2. Định dạng không đồng nhất (Inconsistent Formats): dụ, ngày sinh thể nhập
“31/12/1990” hoặc “1990-12-31.”
3. Dữ liệu thiếu (Missing Values): Giá trị bị bỏ trống hoặc null.
4. Lỗi chính tả (Misspellings): dụ, tên thành phố được nhập sai như “Ytali” thay
“Italy.”
5. Giá trị trùng lặp (Duplicated Values): Một sản phẩm hai ID giống nhau.
Cách xử lý:
Xóa hoặc thay thế giá trị bị thiếu.
Chuẩn hóa định dạng dữ liệu.
Loại bỏ dữ liệu trùng lặp.
Bước 4: Phân tích dữ liệu (Analyze the Data)
Mục tiêu: Tìm ra thông tin chi tiết từ dữ liệu thông qua phân tích.
Phương pháp:
Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA).
Sử dụng công cụ trực quan hóa (Excel, Power BI, Tableau).
Xác định các mẫu, mối quan hệ, xu hướng quan trọng.
Bước 5: Trực quan hóa chia sẻ kết quả (Visualize and Share Findings)
Kỹ thuật trực quan hóa:
Biểu đồ (Bar chart, Line chart, Pie chart).
Heatmap: Để tìm mối tương quan giữa các biến.
Dashboard: Tóm tắt dữ liệu theo thời gian thực.
Kể chuyện bằng dữ liệu (Data Storytelling):
Kết hợp hình ảnh trực quan với câu chuyện để kết nối các phát hiện với hành động cụ
thể.
Lời khuyên khi trình bày báo cáo:
Sử dụng hình ảnh ràng, nhất quán.
Làm nổi bật các số liệu quan trọng.
Đưa ra khuyến nghị thể hành động.
2.2. Các thuật ngữ thường gặp trong Phân tích Kinh doanh
1. Dữ liệu (Data):
Dữ liệu (Data): Các số liệu thông tin được thu thập.
sở dữ liệu (Database): Tập hợp các tệp tin được lưu trữ trên máy tính,
chứa dữ liệu cấu trúc.
Thông tin (Information): Kết quả từ việc phân tích dữ liệu, giúp hiểu sâu hơn về
vấn đề.
2. Phân loại dữ liệu:
a. Dữ liệu cấu trúc (Structured Data):
Được tổ chức dưới dạng bảng, dụ: Số liệu bán hàng, thông tin khách hàng.
3. b. Dữ liệu phi cấu trúc (Unstructured Data):
Không theo định dạng bảng, dụ: Email, bình luận mạng hội, video.
4. c. Dữ liệu bán cấu trúc (Semi-Structured Data):
Kết hợp giữa dữ liệu cấu trúc phi cấu trúc, dụ: File XML, JSON.
3. Dữ liệu cấp (Primary Data):
Dữ liệu được thu thập trực tiếp để phục vụ mục tiêu nghiên cứu cụ thể.
Đặc điểm:
Được thu thập từ nguồn gốc.
Thường đáng tin cậy phù hợp hơn với nghiên cứu.
4. Dữ liệu thứ cấp (Secondary Data):
Dữ liệu đã được thu thập trước đó sử dụng lại cho mục đích khác.
Đặc điểm:
Được thu thập bởi người khác.
Rẻ nhanh hơn so với dữ liệu cấp.
5. Phân loại dữ liệu theo đặc điểm:
a. Dữ liệu định tính (Qualitative Data):
tả đặc điểm hoặc thuộc tính không phải số.
dụ: Giới tính, quốc gia, danh mục sản phẩm.
6. b. Dữ liệu định lượng (Quantitative Data):
Thể hiện dưới dạng số liệu.
dụ: Doanh thu bán hàng, số lượng sản phẩm bán được.
7. Phân loại dữ liệu định lượng:
Dữ liệu rời rạc (Discrete Data): Giá trị nguyên, dụ: Số sản phẩm bán được.
Dữ liệu liên tục (Continuous Data): Giá trị trong một phạm vi, dụ: Doanh thu,
thời gian khách hàng trên trang web.
6. Phân loại theo thời gian:
a. Dữ liệu cắt ngang (Cross-Sectional Data):
Quan sát từ các nhân hoặc nhóm tại một thời điểm.
Đặc điểm:
Cung cấp góc nhìn "ảnh chụp" về một hiện tượng.
Phù hợp để so sánh tìm mối tương quan.
7. b. Dữ liệu chuỗi thời gian (Time-Series Data):
Tập hợp các quan sát được thu thập tại các khoảng thời gian liên tiếp.
Ứng dụng:
Phân tích xu hướng, mẫu hình, thay đổi qua thời gian.
8. c. Dữ liệu bảng (Panel Data):
Kết hợp giữa dữ liệu cắt ngang chuỗi thời gian.
Đặc điểm:
Theo dõi nhiều đối tượng qua các thời điểm khác nhau.
So sánh thay đổi theo thời gian giữa các đối tượng.
7. Thang đo dữ liệu (Scale of Measurement):
Thang đo dữ liệu được chia thành 4 loại:
a. Thang đo danh nghĩa (Nominal Scale):
Phân loại các mục không xếp hạng.
dụ:
Giới tính: Nam, Nữ.
Tình trạng hôn nhân: Độc thân, Đã kết hôn.
8. b. Thang đo thứ bậc (Ordinal Scale):
Xếp hạng các mục nhưng không đo được khoảng cách.
dụ:
Mức thu nhập hàng tháng:
1. Dưới 200 USD.
2. Từ 200 399 USD.
3. Từ 400 599 USD.
9. c. Thang đo khoảng (Interval Scale):
Đo khoảng cách giữa các giá trị, nhưng không điểm 0 tuyệt đối.
dụ: Nhiệt độ, thời gian.
10. d. Thang đo tỷ lệ (Ratio Scale):
khoảng cách giữa các giá trị điểm 0 tuyệt đối.
dụ: Doanh thu, chi phí.
2.2. Các thuật ngữ thường gặp trong Phân tích Kinh doanh (tiếp tục)
Trực quan hóa dữ liệu (Data Visualization)
1. Định nghĩa:
Trực quan hóa dữ liệu quá trình sử dụng các công cụ đồ họa để truyền tải
thông tin từ dữ liệu.
Mục tiêu giúp người xem dễ dàng hiểu rút ra thông tin từ các bộ dữ liệu
phức tạp.
Kỹ thuật trực quan hóa dữ liệu:
1. Các loại biểu đồ phổ biến:
Biểu đồ cột (Bar chart): So sánh các giá trị giữa các danh mục.
Biểu đồ đường (Line chart): Hiển thị xu hướng theo thời gian.
Biểu đồ tròn (Pie chart): Minh họa tỷ lệ hoặc phân bổ.
Biểu đồ bong bóng (Bubble chart): Hiển thị mối quan hệ giữa ba biến.
Biểu đồ phân tán (Scatter chart): Xác định mối quan hệ giữa hai biến.
2. Các công cụ hỗ trợ trực quan hóa:
Excel: Công cụ bản, dễ sử dụng để tạo biểu đồ bảng dữ liệu.
Power BI Tableau: Công cụ nâng cao để tạo bảng điều khiển (dashboard) báo
cáo tương tác.
Phần mềm phân tích khác: SPSS, R, Python (dùng thư viện trực quan hóa như
Matplotlib, Seaborn).
3. Các phương pháp nâng cao:
Heatmap (Bản đồ nhiệt): Hiển thị sự tương quan cường độ giữa các biến bằng màu
sắc.
Bảng điều khiển (Dashboards): Tích hợp nhiều biểu đồ số liệu trong một giao diện
duy nhất, cung cấp dữ liệu thời gian thực.
Định dạng điều kiện (Conditional Formatting): Thay đổi màu sắc hoặc biểu tượng
để làm nổi bật dữ liệu quan trọng.
dụ: Thanh dữ liệu (Data Bars), Tập hợp biểu tượng (Icon Sets).
4. Trình bày dữ liệu hiệu quả:
Biết đối tượng người xem (Know Your Audience): Điều chỉnh nội dung theo mức độ hiểu
biết của họ.
Tập trung vào thông tin quan trọng (Focus on Key Insights): Nhấn mạnh những phát
hiện quan trọng ảnh hưởng đến quyết định.
Kể chuyện dữ liệu (Data Storytelling): Kết hợp dữ liệu với một câu chuyện hấp dẫn để
tăng tính thuyết phục.
Ứng dụng thực tế của trực quan hóa dữ liệu:
Phân tích khách hàng: Đánh giá mức độ hài lòng hành vi tiêu dùng.
Tối ưu hóa vận hành: Giám sát hiệu suất chuỗi cung ứng.
Marketing: Theo dõi các chiến dịch đo lường hiệu quả đầu (ROI).
Tài chính: Tạo bảng tóm tắt tài chính với các chỉ số chính.
Khai thác dữ liệu (Data Mining)
1. Định nghĩa:
Khai thác dữ liệu một lĩnh vực liên ngành thuộc khoa học máy tính.
Quá trình tính toán nhằm khám phá các mẫu hoặc thông tin tiềm ẩn trong các bộ dữ
liệu lớn, sử dụng các phương pháp từ trí tuệ nhân tạo, học máy, thống hệ thống
sở dữ liệu.
2. Các nhiệm vụ chính trong khai thác dữ liệu:
1. Phân loại (Classification):
Phân loại dữ liệu vào các nhóm thể hành động.
dụ: Phân loại hồ vay ngân hàng thành “rủi ro thấp” “rủi ro cao.”
2. Ước lượng (Estimation):
Dự đoán các tỷ lệ phản hồi hoặc khả năng xảy ra một sự kiện.
dụ: Xác suất khách hàng nhấp vào quảng cáo.
3. Dự đoán (Prediction):
Sử dụng dữ liệu lịch sử để dự đoán hành vi khách hàng trong tương lai.
4. Nhóm liên kết (Affinity Grouping):
Xác định các sản phẩm/dịch vụ thường được mua cùng nhau.
dụ: Phân tích giỏ hàng (Market Basket Analysis).
5. tả (Description):
Tìm kiếm các mẫu thú vị trong dữ liệu trước đây chưa được biết đến.
3. Các kỹ thuật khai thác dữ liệu:
Phân tích giỏ hàng (Market Basket Analysis): Tìm kiếm các mặt hàng được mua
cùng nhau trong các giao dịch.
Phân tích cụm (Cluster Analysis): Nhóm dữ liệu dựa trên các thuộc tính tương tự.
Cây quyết định (Decision Trees) Quy tắc suy diễn (Rule Induction): Xác định các
quy tắc ra quyết định dựa trên dữ liệu.
Mạng nơ-ron (Neural Networks): Sử dụng trí tuệ nhân tạo để phát hiện các mẫu phức
tạp.
Ứng dụng khai thác dữ liệu:
1. Công cụ cần thiết:
Truy cập định hình dữ liệu: Khám phá trực quan hóa dữ liệu.
Huấn luyện hình: Sử dụng học máy để xây dựng hình.
Xác thực kết quả: Sử dụng thống kê, đường cong Lift/ROC để đánh giá.
2. Phương pháp thực hiện:
Xử dữ liệu ban đầu (Data Wrangling) để làm sạch chuẩn bị dữ liệu.
Lựa chọn đặc trưng (Feature Selection) để xác định các biến quan trọng.
Sử dụng nhiều thuật toán (Hồi quy, cây quyết định, mạng nơ-ron) để tìm ra phương
pháp tốt nhất.
Đánh giá kết quả để tránh hiện tượng overfitting.
Tối ưu hóa (Optimization)
1. Định nghĩa:
Tối ưu hóa quá trình tìm các giá trị tối ưu của biến quyết định để đạt được mục tiêu (ví
dụ: giảm chi phí hoặc tăng lợi nhuận) trong khi đáp ứng các ràng buộc nhất định.
Mục tiêu (Objective Function): Phương trình được tối thiểu hóa hoặc tối đa hóa.
Ràng buộc (Constraints): Các giới hạn hoặc điều kiện phải tuân theo.
Giải pháp tối ưu (Optimal Solution): Giá trị biến quyết định đạt điểm cực đại hoặc cực
tiểu.
2. Ứng dụng thực tế:
Quản nguồn lực: Phân bổ nhân sự, ngân sách hoặc thời gian để đạt hiệu suất cao
nhất.
Quản chuỗi cung ứng: Xác định lộ trình vận chuyển ngắn nhất hoặc mức tồn kho tối
ưu.
Chiến lược định giá: Tối ưu hóa giá bán để tối đa hóa doanh thu dựa trên nhu cầu
cạnh tranh.
3. Phương pháp thực hiện:
hình hóa ràng buộc: Đặt giới hạn tài nguyên, điều kiện thực tế.
Định nghĩa sự phụ thuộc: Xác định mối quan hệ giữa biến đầu vào kết quả đầu ra.
Chạy hình tối ưu hóa: Sử dụng các công cụ như Excel Solver, Python (Scipy), R
để tính toán giá trị tối ưu.
T tuệ kinh doanh (Business Intelligence - BI)
1. Định nghĩa:
BI tập hợp các quy trình, công nghệ, công cụ được sử dụng để biến dữ liệu thành
thông tin, thông tin thành tri thức, tri thức thành hành động kinh doanh lợi nhuận.
BI bao gồm các hoạt động:
Lưu trữ dữ liệu (Data Warehousing).
Phân tích kinh doanh (Business Analytics).
Quản tri thức (Knowledge Management).
2. BI so với OLAP (Xử phân tích trực tuyến):
OLAP (Online Analytical Processing):
Tập trung vào trả lời nhanh các truy vấn phân tích đa chiều.
một phần của BI, cung cấp công cụ phân tích.
BI: Bao quát hơn OLAP, bao gồm cả báo cáo, khai thác dữ liệu phân tích.
3. Ứng dụng BI thực tế:
Phân tích khách hàng: Dự đoán hành vi mua hàng cải thiện trải nghiệm người
dùng.
Phân tích tài chính: Dự báo dòng tiền, tối ưu hóa đầu tư.
Quản chuỗi cung ứng: Theo dõi tối ưu hóa hiệu suất của toàn bộ chuỗi cung
ứng.
Marketing: Đánh giá hiệu quả chiến dịch cải thiện chiến lược quảng cáo.
hình quyết định (Decision Models)
1. Định nghĩa:
hình quyết định các công cụ giúp hiểu phân tích các tình huống kinh
doanh, từ đó đưa ra các quyết định thông minh.
Các đầu vào của hình quyết định:
Dữ liệu: Thông tin số liệu cần thiết để xây dựng hình.
Biến không kiểm soát (Uncontrollable Variables): Các yếu tố ngoài tầm
kiểm soát, dụ: tình hình kinh tế.
Biến quyết định (Decision Variables): Các yếu tố thể điều chỉnh để ảnh
hưởng đến kết quả.
2. Các loại hình quyết định:
hình tả (Descriptive Decision Models):
Chỉ ra các mối quan hệ hiện không yêu cầu hành động.
dụ: hình tổng chi phí sản xuất chi phí thuê ngoài.
hình dự đoán (Predictive Decision Models):
Dự đoán các kết quả trong tương lai, thường dùng khi sự không chắc
chắn.
dụ: hình dự đoán nhu cầu sản phẩm.
hình đề xuất (Prescriptive Decision Models):
Đưa ra các giải pháp tối ưu để đạt được mục tiêu nhất định, dụ: giảm chi
phí hoặc tăng lợi nhuận.
dụ: hình tối ưu hóa chuỗi cung ứng.
3. Ứng dụng hình quyết định trong doanh nghiệp:
Ra quyết định chiến lược: Đưa ra các quyết định dài hạn về hướng đi của công ty.
Ra quyết định chiến thuật: Quyết định về cách thức thực hiện chiến lược trong
năm hoặc trong ngắn hạn.
Ra quyết định vận hành: Các quyết định hàng ngày ảnh hưởng đến hoạt động của
công ty.
Tổng kết Chương 2:
Nội dung bản của Phân tích Kinh doanh:
Phân tích Kinh doanh bao gồm ba loại chính: tả (Descriptive), dự đoán
(Predictive), đề xuất (Prescriptive).
Quá trình phân tích dữ liệu giúp doanh nghiệp đưa ra quyết định sáng suốt hơn,
từ việc xác định vấn đề đến việc thực hiện các hành động dựa trên dữ liệu.
Các thuật ngữ quan trọng:
Khai thác dữ liệu (Data Mining): Khám phá các mẫu ẩn trong dữ liệu lớn để đưa ra
quyết định.
Tối ưu hóa (Optimization): Tìm kiếm giải pháp tối ưu cho các vấn đề trong kinh
doanh.
T tuệ kinh doanh (Business Intelligence): Quy trình biến dữ liệu thành thông tin
thể hành động để cải thiện hiệu quả kinh doanh.
hình quyết định (Decision Models): Các công cụ giúp doanh nghiệp đưa ra
quyết định dựa trên phân tích dự đoán.

Preview text:

CHƯƠNG 1: GIỚI THIỆU VỀ KINH DOANH, DOANH NGHIỆP VÀ PHÂN TÍCH KINH DOANH
1.1. Định nghĩa về Kinh doanh và Doanh nghiệp Kinh doanh (Business)
● Là hoạt động mua và bán hàng hóa và dịch vụ.
● Là một công ty cụ thể thực hiện hoạt động mua bán hàng hóa và dịch vụ.
(Nguồn: Cambridge Dictionary)
Kinh doanh có thể thuộc sở hữu tư nhân, phi lợi nhuận hoặc thuộc sở hữu nhà nước.
● Ví dụ: PepsiCo là một công ty kinh doanh toàn cầu, trong khi một quán ăn gia đình là
một doanh nghiệp tư nhân.
Doanh nghiệp (Enterprise)
● Là một doanh nghiệp hoặc công ty.
● Là hoạt động kinh doanh có tinh thần khởi xướng và sáng tạo.
(Nguồn: Business Dictionary)
1.2. Các chức năng quản lý trong doanh nghiệp Quản lý (Management)
● Bao gồm các quy trình và chức năng: Lập kế hoạch, Tổ chức, Lãnh đạo, và Kiểm soát. ● Vai trò của quản lý:
○ Giám sát và hướng dẫn nhân viên thực hiện nhiệm vụ vì lợi ích của công ty.
○ Đảm bảo công việc vận hành hiệu quả thông qua các nhà quản lý cấp cao, trung và vận hành.
Các chức năng chính của quản lý:
1. Lập kế hoạch (Planning): Đặt mục tiêu và kế hoạch cho tương lai.
2. Tổ chức (Organizing): Sắp xếp nguồn lực và phân bổ nhiệm vụ.
3. Lãnh đạo (Leading): Chỉ đạo, động viên và quản lý nhân sự.
4. Kiểm soát (Controlling): Giám sát và đánh giá hiệu suất, điều chỉnh khi cần thiết.
1.3. Môi trường kinh doanh (Business Environment)
Môi trường kinh doanh hiện đại:
● Kinh doanh là một lĩnh vực năng động.
● Môi trường kinh doanh bao gồm tất cả các lực lượng bên ngoài ảnh hưởng đến hoạt động của doanh nghiệp.
Các mô hình phân tích môi trường kinh doanh phổ biến:
1. Mô hình PESTE (Phân tích các yếu tố vĩ mô):
Political (Chính trị): Ảnh hưởng từ luật pháp, quy định.
Economic (Kinh tế): Tình trạng kinh tế, tỷ giá, lạm phát.
Social (Xã hội): Văn hóa, hành vi người tiêu dùng.
Technological (Công nghệ): Ứng dụng công nghệ vào sản xuất/kinh doanh.
Environmental (Môi trường): Các yếu tố môi trường tự nhiên và bền vững. 2. Mô hình Michael : Porter
○ Đánh giá sức cạnh tranh của ngành thông qua 5 lực lượng (như đối thủ cạnh
tranh, khách hàng, nhà cung cấp, hàng thay thế, đối thủ mới).
1.4. Định nghĩa và nội dung của Phân tích Kinh doanh (Business Analytics)
Khái niệm Phân tích Kinh doanh (BA):
● Là quy trình khoa học chuyển đổi dữ liệu thành thông tin chi tiết để đưa ra quyết định tốt hơn.
● BA được sử dụng cho việc ra quyết định dựa trên dữ liệu hoặc thực tế, giúp tăng tính khách quan.
Các lĩnh vực liên quan:
● Toán học ứng dụng, xác suất, thống kê, khoa học máy tính.
● Tập trung vào việc biến dữ liệu thành hiểu biết kinh doanh và lập kế hoạch. Mục tiêu:
● Phân tích dữ liệu để đưa ra quyết định chiến lược, chiến thuật và vận hành, ví dụ:
Chiến lược: Định hướng tổng thể (ví dụ: Chuyển đổi từ bán hàng qua catalog sang trực tuyến).
Chiến thuật: Cách thức thực hiện chiến lược (ví dụ: Mở bao nhiêu cửa hàng mới trong năm nay).
Vận hành: Hoạt động hàng ngày (ví dụ: Xác định lịch làm việc cho nhân viên bán hàng).
1.5. Vai trò và ứng dụng của Phân tích Kinh doanh
Tầm quan trọng của Phân tích Kinh doanh:
● Có mối liên hệ mạnh mẽ với:
Lợi nhuận: Tăng hiệu quả tài chính.
Doanh thu: Cải thiện doanh số bán hàng.
Lợi ích cổ đông: Tăng giá trị cho nhà đầu tư.
● Giúp doanh nghiệp duy trì tính cạnh tranh và tạo các báo cáo thông tin.
Các ứng dụng chính:
Quản lý khách hàng: Phân tích hành vi và mức độ hài lòng.
Quản lý chuỗi cung ứng: Tối ưu hóa vận hành, giảm lãng phí.
Phân tích nguồn nhân lực: Đánh giá hiệu suất nhân viên, cải thiện môi trường làm việc.
Phân tích tài chính: Dự báo tài chính, phân tích chi phí-lợi ích.
CHƯƠNG 2: NỘI DUNG CƠ BẢN VÀ CÁC THUẬT NGỮ TRONG PHÂN TÍCH KINH DOANH
2.1. Nội dung cơ bản của Phân tích Kinh doanh
Phạm vi Phân tích Kinh doanh (Spectrum of Business Analytics):
Phân tích kinh doanh được chia thành ba loại chính:
1. Phân tích mô tả (Descriptive Analytics):
○ Tập trung vào việc mô tả những gì đã xảy ra trong quá khứ.
○ Các ví dụ bao gồm:
Truy vấn dữ liệu: Truy vấn thông tin từ cơ sở dữ liệu.
Báo cáo: Tóm tắt thông tin lịch sử liên quan để quản lý.
Thống kê mô tả: Tính toán trung bình, phương sai, v.v.
Trực quan hóa dữ liệu: Sử dụng bảng, biểu đồ, bản đồ.
Bảng điều khiển (Dashboards): Cập nhật dữ liệu theo thời gian thực.
Ví dụ thực tế:
■ Công ty phân tích số liệu bán hàng năm qua để xác định sản phẩm hoặc
khu vực hoạt động tốt nhất.
■ Theo dõi lượt truy cập trang web để hiểu phần nội dung được truy cập nhiều nhất.
2. Phân tích dự đoán (Predictive Analytics):
○ Sử dụng các mô hình dựa trên dữ liệu quá khứ để dự đoán tương lai.
Ví dụ thực tế:
■ Dự báo doanh số bán hàng dựa trên các xu hướng trong quá khứ.
■ Ước tính tác động của các sự kiện khuyến mãi hoặc phiếu giảm giá lên doanh số.
Lợi ích của phân tích dự đoán:
■ Cải thiện ra quyết định bằng cách hiểu khả năng xảy ra các sự kiện trong tương lai.
■ Tối ưu hóa quy trình và giảm thiểu rủi ro.
3. Phân tích đề xuất (Prescriptive Analytics):
○ Tập trung vào việc đề xuất hành động dựa trên kết quả phân tích.
○ Đi xa hơn phân tích dự đoán, trả lời câu hỏi: "Chúng ta nên làm gì?"
Ứng dụng thực tế:
Tối ưu hóa chuỗi cung ứng: Xác định tuyến đường hiệu quả nhất cho logistics.
Chiến lược định giá động: Các công ty hàng không, khách sạn sử dụng
để thiết lập giá tối ưu dựa trên dự báo nhu cầu.
Marketing cá nhân hóa: Thiết kế các chiến dịch dựa trên hành vi khách hàng.
Chăm sóc sức khỏe: Đề xuất kế hoạch điều trị cá nhân hóa cho bệnh nhân.
Lợi ích của phân tích đề xuất:
● Ra quyết định chủ động, tăng hiệu quả và tiết kiệm chi phí.
● Cải thiện trải nghiệm khách hàng thông qua các khuyến nghị được tùy chỉnh.
Quy trình phân tích dữ liệu
Quy trình phân tích dữ liệu gồm 5 bước:
1. Xác định vấn đề:
○ Đặt câu hỏi kinh doanh hoặc nghiên cứu cụ thể.
○ Ví dụ: "Làm thế nào để tăng doanh số sản phẩm X thêm 10%?"
2. Thu thập dữ liệu:
○ Từ nguồn nội bộ (hồ sơ bán hàng, báo cáo tài chính) và nguồn bên ngoài (dữ
liệu thị trường, mạng xã hội). ○ Chia thành:
Dữ liệu định tính (Qualitative Data): Ví dụ: ý kiến khách hàng, khảo sát mở.
Dữ liệu định lượng (Quantitative Data): Số liệu thống kê, doanh thu.
3. Làm sạch dữ liệu:
○ Loại bỏ dữ liệu không hợp lệ, chuẩn hóa định dạng, xử lý giá trị bị thiếu.
4. Phân tích dữ liệu:
○ Sử dụng các phương pháp như phân tích khám phá (Exploratory Data Analysis -
EDA), xác định mẫu, xu hướng.
5. Trực quan hóa và chia sẻ kết quả:
○ Sử dụng đồ thị, biểu đồ, bảng điều khiển để trình bày dữ liệu.
○ Kết hợp kể chuyện dữ liệu (Data Storytelling) để truyền đạt thông tin dễ hiểu.
2.1. Nội dung cơ bản của Phân tích Kinh doanh (tiếp tục)
Bước 1: Xác định vấn đề (Define the Problem)
Quy trình này yêu cầu:
● Xác định rõ câu hỏi hoặc mục tiêu kinh doanh.
● Đặt mục tiêu theo nguyên tắc SMART:
1. Cụ thể (Specific): Mục tiêu phải rõ ràng, ví dụ: “Tăng doanh số sản phẩm X
thêm 10%” thay vì “Cải thiện doanh số”.
2. Đo lường được (Measurable): Mục tiêu cần có chỉ số để đo lường, ví dụ: “Tăng
tỷ lệ giữ chân khách hàng lên 15% trong quý 4”.
3. Khả thi (Achievable): Đặt mục tiêu thực tế, ví dụ: Tăng doanh số 100% trong 1 tháng là không khả thi.
4. Liên quan (Relevant): Mục tiêu phải phù hợp với chiến lược kinh doanh chung.
5. Có thời hạn (Time-bound): Xác định rõ thời gian hoàn thành, ví dụ: “Tăng
tương tác mạng xã hội lên 20% trong 3 tháng”.
Bước 2: Thu thập dữ liệu (Collect the Data) Nguồn dữ liệu:
1. Nội bộ (Internal):
○ Dữ liệu bán hàng, cơ sở dữ liệu khách hàng, báo cáo tài chính.
2. Bên ngoài (External):
○ Nghiên cứu thị trường, dữ liệu công khai, mạng xã hội, dữ liệu từ đối thủ cạnh tranh.
Phân loại dữ liệu:
Định tính (Qualitative): Thông tin mô tả như phản hồi khách hàng, phỏng vấn.
Định lượng (Quantitative): Số liệu cụ thể như doanh thu, số lượng bán hàng.
Phương pháp thu thập dữ liệu:
Khảo sát: Câu hỏi trắc nghiệm, câu hỏi mở.
Web Scraping: Thu thập dữ liệu từ các trang web.
Phân tích mạng xã hội: Dữ liệu từ Facebook, Twitter, LinkedIn.
Nhà cung cấp dữ liệu bên thứ ba: Báo cáo ngành, dữ liệu nhân khẩu học.
Cân nhắc chất lượng dữ liệu:
Độ chính xác (Accuracy): Dữ liệu phải đáng tin cậy.
Tính đầy đủ (Completeness): Không thiếu thông tin quan trọng.
Tính nhất quán (Consistency): Đảm bảo dữ liệu đồng bộ, tránh xung đột.
Bước 3: Làm sạch dữ liệu (Clean the Data)
Mục tiêu: Đảm bảo dữ liệu chính xác và phù hợp để phân tích.
Các vấn đề thường gặp:
1. Giá trị không hợp lệ (Invalid Values): Ví dụ, giới tính phải là “Nam” hoặc “Nữ,” nhưng
có dữ liệu sai như “A.”
2. Định dạng không đồng nhất (Inconsistent Formats): Ví dụ, ngày sinh có thể nhập là
“31/12/1990” hoặc “1990-12-31.”
3. Dữ liệu thiếu (Missing Values): Giá trị bị bỏ trống hoặc null.
4. Lỗi chính tả (Misspellings): Ví dụ, tên thành phố được nhập sai như “Ytali” thay vì “Italy.”
5. Giá trị trùng lặp (Duplicated Values): Một sản phẩm có hai ID giống nhau. Cách xử lý:
● Xóa hoặc thay thế giá trị bị thiếu.
● Chuẩn hóa định dạng dữ liệu.
● Loại bỏ dữ liệu trùng lặp.
Bước 4: Phân tích dữ liệu (Analyze the Data)
Mục tiêu: Tìm ra thông tin chi tiết từ dữ liệu thông qua phân tích. ● Phương pháp:
○ Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA).
○ Sử dụng công cụ trực quan hóa (Excel, Power BI, Tableau).
○ Xác định các mẫu, mối quan hệ, và xu hướng quan trọng.
Bước 5: Trực quan hóa và chia sẻ kết quả (Visualize and Share Findings)
Kỹ thuật trực quan hóa:
○ Biểu đồ (Bar chart, Line chart, Pie chart).
○ Heatmap: Để tìm mối tương quan giữa các biến.
○ Dashboard: Tóm tắt dữ liệu theo thời gian thực.
Kể chuyện bằng dữ liệu (Data Storytelling):
● Kết hợp hình ảnh trực quan với câu chuyện để kết nối các phát hiện với hành động cụ thể.
Lời khuyên khi trình bày báo cáo:
● Sử dụng hình ảnh rõ ràng, nhất quán.
● Làm nổi bật các số liệu quan trọng.
● Đưa ra khuyến nghị có thể hành động.
2.2. Các thuật ngữ thường gặp trong Phân tích Kinh doanh 1. Dữ liệu (Data):
Dữ liệu (Data): Các số liệu và thông tin được thu thập.
Cơ sở dữ liệu (Database): Tập hợp các tệp tin được lưu trữ trên máy tính,
chứa dữ liệu có cấu trúc.
Thông tin (Information): Kết quả từ việc phân tích dữ liệu, giúp hiểu sâu hơn về vấn đề.
2. Phân loại dữ liệu:
a. Dữ liệu cấu trúc (Structured Data):
○ Được tổ chức dưới dạng bảng, ví dụ: Số liệu bán hàng, thông tin khách hàng.
3. b. Dữ liệu phi cấu trúc (Unstructured Data):
○ Không theo định dạng bảng, ví dụ: Email, bình luận mạng xã hội, video.
4. c. Dữ liệu bán cấu trúc (Semi-Structured Data):
○ Kết hợp giữa dữ liệu có cấu trúc và phi cấu trúc, ví dụ: File XML, JSON.
3. Dữ liệu sơ cấp (Primary Data):
○ Dữ liệu được thu thập trực tiếp để phục vụ mục tiêu nghiên cứu cụ thể. ○ Đặc điểm:
■ Được thu thập từ nguồn gốc.
■ Thường đáng tin cậy và phù hợp hơn với nghiên cứu.
4. Dữ liệu thứ cấp (Secondary Data):
○ Dữ liệu đã được thu thập trước đó và sử dụng lại cho mục đích khác. ○ Đặc điểm:
■ Được thu thập bởi người khác.
■ Rẻ và nhanh hơn so với dữ liệu sơ cấp.
5. Phân loại dữ liệu theo đặc điểm:
a. Dữ liệu định tính (Qualitative Data):
○ Mô tả đặc điểm hoặc thuộc tính không phải số.
Ví dụ: Giới tính, quốc gia, danh mục sản phẩm.
6. b. Dữ liệu định lượng (Quantitative Data):
○ Thể hiện dưới dạng số liệu.
Ví dụ: Doanh thu bán hàng, số lượng sản phẩm bán được.
7. Phân loại dữ liệu định lượng:
Dữ liệu rời rạc (Discrete Data): Giá trị nguyên, ví dụ: Số sản phẩm bán được.
Dữ liệu liên tục (Continuous Data): Giá trị trong một phạm vi, ví dụ: Doanh thu,
thời gian khách hàng trên trang web.
6. Phân loại theo thời gian:
a. Dữ liệu cắt ngang (Cross-Sectional Data):
○ Quan sát từ các cá nhân hoặc nhóm tại một thời điểm. ○ Đặc điểm:
■ Cung cấp góc nhìn "ảnh chụp" về một hiện tượng.
■ Phù hợp để so sánh và tìm mối tương quan.
7. b. Dữ liệu chuỗi thời gian (Time-Series Data):
○ Tập hợp các quan sát được thu thập tại các khoảng thời gian liên tiếp. ○ Ứng dụng:
■ Phân tích xu hướng, mẫu hình, và thay đổi qua thời gian.
8. c. Dữ liệu bảng (Panel Data):
○ Kết hợp giữa dữ liệu cắt ngang và chuỗi thời gian. ○ Đặc điểm:
■ Theo dõi nhiều đối tượng qua các thời điểm khác nhau.
■ So sánh thay đổi theo thời gian và giữa các đối tượng.
7. Thang đo dữ liệu (Scale of Measurement):
Thang đo dữ liệu được chia thành 4 loại:
a. Thang đo danh nghĩa (Nominal Scale):
○ Phân loại các mục mà không xếp hạng. Ví dụ: ■ Giới tính: Nam, Nữ.
■ Tình trạng hôn nhân: Độc thân, Đã kết hôn.
8. b. Thang đo thứ bậc (Ordinal Scale):
○ Xếp hạng các mục nhưng không đo được khoảng cách. Ví dụ:
■ Mức thu nhập hàng tháng: 1. Dưới 200 USD. 2. Từ 200 – 399 USD. 3. Từ 400 – 599 USD.
9. c. Thang đo khoảng (Interval Scale):
○ Đo khoảng cách giữa các giá trị, nhưng không có điểm 0 tuyệt đối.
Ví dụ: Nhiệt độ, thời gian.
10. d. Thang đo tỷ lệ (Ratio Scale):
○ Có khoảng cách giữa các giá trị và có điểm 0 tuyệt đối.
Ví dụ: Doanh thu, chi phí.
2.2. Các thuật ngữ thường gặp trong Phân tích Kinh doanh (tiếp tục)
Trực quan hóa dữ liệu (Data Visualization) 1. Định nghĩa:
○ Trực quan hóa dữ liệu là quá trình sử dụng các công cụ đồ họa để truyền tải
thông tin từ dữ liệu.
○ Mục tiêu là giúp người xem dễ dàng hiểu và rút ra thông tin từ các bộ dữ liệu phức tạp.
Kỹ thuật trực quan hóa dữ liệu:
1. Các loại biểu đồ phổ biến:
Biểu đồ cột (Bar chart): So sánh các giá trị giữa các danh mục.
Biểu đồ đường (Line chart): Hiển thị xu hướng theo thời gian.
Biểu đồ tròn (Pie chart): Minh họa tỷ lệ hoặc phân bổ.
Biểu đồ bong bóng (Bubble chart): Hiển thị mối quan hệ giữa ba biến.
Biểu đồ phân tán (Scatter chart): Xác định mối quan hệ giữa hai biến.
2. Các công cụ hỗ trợ trực quan hóa:
Excel: Công cụ cơ bản, dễ sử dụng để tạo biểu đồ và bảng dữ liệu.
Power BI và Tableau: Công cụ nâng cao để tạo bảng điều khiển (dashboard) và báo cáo tương tác.
Phần mềm phân tích khác: SPSS, R, Python (dùng thư viện trực quan hóa như Matplotlib, Seaborn).
3. Các phương pháp nâng cao:
Heatmap (Bản đồ nhiệt): Hiển thị sự tương quan và cường độ giữa các biến bằng màu sắc.
Bảng điều khiển (Dashboards): Tích hợp nhiều biểu đồ và số liệu trong một giao diện
duy nhất, cung cấp dữ liệu thời gian thực.
Định dạng có điều kiện (Conditional Formatting): Thay đổi màu sắc hoặc biểu tượng
để làm nổi bật dữ liệu quan trọng.
Ví dụ: Thanh dữ liệu (Data Bars), Tập hợp biểu tượng (Icon Sets).
4. Trình bày dữ liệu hiệu quả:
● Biết đối tượng người xem (Know Your Audience): Điều chỉnh nội dung theo mức độ hiểu biết của họ.
● Tập trung vào thông tin quan trọng (Focus on Key Insights): Nhấn mạnh những phát
hiện quan trọng có ảnh hưởng đến quyết định.
● Kể chuyện dữ liệu (Data Storytelling): Kết hợp dữ liệu với một câu chuyện hấp dẫn để tăng tính thuyết phục.
Ứng dụng thực tế của trực quan hóa dữ liệu:
Phân tích khách hàng: Đánh giá mức độ hài lòng và hành vi tiêu dùng.
Tối ưu hóa vận hành: Giám sát hiệu suất chuỗi cung ứng.
Marketing: Theo dõi các chiến dịch và đo lường hiệu quả đầu tư (ROI).
Tài chính: Tạo bảng tóm tắt tài chính với các chỉ số chính.
Khai thác dữ liệu (Data Mining) 1. Định nghĩa:
● Khai thác dữ liệu là một lĩnh vực liên ngành thuộc khoa học máy tính.
● Quá trình tính toán nhằm khám phá các mẫu hoặc thông tin tiềm ẩn trong các bộ dữ
liệu lớn, sử dụng các phương pháp từ trí tuệ nhân tạo, học máy, thống kê và hệ thống cơ sở dữ liệu.
2. Các nhiệm vụ chính trong khai thác dữ liệu:
1. Phân loại (Classification):
○ Phân loại dữ liệu vào các nhóm có thể hành động.
Ví dụ: Phân loại hồ sơ vay ngân hàng thành “rủi ro thấp” và “rủi ro cao.”
2. Ước lượng (Estimation):
○ Dự đoán các tỷ lệ phản hồi hoặc khả năng xảy ra một sự kiện.
Ví dụ: Xác suất khách hàng nhấp vào quảng cáo.
3. Dự đoán (Prediction):
○ Sử dụng dữ liệu lịch sử để dự đoán hành vi khách hàng trong tương lai.
4. Nhóm liên kết (Affinity Grouping):
○ Xác định các sản phẩm/dịch vụ thường được mua cùng nhau.
Ví dụ: Phân tích giỏ hàng (Market Basket Analysis).
5. Mô tả (Description):
○ Tìm kiếm các mẫu thú vị trong dữ liệu mà trước đây chưa được biết đến.
3. Các kỹ thuật khai thác dữ liệu:
Phân tích giỏ hàng (Market Basket Analysis): Tìm kiếm các mặt hàng được mua
cùng nhau trong các giao dịch.
Phân tích cụm (Cluster Analysis): Nhóm dữ liệu dựa trên các thuộc tính tương tự.
Cây quyết định (Decision Trees) và Quy tắc suy diễn (Rule Induction): Xác định các
quy tắc ra quyết định dựa trên dữ liệu.
Mạng nơ-ron (Neural Networks): Sử dụng trí tuệ nhân tạo để phát hiện các mẫu phức tạp.
Ứng dụng khai thác dữ liệu:
1. Công cụ cần thiết:
Truy cập và định hình dữ liệu: Khám phá và trực quan hóa dữ liệu.
Huấn luyện mô hình: Sử dụng học máy để xây dựng mô hình.
Xác thực kết quả: Sử dụng thống kê, đường cong Lift/ROC để đánh giá.
2. Phương pháp thực hiện:
● Xử lý dữ liệu ban đầu (Data Wrangling) để làm sạch và chuẩn bị dữ liệu.
● Lựa chọn đặc trưng (Feature Selection) để xác định các biến quan trọng.
● Sử dụng nhiều thuật toán (Hồi quy, cây quyết định, mạng nơ-ron) để tìm ra phương pháp tốt nhất.
● Đánh giá kết quả để tránh hiện tượng overfitting.
Tối ưu hóa (Optimization) 1. Định nghĩa:
● Tối ưu hóa là quá trình tìm các giá trị tối ưu của biến quyết định để đạt được mục tiêu (ví
dụ: giảm chi phí hoặc tăng lợi nhuận) trong khi đáp ứng các ràng buộc nhất định.
Mục tiêu (Objective Function): Phương trình được tối thiểu hóa hoặc tối đa hóa.
Ràng buộc (Constraints): Các giới hạn hoặc điều kiện phải tuân theo.
Giải pháp tối ưu (Optimal Solution): Giá trị biến quyết định đạt điểm cực đại hoặc cực tiểu.
2. Ứng dụng thực tế:
Quản lý nguồn lực: Phân bổ nhân sự, ngân sách hoặc thời gian để đạt hiệu suất cao nhất.
Quản lý chuỗi cung ứng: Xác định lộ trình vận chuyển ngắn nhất hoặc mức tồn kho tối ưu.
Chiến lược định giá: Tối ưu hóa giá bán để tối đa hóa doanh thu dựa trên nhu cầu và cạnh tranh.
3. Phương pháp thực hiện:
Mô hình hóa ràng buộc: Đặt giới hạn tài nguyên, điều kiện thực tế.
Định nghĩa sự phụ thuộc: Xác định mối quan hệ giữa biến đầu vào và kết quả đầu ra.
Chạy mô hình tối ưu hóa: Sử dụng các công cụ như Excel Solver, Python (Scipy), R
để tính toán giá trị tối ưu.
Trí tuệ kinh doanh (Business Intelligence - BI) 1. Định nghĩa:
● BI là tập hợp các quy trình, công nghệ, và công cụ được sử dụng để biến dữ liệu thành
thông tin, thông tin thành tri thức, và tri thức thành hành động kinh doanh có lợi nhuận.
● BI bao gồm các hoạt động:
○ Lưu trữ dữ liệu (Data Warehousing).
○ Phân tích kinh doanh (Business Analytics).
○ Quản lý tri thức (Knowledge Management).
2. BI so với OLAP (Xử lý phân tích trực tuyến):
OLAP (Online Analytical Processing):
○ Tập trung vào trả lời nhanh các truy vấn phân tích đa chiều.
○ Là một phần của BI, cung cấp công cụ phân tích.
BI: Bao quát hơn OLAP, bao gồm cả báo cáo, khai thác dữ liệu và phân tích.
3. Ứng dụng BI thực tế:
Phân tích khách hàng: Dự đoán hành vi mua hàng và cải thiện trải nghiệm người dùng.
Phân tích tài chính: Dự báo dòng tiền, tối ưu hóa đầu tư.
Quản lý chuỗi cung ứng: Theo dõi và tối ưu hóa hiệu suất của toàn bộ chuỗi cung ứng.
Marketing: Đánh giá hiệu quả chiến dịch và cải thiện chiến lược quảng cáo.
Mô hình quyết định (Decision Models) 1. Định nghĩa:
● Mô hình quyết định là các công cụ giúp hiểu và phân tích các tình huống kinh
doanh, từ đó đưa ra các quyết định thông minh.
● Các đầu vào của mô hình quyết định:
○ Dữ liệu: Thông tin và số liệu cần thiết để xây dựng mô hình.
○ Biến không kiểm soát (Uncontrollable Variables): Các yếu tố ngoài tầm

kiểm soát, ví dụ: tình hình kinh tế.
○ Biến quyết định (Decision Variables): Các yếu tố có thể điều chỉnh để ảnh
hưởng đến kết quả.
2. Các loại mô hình quyết định:
● Mô hình mô tả (Descriptive Decision Models):
○ Chỉ ra các mối quan hệ hiện có và không yêu cầu hành động.
○ Ví dụ: Mô hình tổng chi phí sản xuất và chi phí thuê ngoài.

● Mô hình dự đoán (Predictive Decision Models):
○ Dự đoán các kết quả trong tương lai, thường dùng khi có sự không chắc chắn.
○ Ví dụ: Mô hình dự đoán nhu cầu sản phẩm.
● Mô hình đề xuất (Prescriptive Decision Models):
○ Đưa ra các giải pháp tối ưu để đạt được mục tiêu nhất định, ví dụ: giảm chi
phí hoặc tăng lợi nhuận.
○ Ví dụ: Mô hình tối ưu hóa chuỗi cung ứng.
3. Ứng dụng mô hình quyết định trong doanh nghiệp:
● Ra quyết định chiến lược: Đưa ra các quyết định dài hạn về hướng đi của công ty.
● Ra quyết định chiến thuật: Quyết định về cách thức thực hiện chiến lược trong

năm hoặc trong ngắn hạn.
● Ra quyết định vận hành: Các quyết định hàng ngày ảnh hưởng đến hoạt động của công ty.
Tổng kết Chương 2:
Nội dung cơ bản của Phân tích Kinh doanh:
● Phân tích Kinh doanh bao gồm ba loại chính: mô tả (Descriptive), dự đoán
(Predictive), và đề xuất (Prescriptive).
● Quá trình phân tích dữ liệu giúp doanh nghiệp đưa ra quyết định sáng suốt hơn,
từ việc xác định vấn đề đến việc thực hiện các hành động dựa trên dữ liệu.
Các thuật ngữ quan trọng:
● Khai thác dữ liệu (Data Mining): Khám phá các mẫu ẩn trong dữ liệu lớn để đưa ra quyết định.
● Tối ưu hóa (Optimization): Tìm kiếm giải pháp tối ưu cho các vấn đề trong kinh doanh.
● Trí tuệ kinh doanh (Business Intelligence): Quy trình biến dữ liệu thành thông tin
có thể hành động để cải thiện hiệu quả kinh doanh.
● Mô hình quyết định (Decision Models): Các công cụ giúp doanh nghiệp đưa ra
quyết định dựa trên phân tích và dự đoán.