Nhóm-K1721 Báo-cáo-cuối-kỳ-Big-Data - Tài liệu tham khảo | Đại học Tôn đức thắng

Nhóm-K1721 Báo-cáo-cuối-kỳ-Big-Data - Tài liệu tham khảo và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả 

Môn:
Trường:

Đại học Hoa Sen 4.8 K tài liệu

Thông tin:
65 trang 4 tháng trước

Bình luận

Vui lòng đăng nhập hoặc đăng ký để gửi bình luận.

Nhóm-K1721 Báo-cáo-cuối-kỳ-Big-Data - Tài liệu tham khảo | Đại học Tôn đức thắng

Nhóm-K1721 Báo-cáo-cuối-kỳ-Big-Data - Tài liệu tham khảo và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả 

161 81 lượt tải Tải xuống
TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM
TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG
KHOA QUẢN TRỊ KINH DOANH
BÀI BÁO CÁO CUỐI KỲ
MÔN ỨNG DỤNG PHÂN TÍCH DỮ LIỆU LỚN
TRONG QUẢN LÝ
ĐỀ TÀI: DỰ BÁO VỀ KHẢ NĂNG NGHỈ VIỆC CỦA NHÂN VIÊN
CÔNG TY IBM TẠI MỸ BẰNG CÁCH SỬ DỤNG MÔ HÌNH
AZURE MACHINE LEARNING
Giảng viên hướng dẫn: ThS. Phạm Ngọc Bảo Duy
Ngành: Kinh doanh quốc tế
Khóa: 21
Nhóm: K1721
Sinh viên thực hiện:
1. Nguyễn Thị Trâm Anh 71706244
2. Nguyễn Thị Thu Thảo 71706161
3. Nguyễn Thị Cẩm Tú 71706209
THÀNH PHỐ HỒ CHÍ MINH, THÁNG 9 NĂM 2021.
NHẬN XÉT CỦA GIẢNG VIÊN
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
DANH SÁCH THÀNH VIÊN NHÓM
STT HỌ VÀ TÊN MSSV CÔNG VIỆC
MỨC ĐỘ
HOÀN THÀNH
CHỮ KÝ
1 Nguyễn Thị Trâm Anh 71706244
Chương 3,
Chương 4, Chạy
mô hình
100%
2 Nguyễn Thị Thu Thảo 71706161
Chương 1,
Chương 5, Chạy
mô hình
100%
3 Nguyễn Thị Cẩm Tú 71706209
Chương 2,
Chỉnh word,
Chạy mô hình
100%
4 Đinh Việt Thái 71706331
Làm PPT,
Chạy mô hình
90%
5 Trần Nhật Hà 71706263
Làm PPT,
Chạy mô hình
95%
MỤC LỤC
DANH MỤC HÌNH ẢNH..............................................................................................1
DANH MỤC BẢNG......................................................................................................2
DANH MỤC BIỂU ĐỔ.................................................................................................2
CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU.....................................................3
1.1 Lý do chọn đề tài...............................................................................................3
1.2 Giới thiệu tổng quan về công ty IBM................................................................6
1.3 Mục tiêu nghiên cứu..........................................................................................7
1.4 Câu hỏi nghiên cứu...........................................................................................7
1.5 Ý nghĩa của nghiên cứu.....................................................................................8
1.6 Đối tượng và phạm vi nghiên cứu.....................................................................8
1.7 Bố cục bài nghiên cứu.......................................................................................8
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT...............................................................................9
2.1 Lý thuyết về quyết định nghỉ việc và các yếu tố ảnh hưởng..............................9
2.1.1 Lý thuyết về quyết định nghỉ việc..............................................................9
2.1.2 Ảnh hưởng của sự nghỉ việc.......................................................................9
2.1.3 Các yếu tố ảnh hưởng đến quyết định nghỉ việc.......................................10
2.2 Các nghiên cứu trước......................................................................................12
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU..........................................................14
3.1 Thu thập và mô tả dữ liệu................................................................................14
3.2 Xử lý dữ liệu...................................................................................................18
3.3 Phân tích khám phá dữ liệu.............................................................................20
3.4 Mô hình nghiên cứu........................................................................................27
3.5 Lựa chọn mô hình nghiên cứu.........................................................................31
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU.....................................................................33
4.1 Thiết lập mô hình Two-Class Bayes Point Machine, Two-Class Logistics
Regression, Two-Class Decision Forest, Two-Class Support Vector Machine:.........34
4.2 Thiết lập mô hình Random Forest.......................................................................36
4.3 Kết luận:..........................................................................................................40
4.4 Setup Web Service..........................................................................................40
CHƯƠNG 5: KẾT LUẬN............................................................................................43
5.1. Các yếu tố ảnh hưởng......................................................................................43
5.2. Mô hình dự đoán.............................................................................................44
5.3. Giải pháp, kiến nghị........................................................................................44
5.4. Hạn chế của đề tài...........................................................................................45
TÀI LIỆU THAM KHẢO............................................................................................47
PHỤ LỤC THAM KHẢO............................................................................................51
DANH MỤC HÌNH ẢNH
Hình 1.1: Tỷ lệ nghỉ việc của nhân viên tại Mỹ và các khu vực trên thế giới.................4
Hình 1.2: Tỷ lệ nghỉ việc tại Mỹ theo ngành..................................................................5
Hình 3.1: Những thuộc tính ảnh hưởng nhiều nhất đến biến “Attrition” bằng Filter
Based Feature Selection................................................................................................19
Hình 3.2: Những thuộc tính ít hoặc không ảnh hưởng đến biến “Attrition” bằng Filter
Based Feature Selection................................................................................................19
Hình 3.3: Mô hình Random Forest...............................................................................30
Hình 4.1: Mô hình dự báo khả năng nghỉ việc của nhân viên bằng Azure Machine
Learning.......................................................................................................................34
Hình 4.2: Mô hình Random Forest trên Azure Machine Learning................................36
Hình 4.3: Kết quả mô hình Random Forest thông qua Metrics.....................................38
Hình 4.4: Kết quả Random Forest thông qua ma trận Confusion Matrix......................39
Hình 4.5: Setup Web Service của mô hình Two-Class Logistics Regression................40
Hình 4.6: Kết quả dự đoán khả năng nghỉ việc của nhân viên bằng mô hình Two-Class
Logistics Regression.....................................................................................................42
1
DANH MỤC BẢNG
Bảng 3.1: Mô tả biến....................................................................................................18
Bảng 3.2: Chỉ số ảnh hưởng các thuộc tính có ảnh hưởng nhiều nhất đến biến
“Attrition”..................................................................................................................... 20
Bảng 4.1: Chỉ số so sánh kết quả các mô hình..............................................................35
DANH MỤC BIỂU Đ
Biểu đồ 3.1: Thống kê số lượng nhân viên nghỉ việc tại IBM......................................20
Biểu đồ 3.2: Thống kê số lượng nhân viên nghỉ việc theo áp lực tăng ca.....................21
Biểu đồ 3.3: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong các
mối quan hệ ở công ty...................................................................................................22
Biểu đồ 3.4: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng về môi
trường làm việc ở công ty.............................................................................................23
Biểu đồ 3.5: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong công
việc ở công ty................................................................................................................24
Biểu đồ 3.6: Thống kê số lượng nhân viên nghỉ việc theo mức thu nhập hằng tháng ở
công ty..........................................................................................................................25
Biểu đồ 3.7: Kiểm tra mức độ tương quan giữa các biến..............................................26
2
CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU
1.1 Lý do chọn đề tài
Trong nền kinh tế cạnh tranh ngày nay sự chuyên môn hóa, mua lại công
nghệ ngày càng cao, việc nghiên cứu phân tích dữ liệu đang tạo ra kiến thức mới,
được gọi “nền kinh tế tri thức”. Công nghệ thông tin không chỉ nguồn dữ liệu
trên hết, yếu tố tạo điều kiện cho phân tích dữ liệu, làm cho có thể xửcác bộ sưu
tập dữ liệu lớn và cho phép thông tin được rút ra chuẩn xác.
Trong các tổ chức, một số lĩnh vực việc áp dụng AI - trí tuệ nhân tạo sẽ
tác động đến quá trình ra quyết định. Những năm gần đây, nguồn nhân lực ngày càng
được chú trọng. Chất lượng và kỹ năng của nhân viên tạo thành yếu tố tăng trưởng
Št lợi thế cạnh tranh thực sự cho các công ty.
Tuy nhiên trong những năm gần đây, nhiều công ty đang gặp phải tình trạng
nhân viên “nhảy việc”, nhân viên không gắn kết lâu dài với công ty. Khi một nhân viên
nghỉ việc, công ty không những mất đi một nhân viên giá trị, còn gây ra nhiều
tổn thất cụ thể là thời gian, chi phí tuyển dụng, đào tạo nhân viên mới, gia tăng các sai
sót do nhân viên mới chưa quen với công việc, thậm chí gây mất niềm tin, sự đoàn kết
của các thành viên trong nội bộ,.. Theo Mohd & Lim, 2007 các công ty không giảm tỷ
lệ nghỉ việc của nhân viên thì có khả năng sẽ giảm khả năng cạnh tranh trong thời gian
dài. Một nhân viên sẽ chọn ở lại hoặc rời khỏi một tổ chức phụ thuộc vào nhiều nguyên
nhân như hội phát triển nghề nghiệp, môi trường làm việc, hành vi quản lý, đặc
điểm công việc, lương thưởng và phúc lợi, cân bằng giữa công việc và cuộc sống.
Nhận thấy tầm quan trọng của đội ngũ nhân viên, các nhà quản đã đang
tìm mọi cách để duy trì, phát triển và nâng cao nguồn nhân lực. Họ phân tích đến các
yếu tốsự tác động đến nhân viên của mình tại nơi làm việc các yếu tố đó sẽ ảnh
3
hưởng như thế nào đến quyết định gắn bó hoặc rời đi của nhân viên nhằm đưa ra những
giải pháp giúp nhân viên gắn bó lâu dài hơn với tổ chức.
Tình hình về nghỉ việc của nhân viên tại Mỹ
Theo Tổng cục Thống kê lao động Mỹ, có khoảng 3 triệu người Mỹ nghỉ việc
mỗi tháng với tỷ lệ cao hơn so với Châu Âu và Châu Phi.
Hình 1.1: Tỷ lệ nghỉ việc của nhân viên tại Mỹ và các khu vực trên thế giới.
Tại Mỹ, tỷ lệ nhân viên nghỉ việc có sự khác nhau giữa các ngành nghề, cụ thể
năm 2015 tỷ lệ nghỉ việc trung bình 13.7% trong đó ngành khách sạn tỷ lệ nhân
viên nghỉ việc cao nhất 17,8%, ngành chăm sóc sức khỏe là 14,2% trong khi đó, tỷ lệ
thấp hơn rất nhiều trong các ngành công nghiệp khác, như bảo hiểm 8,8%, tiện ích
6,1%,y dựng sản xuất. Đến năm 2020, tỷ lệ này xu hướng giảm nhưng vẫn
còn cao hơn so với toàn cầu 10.9%.
4
Hình 1.2: Tỷ lệ nghỉ việc tại Mỹ theo ngành.
Với hiện trạng thiếu hụt nguồn nhân lực các ngành nghề tăng cao, thì nhân
viên khi kinh nghiệm trong lĩnh vực nghề, sẽ những ý định nghỉ việc để tìm
những nơi đem cho họ cơ hội mới. Phần lớn (81%) nhân viên đã tự nguyện rời đi để có
hội việc làm tốt hơn. Một nửa số nhân viên được khảo sát cho biết họ sẽ nghỉ việc
nếu họ tìm thấy một công việc linh hoạt hơn. Một nửa số nhân viên Hoa Kỳ đã nghĩ
đến việc rời bỏ công ty hiện tại của họ.
Hơn 20% nhân viên nhận thấy hội thăng tiến trong nghề nghiệp sẽ
khả năng ở lại làm việc cao hơn.
Các nhân viên trẻ mong muốn sự linh hoạt trong công việc, 84% thế hệ
millennials muốn cân bằng giữa công việc và cuộc sống, 36% chọn phương án
làm việc tại nhà thay vì tăng lương.
31% nhân viên nghỉ việc văn hoá, môi trường làm việc của công ty không
như họ mong nghĩ, trong đó nhân viên da đen ý định nghỉ việc chiếm 35%
cao hơn so với nhân viên da trắng 27%.
Theo số liệu thống kê từ Hiệp hội Quản lý Nguồn nhân lực tại Hoa Kỳ (SHRM),
tình trạng nghỉ việc của nhân viên đang là một thách thức đối với các công ty ở Hoa Kỳ
5
nói riêng trên toàn cầu nói chung, trên 29% công ty đang bị căng thẳng về vấn đề
tìm người thay thế.
Một nghiên cứu của Center for American Progress (Tổ chức nghiên cứu và vận
động chính sách công tại Mỹ) chỉ ra rằng các công ty thường phải chi trả khoảng 1/5 số
tiền lương của một nhân viên để thay thế họ chi phí thể tăng lên đáng kể nếu
những chức vụ cao hoặc những nhân viên được trả lương cao cần tìm người thay thế.
Việc nắm bắt được tại sao và khi nào nhân viên có khả năng nghỉ việc cao có thể
giúp nhà quản lý đưa ra các phương án hành động để giữ chân nhân viên lâu hơn cũng
như kế hoạch tuyển dụng phù hợp. Nhóm chúng tôi đã tiến hành nghiên cứu thực
hiện đề tài “Dự báo khả năng nghỉ việc của nhân viên tại công ty IBM Mỹ bằng
hình Azure Machine Learning”. Thông qua bài nghiên cứu này sẽ cung cấp một
hình mang tính chất tham khảo giúp dự báo khả năng nghỉ việc hay tiếp tục lại dựa
trên những yếu tố bản từ đó thể giúp nhà quản lý đưa ra những phương án hành
động để giữ chân nhân viên lâu hơn cũng như lập kế hoạch tuyển dụng phù hợp.
1.2 Giới thiệu tổng quan về công ty IBM
IBM Tập đoàn công nghệ đến từ USA (viết tắt của International Business
Machines) là một tập đoàn công nghệ máy tính đa quốc gia có trụ sở tại Armonk, New
York, Mỹ. Được thành lập năm 1911, công ty IBM một trong số ít các công ty công
nghệ của thế kỷ thứ 19 vẫn còn tồn tại cho đến ngày nay. Các sản phẩm được IBM sản
xuất và bán ra chủ yếu là phần cứng và phần mềm máy tính, bên cạnh đó là các dịch vụ
sở hạ tầng, hosting vấn trong nhiều lĩnh vực từ máy tính lớn đến công nghệ
nano.
IBM được biết đến gần đây nhưmột công ty sản xuất máy tính hàng đầu thế
giới, với hơn 388,000 công nhân trên toàn thế giới. IBM chủ công nhân công nghệ
6
lớn nhất trên toàn thế giới. Năm 2011, IBM đã xếp thứ 2 trong top 10 thương hiệu lớn
nhất thế giới với giá trị thương hiệu lên đến 70 tỷ USD.
IBM đã liên tục cải tiến AI sử dụng trong việc quản nguồn nhân sự tại công
ty, bà Rometty - CEO của IBM đã chia sẻ trong nhiệm kỳ CEO 7 năm của mình “Thời
điểm tốt nhất để được nhân viên trước khi họ bỏ việc”. Rometty nhận định rằng,
mô hình nhân sự truyền thống cần một cuộc đại tu, và đó là một trong số những chuyên
môn mà con người cần sự hỗ trợ của AI để cải thiện hiệu quả.
Bằng việc hiểu rõ hơn những mẫu dữ liệu và các kỹ năng liên quan, AI của IBM
có thể tập trung vào thế mạnh của mỗi cá nhân. Điều này sẽ giúp quản lý có thể chỉ dẫn
nhân viên tới những cơ hội trong tương lai mà khó có thể xác định khi sử dụng phương
pháp truyền thống. “Chúng tôi nhận ra rằng bảng khảo sát bởi quản lý không hề chính
xác, đánh giá của quảnmang tính chủ quan, chúng tôi thể đưa ra nhận định một
cách chính xác hơn từ dữ liệu” bà Rometty nói về quy trình đánh giá kỹ năng.
vậy, nhóm chúng tôi mong muốn thực hiện việc đề xuất một hình dự
đoán khả năng nghỉ việc của nhân viên để thể giúp ban lãnh đạo quản sử dụng
nguồn nhân sự của công ty một cách chính xác và hiệu quả hơn.
1.3 Mục tiêu nghiên cứu
Đề tài nghiên cứu của chúng tôi tập trung vào các giải quyết các vấn đề như sau:
Tìm hiểu các yếu tố bản ảnh hưởng đến quyết định nghỉ việc hoặc tiếp tục
làm việc của nhân viên tại công ty IBM.
Đề xuất ra hình giúp công ty IBM cũng như các doanh nghiệp thể áp
dụng để dự đoán khả năng nghỉ việc của nhân viên nhằm nâng cao công tác
quản lý nhân sự HRM.
7
1.4 Câu hỏi nghiên cứu
Để hỗ trợ việc nghiên cứu, cần đặt ra các câu hỏi nhằm mục đích giải quyết các
thắc mắc đang gặp phải cũng như để hiểu rõ hơn về vấn đề:
Các yếu tố ảnh hưởng đến vấn đề nghỉ việc của nhân viên? Yếu tố nào quan
trọng nhất?
Mô hình nào phù hợp nhất để dự đoán quyết định nghỉ việc của nhân viên?
Giải pháp để nhà lãnh đạo thể hạn chế được quyết định nghỉ việc của nhân
viên trong công ty, nâng cao hiệu quả quản lý nguồn nhân lực hơn?
1.5 Ý nghĩa của nghiên cứu
Bài nghiên cứu này, tiết kiệm tài nguyên, giảm bớt sự lo lắng của các nhà quản
lý. Và chỉ ra cho các nhà quản lý sở để sửa đổi, cải thiện các yêu cầu làm việc của
nhân viên nhằm giữ chân họ lại.
1.6 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: quyết định nghỉ việc của nhân viên tại công ty IBM
Mỹ.
Phạm vi nghiên cứu: hình được lấy dữ liệu tại Hoa Kỳ được cung cấp bởi
IBM Analytics.
1.7 Bố cục bài nghiên cứu
Chương 1: Giới thiệu đề tài nghiên cứu
Chương 2: Cơ sở lý thuyết
Chương 3: Phương pháp nghiên cứu
8
Chương 4: Kết quả nghiên cứu
Chương 5: Kết luận và đề xuất giải pháp.
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
2.1Lý thuyết về quyết định nghỉ việc và các yếu tố ảnh hưởng
2.1.1 Lý thuyết về quyết định nghỉ việc
Theo Tommy Thomas, 2009 quyết định nghỉ việc tình trạng xảy ra khi nhân
viên của một tổ chức lựa chọn đưa ra quyết định chấm dứt hợp đồng lao động với tổ
chức.
Theo Tett & Meyer, 1993 quyết định nghỉ việc là hành động có ý thức, có sự cân
nhắc trước khi rời khỏi tổ chức hiện tại.
Theo Mobley, 1997 quá trình đưa ra quyết định nghỉ việc một chuỗi các giai
đoạn nhận thức, bắt đầu từ việc đánh giá công việc hiện tại, tiếp theo cảm giác thỏa
mãn hoặc không thoả mãn về công việc hiện tại, nếu không thoả mãn họ sẽ nghĩ đến
việc nghỉ việc. Kế tiếp họ sẽ đánh giá tìm kiếm việc làm khác và chi phí bỏ ra. Nếu họ
nhận thấy sự thay thế sẵn chi phí bỏ ra không cao, họ sẽ thực hiện việc tìm
kiếm và đánh giá các lựa chọn. Từ đó ý định nghỉ việc sẽ được kích thích và cuối cùng
là đưa ra quyết định nghỉ việc.
2.1.2 Ảnh hưởng của sự nghỉ việc
Theo Chan cộng sự, 2001 đã khẳng định nhân viên nghỉ việc một vấn đề
nghiêm trọng đối với tổ chức, đặc biệt trong lĩnh vực quản trị nhân sự. Ông cho rằng tỷ
lệ nghỉ việc cao sẽ gây bất lợi cho tổ chức thông qua việc gia tăng các loại chi phí, ảnh
hưởng trực tiếp và gián tiếp tới tổ chức.
9
Ảnh hưởng trực tiếp: Khi một nhân viên nghỉ việc, công ty phải mất 78.000 USD để
thay thế nhân viên nghỉ việc (Ramsey Smith, 2004), bao gồm:
- Chi phí cho tuyển dụng, chi phí đào tạo cho nhân viên (Alexander cộng sự,
1994).
- Chi phí do s mất mát những kiến thức ngầm quan trọng (Droege, Hoobler,
2003).
- Chi phí phát sinh từ kết quả hoạt động kinh doanh không hiệu quả, suy giảm
năng suất tạm thời của tổ chức (Osterman, 1987).
Ảnh hưởng gián tiếp:
- Gây thiếu hụt nhân sự chuyên môn kinh nghiệm, làm giảm hiệu suất
công việc và gián đoạn hoạt động của dự án.
- Ảnh hưởng tinh thần làm việc của nhân viên khác.
- Thông tin, tình hình kinh doanh cũng như chính sách, khách hàng thân thiết
của tổ chức cũng nguy bị chia sẻ ra bên ngoài đặc biệt nguy hiểm khi
nhân viên chuyển sang làm việc cho đối thủ cạnh tranh.
2.1.3 Các yếu tố ảnh hưởng đến quyết định nghỉ việc
Hiện nay, công tác nghiên cứu về các yếu tố ảnh hưởng tới quyết định nghỉ việc
của nhân viên đã được nhiều nhà nghiên cứu tìm hiểu, nhóm tác giả nhận thấy có 2 yếu
tố chính ảnh hưởng đến quyết định này là: yếu tố cá nhân và yếu tố tổ chức.
Yếu tố cá nhân:
10
- Age: tuổi tác thể ảnh hưởng đến quyết định nghỉ việc của nhân viên. Theo
Pitts và cộng sự, 2011 cho thấy ý định nghỉ việc sẽ xuất hiện và tăng trong giai
đoạn tuổi đầu tiên tham gia vào lao động sau đó thì giảm lại.
- Gender: theo kết quả từ các nghiên cứu của Knapp, 1982; Schwartz, 1989;
Powell York, 1992 đã kết luận rằng mối quan hệ giữa giới tính
quyết định nghỉ việc, và họ phân tích rằng khả năng nữ giới rời bỏ nơi làm việc
nhiều hơn nam giới.
- Education: trình độ học vấnnhân cũng một nhân tố tác động đến quyết
định nghỉ việc, các nghiên cứu đã đưa ra kết luận là người lao động có trình độ
học vấn càng cao thì càng nhiều hội tìm kiếm công việc thay thế theo
Cordes Dougherty, 1993; Todd Deery Schimit, 1996; Blankertz
Robinson, 1997.
- Overtime: theo phân tích của Zangaro Soeken, 2007 về sự hài lòng công
việc đã nhận thấy rằng làm thêm giờ gây ra căng thẳng trong công việc,
mang tính tương quan mạnh mẽ đến sự hài lòng trong công việc.
- Marital Status: theo Krau, 1981 tình trạng hôn nhân cũng thể ảnh hưởng
đến sự hao mòn nhân lực. Số con, trách nhiệm khi có gia đình sẽ tạo ra các nhu
cầu ổn định.
- Monthly Income: trong phân tích của Griffith cộng sự, 2000 thảo luận về
tác dụng trả công sự thoả mãn. Họ nhận thấy điều quan trọng nhất nhân
viên phải có cảm giác công bằng trong tiền lương. Theo McConnell, 2007 cho
rằng mức lương nguyên nhân hàng đầu gây ra ý định nghỉ việc của nhân
viên. Theo Willis, 2000 tiền lương, thưởng vấn đề quan trọng nhất khi nói
đến việc thu hút và giữ chân nhân tài.
11
- Total Working Years: thâm niên làm việc cũng có mối quan hệ với quyết định
nghỉ việc của người lao động. Người lao động làm việc cho tổ chức với thời
gian càng dài, họ sẽ càng gắn bó với tổ chức và tiếp tục làm việc cho tổ chức
lâu dài hơn theo Miller và Wheeler, 1992; Krecker, 1994; Lane, 1998.
Yếu tố tổ chức:
- Job Level: theo Delfgaauw Josse, 2007 sự không hài lòng với một lĩnh vực
công việc chẳng hạn như nhiệm vụ họ đang làm thể đẩy người lao động ra
khỏi công việc đó, họ sẽ tìm tới công việc khác phù hợp hơn.
- Environment Satisfaction: theo Knight, Crutsinger, Kim, 2006 sự hài lòng
trong môi trường làm việc có thể ảnh hưởng đến quyết định của một nhân viên
ở lại với tổ chức dù vẫn có cơ hội việc làm khác.
- Relationship Satisfaction: sự hài lòng trong mối quan hệ sự đánh giá chủ
quan về mối quan hệ của một người với nhiều người trong tổ chức. Khi sự hài
lòng ở mức cao mối quan hệ sẽ kéo dài, và ngược lại.
- Job Satisfaction: theo kết quả nghiên cứu của Bashir và cộng sự, 2012, sự hài
lòng với công việc tác động ngược chiều đến quyết định nghỉ việc. Bashir
cũng cho biết kết quả này trùng khớp với nghiên cứu của Hulin, 1966.
2.2Các nghiên cứu trước
- K. Coussement D. Vanden poel, 2008 với bài nghiên cứu “Integrating
the voice of customers through call center email into a decision support
system for attrition prediction”. Trong nghiên cứu này, họ thiết lập rằng việc
thêm d liệu văn bản, phi cấu trúc thành một nhận dạng rời đi thông thường.
Các kết quả là nâng cao hiệu suất trong phân tích nhận dạng rời đi. Nghiên cứu
này hỗ trợ cho những người ra quyết định tiếp thị để cải thiện khả năng nhận
biết khách hàng có xác suất rời đi.
12
- CP Wei IT Chiu,2002 “Turning telecommunications với bài nghiên cứu
call details to attrition prediction: a data mining approach”. Trong nghiên
cứu này, thực nghiệm đánh giá phương pháp nhận dạng sự rời đi từ dữ liệu hợp
đồng thuê bao và mô hình cuộc gọi sửa đổi được khai thác từ chi tiết cuộc gọi.
Điều này được tả phương pháp khảng tả tiềm năng những
khách hàng tiêu chuẩn với mức hợp đồng cụ thể cho khoảng thời gian dự đoán
được.
- VV Saradhi GK Palshikar, 2011 “Employee churn với bài nghiên cứu
prediction” đã nghiên cứu so sánh một số các phương pháp trong Machine
Learning để ngăn chặn quyết định nghỉ việc của nhân viên. Trong này họ đã
thực hiện một số phương pháp để tạo so sánh các hình để được
hình dự đoán tốt nhất.
- R.Khare, D. Kaloya, CK Choudhary G.Gupta, 2011 đã nghiên cứu về
“Employee attrition risk assessment using logistic regression analysis”.
Nghiên cứu này sử dụng phương pháp Logistics Regression để ngăn chặn sự
rời đi của nhân viên. Trong điều này các nhà nghiên cứu thu thập dữ liệu nhân
khẩu học của nhân viên hiện tại công ty. Các thông tin này hữu ích để tạo ra
những hình phân loại nhóm các nhân viên rủi ro cao. Mục tiêu cuối
cùng của nghiên cứu là xác định nhóm nhân viên có rủi ro cao để tổ chức chú ý
và ngăn chặn khỏi sự nghỉ việc này.
- ML Kane- Sellers, 2007 “Predictive models of employee đã nghiên cứu về
voluntary turnover in a North American professional salesforce using
data-mining analysis”. Bài nghiên cứu chủ yếu tập trung vào các đặc điểm
nhân, đặc tính công việc phát triển nguồn nhân lực (human resources
development) ảnh hưởng đến sự tự nguyện của nhân viên. Các kết quả khuyến
13
nghị rằng sự đào tạo tham gia phát triển các yếu tố giữ chân nhân viên
hơn là tiền lương và sự thăng tiến trong công việc.
14
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
Chúng tôi đề xuất sử dụng hình Azure Machine Learning để dự báo khả
năng nghỉ việc của nhân viên tại công ty IBM theo quy trình như sau:
Đầu tiên, chúng tôi thu thập dữ liệu về nhân viên bao gồm cả nhân viên quá
khứ và hiện tại.
Thứ hai, chúng tôi áp dụng các kỹ thuật làm sạch dữ liệu khác nhau tạo ra tập dữ
liệu mới đồng thời tiến hành phân tích, mô tả dữ liệu để xác định các thuộc tính
chính ảnh hưởng lớn đến quyết định nghỉ việc của nhân viên.
Thứ ba, chúng tôi áp dụng hình số học Azure Machine Learning với nhiều
thuật toán khác nhau trên tập dữ liệu đã được xử lý cùng với các biến số đã được
chọn ra để dự báo khả năng nghỉ việc của nhân viên.
Cuối cùng dựa trên kết quả thu thập được, so sánh các chỉ shiệu suất của
hình máy học và chọn ra mô hình có hiệu quả nhất để giải quyết vấn đề đặt ra và
phát hành phần mềm hỗ trợ nhân sự trong công tác HRM.
3.1Thu thập và mô tả dữ liệu
Để thực hiện bài nghiên cứu, chúng tôi đã sử dụng bộ dữ liệu “IBM Employee
Dataset” được cung cấp bởi IBM Watson Analytics tại trang web
https://www.kaggle.com/rohitsahoo/employee.
Bộ dữ liệu bao gồm 1470 mẫu quan sát với 35 đặc tính khác nhau liên quan đến
đời sống làm việc và đặc điểm cá nhân của nhân viên tại Hoa Kỳ bao gồm:
ST
T
Thuộc tính Loại dữ liệu
Định nghĩa thuộc
tính
Mô tả thuộc tính
1 Age Số nguyên Tuổi
2 Attrition Phân loại Quyết định nghỉ việc
3 Business Phân loại Mức độ đi công tác Non_Travel/Travel_
15
| 1/65

Preview text:

TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM
TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG
KHOA QUẢN TRỊ KINH DOANH
BÀI BÁO CÁO CUỐI KỲ
MÔN ỨNG DỤNG PHÂN TÍCH DỮ LIỆU LỚN TRONG QUẢN LÝ
ĐỀ TÀI: DỰ BÁO VỀ KHẢ NĂNG NGHỈ VIỆC CỦA NHÂN VIÊN
CÔNG TY IBM TẠI MỸ BẰNG CÁCH SỬ DỤNG MÔ HÌNH AZURE MACHINE LEARNING
Giảng viên hướng dẫn: ThS. Phạm Ngọc Bảo Duy
Ngành: Kinh doanh quốc tế Khóa: 21 Nhóm: K1721
Sinh viên thực hiện: 1. Nguyễn Thị Trâm Anh 71706244 2. Nguyễn Thị Thu Thảo 71706161 3. Nguyễn Thị Cẩm Tú 71706209
THÀNH PHỐ HỒ CHÍ MINH, THÁNG 9 NĂM 2021.
NHẬN XÉT CỦA GIẢNG VIÊN
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
DANH SÁCH THÀNH VIÊN NHÓM MỨC ĐỘ STT HỌ VÀ TÊN MSSV CÔNG VIỆC CHỮ KÝ HOÀN THÀNH Chương 3, 1 Nguyễn Thị Trâm Anh 71706244 Chương 4, Chạy 100% mô hình Chương 1, 2 Nguyễn Thị Thu Thảo 71706161 Chương 5, Chạy 100% mô hình Chương 2, 3 Nguyễn Thị Cẩm Tú 71706209 Chỉnh word, 100% Chạy mô hình Làm PPT, 4 Đinh Việt Thái 71706331 90% Chạy mô hình Làm PPT, 5 Trần Nhật Hà 71706263 95% Chạy mô hình MỤC LỤC
DANH MỤC HÌNH ẢNH..............................................................................................1
DANH MỤC BẢNG......................................................................................................2
DANH MỤC BIỂU ĐỔ.................................................................................................2
CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU.....................................................3 1.1
Lý do chọn đề tài...............................................................................................3 1.2
Giới thiệu tổng quan về công ty IBM................................................................6 1.3
Mục tiêu nghiên cứu..........................................................................................7 1.4
Câu hỏi nghiên cứu...........................................................................................7 1.5
Ý nghĩa của nghiên cứu.....................................................................................8 1.6
Đối tượng và phạm vi nghiên cứu.....................................................................8 1.7
Bố cục bài nghiên cứu.......................................................................................8
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT...............................................................................9 2.1
Lý thuyết về quyết định nghỉ việc và các yếu tố ảnh hưởng..............................9 2.1.1
Lý thuyết về quyết định nghỉ việc..............................................................9 2.1.2
Ảnh hưởng của sự nghỉ việc.......................................................................9 2.1.3
Các yếu tố ảnh hưởng đến quyết định nghỉ việc.......................................10 2.2
Các nghiên cứu trước......................................................................................12
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU..........................................................14 3.1
Thu thập và mô tả dữ liệu................................................................................14 3.2
Xử lý dữ liệu...................................................................................................18 3.3
Phân tích khám phá dữ liệu.............................................................................20 3.4
Mô hình nghiên cứu........................................................................................27 3.5
Lựa chọn mô hình nghiên cứu.........................................................................31
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU.....................................................................33 4.1
Thiết lập mô hình Two-Class Bayes Point Machine, Two-Class Logistics
Regression, Two-Class Decision Forest, Two-Class Support Vector Machine:.........34
4.2 Thiết lập mô hình Random Forest.......................................................................36 4.3
Kết luận:..........................................................................................................40 4.4
Setup Web Service..........................................................................................40
CHƯƠNG 5: KẾT LUẬN............................................................................................43
5.1. Các yếu tố ảnh hưởng......................................................................................43
5.2. Mô hình dự đoán.............................................................................................44
5.3. Giải pháp, kiến nghị........................................................................................44
5.4. Hạn chế của đề tài...........................................................................................45
TÀI LIỆU THAM KHẢO............................................................................................47
PHỤ LỤC THAM KHẢO............................................................................................51 DANH MỤC HÌNH ẢNH
Hình 1.1: Tỷ lệ nghỉ việc của nhân viên tại Mỹ và các khu vực trên thế giới.................4
Hình 1.2: Tỷ lệ nghỉ việc tại Mỹ theo ngành..................................................................5
Hình 3.1: Những thuộc tính ảnh hưởng nhiều nhất đến biến “Attrition” bằng Filter
Based Feature Selection................................................................................................19
Hình 3.2: Những thuộc tính ít hoặc không ảnh hưởng đến biến “Attrition” bằng Filter
Based Feature Selection................................................................................................19
Hình 3.3: Mô hình Random Forest...............................................................................30
Hình 4.1: Mô hình dự báo khả năng nghỉ việc của nhân viên bằng Azure Machine
Learning.......................................................................................................................34
Hình 4.2: Mô hình Random Forest trên Azure Machine Learning................................36
Hình 4.3: Kết quả mô hình Random Forest thông qua Metrics.....................................38
Hình 4.4: Kết quả Random Forest thông qua ma trận Confusion Matrix......................39
Hình 4.5: Setup Web Service của mô hình Two-Class Logistics Regression................40
Hình 4.6: Kết quả dự đoán khả năng nghỉ việc của nhân viên bằng mô hình Two-Class
Logistics Regression.....................................................................................................42 1 DANH MỤC BẢNG
Bảng 3.1: Mô tả biến....................................................................................................18
Bảng 3.2: Chỉ số ảnh hưởng các thuộc tính có ảnh hưởng nhiều nhất đến biến
“Attrition”..................................................................................................................... 20
Bảng 4.1: Chỉ số so sánh kết quả các mô hình..............................................................35 DANH MỤC BIỂU Đ
Biểu đồ 3.1: Thống kê số lượng nhân viên nghỉ việc tại IBM......................................20
Biểu đồ 3.2: Thống kê số lượng nhân viên nghỉ việc theo áp lực tăng ca.....................21
Biểu đồ 3.3: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong các
mối quan hệ ở công ty...................................................................................................22
Biểu đồ 3.4: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng về môi
trường làm việc ở công ty.............................................................................................23
Biểu đồ 3.5: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong công
việc ở công ty................................................................................................................24
Biểu đồ 3.6: Thống kê số lượng nhân viên nghỉ việc theo mức thu nhập hằng tháng ở
công ty..........................................................................................................................25
Biểu đồ 3.7: Kiểm tra mức độ tương quan giữa các biến..............................................26 2
CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU
1.1 Lý do chọn đề tài
Trong nền kinh tế cạnh tranh ngày nay và sự chuyên môn hóa, mua lại công
nghệ ngày càng cao, việc nghiên cứu và phân tích dữ liệu đang tạo ra kiến thức mới,
được gọi là “nền kinh tế tri thức”. Công nghệ thông tin không chỉ là nguồn dữ liệu mà
trên hết, là yếu tố tạo điều kiện cho phân tích dữ liệu, làm cho có thể xử lý các bộ sưu
tập dữ liệu lớn và cho phép thông tin được rút ra chuẩn xác.
Trong các tổ chức, có một số lĩnh vực mà việc áp dụng AI - trí tuệ nhân tạo sẽ
tác động đến quá trình ra quyết định. Những năm gần đây, nguồn nhân lực ngày càng
được chú trọng. Chất lượng và kỹ năng của nhân viên tạo thành yếu tố tăng trưởng và
mô Št lợi thế cạnh tranh thực sự cho các công ty.
Tuy nhiên trong những năm gần đây, nhiều công ty đang gặp phải tình trạng
nhân viên “nhảy việc”, nhân viên không gắn kết lâu dài với công ty. Khi một nhân viên
nghỉ việc, công ty không những mất đi một nhân viên có giá trị, mà còn gây ra nhiều
tổn thất cụ thể là thời gian, chi phí tuyển dụng, đào tạo nhân viên mới, gia tăng các sai
sót do nhân viên mới chưa quen với công việc, thậm chí gây mất niềm tin, sự đoàn kết
của các thành viên trong nội bộ,.. Theo Mohd & Lim, 2007 các công ty không giảm tỷ
lệ nghỉ việc của nhân viên thì có khả năng sẽ giảm khả năng cạnh tranh trong thời gian
dài. Một nhân viên sẽ chọn ở lại hoặc rời khỏi một tổ chức phụ thuộc vào nhiều nguyên
nhân như cơ hội phát triển nghề nghiệp, môi trường làm việc, hành vi quản lý, đặc
điểm công việc, lương thưởng và phúc lợi, cân bằng giữa công việc và cuộc sống.
Nhận thấy tầm quan trọng của đội ngũ nhân viên, các nhà quản lý đã và đang
tìm mọi cách để duy trì, phát triển và nâng cao nguồn nhân lực. Họ phân tích đến các
yếu tố có sự tác động đến nhân viên của mình tại nơi làm việc và các yếu tố đó sẽ ảnh 3
hưởng như thế nào đến quyết định gắn bó hoặc rời đi của nhân viên nhằm đưa ra những
giải pháp giúp nhân viên gắn bó lâu dài hơn với tổ chức.
Tình hình về nghỉ việc của nhân viên tại Mỹ
Theo Tổng cục Thống kê lao động ở Mỹ, có khoảng 3 triệu người Mỹ nghỉ việc
mỗi tháng với tỷ lệ cao hơn so với Châu Âu và Châu Phi.
Hình 1.1: Tỷ lệ nghỉ việc của nhân viên tại Mỹ và các khu vực trên thế giới.
Tại Mỹ, tỷ lệ nhân viên nghỉ việc có sự khác nhau giữa các ngành nghề, cụ thể
năm 2015 tỷ lệ nghỉ việc trung bình là 13.7% trong đó ngành khách sạn có tỷ lệ nhân
viên nghỉ việc cao nhất 17,8%, ngành chăm sóc sức khỏe là 14,2% trong khi đó, tỷ lệ
thấp hơn rất nhiều trong các ngành công nghiệp khác, như bảo hiểm 8,8%, tiện ích
6,1%, xây dựng và sản xuất. Đến năm 2020, tỷ lệ này có xu hướng giảm nhưng vẫn
còn cao hơn so với toàn cầu 10.9%. 4
Hình 1.2: Tỷ lệ nghỉ việc tại Mỹ theo ngành.
Với hiện trạng thiếu hụt nguồn nhân lực ở các ngành nghề tăng cao, thì nhân
viên khi có kinh nghiệm trong lĩnh vực nghề, sẽ có những ý định nghỉ việc để tìm
những nơi đem cho họ cơ hội mới. Phần lớn (81%) nhân viên đã tự nguyện rời đi để có
cơ hội việc làm tốt hơn. Một nửa số nhân viên được khảo sát cho biết họ sẽ nghỉ việc
nếu họ tìm thấy một công việc linh hoạt hơn. Một nửa số nhân viên Hoa Kỳ đã nghĩ
đến việc rời bỏ công ty hiện tại của họ.
● Hơn 20% nhân viên nhận thấy có cơ hội thăng tiến trong nghề nghiệp sẽ có
khả năng ở lại làm việc cao hơn.
● Các nhân viên trẻ mong muốn có sự linh hoạt trong công việc, 84% thế hệ
millennials muốn cân bằng giữa công việc và cuộc sống, 36% chọn phương án
làm việc tại nhà thay vì tăng lương.
● 31% nhân viên nghỉ việc vì văn hoá, môi trường làm việc của công ty không
như họ mong nghĩ, trong đó nhân viên da đen có ý định nghỉ việc chiếm 35%
cao hơn so với nhân viên da trắng 27%.
Theo số liệu thống kê từ Hiệp hội Quản lý Nguồn nhân lực tại Hoa Kỳ (SHRM),
tình trạng nghỉ việc của nhân viên đang là một thách thức đối với các công ty ở Hoa Kỳ 5
nói riêng và trên toàn cầu nói chung, trên 29% công ty đang bị căng thẳng về vấn đề tìm người thay thế.
Một nghiên cứu của Center for American Progress (Tổ chức nghiên cứu và vận
động chính sách công tại Mỹ) chỉ ra rằng các công ty thường phải chi trả khoảng 1/5 số
tiền lương của một nhân viên để thay thế họ và chi phí có thể tăng lên đáng kể nếu
những chức vụ cao hoặc những nhân viên được trả lương cao cần tìm người thay thế.
Việc nắm bắt được tại sao và khi nào nhân viên có khả năng nghỉ việc cao có thể
giúp nhà quản lý đưa ra các phương án hành động để giữ chân nhân viên lâu hơn cũng
như có kế hoạch tuyển dụng phù hợp. Nhóm chúng tôi đã tiến hành nghiên cứu thực
hiện đề tài “Dự báo khả năng nghỉ việc của nhân viên tại công ty IBM ở Mỹ bằng mô
hình Azure Machine Learning”. Thông qua bài nghiên cứu này sẽ cung cấp một mô
hình mang tính chất tham khảo giúp dự báo khả năng nghỉ việc hay tiếp tục ở lại dựa
trên những yếu tố cơ bản từ đó có thể giúp nhà quản lý đưa ra những phương án hành
động để giữ chân nhân viên lâu hơn cũng như lập kế hoạch tuyển dụng phù hợp.
1.2 Giới thiệu tổng quan về công ty IBM
IBM – Tập đoàn công nghệ đến từ USA (viết tắt của International Business
Machines) là một tập đoàn công nghệ máy tính đa quốc gia có trụ sở tại Armonk, New
York, Mỹ. Được thành lập năm 1911, công ty IBM là một trong số ít các công ty công
nghệ của thế kỷ thứ 19 vẫn còn tồn tại cho đến ngày nay. Các sản phẩm được IBM sản
xuất và bán ra chủ yếu là phần cứng và phần mềm máy tính, bên cạnh đó là các dịch vụ
cơ sở hạ tầng, hosting và tư vấn trong nhiều lĩnh vực từ máy tính lớn đến công nghệ nano.
IBM được biết đến gần đây như là một công ty sản xuất máy tính hàng đầu thế
giới, với hơn 388,000 công nhân trên toàn thế giới. IBM là chủ công nhân công nghệ 6
lớn nhất trên toàn thế giới. Năm 2011, IBM đã xếp thứ 2 trong top 10 thương hiệu lớn
nhất thế giới với giá trị thương hiệu lên đến 70 tỷ USD.
IBM đã liên tục cải tiến AI sử dụng trong việc quản lý nguồn nhân sự tại công
ty, bà Rometty - CEO của IBM đã chia sẻ trong nhiệm kỳ CEO 7 năm của mình “Thời
điểm tốt nhất để có được nhân viên là trước khi họ bỏ việc”. Rometty nhận định rằng,
mô hình nhân sự truyền thống cần một cuộc đại tu, và đó là một trong số những chuyên
môn mà con người cần sự hỗ trợ của AI để cải thiện hiệu quả.
Bằng việc hiểu rõ hơn những mẫu dữ liệu và các kỹ năng liên quan, AI của IBM
có thể tập trung vào thế mạnh của mỗi cá nhân. Điều này sẽ giúp quản lý có thể chỉ dẫn
nhân viên tới những cơ hội trong tương lai mà khó có thể xác định khi sử dụng phương
pháp truyền thống. “Chúng tôi nhận ra rằng bảng khảo sát bởi quản lý không hề chính
xác, đánh giá của quản lý mang tính chủ quan, chúng tôi có thể đưa ra nhận định một
cách chính xác hơn từ dữ liệu” bà Rometty nói về quy trình đánh giá kỹ năng.
Vì vậy, nhóm chúng tôi mong muốn thực hiện việc đề xuất một mô hình dự
đoán khả năng nghỉ việc của nhân viên để có thể giúp ban lãnh đạo quản lý sử dụng
nguồn nhân sự của công ty một cách chính xác và hiệu quả hơn.
1.3 Mục tiêu nghiên cứu
Đề tài nghiên cứu của chúng tôi tập trung vào các giải quyết các vấn đề như sau:
 Tìm hiểu các yếu tố cơ bản ảnh hưởng đến quyết định nghỉ việc hoặc tiếp tục
làm việc của nhân viên tại công ty IBM.
 Đề xuất ra mô hình giúp công ty IBM cũng như các doanh nghiệp có thể áp
dụng để dự đoán khả năng nghỉ việc của nhân viên nhằm nâng cao công tác quản lý nhân sự HRM. 7
1.4 Câu hỏi nghiên cứu
Để hỗ trợ việc nghiên cứu, cần đặt ra các câu hỏi nhằm mục đích giải quyết các
thắc mắc đang gặp phải cũng như để hiểu rõ hơn về vấn đề:
 Các yếu tố ảnh hưởng đến vấn đề nghỉ việc của nhân viên? Yếu tố nào là quan trọng nhất?
 Mô hình nào phù hợp nhất để dự đoán quyết định nghỉ việc của nhân viên?
 Giải pháp để nhà lãnh đạo có thể hạn chế được quyết định nghỉ việc của nhân
viên trong công ty, nâng cao hiệu quả quản lý nguồn nhân lực hơn?
1.5 Ý nghĩa của nghiên cứu
Bài nghiên cứu này, tiết kiệm tài nguyên, giảm bớt sự lo lắng của các nhà quản
lý. Và chỉ ra cho các nhà quản lý cơ sở để sửa đổi, cải thiện các yêu cầu làm việc của
nhân viên nhằm giữ chân họ lại.
1.6 Đối tượng và phạm vi nghiên cứu
 Đối tượng nghiên cứu: quyết định nghỉ việc của nhân viên tại công ty IBM ở Mỹ.
 Phạm vi nghiên cứu: mô hình được lấy dữ liệu tại Hoa Kỳ được cung cấp bởi IBM Analytics.
1.7 Bố cục bài nghiên cứu
 Chương 1: Giới thiệu đề tài nghiên cứu
 Chương 2: Cơ sở lý thuyết
 Chương 3: Phương pháp nghiên cứu 8
 Chương 4: Kết quả nghiên cứu
 Chương 5: Kết luận và đề xuất giải pháp.
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
2.1 Lý thuyết về quyết định nghỉ việc và các yếu tố ảnh hưởng
2.1.1 Lý thuyết về quyết định nghỉ việc
Theo Tommy Thomas, 2009 quyết định nghỉ việc là tình trạng xảy ra khi nhân
viên của một tổ chức lựa chọn đưa ra quyết định chấm dứt hợp đồng lao động với tổ chức.
Theo Tett & Meyer, 1993 quyết định nghỉ việc là hành động có ý thức, có sự cân
nhắc trước khi rời khỏi tổ chức hiện tại.
Theo Mobley, 1997 quá trình đưa ra quyết định nghỉ việc là một chuỗi các giai
đoạn nhận thức, bắt đầu từ việc đánh giá công việc hiện tại, tiếp theo là cảm giác thỏa
mãn hoặc không thoả mãn về công việc hiện tại, nếu không thoả mãn họ sẽ nghĩ đến
việc nghỉ việc. Kế tiếp họ sẽ đánh giá tìm kiếm việc làm khác và chi phí bỏ ra. Nếu họ
nhận thấy sự thay thế là có sẵn và chi phí bỏ ra không cao, họ sẽ thực hiện việc tìm
kiếm và đánh giá các lựa chọn. Từ đó ý định nghỉ việc sẽ được kích thích và cuối cùng
là đưa ra quyết định nghỉ việc.
2.1.2 Ảnh hưởng của sự nghỉ việc
Theo Chan và cộng sự, 2001 đã khẳng định nhân viên nghỉ việc là một vấn đề
nghiêm trọng đối với tổ chức, đặc biệt trong lĩnh vực quản trị nhân sự. Ông cho rằng tỷ
lệ nghỉ việc cao sẽ gây bất lợi cho tổ chức thông qua việc gia tăng các loại chi phí, ảnh
hưởng trực tiếp và gián tiếp tới tổ chức. 9
Ảnh hưởng trực tiếp: Khi một nhân viên nghỉ việc, công ty phải mất 78.000 USD để
thay thế nhân viên nghỉ việc (Ramsey Smith, 2004), bao gồm:
- Chi phí cho tuyển dụng, chi phí đào tạo cho nhân viên (Alexander và cộng sự, 1994).
- Chi phí do sự mất mát những kiến thức ngầm quan trọng (Droege, Hoobler, 2003).
- Chi phí phát sinh từ kết quả hoạt động kinh doanh không hiệu quả, suy giảm
năng suất tạm thời của tổ chức (Osterman, 1987).
● Ảnh hưởng gián tiếp:
- Gây thiếu hụt nhân sự có chuyên môn và kinh nghiệm, làm giảm hiệu suất
công việc và gián đoạn hoạt động của dự án.
- Ảnh hưởng tinh thần làm việc của nhân viên khác.
- Thông tin, tình hình kinh doanh cũng như chính sách, khách hàng thân thiết
của tổ chức cũng có nguy cơ bị chia sẻ ra bên ngoài đặc biệt nguy hiểm khi
nhân viên chuyển sang làm việc cho đối thủ cạnh tranh.
2.1.3 Các yếu tố ảnh hưởng đến quyết định nghỉ việc
Hiện nay, công tác nghiên cứu về các yếu tố ảnh hưởng tới quyết định nghỉ việc
của nhân viên đã được nhiều nhà nghiên cứu tìm hiểu, nhóm tác giả nhận thấy có 2 yếu
tố chính ảnh hưởng đến quyết định này là: yếu tố cá nhân và yếu tố tổ chức.
Yếu tố cá nhân: 10
- Age: tuổi tác có thể ảnh hưởng đến quyết định nghỉ việc của nhân viên. Theo
Pitts và cộng sự, 2011 cho thấy ý định nghỉ việc sẽ xuất hiện và tăng trong giai
đoạn tuổi đầu tiên tham gia vào lao động sau đó thì giảm lại.
- Gender: theo kết quả từ các nghiên cứu của Knapp, 1982; Schwartz, 1989;
Powell và York, 1992 đã có kết luận rằng có mối quan hệ giữa giới tính và
quyết định nghỉ việc, và họ phân tích rằng khả năng nữ giới rời bỏ nơi làm việc nhiều hơn nam giới.
- Education: trình độ học vấn cá nhân cũng là một nhân tố tác động đến quyết
định nghỉ việc, các nghiên cứu đã đưa ra kết luận là người lao động có trình độ
học vấn càng cao thì càng có nhiều cơ hội tìm kiếm công việc thay thế theo
Cordes và Dougherty, 1993; Todd và Deery Schimit, 1996; Blankertz và Robinson, 1997.
- Overtime: theo phân tích của Zangaro và Soeken, 2007 về sự hài lòng công
việc đã nhận thấy rằng làm thêm giờ gây ra căng thẳng trong công việc, nó
mang tính tương quan mạnh mẽ đến sự hài lòng trong công việc.
- Marital Status: theo Krau, 1981 tình trạng hôn nhân cũng có thể ảnh hưởng
đến sự hao mòn nhân lực. Số con, trách nhiệm khi có gia đình sẽ tạo ra các nhu cầu ổn định.
- Monthly Income: trong phân tích của Griffith và cộng sự, 2000 thảo luận về
tác dụng và trả công sự thoả mãn. Họ nhận thấy điều quan trọng nhất là nhân
viên phải có cảm giác công bằng trong tiền lương. Theo McConnell, 2007 cho
rằng mức lương là nguyên nhân hàng đầu gây ra ý định nghỉ việc của nhân
viên. Theo Willis, 2000 tiền lương, thưởng là vấn đề quan trọng nhất khi nói
đến việc thu hút và giữ chân nhân tài. 11
- Total Working Years: thâm niên làm việc cũng có mối quan hệ với quyết định
nghỉ việc của người lao động. Người lao động làm việc cho tổ chức với thời
gian càng dài, họ sẽ càng gắn bó với tổ chức và tiếp tục làm việc cho tổ chức
lâu dài hơn theo Miller và Wheeler, 1992; Krecker, 1994; Lane, 1998.
Yếu tố tổ chức:
- Job Level: theo Delfgaauw Josse, 2007 sự không hài lòng với một lĩnh vực
công việc chẳng hạn như nhiệm vụ họ đang làm có thể đẩy người lao động ra
khỏi công việc đó, họ sẽ tìm tới công việc khác phù hợp hơn.
- Environment Satisfaction: theo Knight, Crutsinger, Kim, 2006 sự hài lòng
trong môi trường làm việc có thể ảnh hưởng đến quyết định của một nhân viên
ở lại với tổ chức dù vẫn có cơ hội việc làm khác.
- Relationship Satisfaction: sự hài lòng trong mối quan hệ là sự đánh giá chủ
quan về mối quan hệ của một người với nhiều người trong tổ chức. Khi sự hài
lòng ở mức cao mối quan hệ sẽ kéo dài, và ngược lại.
- Job Satisfaction: theo kết quả nghiên cứu của Bashir và cộng sự, 2012, sự hài
lòng với công việc có tác động ngược chiều đến quyết định nghỉ việc. Bashir
cũng cho biết kết quả này trùng khớp với nghiên cứu của Hulin, 1966.
2.2 Các nghiên cứu trước
- K. Coussement và D. Vanden poel, 2008 với bài nghiên cứu “Integrating
the voice of customers through call center email into a decision support
system for attrition prediction”. Trong nghiên cứu này, họ thiết lập rằng việc
thêm dữ liệu văn bản, phi cấu trúc thành một nhận dạng rời đi thông thường.
Các kết quả là nâng cao hiệu suất trong phân tích nhận dạng rời đi. Nghiên cứu
này hỗ trợ cho những người ra quyết định tiếp thị để cải thiện khả năng nhận
biết khách hàng có xác suất rời đi. 12
- CP Wei và IT Chiu,2002 với bài nghiên cứu “Turning telecommunications
call details to attrition prediction: a data mining approach”. Trong nghiên
cứu này, thực nghiệm đánh giá phương pháp nhận dạng sự rời đi từ dữ liệu hợp
đồng thuê bao và mô hình cuộc gọi sửa đổi được khai thác từ chi tiết cuộc gọi.
Điều này được mô tả là phương pháp có khả năng mô tả tiềm năng những
khách hàng tiêu chuẩn với mức hợp đồng cụ thể cho khoảng thời gian dự đoán được.
- VV Saradhi và GK Palshikar, 2011 với bài nghiên cứu “Employee churn
prediction” đã nghiên cứu và so sánh một số các phương pháp trong Machine
Learning để ngăn chặn quyết định nghỉ việc của nhân viên. Trong này họ đã
thực hiện một số phương pháp để tạo và so sánh các mô hình để có được mô
hình dự đoán tốt nhất.
- R.Khare, D. Kaloya, CK Choudhary và G.Gupta, 2011 đã nghiên cứu về
“Employee attrition risk assessment using logistic regression analysis”.
Nghiên cứu này sử dụng phương pháp Logistics Regression để ngăn chặn sự
rời đi của nhân viên. Trong điều này các nhà nghiên cứu thu thập dữ liệu nhân
khẩu học của nhân viên hiện tại ở công ty. Các thông tin này hữu ích để tạo ra
những mô hình phân loại nhóm các nhân viên có rủi ro cao. Mục tiêu cuối
cùng của nghiên cứu là xác định nhóm nhân viên có rủi ro cao để tổ chức chú ý
và ngăn chặn khỏi sự nghỉ việc này.
- ML Kane- Sellers, 2007 đã nghiên cứu về “Predictive models of employee
voluntary turnover in a North American professional salesforce using
data-mining analysis”. Bài nghiên cứu chủ yếu tập trung vào các đặc điểm cá
nhân, đặc tính công việc và phát triển nguồn nhân lực (human resources
development) ảnh hưởng đến sự tự nguyện của nhân viên. Các kết quả khuyến 13
nghị rằng sự đào tạo và tham gia phát triển là các yếu tố giữ chân nhân viên
hơn là tiền lương và sự thăng tiến trong công việc. 14
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
Chúng tôi đề xuất sử dụng mô hình Azure Machine Learning để dự báo khả
năng nghỉ việc của nhân viên tại công ty IBM theo quy trình như sau:
● Đầu tiên, chúng tôi thu thập dữ liệu về nhân viên bao gồm cả nhân viên ở quá khứ và hiện tại.
● Thứ hai, chúng tôi áp dụng các kỹ thuật làm sạch dữ liệu khác nhau tạo ra tập dữ
liệu mới đồng thời tiến hành phân tích, mô tả dữ liệu để xác định các thuộc tính
chính ảnh hưởng lớn đến quyết định nghỉ việc của nhân viên.
● Thứ ba, chúng tôi áp dụng mô hình số học Azure Machine Learning với nhiều
thuật toán khác nhau trên tập dữ liệu đã được xử lý cùng với các biến số đã được
chọn ra để dự báo khả năng nghỉ việc của nhân viên.
● Cuối cùng dựa trên kết quả thu thập được, so sánh các chỉ số hiệu suất của mô
hình máy học và chọn ra mô hình có hiệu quả nhất để giải quyết vấn đề đặt ra và
phát hành phần mềm hỗ trợ nhân sự trong công tác HRM.
3.1 Thu thập và mô tả dữ liệu
Để thực hiện bài nghiên cứu, chúng tôi đã sử dụng bộ dữ liệu “IBM Employee
Dataset” được cung cấp bởi IBM Watson Analytics tại trang web
https://www.kaggle.com/rohitsahoo/employee.
Bộ dữ liệu bao gồm 1470 mẫu quan sát với 35 đặc tính khác nhau liên quan đến
đời sống làm việc và đặc điểm cá nhân của nhân viên tại Hoa Kỳ bao gồm: ST Định nghĩa thuộc Thuộc tính Loại dữ liệu Mô tả thuộc tính T tính 1 Age Số nguyên Tuổi 2 Attrition Phân loại Quyết định nghỉ việc 3 Business Phân loại Mức độ đi công tác Non_Travel/Travel_ 15