Tên Đề Tài Ứng Dụng Của Big Data Trong Lĩnh Vực Ngân Hàng | Năng lực số ứng dụng

Tên Đề Tài Ứng Dụng Của Big Data Trong Lĩnh Vực Ngân Hàng | Năng lực số ứng dụng với những kiến thức và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần. Mời bạn đọc đón xem!

HỌC VIỆN NGÂN HÀNG
HỆ THỐNG QUẢN THÔNG TIN QUẢN LÝ
BÀI TẬP LỚN
MÔN NĂNG LỰC SỐ ỨNG DỤNG
TÊN ĐỀ TÀI
ỨNG DỤNG CỦA BIG DATA TRONG
LĨNH VỰC NGÂN HÀNG
Giáo viên hướng dẫn: Đinh Trọng Hiếu
Danh sách nhóm 15:
1. Mã sinh viên: 26A4011975 Họ và tên: Nguyễn Thị Minh Hương
2. Mã sinh viên: 24A4013306 Họ và tên: Lý Thị Thảo
3. Mã sinh viên: 26A4013322 Họ và tên: Trịnh Huyền Thư
4. Mã sinh viên: 26A4011963 Họ và tên: Trần Tuấn Huy
HÀ NỘI-15/12/2023
BẢNG PHÂN CÔNG CÔNG VIỆC
STT Mã SV Họ và tên Phân công
Đánh
giá
chất
lượng
(%)
Nhận xét
1 26A4011975 Nguyễn Thị Minh Hương
Ứng dụng của Big
Data trong các
hoạt động của
ngân hàng & Lý
thuyết của Big
Data
100%
hoàn
thành
đúng
hạn
2 24A4013306 Lý Thị Thảo
Ứng dụng của Big
Data trong các
hoạt động của
ngân hàng
100%
hoàn
thành
đúng
hạn
3 26A4013322 Trịnh Huyền Thư
Lý thuyết của Big
Data
100%
hoàn
thành
đúng
hạn
4 26A4011963 Trần Tuấn Huy
Thách thức, hạn
chế và giải pháp
khi ứng dụng Big
Data trong ngân
hàng
100%
hoàn
thành
đúng
hạn
MỤC LỤC
LỜI MỞ ĐẦU........................................................................................................................2
CHƯƠNG 1: KHÁI NIỆM, ĐẶC TRƯNG CỦA DỮ LIỆU LỚN VÀ SỰ KHÁC BIỆT
VỚI KHAI THÁC DỮ LIỆU..............................................................................................3
1.1.Khái niệm Big Data........................................................................................................... 3
1.2.Đặc trưng của Big data......................................................................................................3
1.3.Phân loại Big data.............................................................................................................5
1.4.Tầm quan trọng của dữ liệu lớn tài chính trong Ngân hàng.................................................7
1.4.1.Phát hiện và nn chặn gian lận...................................................................................7
1.4.2.Đánh g rủi ro chính xác.............................................................................................8
1.4.3.Phân loại hoặc giải thể khách hàng..............................................................................8
1.4.4.Tăng hiệu quả của c quy trình thcông.....................................................................8
1.5. Cách thức hoạt động của Big data....................................................................................8
1.6. So sánh Big Data và Data mining (Khai thác dữ liệu)....................................................10
1.7. Bộ công cụ và bộ kĩ năng cho Big Data trong ngân hàng...............................................11
1.7.1. Bộ công cụ cho Big Data trong ngân hàng..............................................................11
1.7.2. Bộ kỹ năng cho Big Data trong ngânng................................................................15
CHƯƠNG 2. ĐẶC ĐIỂM VÀ ỨNG DỤNG CỦA BIG DATA TRONG LĨNH VỰC
NGÂN HÀNG......................................................................................................................16
2.1. Phân tích thói quen hành vi chi tiêu của khách hàng......................................................17
2.3. Marketing cá nhân hóa...................................................................................................18
2.4. Nâng cao chất lượng dịch vụ chăm sóc khách hàng.......................................................19
2.5. Thay đổi cách thức cung cấp dịch vụ đến khách hàng....................................................19
2.6. Ngăn chặn các hành vi lừa đảo, vi phạm pháp luật........................................................20
2.7. Kiểm soát rủi ro, tuân thủ luật pháp và minh bạch trong báo cáo tài chính....................21
2.8. Bán chéo thêm các dịch vụ.............................................................................................21
2.9. Tham gia vào việc kiểm soát đánh giá và nâng cao hiệu quả làm việc của nhân viên....22
2.10. Dự đoán xu hướng tài chính.........................................................................................22
2.11. Tự động hóa các quy trình chính..................................................................................23
CHƯƠNG 3. THÁCH THỨC, HẠN CHẾ VÀ GIẢI PHÁP KHI ỨNG DỤNG BIG
DATA Ở TRONG NGÂN HÀNG......................................................................................23
3.1. Thách thức, hạn chế khi ứng dụng Big Data ở trong lĩnh vực ngân hàng.......................23
3.1.1.Khó tích hợp các hệ thống kế thừa............................................................................23
3.1.2.Big data 4.0 liên tục thay đổi....................................................................................24
3.1.3.Dữ liệu lớn đang trở nên không thể quản lý..............................................................24
3.1.4.Đòi hỏi thay đổi văn hóa doanh nghiệp....................................................................24
3.1.5.Rủi ro an ninh mạng..................................................................................................25
3.1.6.Thiếu chuyên gia công nghệ gây cản trở trong việc ứng dụng Big Data Industry 4.0.
...........................................................................................................................................25
3.2. Giải pháp khi ứng dụng Big Data trong lĩnh vực ngân hàng..........................................25
KẾT LUẬN..................................................................................................................................27
TÀI LIỆU THAM KHẢO.............................................................................................................28
1
LỜI MỞ ĐẦU
Dữ liệu lớn đang trở thành một trong những xu hướng công nghệ quan trọng nhất có tiềm
năng thay đổi đáng kể cách các tổ chức sử dụng thông tin để nâng cao trải nghiệm của khách
hàng và chuyển đổi mô hình kinh doanh của họ. Làm thế nào để một công ty sử dụng dữ liệu
để có lợi thế tốt nhất? Biến một lượng lớn dữ liệu thành kiến thức có nghĩa là gì? Trong cuốn
sách này, chúng tôi cung cấp cho bạn thông tin chi tiết về cách chuyển đổi công nghệ trong
phần mềm, phần cứng và mô hình phân phối đang thay đổi cách dữ liệu có thể được sử dụng
theo những cách mới. Dữ liệu lớn không phải là một thị trường duy nhất. Thay vào đó, nó là
sự kết hợp của các công nghệ quản lý dữ liệu đã phát triển theo thời gian. Dữ liệu lớn cho
phép các tổ chức lưu trữ, quản lý và thao tác một lượng lớn dữ liệu với tốc độ phù hợp và
đúng thời điểm để có được thông tin chi tiết phù hợp.
Chìa khóa để hiểu dữ liệu lớn là dữ liệu phải được quản lý để nó có thể đáp ứng yêu cầu
kinh doanh mà một giải pháp nhất định được thiết kế để hỗ trợ. Hầu hết các công ty đang ở
giai đoạn đầu với hành trình dữ liệu lớn của họ. Nhiều công ty đang thử nghiệm các kỹ thuật
cho phép họ thu thập một lượng lớn dữ liệu để xác định xem liệu các mẫu ẩn có tồn tại trong
dữ liệu đó có thể là dấu hiệu ban đầu của một thay đổi quan trọng hay không. Một số dữ liệu
có thể chỉ ra rằng mô hình mua hàng của khách hàng đang thay đổi hoặc các yếu tố mới trong
doanh nghiệp cần được giải quyết trước khi quá muộn. Khi các công ty bắt đầu đánh giá các
loại giải pháp dữ liệu lớn mới, nhiều cơ hội mới sẽ mở ra. Ví dụ, các công ty sản xuất có thể
theo dõi dữ liệu đến từ các cảm biến máy để xác định cách các quy trình cần được sửa đổi
trước khi một sự kiện thảm khốc xảy ra. Các nhà bán lẻ sẽ có thể theo dõi dữ liệu trong thời
gian thực để bán thêm các sản phẩm liên quan đến khách hàng khi họ đang thực hiện giao
dịch. Các giải pháp dữ liệu lớn có thể được sử dụng trong chăm sóc sức khỏe để xác định
nguyên nhân gây bệnh và cung cấp cho bác sĩ hướng dẫn về các lựa chọn điều trị. Tuy nhiên,
dữ liệu lớn không phải là một giải pháp cô lập. Việc triển khai một giải pháp dữ liệu lớn đòi
hỏi phải có cơ sở hạ tầng để hỗ trợ khả năng mở rộng, phân phối và quản lý dữ liệu đó. Do đó,
điều quan trọng là phải đưa ra cả chiến lược kinh doanh và kỹ thuật để sử dụng điều quan
trọng này xu hướng công nghệ. Vì nhiều lý do quan trọng, chúng tôi nghĩ rằng điều quan trọng
là bạn phải hiểu các công nghệ dữ liệu lớn và biết các cách mà các công ty đang sử dụng các
công nghệ mới nổi như Hadoop, MapReduce và các công cụ cơ sở dữ liệu mới để kinh doanh.
Sự trỗi dậy của Dữ liệu lớn đãtác động đáng kể đến ngành tài chính. Kháchng không
n phải đến chi nhánh ngân hàng địa phương và giải quyết mọi nhu cầu ngân hàng của họ với
sự hỗ trợ của nhân viên thu ngân. Trên thực tế, hầu hết kháchng hiện nay đều sử dụng các ứng
dụng điện thoại thông minh ngân hàng trực tuyến cũng như các dịch vụ truyền thống tại chi
nhánh để truy cập nhiều loại sản phẩm tài chính. Với sự phát triển của internet và pơng tiện
truyền thônghội, ngành ngân hàng, giống như phần còn lại của nền kinh tế toàn cầu, đã trải
2
qua một biến động cơ bản. Ngành ngânng Dữ liệu lớn có quyền truy cập vào rất nhiều nguồn
dữ liệu mà họthể sử dụng để hiểun về người tiêung và cung cấp cho học dịch v
sản phẩm đượcnhân hóa hơn. Ví dụ: Dữ liệu lớn cho ngân hàng có thể được xemt từ
c độ mô hình chi tiêu, thông tinn dụng,nh hình tài chính và giám sát phương tiện truyền
thônghội để hiểu hơn về hành vi và mô hình của người tiêu dùng. Dữ liệu lớn để phân tích
khách hàng ngân hàng thúc đẩy cơ hội doanh thu.
3
CHƯƠNG 1: KHÁI NIỆM, ĐẶC TRƯNG CỦA DỮ LIỆU LỚN VÀ SỰ KHÁC BIỆT
VỚI KHAI THÁC DỮ LIỆU
1.1.Khái niệm Big Data
Big Data là các tập dữ liệu có khối lượng lớn và phức tạp. Độ lớn đến mức các phần mềm xử
lý dữ liệu truyền thống không có khả năng thu thập, quản lý và xử lý dữ liệu trong một
khoảng thời gian hợp lý.
Những tập dữ liệu lớn này có thể bao gồm các dữ liệu có cấu trúc, không có cấu trúc và bán
cấu trúc, mỗi tập có thể được khai thác để tìm hiểu insights.
1.2.Đặc trưng của Big data
Big Data (Dữ liệu lớn) là tập hợp các dữ liệu được tổng hợp từ nhiều nguồn và thường được
miêu tả bằng 5 đặc điểm: Volume (Khối lượng), Variety (Tính đa dạng), Velocity (Tốc độ),
Value (Tính giá trị), Veracity (Độ tin cậy).
3
*Volume (Khối lượng dữ liệu)
Là sự tăng trưởng về mặt khối lượng của tệp dữ liệu. Dữ liệu trong các hệ thống thông tin
luôn và liên tục tăng lên về mặt kích thước. Thực vậy, trong khi những dữ liệu thông thường
có thể đo lường bằng những đơn vị quen thuộc như là Megabyte (MB), Gigabyte (GB),
Terabyte (TB), thì Big Data được lưu trữ bằng Petabyte (PB), Exabyte (EB), Zettabyte (ZB).
Để mô tả rõ sự khác biệt về kích thước của hai loại dữ liệu, trường Đại Học Berkeley đã
nghiên cứu và đưa ra kết luận rằng: 1GB có khối lượng dữ liệu tương đương với một video
với chất lượng HD trong vòng 7 phút thì 1 ZB lại tương đương với 250 tỷ đĩa DVD.
*Variety (Tính đa dạng)
Là sự gia tăng về tính đa dạng của dữ liệu. Trong khi dữ liệu truyền thống chỉ có một loại dữ
liệu được tổ chức và sắp xếp ở trong cơ sở dữ liệu lên quan thì Big Data còn có thêm loại dữ
liệu phi cấu trúc và dữ liệu bán cấu trúc như là văn bản, âm thanh và video. Điều đó có nghĩa
là nó đòi hỏi phải có thêm một số phương pháp xử lý để tìm ra ý nghĩa của dữ liệu và cùng
tổng hợp chúng thành thông tin có ý nghĩa.
*Velocity (Tốc độ)
Là tốc độ tăng trưởng của dữ liệu. Khái niệm này chỉ khoảng thời gian cần thiết để tạo ra,
phân tích, quản lý toàn bộ dữ liệu. Mặc dù Big Data có khối lượng lớn dữ liệu khổng lồ
nhưng nó cần phải được xử lý với tốc độ cực nhanh để sinh ra những thông tin cần thiết.
Ngày nay, khi thời đại tốc độ Internet phát triển mạnh mẽ, tốc độ của một dữ liệu được tạo ra,
tìm kiếm và rồi dịch chuyển sang vị trí khác hiện tại đã đạt đến mức đáng kinh ngạc, chỉ vài
micro giây, cho phép người dùng có thể phân tích trực tiếp các thông số của các dữ liệu được
tạo ra trong thời gian thực.
4
*Value (Tính giá trị)
Tính giá trị của dữ liệu thường được đánh giá bởi giá trị kinh tế hoặc xã hội tiềm năng mà dữ
liệu có thể đưa cho doanh nghiệp. Đây được coi là một trong những đặc điểm quan trọng nhất
của công nghệ Big Data đối với doanh nghiệp, bởi không phải dữ liệu nào cũng có ý nghĩa.
Vậy nên, các doanh nghiệp cần phải hoạch định được những giá trị thông tin hữu ích của Big
Data đối với các vấn đề hoặc mô hình hoạt động kinh doanh của họ.
*Veracity (Độ tin cậy)
Độ tin cậy của dữ liệu được định nghĩa như là sự chính xác của dữ liệu. Đặc biệt, trong thời
kì các phương tiện truyền thông xã hội và mạng xã hội phát triển mạnh mẽ, mỗi ngày người
dùng tạo ra vô vàn thông tin, kiến thức mới, khiến cho độ xác thực và tin cậy của dữ liệu càng
ngày càng khó xác định hơn, tạo nên sự không đồng nhất của các tệp dữ liệu và gây cản trở
cho các quy trình xử lý và quản lý nó. Vậy nên, doanh nghiệp cần phải đảm bảo độ chính xác
của dữ liệu để giảm bớt những sai lệch có thể xảy ra.
1.3.Phân loại Big data
Big Data bao gồm các dữ liệu có cấu trúc, dữ liệu phi cấu trúc và các dữ liệu bán cấu trúc.
Theo Tạp chí Thế giới máy tính, có tới hơn 70-80% tất cả các dữ liệu trong các tổ chức là dữ
liệu phi cấu trúc như là video, ảnh, trang website,… Và mỗi loại dữ liệu lớn này đều có
những công cụ để lưu trữ và xử lý riêng biệt.
*Dữ liệu có cấu trúc:
5
Dữ liệu có cấu trúc thường được lưu trữ, sắp xếp một cách có tổ chức dưới dạng bảng
và cột chứa thông tin để mô tả các thuộc tính và mối quan hệ với các dữ liệu khác. Các
dữ liệu loại này thường được quản lý thông qua cơ sở dữ liệu quan hệ. Bên cạnh đó dữ liệu có
cấu trúc thường được tìm kiếm, xử lí bằng cách sử dụng ngôn ngữ truy vấn có cấu trúc
Structured Query Language (SQL).
*Dữ liệu phi cấu trúc:
Dữ liệu phi cấu trúc không thể chứa trong cơ sở dữ liệu dạng hàng và cột, và nó cũng
không có mô hình dữ liệu liên quan nào. Đây là loại dữ liệu gốc và có rất nhiều định
dạng như: video và hình ảnh, văn bản, âm thanh, nội dung từ mạng xã hội,… Chính vì
6
vậy, những dữ liệu này rất khó tìm kiếm, quản lý và phân tích nên các doanh nghiệp thường
bỏ qua loại dữ liệu này cho đến khi sự ra đời của trí tuệ nhân tạo và các thuật toán máy tự học
giúp quá trình này trở nên dễ dàng hơn. Ngoài ra, dữ liệu phi cấu trúc thường được lưu trữ
trong một cơ sở dữ liệu không quan hệ là No Structured Query Language (NoSQL).
*Dữ liệu bán cấu trúc:
Dữ liệu bán cấu trúc có một số tính chất đồng nhất có thể xác định được, nhưng lại
không hình thành một cấu trúc rõ ràng để phù hợp với cơ sở dữ liệu quan hệ dưới dạng
bảng và cột. Một vài ví dụ cho dạng cấu trúc này là email thuộc dạng không có cấu trúc
nhưng lại chứa những dữ liệu có cấu trúc như tên, địa chỉ người nhận, thời gian gửi thư,.. hay
những bức ảnh chụp từ điện không có cấu trúc với những dữ liệu cơ sở liên quan nhưng lại
được gắn những dữ liệu cấu trúc như thời gian chụp, nơi chụp, ID của thiết bị.
1.4.Tầm quan trọng của dữ liệu lớn tài chính trong Ngân hàng
Dữ liệu lớn trong tài chính hoặc ngân hàng Dữ liệu lớn đề cập đến hàng petabyte dữ liệu có t
chức và phi cấu trúc có thể được các ngân hàngtổ chức tài chính sử dụng để dự đoán hành vi
của khách hàng và phát triển chiếnợc. Lĩnh vực tài chính tạo ra một lượng lớn dữ liệu. Dữ
liệu có cấu trúcthông tin được xử trong một công ty để cung cấp những hiểu biết quan
trọng về việc ra quyết định. Dữ liệu phi cấu trúc đang đượcch lũy từ nhiều nguồn khác nhau
với số lượng ngày càngng, mang lại những cơ hội phân tích to lớn.
Mỗi ngày, hàng tỷ đô la đi qua thị trường toàn cầu và các nhà phân tích được giao nhiệm vụ
theo dõi thông tin này với độ chính xác, bảo mật tốc độ để đưa ra dự báo, tìm ra mô hình
phát triển các chiến thuật dđoán. Cách dữ liệu này được thu thập, xlý, lưu trữ và phân tích sẽ
c định giá trị của nó. Các nhà phân tích ngày càng lựa chọn các giải pháp dữ liệu đám mây
c hệ thống không thể chứa dữ liệu phi cấu trúc tách biệt nếu khôngsự tham gia rộng
i và phức tạp của CNTT. Các ngân hàng sử dụng Dữ liệu lớn có thể đưa ra những đánh g
ng suốt về những thứ như cải thiện dịch vụ chăm sóc kháchng, nn chặn gian lận, nhắm
mục tiêu khách hàng tốt hơn, hiệu suất kênhng đầu và đánh giá mức độ rủi ro với khả năng
đánh giá các loại dữ liệu khác nhau.
c tổ chức tài chính không phải là những người bản địa về kỹ thuật số và đã phải trải qua một
quá trình chuyển đổi o dài, đòi hỏi những thay đổi về hành vicông nghệ. Ngành ngân hàng
Dữ liệu lớn đã trải qua những tiến bộ công nghệ đáng kể trong những năm gần đây, mang đến
c giải pháp thuận tiện, phợp an toàn cho doanh nghiệp. Do đó, phân tích Dữ liệu lớn của
ngân hàng đã thể cách mạng hóa không chỉ các hoạt động kinh doanh riêng lẻcòn cả toàn
bộ ngành dịch vụi chính. Chúng ta hãy xem xét một số cách cụ thể Dữ liệu lớn đã hiện đại
a và cách mạng hóa tài chính.
1.4.1.Phát hiện ngăn chặn gian lận
7
Việc phát hiện và ngăn chặn gian lận được hỗ trợ rất nhiều nhờ học máy, được hỗ trợ bởi dữ liệu
lớn. Các mối đe dọa về bảo mật thẻ tín dụng đã được giảm bớt nhờ các phân tích phân tích xu
ớng mua hàng. Khi thông tin thẻ tín dụng vừa an toàn vừa có giá trị bị đánh cắp, các ngân
ng giờ đây thể đóng băng thẻ giao dịch ngay lập tức, đồng thời cảnh báo người tiêu
ng về mối nguy hiểm về bảo mật.
1.4.2.Đánh g rủi ro chính c
Học máy ngày càng được sử dụng để đưa ra các lựa chọn tài chính quan trọng như đầucho
vay. Các quyết định dựa trên phân tích dự đoán xem xét mọi thứ từ nền kinh tế, phân khúc
khách hàng đến vốn doanh nghiệp để xác định các mối nguy tiềm ẩn như khoản đầu tư hoặc
thanh toán bị lỗi.
1.4.3.Phân loại hoặc giải thể khách hàng
Đây là một tính năng rất hữu ích và hiệu quả được cung cấp bởi Big Data trong hoạt động kinh
doanh ngân hàng. Nó có khả năng phân loại khách hàng dựa trên các hoạt động tài chính của họ,
chẳng hạn như thu nhập, chi tiêu, tiết kiệm và đầu tư. Thông tin chức năng và quan trọng của
khách hàng được ghi nhận và phân loại dựa trên yêu cầu tài chính của họ. Điều này cho phép
ban quản lý ngân hàng nắm bắt tốt hơnc giới hạn dịch vụ tài chính mà họ cần nâng cấp hoặc
hạ cấp. Tính năng này đã hỗ trợ và tiếp tục hỗ trợ quản lý ngân hàng trong việc hoạch định lãi
suất và các dịch vụ tài chính kc.
1.4.4.Tăng hiệu quả của các quy trình thủ ng
Khả năng mở rộng một tính năng của các giải pháp tích hợp dữ liệu cho phép chúng phát triển
khi nhu cầu kinh doanh thay đổi. Các công ty thẻ tín dụngthể tự động hóa các hoạt động
thường ngày, giảm giờ làm của nhân viên CNTT và cung cấp thông tin chi tiết về hoạt động
ng ngày của khách hàng bằng cách truy cập vào bức tranh hoàn chỉnh về tất cả các giao dịch
ng ngày.
1.5. Cách thức hoạt động của Big data
8
Big Data cung cấp cho bạn thông tin chi tiết mới, mở ra cơ hội và mô hình kinh doanh mới.
Bắt đầu bao gồm ba hành động chính:
*Tích hợp
Big Data tập hợp dữ liệu từ nhiều nguồn và ứng dụng khác nhau. Các cơ chế tích hợp dữ liệu
truyền thống, chẳng hạn như trích xuất, chuyển đổi và tải (ETL) thường không phù hợp với
nhiệm vụ. Nó đòi hỏi các chiến lược và công nghệ mới để phân tích các tập Big Data ở quy
mô terabyte, hoặc thậm chí là petabyte.
Trong quá trình tích hợp, bạn cần đưa dữ liệu vào, xử lý và đảm bảo dữ liệu được định dạng
và có sẵn ở dạng mà các nhà phân tích kinh doanh của bạn có thể bắt đầu.
*Quản lý
Big Data yêu cầu lưu trữ. Giải pháp lưu trữ của bạn có thể trên đám mây, tại chỗ hoặc cả hai.
Bạn có thể lưu trữ dữ liệu của mình ở bất kỳ hình thức nào bạn muốn và đưa các yêu cầu xử
lý mong muốn cũng như các công cụ xử lý cần thiết vào các tập dữ liệu đó theo yêu cầu.
Nhiều người chọn giải pháp lưu trữ của họ theo nơi dữ liệu của họ hiện đang cư trú. Đám
mây đang dần trở nên phổ biến vì nó hỗ trợ các yêu cầu tính toán hiện tại của bạn và cho
phép bạn sử dụng tài nguyên khi cần thiết.
*Phân tích
9
Khoản đầu tư của bạn vào Big Data sẽ được đền đáp khi bạn phân tích và hành động trên dữ
liệu của mình. Có được sự rõ ràng mới với phân tích trực quan về các tập dữ liệu đa dạng của
bạn. Khám phá thêm dữ liệu để tạo ra những khám phá mới. Chia sẻ những phát hiện của bạn
với những người khác. Xây dựng mô hình dữ liệu bằng máy học và trí tuệ nhân tạo. Đưa dữ
liệu của bạn vào hoạt động.
1.6. So sánh Big Data và Data mining (Khai thác dữ liệu)
Big Data Data Mining là hai khái niệm quan trọng trong lĩnh vực quản lý dữ liệu và phân
tích dữ liệu. Dưới đây là một so sánh giữa chúng:
*Định nghĩa:
Big Data: Big Data đề cập đến việc xử lý và phân tích dữ liệu lớn, có kích thước lớn và phức
tạp. Nó không chỉ giới hạn trong việc lưu trữ mà còn bao gồm cả khả năng xử lý và phân tích
dữ liệu có kích thước lớn.
Data Mining: Data Mining là quá trình khám phá các mẫu tiềm ẩn, thông tin hữu ích hoặc tri
thức từ dữ liệu có cấu trúc hoặc không cấu trúc.
*Mục tiêu chính:
Big Data: Mục tiêu chính của Big Data là quản lý và xử lý dữ liệu lớn, giúp tổ chức hiểu rõ
hơn về môi trường kinh doanh của họ, đưa ra quyết định thông tin và tối ưu hóa hiệu suất.
Data Mining: Mục tiêu chính của Data Mining là phát hiện mẫu tiềm ẩn, quy luật, và thông
tin hữu ích từ dữ liệu để hỗ trợ quyết định và dự đoán.
*Quy mô dữ liệu:
Big Data: Xử lý dữ liệu ở quy mô lớn, thường là dữ liệu có kích thước từ terabytes đến
petabytes.
Data Mining: Có thể áp dụng trên các bộ dữ liệu lớn, nhưng không nhất thiết phải là dữ liệu
lớn. Các kỹ thuật Data Mining có thể được sử dụng trên dữ liệu có kích thước nhỏ hơn.
10
*Phương pháp:
Big Data: Sử dụng các công nghệ như Hadoop, Spark để lưu trữ và xử lý dữ liệu lớn, cũng
như các công nghệ in-memory để tối ưu hóa hiệu suất.
Data Mining: Sử dụng các thuật toán máy học, thống kê, khai phá dữ liệu để khám phá thông
tin từ dữ liệu.
*Ứng dụng:
Big Data: Thường được sử dụng để phân tích xu hướng thị trường, dự đoán nhu cầu của
khách hàng, tối ưu hóa quy trình kinh doanh.
Data Mining: Có thể được áp dụng trong nhiều lĩnh vực như tiếp thị, y tế, tài chính để phân
tích mô hình và dự đoán.
*Liên quan:
Big Data: Là nguồn cung cấp dữ liệu cho Data Mining. Dữ liệu lớn cung cấp nguồn dữ liệu
phong phú để áp dụng các kỹ thuật khai thác dữ liệu.
Data Mining: Cần có dữ liệu để phân tích, và dữ liệu lớn cung cấp một nguồn cung cấp dữ
liệu lớn để áp dụng các kỹ thuật khai thác dữ liệu.
=>Tóm lại, Big Data tập trung vào quản lý và xử lý dữ liệu lớn, trong khi Data Mining
tập trung vào việc khám phá thông tin từ dữ liệu để hỗ trợ quyết định và dự đoán. Cả
hai đều là các khía cạnh quan trọng của lĩnh vực quản lý dữ liệu và phân tích dữ liệu.
1.7. Bộ công cụ và bộ kĩ năng cho Big Data trong ngân hàng
1.7.1. Bộ công cụ cho Big Data trong ngân hàng
Hadoop
Hadoop được tạo ra như một giải pháp Dữ liệu lớn tiên phong giúp xử lý khối lượng khổng
lồ dữ liệu có cấu trúc, phi cấu trúcn cấu trúc. Nó là một khung phân tán để lưu trữ d
liệu và chạy các ứng dụng trên các cụm phần cứng thông dụng. Khi được giới thiệu lần đầu
tiên vào năm 2006, gần như ngay lập tức gắn liền với Dữ liệu lớn. Hadoop được tạo
thành từ bốn phần chính:
Yet Another Resource Negotiator, hay YARN, một chương trình lên lịch thực
thi các công việc trên các nút cụm gán tài nguyên hệ thống cho chúng.
Hadoop MapReduce, một công cụ xử hàng loạt tích hợp sẵn giúp phân chia các
phép tính lớn và chạy chúng trên các nút khác nhau để cân bằng tốc độ tải; và
Hadoop MapReduce, một công cụ xử hàng loạt tích hợp sẵn giúp phân chia các
11
phép tính lớn và chạy chúng trên các nút khác nhau để cân bằng tốc độ tải; và
Hadoop MapReduce.
HDFS (Hệ thống tệp phân tán Hadoop) chia dữ liệu thành các khối để lưu trữ trên
c nút cụm, sử dụngchế sao chép để ngăn ngừa mất dữ liệu và điều chỉnh việc
truy cập dữ liệu.
Hadoop Common tập hợp các tiện ích thư viện mà mọi người đềuthể s
dụng.
Trường hợp điển hình: Công cụ dữ liệu lớn dựa trên Hadoop để phân tích thống kê sử
dụng thiết bị
Luồng khí
Airflow là phần mềm quản quy trình làm việc dành cho các hệ thống dữ liệu lớn, cho phép
chúng lên lịch và chạy các đường ống dữ liệu phức tạp. Nó cho phép các kỹ sư dữ liệu và
những người dùng khác đảm bảo rằng mỗi bước trong quy trình làm việc được hoàn thành
theo đúng thứ tựtất cả tài nguyên hệ thống đều có sẵn. Airflow cũng được tiếp thịdễ sử
dụng: Quy trình làm việc được viết bằng Python, ngôn ngữ lập trình có thể được sử dụng để
y dựng mô hình học máy, truyền dữ liệu và thực hiện nhiềuc vụ khác. Đây là một số yếu
tố chính của Airflow:
giao diện người dùng ứng dụng web để trực quana đường dẫn dữ liệu, theo dõi
trạng thái sản xuất và khắc phục sự cố;
một thiết kế mô-đun có thể mở rộng dựa trên khái niệm biểu đồ tuần hoàn
ớng (DAG),tả sự phụ thuộc lẫn nhau giữa các nhiệm vụ của quy trình công
việc;
c kết nối được tạo sẵn với các nền tảng đámy chính các dịch vụn th
ba khác.
Tổ ong
Hive là phần mềm cơ sở hạ tầng kho dữ liệu sử dụng SQL để đọc, ghi và quảncác tập dữ
liệu khổng lồ trong các hệ thống lưu trữ phân tán. Facebook đã phát minh ra nó, nhưng sau
đóđược mở nguồn cho Apache, công ty này vẫn tiếp tục phát triển hỗ trợ .
12
Hive là một khung xử dữ liệu cấu trúc hoạt động trên nền tảng Hadoop. Nó được sử
dụng để tóm tắt và phân tích dữ liệu cũng như truy vấn lượng dữ liệu khổng lồ. Các nhà phát
triển của Hive tả nó là có khả năng mở rộng, nhanh chóng và linh hoạt, mặc thực tế
không thể được sử dụng để xử lý giao dịch trực tuyến, cập nhật theo thời gian thực hoặc
truy vấn hoặc quy trình cần truy xuất dữ liệu có độ trễ thấp. Dưới đây là một số tính năng
chính khác:
một phương pháp tích hợp để hỗ trợ người dùng áp đặt cấu trúc trên các định dạng
dữ liệu khác nhau;
chức năng SQL thông thường để truy vấn phân tích dữ liệu;
truy cập vào các tệp HDFS cũng như các tệp đượcu trữ trongc hệ thống
khác, chẳng hạn như cơ sở dữ liệu Apache HBase.
Nháy mắt
Flink là một khung xử lý luồng dành cho các ứng dụng được nối mạng, hiệu suất caoluôn
khả dụng và đó là một dự án nguồn mở khác của Apache. Nó có thể được sử dụng để xử lý
ng loạt, đồ thị và lặp lại, đồng thời cho phép nh toán trạng thái trên cả luồng dữ liệu hữu
hạn và không giới hạn.
Flink có thể xử lý hàng triệu sự kiện trong thời gian thực với độ trễ thấp và thông lượng
lớn, đồng thời bao gồm các đặc điểm sau, nhằm chạy trong tất cả các môi trường cụm phổ
biến:
ba cấp độ API để tạo các loại ứng dụng khác nhau;
một bộ thư viện để xử lý sự kiện phức tạp, học máy và các trường hợp sử dụng D
liệu lớn khác;
một bộ thư viện để tính toán trong bộ nhớ với khả năng truy cập vào bộu trữ đĩa
nếu cần.
13
Tảng băng trôi
Iceberg là một định dạng bảng mở để quản dữ liệu trong hồ dữ liệu, điều này đạt được một
phần bằngch giữ các tệp dữ liệu riêng lẻ thay vì các thư mục trong bảng. Theo trang web
của dự án, Iceberg hiện là một dự án của Apache và thường được "sử dụng trong sản xuất
trong đó một bảng duy nhấtthể chứa hàng chục petabyte dữ liệu".
Định dạng bảng Iceberg được tạo để cải thiện các bố cục phổ biến thường thấy trong các
ng cụ như Hive, Presto, Spark và Trino. Hoạt động củaơng tự như các bảng SQL
trong sở dữ liệu quan hệ. Tuy nhiên, nó hỗ trợ một số công cụ hoạt động trên cùng một bộ
u tập dữ liệu. Sau đây là một số tính năng quan trọng hơn:
phân vùng dữ liệu ẩn, giúp loại bỏ nhu cầu người dùng duy trì phân vùng;
tiến hóa lược đồ, cho phép nời dùng thay đổi bảngkhông cần phải viết lại
hoặc di chuyển dữ liệu;
khả năng "du hành thời gian", cho phép người dùng chạy các truy vấn lặp lại bằng
ch sử dụng cùng một ảnh chụp nhanh bảng.
Tia lửa
Spark là mộtng cụ phân tích và xử dữ liệu trong bộ nhớ thể chạy trên các cụm hoặc
cụm độc lập do Hadoop YARN, Mesos và Kubernetes quản lý. Nó thể được sử dụng cho
c ứng dụng hàng loạt và phát trực tuyến, cũng như xử lý đồ thịhọc máy. Tất cả đều có
thể thực hiện được nhờ bộ sưu tập các mô-đun và thư viện được cài đặt sẵn sau đây:
Spark SQL, trình tối ưua truy vấn SQL cho dữ liệu cấu trúc;
Spark Streaming và Structured Streaming, hai mô-đun xử luồng;
MLlib, thư việny học với các kỹ thuật và công cụ;
GraphX, một API bổ sung hỗ trợ choc ứng dụng đồ thị.
Kafka
Kafka là một nền tảng phát trực tuyến sự kiện phân tán, chủ yếu được sử dụng choc đường
ống dữ liệu hiệu suất cao, phânch phát trực tuyến, tích hợp dữ liệu và các ứng dụng quan
trọng. Về cơ bản, Kafka là một framework để lưu trữ, đọc phânch dữ liệu truyền phát
dạng đơn giản nhất.Công nghệ tách các luồng dữ liệu khỏi hệ thống, cho phép các luồng d
liệu được lưu trữ và tái sử dụng ở nơi kc. Nó chạy trong môi trường phân tán và giao tiếp
với các hệ thống và ứng dụng bằng giao thức mạng TCP hiệu suất cao. Dưới đây là một số
yếu tố quan trọng nhất của Kafka:
một bộm API Java Scala cơ bản;
14
khả năng chịu lỗi cho cả máy chủ và máy khách trong cụm Kafka;
khả năng mở rộng linh hoạt tới 1.000 "nhài giới" hoặc máy chủ lưu trữ trên
mỗi cụm.
Bão
Storm là một hệ thống xử lý thời gian thực phân tán được thiết kế để xửcác luồng dữ liệu
không giới hạn một cách an toàn và cũng là một phần của công nghệ nguồn mở
Apache. Theo trang web của dự án, có thể được sử dụng để phân tích thời gian thực, học
máy trực tuyến tính toán liên tục, cũng như các hoạt động trích xuất, chuyển đổi tải
(ETL). Các yếu tố sau đây cũng có mặt trong một cơn bão:
Storm SQL, cho phép thực hiện các truy vấn SQL dựa trên các tập dữ liệu truyền
trực tuyến;
API Trident và Streams, hai giao diện xử lý Storm cấp cao hơn; và phối hợp cụm
bằng cách sử dụng Apache Zookeeper.
1.7.2. Bộ kỹ năng cho Big Data trong ngân hàng
Theo phânch từ Tập đoàn Dữ liệu Quốc tế (IDC), ngành phân tích kinh doanh Dữ liệu
lớn toàn cầu đã phát triển với tốc độ nhanh chóng trong những năm gần đây và đang trên đà
đạt 274 tỷ USD vào cuối năm nay, 2022. Với Sự tăng trưởng nhanh chóngy mang đến cơ
hội lớn để cải thiện kỹ năng phân tích dữ liệu của bạn, chẳng hạn như bằng cách tham gia
chương trình đào tạo về phân tích dữ liệu được thiết kế riêng cho những người mới bước vào
nghề. Để thành công trong lĩnh vực này, các nhà phân tích dữ liệu cần một nhóm tài năng cụ
thể, hầu hếtbản chất kỹ thuật; tuy nhiên, họ cũng yêu cầu một bộ kỹ năng mềm.
1. Trực quana dữ liệu. Khả năng sử dụng hình ảnh hoặc các bản vẽ khác để trình bày kết
quả dữ liệu với mục tiêu hiểu hơn về những hiểu biết sâu sắc dựa trên dữ liệu.
2. m sạch dữ liệu. Các nhà phân tích dữ liệu yêu cầu kỹ năng làm sạch dữ liệu mạnh mẽ
dữ liệu không được làm sạch có thể dẫn đến các mẫu dữ liệu không thực tế hoặc sai
lệch.
3. MATLAB. Việc triển khai thuật toán, thao tác ma trậnvẽ đồ thị dữ liệu, cùng với các
khả năng khác, được hỗ trợ bởi ngôn ngữ lập trình và môi trường điện toán số đa mô hình
y. R. Trong phân tích dữ liệu, R là một trong những ngôn ngữ được sử dụng rộng rãi và
rộng rãi nhất. Cú pháp và cấu trúc của R được thiết kế để hỗ trợ công việc phân tích
theo mặc định, nó đim với một số lệnh tổ chức dữ liệu đơn giản, tích hợp sẵn. Các
doanh nghiệp thích ngôn ngữ lập trình nàythể quản lýợng dữ liệu phức tạp
hoặc khổng lồ.
4. Trăn. Đối với các nhà pn tích dữ liệu đầy tham vọng, việc học Python phải là ưu tiên
ng đầu. Sự phù hợp của Python để phát triển AI đặc biệt đáng chú ý.
15
5. SQL/NoSQL. SQL vẫn là pơng pháp tiêu chuẩn để truy vấn thaoc dữ liệu trong
sở dữ liệu quan hệ trong phân tích hiện đại. Các khung NoSQL có thể tổ chức dữ liệu
theo bất kỳ cách nào chúng chọn, miễn cách tiếp cận này kng mangnh quan hệ.
6. Kỹng toán học nâng cao. Trong phân tích, hai nhánh nghiên cứu toán học cụ thể nổi
bật: đại số tuyến tính và phép tính. Đại số tuyến tính được sử dụng trong học máyhọc
u để thực hiện các phép toán vectơ, ma trận tensor. Phép nh cũng được sử dụng để
y dựng các hàm mục tiêu/chi phí/tổn thất hướng dẫn các thuật toán cách đạt được mục
tiêu của chúng.
7. duy phản biện. Bạn có thể suy nghĩ phân tích về dữ liệu với cách một nhà tư
ởng phản biện, phát hiện các mẫu và rút ra thông tin cũng như hiểu biết sâu sắcthể
nh động từ dữ liệu bạn có. Nó đòi hỏi phải vượt lên trên và áp dụng bản thân vào việc
suy nghĩ thay chỉ xử lý.
8. Giao tiếp. Trở thành một nhà phân tích dữ liệu thành công đòi hỏi phải trở thành "song
ngữ". Bạn sẽ có thể thảo luậnc vấn đề kỹ thuật cao vớic đồng nghiệp đã được đào
tạo của mình và đưa ra những giải thích rõ ràng, cấp cao theoch giúp ích - thay vì gây
nhầm lẫn - cho những người ra quyết định tập trung vào hoạt động kinh doanh. Nếu
không thể, bạn vẫn có thể cần cải thiện kỹ năng phân tích dữ liệu củanh.
CHƯƠNG 2. ĐẶC ĐIỂM VÀ ỨNG DỤNG CỦA BIG DATA TRONG LĨNH VỰC
NGÂN HÀNG
Big data một trong những công nghệ ứng
dụng trong nhiều lĩnh vực. Điển hình như trong
ngành ngân hàng, ta thấy big data được coi
chìa khóa vàng giúp cho ngành ngân hàng vươn
tầm mạnh mẽ. Ngay khi áp dụng big data đã
những thy đổi tích cực, đặc biệt trong quy trình
chăm sóc khách hàng.
Vậy các ứng dụng của big data trong ngân hàng
gồm những gì? Và chúng mang lại lợi ích như
thế nào?
16
2.1. Phân ch thói quen nh vi chi tiêu của khách hàng
Nhờ dữ liệu lớn, các ngân hàng có khả năng thu thập thông tin liên quan đến thói quen, hành
vi chi tiêu nguồn thu chủ yếu của khách hàng trong năm hoặc những dịch vụ khách
hàng đang sử dụng ... diều này trở thành cơ sở giúp cho ngân hàng năm bắt được những thông
tin quan trọng, một góc nhìn sâu hơn về khác hàng, cho phép ngân hàng tạo ra các chiến
lược khuyễn mãi cá nhân hóa hơn, dựa trên hành vi và nhu cầu của từng người sử dụng.
Nền tảng dữ liệu này cũng sở để ngân hàng đánh giá rủi ro một cách chính xác, thẩm
định khả năng vay vốn của khách hàng, mở rộng danh mục dịch vụ theo hướng phù hợp.
Bên cạnh đó, nhờ nắm được thông tin về nguồn tiền nhàn rỗi của khách hàng, ngân hàng
thể tận Áp dụng các chức năng sàng lọc thông tin, dụ như, khi lọc ra thời điểm dịp lễ hay
mùa lễ và điều kiện vĩ mô (lạm phát, tỷ lệ thất nghiệp…) mà nhân viên ngân hàng có thể hiểu
được nguyên nhân của biến động trong thu nhập hay chi tiêu của dụng thu hút tiền gửi để
thực hiện các hoạt động đầu tư.
2.2.Xác định phân khúc khách hàng và đánh giá hồ sơ
Phân khúc khách hàng một trong những hoạt động quan trọng nằm trong chiến lược
marketing và thiết kế sản phẩm của ngân hàng
Những thông tin ngân hàng thu thập được về nhu cầu, thói quen hay xu hướng tiêu dùng
với xác định các loại hình dịch vụ, kênh giao dịch được khách hàng ưu tiên (ví dụ khách hàng
muốn gửi tiết kiệm hay muốn đầu các khoản vay) được hoàn tất thì các ngân hàng sẽ
được một cơ sở dữ liệu phục vụ cho quá trình phân khúc, phân loại khách hàng đưa ra những
dịch vụ phù hợp với từng đối tượng.
17
Big Data sẽ cung cấp cho các ngân hàng những hiểu biết, kiến thức chuyên môn sâu về nhu
cầu tiềm ẩn bên trong, thói quen và xu hướng chi tiêu của khách hàng, trợ giúp cho nhiệm vụ
xác định nhu cầu và mong muốn của họ.
Bằng cách nắm các thông tin liên quan đến giao dịch, ngân hàng có thể xác định được khách
hàng của mình thuộc các nhóm nào, ví dụ nhóm có chi tiêu dễ dàng, nhóm nhà đầu tư thận
trọng, nhóm thanh toán nợ nhanh chóng, nhóm khách hàng trung thành… Bên cạnh đó, biết
được hồ sơ cá nhân của tất cả các khách hàng giúp ngân hàng đánh giá chi tiêu và thu nhập
dự kiến trong tháng tới và lập kế hoạch chi tiết để đảm bảo lợi nhuận cho chính tổ chức và lợi
ích cho chính khách hàng.
Ví dụ: McKinsey nhận thấy rằng việc sử dụng dữ liệu để đưa ra quyết định tốt hơn có thể tiết
kiệm tới 15-20% ngân sách tiếp thị của bạn. Tính đến việc các ngân hàng chi trung bình 8%
tổng ngân sách cho tiếp thị, việc khai thác dữ liệu lớn có vẻ là một cơ hội tuyệt vời để không
chỉ tiết kiệm mà còn tạo thêm doanh thu thông qua các chiến lược tiếp thị có mục tiêu cao.
Bằng cách sử dụng dữ liệu lớn, bạn có thể hiểu rõ hơn nhu cầu của khách hàng, xác định các
vấn đề trong việc nhắm mục tiêu sản phẩm của mình và tìm ra cách tốt nhất để khắc phục các
vấn đề hiện có.
Barclays đã sử dụng cái gọi là “lắng nghe xã hội”, tức là phân tích cảm tính, để tìm ra những
hiểu biết sâu sắc có thể hành động từ hoạt động của người dùng trên mạng xã hội.
Khi công ty ra mắt ứng dụng di động, nhiều người không hài lòng với việc người dùng dưới
18 tuổi không thể chuyển hoặc nhận tiền. Những khách hàng không hài lòng đã phản ứng
bằng cách bày tỏ sự thất vọng của họ trên mạng xã hội.
Ngay sau khi dữ liệu do Barclays thu thập tiết lộ sự cố, công ty đã có thể khắc phục sự cố
bằng cách cho phép người dùng từ 16 tuổi trở lên truy cập toàn bộ khả năng của ứng dụng.
2.3. Marketing nhân hóa
Marketing cá nhân hóa là bước tiến quan trọng sau khi xác định phân khúc khách hàng. Ngân
hàng sử dụng thông tin này để nhằm đến đối tượng mục tiêu dựa trên thói quen chi tiêu
nhân của họ.
ùng với đó các ngân hàng sẽ cái nhìn bao quát hơn về các nhu cầu của người dùng, những
mong muốn của họ thông qua việc kết hợp dữ liệu phi cấu trúc từ mạng hội và dữ liệu của
giao dịch
Thông qua những thông tin này, ngân hàng thiết kế những chiến dịch marketing tối ưu, ví dụ
(vay vốn với lãi xuất thấp, áp dụng các trương trình khuyến mãi dể nhận được phản hồi tích
cực từ khác hàng), ngân hàng tạo ra những ưu đãi đáp ứng mong muốn của khách hàng.
Kết quả tỷ lệ phản hồi cao hơn mối quan hệ gắn kết với khách hàng mạnh mẽ hơn.
dụ các ngân hàng sử dụng công cụ email marketing để gửi đến khách hàng các thông tin mới
18
nhất về những dịch vụ cho vay ngắn hạn với lãi suất vừa phải hay gửi tiết kiệm với lãi suất
hấp dẫn, hoặc các chương trình ưu đãi khác,…
2.4.ng cao chất lượng dịch vụ chămc khách hàng
Theo Oracle , 84% giám đốc điều hành được khảo sát đồng ý rằng khách hàng đang tìm kiếm
trải nghiệm cá nhân hóa, phù hợp hơn. Báo cáo cũng cho biết khả năng cung cấp cho người
dùng những gì họ cần có thể mang lại cho bạn doanh thu hàng năm cao hơn 18%.
Khách hàng góp phần quan trọng vào việc cải thiện dịch vụ ngân hàng bằng cách phản hồi
thông tin qua nhiều kênh thông tin như Zalo, Facebook và biểu mẫu sau mỗi lần nhận tư vấn
dịch vụ từ trung tâm chăm sóc khách hàng hay thực hiẹn giao dịch.
Nhờ việc thu thập, chọn lọc phân tích phản hồi của khách hàng từ big data, nhân viên vấn
có thể giải quyết những thắc mắc của khách hàng kịp thời
Ngân hàng cũng thể ngăn chặn những tin đồn gây thiệt hại đến hoạt động kinh doanh
nhanh chóng lập kế hoạch cải tiến xây dựng niềm tin từ khách hàng, tạo nên vị thế thương
hiệu vững mạnh và thu hút sự quan tâm từ thị trường.
2.5. Thay đi cách thức cung cấp dịch vụ đến khách hàng
Hệ thống Big Data thể một hệ thống lớn liên kết giữa nhiều bộ phận chức năng khác
nhau với công việc chính giúp các nhà điều hành dưa ra các quyết định dễ dàng dựa trên
việc phân tích các thông tin dao dịch của khách hàng được nhập vào hệ thống.
Bất cứ khi nào tên một khách hàng hoặc số tài khoản được nhập vào hệ thống, hệ thống Big
Data sẽ hỗ trợ sàng lọc tất cả các dữ liệu và chỉ truyền đi hay cung cấp các dữ liệu được yêu
cầu để phục vụ cho quá trình phân tích.
19
Điều này cho phép các ngân hàng tối ưu hóa quy trình làm việc, rút ngắn được cả thời gian và
tiết kiệm chi phí. Big Data cũng cho phép các tổ chức xác định và khắc phục các vấn đề trước
khi khách hàng bị ảnh hưởng.
2.6. Ngăn chặn các nh vi lừa đo, vi phm pp luật
Một trong những vấn đề nan giải lớn nhất mà ngành ngân hàng phải đối mặt gian lận, tội
phạm trong tín dụng. Big Data sẽ giúp cho ngân hàng đảm bảo rằng không giao dịch trái
phép nào được thực hiện, đảm bảo mức độ an toàn, tiêu chuẩn bảo mật của toàn bộ ngành
nâng cao.
Nhờ vào dữ liệu về lịch sgiao dịch hồ tín dụng của khách hàng, ngân hàng sẽ thể
xác định nhận được cảnh báo nếu điều bất thường xảy ra trong quá trình hoạt động,
cung cấp dịch vụ đến khách hàng.
Ví dụ: Một khách hàng nào đó thường thanh toán chi tiêu cho sinh hoạt hằng ngày hoặc gửi
tiết kiệm trong tài khoản lấy lãi nhưng bất chợt lại rút toàn bộ số tiền mình có trong tài khoản
qua ATM, điều này nghĩa thẻ thể đã bị mất cắp đang được sử dụng. Nhân viên
ngân hàng sẽ gọi điện đến chủ tài khoản hoặc thông báo đến khách hàng bằng bất kỳ hình
thức nào để xác minh lại giao dịch đó một cách hơn.Xem đây đang giao dịch hợp
pháp hay không?
Vậy, việc phân tích dữ liệu giao dịch lịch sử làm sở để kiểm tra tính hợp pháp, an toàn
bảo mật của các giao dịch hiện tại sẽ giảm thiểu được hành vi vi phạm pháp luật có thể xảy
ra.
Các ngân hàng khai thác Big Data để phân biệt giữa các giao dịch hợp pháp hay không bằng
cách áp dụng các thuật toán phân tích dữ liệu “học máy” . Các hệ thống phân tích sẽ tự
động phát hiện, và đề xuất các hành động ngay lập tức, chẳng hạn như chặn các giao dịch bất
20
thường, hành vi lừa đảo trước khi xảy ra để đảm bảo lợi ích của khách hàng hay lợi
nhuận của chính ngân hàng.
2.7. Kim st rủi ro, tuân thủ luật pháp minh bạch trong o cáo tài chính
Trong ngành tài chính Big Data, phân tích Big Data cũng cho phép bạn nhận thức được các mối
đe dọa tiềm ẩn của công ty bạn. Bạn cũng có thể tư vấn cho họ về tình trạng rủi ro của họ. Các
khoản đầurủi ro thể dễ dàng được xác định bằngch sử dụng kỹ thuật học máy. Đây là
hội quan trọng để tránh đưa ra những quyết định tài cnh sai lầm xem xét lại việc tham
gia vào một thảm họa tài chính.
Ngoài phát hiện các hành vi phạm tội, bảo vệ lợi ích của người tiêu dùng, các ngân hàng ứng
dụng Big Data để đo lường, kiểm soát rủi ro trong thực hiện các giao dịch bằng cổ phiếu với
những nhà đầu tư và kiểm tra hồ sơ vay của khách hàng.Dĩ nhiên tất cả phải dựa trên sự phân
tích có kết quả từ mọi dữ liệu lịch sử liên quan.
Ngoài ra các thuật toán Big Data còn giúp giải quyết các vấn đề về tuân thủ quy định pháp
luật về kế, kiểm báo cáo tài chính minh bạch nhằm hợp lý hoá các hoạt động của tổ chức
từ đó giảm được chi phí quản lý.
Hệ thống Big Data thu thập và lưu trữ các dữ liệu lớn giúp cho ngân hàng tiến hành phân tích
một cách nhanh chóng khi có các dấu hiệu rủi ro xảy ra, rồi đưa ra các biện pháp xử lý.
Big Datamột vai trò tất yếu trong việc phối hợp giữa các bộ phận, phòng, ban yêu cầu
xử lý dữ liệu của ngân hàng vào một hệ thống trung tâm; qua đó, hỗ trợ kiểm soát, ngăn chặn
vấn đề mất dữ liệu, giảm rủi ro và gian lận.
2.8. Bán co tm c dch vụ
Dựa vào sở dữ liệu ngân hàng được, ngân hàng thể giữ chân hoặc thu hút thêm
khách hàng bằng cách giới thiệu thêm các dịch vụ khác.
21
Ví dụ, ngân hàng có thể đề xuất các khoản vay ngắn hạn cho các khách hàng bình thường cho
việc chi tiêu hàng ngày của họ hoặc các khoản vay đáp ứng nhu cầu thanh toán ngắn hạn đối
với doanh nghiệp
Phân tích về hồnhân của người sử dụng một cách tương đối, bên ngân hàng có thể bán
kèm các dịch vụ khác với các ưu đãi khác phù hợp với nhu cầu khách
2.9. Tham gia vào việc kiểm soát đánh giá và nâng cao hiệu quả làm việc của nhân viên
Hệ thống Big Data hỗ trợ tổng hợp phân tích, đánh giá truyền tải những dữ liệu về hiệu
suất làm việc của nhân viên.
Trước đây, để thu thập các thông tin này phải cần rất nhiều công đoạn mang tính thủ công, thì
nay với sự phát triển của công nghệ, Big Data sẽ xử được các công việc này một cách
nhanh chóng hiệu quả . Kết quả phân tích sẽ giúp các lãnh đạo có cái nhìn về tình trạng chung
về các nhân viên khi làm việc, đặc biệt là xem xét mức độ hài lòng của ngân viên đối với môi
trường làm việc cũng như là những phúc lợi mà ngân hàng dành cho họ.
Các công cụ của Big Data khai thác tất cả dữ liệu đều ở thời gian thực, do đó khi giải pháp
được đưa ra sẽ mang tính phù hợp và tạo nên những sự thay đổi.
Các giải pháp Big Data trong ngân hàng cho phép các công ty thu thập, hiểu và chia sẻ các số
liệu hiệu suất của chi nhánh (cũng như từng nhân viên) giữa các phòng ban trong thời gian
thực. Điều này nghĩa tầm nhìn tốt hơn về các hoạt động hàng ngày khả năng nâng
cao để chủ động giải quyết mọi vấn đề.
Ngoài ra đo lường hiệu suất làm việc của cá nhân của các ngân hàng, mà còn tinh thần đồng
đội, sự tương tác giữa các ban và văn hóa tổng thể của công ty. Nhân viên sẽ giảm được thời
gian dành cho các công việc gồm nhiều quy trình phức tạp mang tính thủ công bằng cách dựa
vào hệ thống Big Data gồm các phần mềm đã được lập trình sẵn để giải quyết các công việc
ấy một cách nhanh chóng và chính xác. Từ đó nhân viên có thời gian dành nhiều cho các
công việc, nhiệm vụ khó hơn, cấp bách từ cấp trên giao xuống.
2.10. D đoán xu hướngi chính
Một trong những lợi thế chính của Dữ liệu lớn đối với ngân hàng là khả năng dự đoánc xu
ớng trong tương lai trước khi chúng xảy ra. Bạn có thể nhìn thấy những xuớng tiêu cực và
chọn không đi theo chúng. Bạn ng có thể tận dụng xu hướng tích cực và đi trước đối thủ cạnh
tranh. Hơn nữa, việc có trong tay dữ liệu tài chính cụ thể cho phép bạn đưa ra c quyết định
22
đầu tư, dịch vụ và sản phẩm trong tương lai. Trên thực tế, phân tích dữ liệu tài chính cho phép
bạn hỗ trợ khách hàng của mình trong các quy trình của công ty họ.
2.11. Tự động hóa các quy trình chính
Bạn có thể quản lý mọi quy trìnhi chính với tốc độ, hiệu suất giá trị cao hơn với sự trợ giúp
của tự động hóa. Các nhà phânch, người giám sát và đồng nghiệp thể hoàn thành bất kỳ
hoạt động đơn giản nào nhanh hơn, tốt hơn hiệu quả hơn đáng kể so vớic nhân viên khác.
Nhờ tự động hóa tiên tiến, các ngân hàng có thể tiết kiệm đáng kể chi phí và giảm nguy cơ
thất bại bằng cách loại bỏ yếu tố con người khỏi một số quy trình quan trọng.
Ví dụ: JP Morgan Chase & Co. là một trong những công ty tiên phong về tự động hóa trong
ngành dịch vụ ngân hàng. Công ty hiện đang sử dụng một số chương trình trí tuệ nhân tạo và
máy học để tối ưu hóa một số quy trình của họ, bao gồm giao dịch thuật toán và giải thích các
thỏa thuận cho vay thương mại.
Một trong những chương trình của nó, được gọi là LOXM, dựa trên dữ liệu lịch sử được rút
ra từ hàng tỷ giao dịch cho phép họ giao dịch cổ phiếu “ở tốc độ tối đa và ở mức giá tối
ưu”, Business Insider đưa tin . Quá trình này đã được chứng minh là hiệu quả hơn nhiều so
với cả giao dịch thủ công và tự động được sử dụng trước đó và mang lại khoản tiết kiệm đáng
kể cho công ty.
Một sáng kiến tự động hóa dựa trên dữ liệu khác của JP Morgan Chase được gọi
là COIN . Thuật toán học máy, được hỗ trợ bởi mạng đám mây riêng của công ty, được sử
dụng để giảm thời gian cần thiết để xem xét tài liệu: nhiệm vụ này trước đây cần khoảng
360.000 giờ làm việc, giờ chỉ mất vài giây để hoàn thành.
CHƯƠNG 3. THÁCH THỨC, HẠN CHẾ VÀ GIẢI PHÁP KHI ỨNG DỤNG BIG
DATA Ở TRONG NGÂN HÀNG
3.1. Tch thức, hạn chế khi ứng dụng Big Datatrong lĩnh vực nn hàng
3.1.1.Khó tích hợp các hệ thống kế thừa
Trước khi vận hành Big Data, doanh nghiệp cần tiến hành tích hợp tất cả các nguồn dữ liệu
khác nhau lên hệ thống. Thế nhưng, đại đa số doanh nghiệp có thể đã lưu trữ dữ liệu trên
nhiều ứng dụng hoặc phần mềm khác nhau qua nhiều năm. Tuy nhiên, khi nói đến dữ liệu
lớn, mọi thứ thậm chí còn tồi tệ hơn: hầu hết các hệ thống cũ không có khả năng xử lý khối
lượng công việc ngày càng tăng. Việc cố gắng thu thập, lưu trữ và phân tích lượng dữ liệu
cần thiết bằng cơ sở hạ tầng lỗi thời có thể gây nguy hiểm cho sự ổn định của toàn bộ hệ
thống. Do đó, các tổ chức phải tăng khả năng xử lý hoặc xây dựng lại hoàn toàn hệ thống của
mình để đáp ứng thách thức.
23
3.1.2.Big data 4.0 liên tục thay đổi
Big Data 4.0 đang là một xu thế đang gây ảnh hưởng mạnh mẽ đến các lĩnh vực kinh doanh,
nhưng việc sử dụng Big Data cũng đối mặt với nhiều khó khăn. Một trong những khó khăn
chính là tính liên tục của việc thay đổi của Big Data. Nó tạo ra sự khó khăn cho doanh nghiệp
khi họ cần phải dựa vào dữ liệu mới nhất để đưa ra quyết định hoặc cải thiện hoạt động. Do
đó, doanh nghiệp cần phải cập nhật liên tục về các xu thế mới của Big Data để có thể tận
dụng hết các tiện ích của nó.
3.1.3.Dữ liệu lớn đang trở nên không thể quản lý
Với rất nhiều loại dữ liệu khác nhau và khối lượng tổng hợp của chúng không
có gì ngạc nhiên khi các doanh nghiệp phải vật lộn để theo kịp. Điều này càng trở nên rõ ràng
hơn khi cố gắng tách dữ liệu hữu ích khỏi dữ liệu vô ích.
Mặc dù tỷ lệ dữ liệu có khả năng hữu ích đang tăng lên, nhưng vẫn còn rất nhiều dữ liệu
không liên quan cần sắp xếp. Điều này có nghĩa là các doanh nghiệp phải chuẩn bị và củng cố
các phương pháp của họ để phân tích nhiều dữ liệu hơn nữa và nếu có thể, hãy tìm một ứng
dụng mới cho dữ liệu trước đây được cho là không liên quan.
3.1.4.Đòi hỏi thay đổi văn hóa doanh nghiệp
Đòi hỏi thay đổi văn hóa doanh nghiệp là một trong những vấn đề khác khi sử dụng Big Data.
Để sử dụng Big Data, doanh nghiệp cần phải tạo ra một văn hóa mới về cách quản lý dữ liệu
và cách sử dụng dữ liệu để đạt được mục tiêu của họ.
Điều này có thể gây ra sự khó chịu cho những người chưa quen với công nghệ mới này. Khó
khăn này dễ thấy trong thực tiễn, khi nhân viên đã quen với lối làm việc truyền thống, việc
thích ứng cần cả quá trình dài. Ví dụ: Trong cuộc khảo sát thực tế của New Vantage đã chỉ ra
rằng, chỉ có 32,4% doanh nghiệp thành công trong việc thay đổi văn hóa doanh nghiệp theo
hướng hiện đại mới.
24
3.1.5.Rủi ro an ninh mạng
Một trong những khó khăn chính khi sử dụng Big Data là bảo mật và rủi ro an ninh mạng.
Khi lưu trữ và xử lý lượng lớn dữ liệu, cần phải đảm bảo rằng dữ liệu được bảo vệ chặt chẽ
khỏi truy cập trái phép hoặc tấn công mạng. Nếu không, dữ liệu có thể bị rò rỉ hoặc sử dụng
cho mục đích xấu.
Big Data cần được quản lý chặt chẽ bằng cách sử dụng các giải pháp bảo mật phù hợp và cập
nhật. Điều này bao gồm việc mã hóa dữ liệu, sử dụng tường lửa và bảo vệ mạng, xác thực
người dùng và giám sát hoạt động hệ thống.
3.1.6.Thiếu chuyên gia công nghệ gây cản trở trong việc ứng dụng Big Data Industry 4.0.
Công nghệ 4.0 phát triển, sự can thiệp của máy móc, các thiết bị tự động hóa càng nhiều. Thế
nhưng, nếu không có con người vận hành và quản lý, tất cả vật dụng hiện đại đến đâu cũng
khó có thể hoạt động và đem lại hiệu quả tốt nhất. Đối với Big Data cũng vậy.
Việc thuê chuyên gia công nghệ để vận hành Big Data mất nhiều thời gian và chi phí đầu tự
cao. Xử lý toàn bộ Big Data trước đó của doanh nghiệp là vấn đề không hề dễ đối với bất kỳ
chuyên gia nào. Đặc biệt, chính sự thiếu hụt nhân lực chuyên môn đã tạo ra thách thức trong
việc ứng dụng Big Data.
3.2. Gii pp khi ứng dụng Big Data trongnh vực ngân hàng
Theo nghiên cứu, 71% tổ chức tài chính ngân hàng sử dụng phân tích thông tindữ liệu tài
chính lợi thế cạnh tranh so với đối thủ. Các ngân hàng ngày càng nhận thức được tầm quan
trọng của việc hợp tác với những người chơi có uy tín trên thị trường để nhúng Big Data choc
ng cụ ngân hàng vào các lĩnh vực kinh doanh của họ, nơic động sẽ được cảm nhận rõ rệt
nhất, thị trường toàn cầu về phân tích Big Data trong ngân hàng dự kiến sẽ tăng trưởng với
tốc độ tỷ lệ trên 22% mỗi năm cho đến năm 2026 .
Trở thành định hướng dữ liệu là một sự thay đổi mang tính đột phá và hiếm khi các tổ chức
tiếp cận nó với sự chuẩn bị đầy đủ. Theo quy định, phải mất rất nhiều công việc sơ bộ để phát
triển một chiến lược triển khai dữ liệu lớn rõ ràng. Dưới đây là danh sách những cân nhắc
quan trọng để giúp bạn triển khai sáng kiến dữ liệu lớn tiếp theo của mình.
1. Bạn sẽ sử dụng loại dữ liệu nào để thúc đẩy tổ chức của mình hướng tới những thay
đổi mong muốn?
2. Dữ liệu nào không liên quan đến mục tiêu của bạn và có thể bị loại bỏ?
3. Dữ liệu không hoạt động hoặc di chuyển qua mạng và được sử dụng liên tục?
4. Chính xác thì dữ liệu này sẽ giúp bạn đạt được mục tiêu như thế nào?
25
c định khoảng trống dữ liệu
Khi bạn bắt đầu với dự án ban đầu của mình, hãy xác định dữ liệu chính bạn cần để bắt đầu
và chạy dự án. Những số liệu nào bạn sẽ cần để có được một bức tranh rõ ràng? Bạn sẽ thu
thập chúng như thế nào? Biết dữ liệu nào bạn sẽ thu thập sẽ giúp bạn thực hiện các điều chỉnh
quan trọng cho quy trình của mình.
Tinh chỉnh dữ liệu hiện có của bạn
Chất lượng dữ liệu là một trong những rào cản được báo cáo thường xuyên trên con đường
triển khai các giải pháp mới cho phân tích dữ liệu lớn. Trong lịch sử, dữ liệu kế thừa thường
nằm trong các cơ sở dữ liệu khác nhau hoặc tồn tại ở các định dạng không tương thích với
phần mềm dữ liệu hiện đại. Việc tổng hợp dữ liệu của bạn vào một nhóm dữ liệu duy nhất là
một dự án dài có thể mất vài tháng nhưng đó là điều cần thiết phải làm nếu bạn muốn hưởng
lợi từ trải nghiệm độc đáo của tổ chức mình.
Chọn phần mềm phânch dữ liệu
Sau khi bạn đã quyết định nhu cầu dữ liệu của mình, bây giờ bạn có thể bắt đầu chọn phần
mềm phân tích dữ liệu của mình. Một trong những điều quan trọng cần tìm trong giải pháp
bạn lựa chọn là khảnăng mở rộng – nó sẽ mở rộng đến mức nào nếu bạn chọn mở rộng các dự
án dữ liệu của mình sang các khía cạnh khác trong tổ chức của mình? Một điều khác cần tính
đến là khả năng trực quan hóa dữ liệu: phần mềm được đề cập có cung cấp thông tin chi tiết ở
định dạng rõ ràng và dễ hiểu không?
Tuy nhiên, trong nhiều trường hợp, công ty của bạn sẽ yêu cầu một giải pháp được thiết kế
riêng để phù hợp hoàn toàn với hệ sinh thái của mình và bạn sẽ cần tìm một nhà cung cấp
đáng tin cậy để xây dựng nền tảng phân tích dữ liệu tùy chỉnh cho tổ chức của mình.
Kiểm tra để cải thiện. Sau khi bạn đã triển khai giai đoạn đầu của dự án phân tích dữ liệu, hãy
đánh giá các thay đổi và kết quả. Bạn có hài lòng với kết quả dự án của mình không? Hãy suy
nghĩ về những gì cần được cải thiện để tối đa hóa hiệu quả của các quy trình dựa trên dữ liệu
26
của bạn. Lý tưởng nhất là nhà cung cấp phân tích dữ liệu của bạn nên cung cấp hỗ trợ kỹ
thuật và trợ giúp trong việc điều chỉnh nền tảng dữ liệu theo nhu cầu thay đổi của bạn.
KẾT LUN
Công nghệ dữ liệu lớn đã thâm nhập vào mọi ngành công nghiệp, giúp tăng doanh thu, hiệu
quả và đẩy nhanh quá trình chuyển đổi kỹ thuật số. Đến bây giờ, rõ ràng là những người
chậm triển khai dữ liệu lớn sẽ sớm thấy mình ở vị trí rất dễ bị tổn thương, không thể chịu
được sự cạnh tranh ngày càng tăng và theo kịp các tiêu chuẩn đang thay đổi.
Mặt khác, việc triển khai thành công các giải pháp dữ liệu lớn đòi hỏi một cách tiếp cận
mang tính chiến lược và được xác định rõ ràng. Bằng cách phác thảo chính xác các mục tiêu
kinh doanh trước mắt và lâu dài, đánh giá các nguồn lực của bạn và truyền đạt giá trị của dữ
liệu lớn cho nhân viên của mình, bạn sẽ đảm bảo rằng việc chuyển sang sử dụng dữ liệu lớn
diễn ra suôn sẻ và không bị gián đoạn. Quan hệ đối tác công nghệ thành công cũng là yếu tố
quan trọng để thúc đẩy giá trị kinh doanh từ dữ liệu lớn.
Các ngân hàng hiện ngày nay quyền truy cập hàng triệu hoặc thậm chí hàng tỷ thông tin,
dữ liệu về nhu cầu cảm nghĩ của khách hàng. Giờ đây họthể sử dụng các công cụ Big
Data để khai thác chúng nhằm mang lại hiệu quả kinh doanh tốt hơn như đang tận dụng
nguồn lực thứ ba ngoài nhân lực và tài chính. Big Data sẽ mở rộng hoạt động của ngành ngân
hàng theo cách mà sẽ cho phép họ vừa gia tăng lợi nhuận và giảm các chi phí phát sinh. Bằng
cách cập nhật, ứng dụng không chỉ Big Data các xu hướng mới nổi trên toàn cầu như trí
tuệ nhân tạo hay Machine Learning trong thời đại công nghệ 4.0, các ngân hàng và tổ chức
tài chính sẽ nắm bắt tốt hơn nhu cầu của khách hàng, hiểu rõ mục tiêu hoạt động trong nội
bộ tổ chức nhằm cung cấp các dịch vụ được cải tiến một cách kịp thời với chi phí hoạt động
tối ưu đến khách hàng hay đưa ra các giải pháp cải thiện năng suất làm việc của nhân viên.
27
TÀI LIỆU THAM KHO
1.https://www.dvms.com.vn/tin-tuc/big-data/75985-ung-dung-cua-big-data-trong-linh-vuc-
ngan-hang-phan-2.html
2. https://luanvans.com/cac-ung-dung-cua-big-data-trong-linh-vuc-ngan-hang/
3.https://www.dvms.com.vn/tin-tuc/big-data/75986-ung-dung-cua-big-data-trong-linh-vuc-
ngan-hang-phan-1.html
4. https://www.mpbpo.com.vn/big-data-trong-ngan-hang/
5.https://dembuon.vn/threads/ung-dung-cua-big-data-trong-linh-vuc-tai-chinh-ngan-hang-va-
giai-phap.112517/
6 http://iottuonglai.com/ung-dung-big-data-trong-ngan-hang.html
7.https://123docz.net/trich-doan/3657132-ung-dung-cua-big-data-trong-linh-vuc-ngan-
hang.htm
8.Datacenters.vn
9.https://easternpeak.com/blog/7-big-data-solutions-examples-and-a-roadmap-for-their-
implementation/
10.https://easternpeak.com/blog/big-data-in-banking-and-financial-services/#:~:text=The
%20benefits%20of%20big%20data,%2C%20subsequently%2C%20obtain%20business
%20results.
11.https://viblo.asia/p/big-data-trong-ung-dung-va-cuoc-song-3OEqGjWwv9bL
12.https://www.pace.edu.vn/tin-kho-tri-thuc/big-data-la-gi?fbclid=IwAR006eshp1O-
NyF0LN21RzyQXTEFm-bjTlea8UiHwKC8E1CZwf4xgn4_S7Q#co-so-ha-tang-big-data
28
| 1/32

Preview text:

HỌC VIỆN NGÂN HÀNG
HỆ THỐNG QUẢN THÔNG TIN QUẢN LÝ BÀI TẬP LỚN
MÔN NĂNG LỰC SỐ ỨNG DỤNG TÊN ĐỀ TÀI
ỨNG DỤNG CỦA BIG DATA TRONG LĨNH VỰC NGÂN HÀNG
Giáo viên hướng dẫn: Đinh Trọng Hiếu Danh sách nhóm 15:
1. Mã sinh viên: 26A4011975 Họ và tên: Nguyễn Thị Minh Hương
2. Mã sinh viên: 24A4013306 Họ và tên: Lý Thị Thảo
3. Mã sinh viên: 26A4013322 Họ và tên: Trịnh Huyền Thư
4. Mã sinh viên: 26A4011963 Họ và tên: Trần Tuấn Huy
HÀ NỘI-15/12/2023
BẢNG PHÂN CÔNG CÔNG VIỆC Đánh giá STT Mã SV Họ và tên Phân công chất Nhận xét lượng (%) Ứng dụng của Big 100% Data trong các hoàn hoạt động của 1
26A4011975 Nguyễn Thị Minh Hương thành ngân hàng & Lý đúng thuyết của Big hạn Data 100% Ứng dụng của Big hoàn Data trong các 2 24A4013306 Lý Thị Thảo thành hoạt động của đúng ngân hàng hạn 100% hoàn Lý thuyết của Big 3
26A4013322 Trịnh Huyền Thư thành Data đúng hạn Thách thức, hạn 100% chế và giải pháp hoàn 4 26A4011963 Trần Tuấn Huy khi ứng dụng Big thành Data trong ngân đúng hàng hạn MỤC LỤC
LỜI MỞ ĐẦU
........................................................................................................................ 2
CHƯƠNG 1: KHÁI NIỆM, ĐẶC TRƯNG CỦA DỮ LIỆU LỚN VÀ SỰ KHÁC BIỆT
VỚI KHAI THÁC DỮ LIỆU
..............................................................................................3
1.1.Khái niệm Big Data........................................................................................................... 3
1.2.Đặc trưng của Big data...................................................................................................... 3
1.3.Phân loại Big data............................................................................................................. 5
1.4.Tầm quan trọng của dữ liệu lớn tài chính trong Ngân hàng.................................................7
1.4.1.Phát hiện và ngăn chặn gian lận...................................................................................7
1.4.2.Đánh giá rủi ro chính xác.............................................................................................8
1.4.3.Phân loại hoặc giải thể khách hàng..............................................................................8
1.4.4.Tăng hiệu quả của các quy trình thủ công.....................................................................8
1.5. Cách thức hoạt động của Big data....................................................................................8
1.6. So sánh Big Data và Data mining (Khai thác dữ liệu)....................................................10
1.7. Bộ công cụ và bộ kĩ năng cho Big Data trong ngân hàng...............................................11
1.7.1. Bộ công cụ cho Big Data trong ngân hàng..............................................................11
1.7.2. Bộ kỹ năng cho Big Data trong ngân hàng................................................................15
CHƯƠNG 2. ĐẶC ĐIỂM VÀ ỨNG DỤNG CỦA BIG DATA TRONG LĨNH VỰC
NGÂN HÀNG
...................................................................................................................... 16
2.1. Phân tích thói quen hành vi chi tiêu của khách hàng......................................................17
2.3. Marketing cá nhân hóa................................................................................................... 18
2.4. Nâng cao chất lượng dịch vụ chăm sóc khách hàng.......................................................19
2.5. Thay đổi cách thức cung cấp dịch vụ đến khách hàng....................................................19
2.6. Ngăn chặn các hành vi lừa đảo, vi phạm pháp luật........................................................20
2.7. Kiểm soát rủi ro, tuân thủ luật pháp và minh bạch trong báo cáo tài chính....................21
2.8. Bán chéo thêm các dịch vụ.............................................................................................21
2.9. Tham gia vào việc kiểm soát đánh giá và nâng cao hiệu quả làm việc của nhân viên....22
2.10. Dự đoán xu hướng tài chính.........................................................................................22
2.11. Tự động hóa các quy trình chính..................................................................................23
CHƯƠNG 3. THÁCH THỨC, HẠN CHẾ VÀ GIẢI PHÁP KHI ỨNG DỤNG BIG
DATA Ở TRONG NGÂN HÀNG
......................................................................................23
3.1. Thách thức, hạn chế khi ứng dụng Big Data ở trong lĩnh vực ngân hàng.......................23
3.1.1.Khó tích hợp các hệ thống kế thừa............................................................................23
3.1.2.Big data 4.0 liên tục thay đổi....................................................................................24
3.1.3.Dữ liệu lớn đang trở nên không thể quản lý..............................................................24
3.1.4.Đòi hỏi thay đổi văn hóa doanh nghiệp....................................................................24
3.1.5.Rủi ro an ninh mạng.................................................................................................. 25
3.1.6.Thiếu chuyên gia công nghệ gây cản trở trong việc ứng dụng Big Data Industry 4.0.
...........................................................................................................................................
25
3.2. Giải pháp khi ứng dụng Big Data trong lĩnh vực ngân hàng..........................................25
KẾT LUẬN.................................................................................................................................. 27
TÀI LIỆU THAM KHẢO............................................................................................................. 28 1 LỜI MỞ ĐẦU
Dữ liệu lớn đang trở thành một trong những xu hướng công nghệ quan trọng nhất có tiềm
năng thay đổi đáng kể cách các tổ chức sử dụng thông tin để nâng cao trải nghiệm của khách
hàng và chuyển đổi mô hình kinh doanh của họ. Làm thế nào để một công ty sử dụng dữ liệu
để có lợi thế tốt nhất? Biến một lượng lớn dữ liệu thành kiến thức có nghĩa là gì? Trong cuốn
sách này, chúng tôi cung cấp cho bạn thông tin chi tiết về cách chuyển đổi công nghệ trong
phần mềm, phần cứng và mô hình phân phối đang thay đổi cách dữ liệu có thể được sử dụng
theo những cách mới. Dữ liệu lớn không phải là một thị trường duy nhất. Thay vào đó, nó là
sự kết hợp của các công nghệ quản lý dữ liệu đã phát triển theo thời gian. Dữ liệu lớn cho
phép các tổ chức lưu trữ, quản lý và thao tác một lượng lớn dữ liệu với tốc độ phù hợp và
đúng thời điểm để có được thông tin chi tiết phù hợp.
Chìa khóa để hiểu dữ liệu lớn là dữ liệu phải được quản lý để nó có thể đáp ứng yêu cầu
kinh doanh mà một giải pháp nhất định được thiết kế để hỗ trợ. Hầu hết các công ty đang ở
giai đoạn đầu với hành trình dữ liệu lớn của họ. Nhiều công ty đang thử nghiệm các kỹ thuật
cho phép họ thu thập một lượng lớn dữ liệu để xác định xem liệu các mẫu ẩn có tồn tại trong
dữ liệu đó có thể là dấu hiệu ban đầu của một thay đổi quan trọng hay không. Một số dữ liệu
có thể chỉ ra rằng mô hình mua hàng của khách hàng đang thay đổi hoặc các yếu tố mới trong
doanh nghiệp cần được giải quyết trước khi quá muộn. Khi các công ty bắt đầu đánh giá các
loại giải pháp dữ liệu lớn mới, nhiều cơ hội mới sẽ mở ra. Ví dụ, các công ty sản xuất có thể
theo dõi dữ liệu đến từ các cảm biến máy để xác định cách các quy trình cần được sửa đổi
trước khi một sự kiện thảm khốc xảy ra. Các nhà bán lẻ sẽ có thể theo dõi dữ liệu trong thời
gian thực để bán thêm các sản phẩm liên quan đến khách hàng khi họ đang thực hiện giao
dịch. Các giải pháp dữ liệu lớn có thể được sử dụng trong chăm sóc sức khỏe để xác định
nguyên nhân gây bệnh và cung cấp cho bác sĩ hướng dẫn về các lựa chọn điều trị. Tuy nhiên,
dữ liệu lớn không phải là một giải pháp cô lập. Việc triển khai một giải pháp dữ liệu lớn đòi
hỏi phải có cơ sở hạ tầng để hỗ trợ khả năng mở rộng, phân phối và quản lý dữ liệu đó. Do đó,
điều quan trọng là phải đưa ra cả chiến lược kinh doanh và kỹ thuật để sử dụng điều quan
trọng này xu hướng công nghệ. Vì nhiều lý do quan trọng, chúng tôi nghĩ rằng điều quan trọng
là bạn phải hiểu các công nghệ dữ liệu lớn và biết các cách mà các công ty đang sử dụng các
công nghệ mới nổi như Hadoop, MapReduce và các công cụ cơ sở dữ liệu mới để kinh doanh.
Sự trỗi dậy của Dữ liệu lớn đã có tác động đáng kể đến ngành tài chính. Khách hàng không
còn phải đến chi nhánh ngân hàng địa phương và giải quyết mọi nhu cầu ngân hàng của họ với
sự hỗ trợ của nhân viên thu ngân. Trên thực tế, hầu hết khách hàng hiện nay đều sử dụng các ứng
dụng điện thoại thông minh và ngân hàng trực tuyến cũng như các dịch vụ truyền thống tại chi
nhánh để truy cập nhiều loại sản phẩm tài chính. Với sự phát triển của internet và phương tiện
truyền thông xã hội, ngành ngân hàng, giống như phần còn lại của nền kinh tế toàn cầu, đã trải 2
qua một biến động cơ bản. Ngành ngân hàng Dữ liệu lớn có quyền truy cập vào rất nhiều nguồn
dữ liệu mà họ có thể sử dụng để hiểu rõ hơn về người tiêu dùng và cung cấp cho họ các dịch vụ
và sản phẩm được cá nhân hóa hơn. Ví dụ: Dữ liệu lớn cho ngân hàng có thể được xem xét từ
góc độ mô hình chi tiêu, thông tin tín dụng, tình hình tài chính và giám sát phương tiện truyền
thông xã hội để hiểu rõ hơn về hành vi và mô hình của người tiêu dùng. Dữ liệu lớn để phân tích
khách hàng ngân hàng thúc đẩy cơ hội doanh thu. 3
CHƯƠNG 1: KHÁI NIỆM, ĐẶC TRƯNG CỦA DỮ LIỆU LỚN VÀ SỰ KHÁC BIỆT
VỚI KHAI THÁC DỮ LIỆU
1.1.Khái niệm Big Data
Big Data là các tập dữ liệu có khối lượng lớn và phức tạp. Độ lớn đến mức các phần mềm xử
lý dữ liệu truyền thống không có khả năng thu thập, quản lý và xử lý dữ liệu trong một
khoảng thời gian hợp lý.
Những tập dữ liệu lớn này có thể bao gồm các dữ liệu có cấu trúc, không có cấu trúc và bán
cấu trúc, mỗi tập có thể được khai thác để tìm hiểu insights.
1.2.Đặc trưng của Big data
Big Data (Dữ liệu lớn) là tập hợp các dữ liệu được tổng hợp từ nhiều nguồn và thường được
miêu tả bằng 5 đặc điểm: Volume (Khối lượng), Variety (Tính đa dạng), Velocity (Tốc độ),
Value (Tính giá trị), Veracity (Độ tin cậy). 3
*Volume (Khối lượng dữ liệu)
Là sự tăng trưởng về mặt khối lượng của tệp dữ liệu. Dữ liệu trong các hệ thống thông tin
luôn và liên tục tăng lên về mặt kích thước. Thực vậy, trong khi những dữ liệu thông thường
có thể đo lường bằng những đơn vị quen thuộc như là Megabyte (MB), Gigabyte (GB),
Terabyte (TB), thì Big Data được lưu trữ bằng Petabyte (PB), Exabyte (EB), Zettabyte (ZB).
Để mô tả rõ sự khác biệt về kích thước của hai loại dữ liệu, trường Đại Học Berkeley đã
nghiên cứu và đưa ra kết luận rằng: 1GB có khối lượng dữ liệu tương đương với một video
với chất lượng HD trong vòng 7 phút thì 1 ZB lại tương đương với 250 tỷ đĩa DVD. *Variety (Tính đa dạng)
Là sự gia tăng về tính đa dạng của dữ liệu. Trong khi dữ liệu truyền thống chỉ có một loại dữ
liệu được tổ chức và sắp xếp ở trong cơ sở dữ liệu lên quan thì Big Data còn có thêm loại dữ
liệu phi cấu trúc và dữ liệu bán cấu trúc như là văn bản, âm thanh và video. Điều đó có nghĩa
là nó đòi hỏi phải có thêm một số phương pháp xử lý để tìm ra ý nghĩa của dữ liệu và cùng
tổng hợp chúng thành thông tin có ý nghĩa. *Velocity (Tốc độ)
Là tốc độ tăng trưởng của dữ liệu. Khái niệm này chỉ khoảng thời gian cần thiết để tạo ra,
phân tích, quản lý toàn bộ dữ liệu. Mặc dù Big Data có khối lượng lớn dữ liệu khổng lồ
nhưng nó cần phải được xử lý với tốc độ cực nhanh để sinh ra những thông tin cần thiết.
Ngày nay, khi thời đại tốc độ Internet phát triển mạnh mẽ, tốc độ của một dữ liệu được tạo ra,
tìm kiếm và rồi dịch chuyển sang vị trí khác hiện tại đã đạt đến mức đáng kinh ngạc, chỉ vài
micro giây, cho phép người dùng có thể phân tích trực tiếp các thông số của các dữ liệu được
tạo ra trong thời gian thực. 4 *Value (Tính giá trị)
Tính giá trị của dữ liệu thường được đánh giá bởi giá trị kinh tế hoặc xã hội tiềm năng mà dữ
liệu có thể đưa cho doanh nghiệp. Đây được coi là một trong những đặc điểm quan trọng nhất
của công nghệ Big Data đối với doanh nghiệp, bởi không phải dữ liệu nào cũng có ý nghĩa.
Vậy nên, các doanh nghiệp cần phải hoạch định được những giá trị thông tin hữu ích của Big
Data đối với các vấn đề hoặc mô hình hoạt động kinh doanh của họ. *Veracity (Độ tin cậy)
Độ tin cậy của dữ liệu được định nghĩa như là sự chính xác của dữ liệu. Đặc biệt, trong thời
kì các phương tiện truyền thông xã hội và mạng xã hội phát triển mạnh mẽ, mỗi ngày người
dùng tạo ra vô vàn thông tin, kiến thức mới, khiến cho độ xác thực và tin cậy của dữ liệu càng
ngày càng khó xác định hơn, tạo nên sự không đồng nhất của các tệp dữ liệu và gây cản trở
cho các quy trình xử lý và quản lý nó. Vậy nên, doanh nghiệp cần phải đảm bảo độ chính xác
của dữ liệu để giảm bớt những sai lệch có thể xảy ra.
1.3.Phân loại Big data
Big Data bao gồm các dữ liệu có cấu trúc, dữ liệu phi cấu trúc và các dữ liệu bán cấu trúc.
Theo Tạp chí Thế giới máy tính, có tới hơn 70-80% tất cả các dữ liệu trong các tổ chức là dữ
liệu phi cấu trúc như là video, ảnh, trang website,… Và mỗi loại dữ liệu lớn này đều có
những công cụ để lưu trữ và xử lý riêng biệt. *Dữ liệu có cấu trúc: 5
Dữ liệu có cấu trúc thường được lưu trữ, sắp xếp một cách có tổ chức dưới dạng bảng
và cột chứa thông tin để mô tả các thuộc tính và mối quan hệ với các dữ liệu khác
. Các
dữ liệu loại này thường được quản lý thông qua cơ sở dữ liệu quan hệ. Bên cạnh đó dữ liệu có
cấu trúc thường được tìm kiếm, xử lí bằng cách sử dụng ngôn ngữ truy vấn có cấu trúc
Structured Query Language (SQL). *Dữ liệu phi cấu trúc:
Dữ liệu phi cấu trúc không thể chứa trong cơ sở dữ liệu dạng hàng và cột, và nó cũng
không có mô hình dữ liệu liên quan nào. Đây là loại dữ liệu gốc và có rất nhiều định
dạng như: video và hình ảnh, văn bản, âm thanh, nội dung từ mạng xã hội,…
Chính vì 6
vậy, những dữ liệu này rất khó tìm kiếm, quản lý và phân tích nên các doanh nghiệp thường
bỏ qua loại dữ liệu này cho đến khi sự ra đời của trí tuệ nhân tạo và các thuật toán máy tự học
giúp quá trình này trở nên dễ dàng hơn. Ngoài ra, dữ liệu phi cấu trúc thường được lưu trữ
trong một cơ sở dữ liệu không quan hệ là No Structured Query Language (NoSQL). *Dữ liệu bán cấu trúc:
Dữ liệu bán cấu trúc có một số tính chất đồng nhất có thể xác định được, nhưng lại
không hình thành một cấu trúc rõ ràng để phù hợp với cơ sở dữ liệu quan hệ dưới dạng
bảng và cột.
Một vài ví dụ cho dạng cấu trúc này là email thuộc dạng không có cấu trúc
nhưng lại chứa những dữ liệu có cấu trúc như tên, địa chỉ người nhận, thời gian gửi thư,.. hay
những bức ảnh chụp từ điện không có cấu trúc với những dữ liệu cơ sở liên quan nhưng lại
được gắn những dữ liệu cấu trúc như thời gian chụp, nơi chụp, ID của thiết bị.
1.4.Tầm quan trọng của dữ liệu lớn tài chính trong Ngân hàng
Dữ liệu lớn trong tài chính hoặc ngân hàng Dữ liệu lớn đề cập đến hàng petabyte dữ liệu có tổ
chức và phi cấu trúc có thể được các ngân hàng và tổ chức tài chính sử dụng để dự đoán hành vi
của khách hàng và phát triển chiến lược. Lĩnh vực tài chính tạo ra một lượng lớn dữ liệu. Dữ
liệu có cấu trúc là thông tin được xử lý trong một công ty để cung cấp những hiểu biết quan
trọng về việc ra quyết định. Dữ liệu phi cấu trúc đang được tích lũy từ nhiều nguồn khác nhau
với số lượng ngày càng tăng, mang lại những cơ hội phân tích to lớn.
Mỗi ngày, hàng tỷ đô la đi qua thị trường toàn cầu và các nhà phân tích được giao nhiệm vụ
theo dõi thông tin này với độ chính xác, bảo mật và tốc độ để đưa ra dự báo, tìm ra mô hình và
phát triển các chiến thuật dự đoán. Cách dữ liệu này được thu thập, xử lý, lưu trữ và phân tích sẽ
xác định giá trị của nó. Các nhà phân tích ngày càng lựa chọn các giải pháp dữ liệu đám mây vì
các hệ thống cũ không thể chứa dữ liệu phi cấu trúc và tách biệt nếu không có sự tham gia rộng
rãi và phức tạp của CNTT. Các ngân hàng sử dụng Dữ liệu lớn có thể đưa ra những đánh giá
sáng suốt về những thứ như cải thiện dịch vụ chăm sóc khách hàng, ngăn chặn gian lận, nhắm
mục tiêu khách hàng tốt hơn, hiệu suất kênh hàng đầu và đánh giá mức độ rủi ro với khả năng
đánh giá các loại dữ liệu khác nhau.
Các tổ chức tài chính không phải là những người bản địa về kỹ thuật số và đã phải trải qua một
quá trình chuyển đổi kéo dài, đòi hỏi những thay đổi về hành vi và công nghệ. Ngành ngân hàng
Dữ liệu lớn đã trải qua những tiến bộ công nghệ đáng kể trong những năm gần đây, mang đến
các giải pháp thuận tiện, phù hợp và an toàn cho doanh nghiệp. Do đó, phân tích Dữ liệu lớn của
ngân hàng đã có thể cách mạng hóa không chỉ các hoạt động kinh doanh riêng lẻ mà còn cả toàn
bộ ngành dịch vụ tài chính. Chúng ta hãy xem xét một số cách cụ thể Dữ liệu lớn đã hiện đại
hóa và cách mạng hóa tài chính.
1.4.1.Phát hiện và ngăn chặn gian lận 7
Việc phát hiện và ngăn chặn gian lận được hỗ trợ rất nhiều nhờ học máy, được hỗ trợ bởi dữ liệu
lớn. Các mối đe dọa về bảo mật thẻ tín dụng đã được giảm bớt nhờ các phân tích phân tích xu
hướng mua hàng. Khi thông tin thẻ tín dụng vừa an toàn vừa có giá trị bị đánh cắp, các ngân
hàng giờ đây có thể đóng băng thẻ và giao dịch ngay lập tức, đồng thời cảnh báo người tiêu
dùng về mối nguy hiểm về bảo mật.
1.4.2.Đánh giá rủi ro chính xác
Học máy ngày càng được sử dụng để đưa ra các lựa chọn tài chính quan trọng như đầu tư và cho
vay. Các quyết định dựa trên phân tích dự đoán xem xét mọi thứ từ nền kinh tế, phân khúc
khách hàng đến vốn doanh nghiệp để xác định các mối nguy tiềm ẩn như khoản đầu tư hoặc thanh toán bị lỗi.
1.4.3.Phân loại hoặc giải thể khách hàng
Đây là một tính năng rất hữu ích và hiệu quả được cung cấp bởi Big Data trong hoạt động kinh
doanh ngân hàng. Nó có khả năng phân loại khách hàng dựa trên các hoạt động tài chính của họ,
chẳng hạn như thu nhập, chi tiêu, tiết kiệm và đầu tư. Thông tin chức năng và quan trọng của
khách hàng được ghi nhận và phân loại dựa trên yêu cầu tài chính của họ. Điều này cho phép
ban quản lý ngân hàng nắm bắt tốt hơn các giới hạn dịch vụ tài chính mà họ cần nâng cấp hoặc
hạ cấp. Tính năng này đã hỗ trợ và tiếp tục hỗ trợ quản lý ngân hàng trong việc hoạch định lãi
suất và các dịch vụ tài chính khác.
1.4.4.Tăng hiệu quả của các quy trình thủ công
Khả năng mở rộng là một tính năng của các giải pháp tích hợp dữ liệu cho phép chúng phát triển
khi nhu cầu kinh doanh thay đổi. Các công ty thẻ tín dụng có thể tự động hóa các hoạt động
thường ngày, giảm giờ làm của nhân viên CNTT và cung cấp thông tin chi tiết về hoạt động
hàng ngày của khách hàng bằng cách truy cập vào bức tranh hoàn chỉnh về tất cả các giao dịch hàng ngày.
1.5. Cách thức hoạt động của Big data 8
Big Data cung cấp cho bạn thông tin chi tiết mới, mở ra cơ hội và mô hình kinh doanh mới.
Bắt đầu bao gồm ba hành động chính: *Tích hợp
Big Data tập hợp dữ liệu từ nhiều nguồn và ứng dụng khác nhau. Các cơ chế tích hợp dữ liệu
truyền thống, chẳng hạn như trích xuất, chuyển đổi và tải (ETL) thường không phù hợp với
nhiệm vụ. Nó đòi hỏi các chiến lược và công nghệ mới để phân tích các tập Big Data ở quy
mô terabyte, hoặc thậm chí là petabyte.
Trong quá trình tích hợp, bạn cần đưa dữ liệu vào, xử lý và đảm bảo dữ liệu được định dạng
và có sẵn ở dạng mà các nhà phân tích kinh doanh của bạn có thể bắt đầu. *Quản lý
Big Data yêu cầu lưu trữ. Giải pháp lưu trữ của bạn có thể trên đám mây, tại chỗ hoặc cả hai.
Bạn có thể lưu trữ dữ liệu của mình ở bất kỳ hình thức nào bạn muốn và đưa các yêu cầu xử
lý mong muốn cũng như các công cụ xử lý cần thiết vào các tập dữ liệu đó theo yêu cầu.
Nhiều người chọn giải pháp lưu trữ của họ theo nơi dữ liệu của họ hiện đang cư trú. Đám
mây đang dần trở nên phổ biến vì nó hỗ trợ các yêu cầu tính toán hiện tại của bạn và cho
phép bạn sử dụng tài nguyên khi cần thiết. *Phân tích 9
Khoản đầu tư của bạn vào Big Data sẽ được đền đáp khi bạn phân tích và hành động trên dữ
liệu của mình. Có được sự rõ ràng mới với phân tích trực quan về các tập dữ liệu đa dạng của
bạn. Khám phá thêm dữ liệu để tạo ra những khám phá mới. Chia sẻ những phát hiện của bạn
với những người khác. Xây dựng mô hình dữ liệu bằng máy học và trí tuệ nhân tạo. Đưa dữ
liệu của bạn vào hoạt động.
1.6. So sánh Big Data và Data mining (Khai thác dữ liệu)
Big DataData Mining là hai khái niệm quan trọng trong lĩnh vực quản lý dữ liệu và phân
tích dữ liệu. Dưới đây là một so sánh giữa chúng: *Định nghĩa:
Big Data: Big Data đề cập đến việc xử lý và phân tích dữ liệu lớn, có kích thước lớn và phức
tạp. Nó không chỉ giới hạn trong việc lưu trữ mà còn bao gồm cả khả năng xử lý và phân tích
dữ liệu có kích thước lớn.
Data Mining: Data Mining là quá trình khám phá các mẫu tiềm ẩn, thông tin hữu ích hoặc tri
thức từ dữ liệu có cấu trúc hoặc không cấu trúc. *Mục tiêu chính:
Big Data: Mục tiêu chính của Big Data là quản lý và xử lý dữ liệu lớn, giúp tổ chức hiểu rõ
hơn về môi trường kinh doanh của họ, đưa ra quyết định thông tin và tối ưu hóa hiệu suất.
Data Mining: Mục tiêu chính của Data Mining là phát hiện mẫu tiềm ẩn, quy luật, và thông
tin hữu ích từ dữ liệu để hỗ trợ quyết định và dự đoán. *Quy mô dữ liệu:
Big Data: Xử lý dữ liệu ở quy mô lớn, thường là dữ liệu có kích thước từ terabytes đến petabytes.
Data Mining: Có thể áp dụng trên các bộ dữ liệu lớn, nhưng không nhất thiết phải là dữ liệu
lớn. Các kỹ thuật Data Mining có thể được sử dụng trên dữ liệu có kích thước nhỏ hơn. 10 *Phương pháp:
Big Data: Sử dụng các công nghệ như Hadoop, Spark để lưu trữ và xử lý dữ liệu lớn, cũng
như các công nghệ in-memory để tối ưu hóa hiệu suất.
Data Mining: Sử dụng các thuật toán máy học, thống kê, khai phá dữ liệu để khám phá thông tin từ dữ liệu. *Ứng dụng:
Big Data: Thường được sử dụng để phân tích xu hướng thị trường, dự đoán nhu cầu của
khách hàng, tối ưu hóa quy trình kinh doanh.
Data Mining: Có thể được áp dụng trong nhiều lĩnh vực như tiếp thị, y tế, tài chính để phân
tích mô hình và dự đoán. *Liên quan:
Big Data: Là nguồn cung cấp dữ liệu cho Data Mining. Dữ liệu lớn cung cấp nguồn dữ liệu
phong phú để áp dụng các kỹ thuật khai thác dữ liệu.
Data Mining: Cần có dữ liệu để phân tích, và dữ liệu lớn cung cấp một nguồn cung cấp dữ
liệu lớn để áp dụng các kỹ thuật khai thác dữ liệu.
=>Tóm lại, Big Data tập trung vào quản lý và xử lý dữ liệu lớn, trong khi Data Mining
tập trung vào việc khám phá thông tin từ dữ liệu để hỗ trợ quyết định và dự đoán. Cả
hai đều là các khía cạnh quan trọng của lĩnh vực quản lý dữ liệu và phân tích dữ liệu.

1.7. Bộ công cụ và bộ kĩ năng cho Big Data trong ngân hàng
1.7.1. Bộ công cụ cho Big Data trong ngân hàng
Hadoop
Hadoop được tạo ra như một giải pháp Dữ liệu lớn tiên phong giúp xử lý khối lượng khổng
lồ dữ liệu có cấu trúc, phi cấu trúc và bán cấu trúc. Nó là một khung phân tán để lưu trữ dữ
liệu và chạy các ứng dụng trên các cụm phần cứng thông dụng. Khi được giới thiệu lần đầu
tiên vào năm 2006, nó gần như ngay lập tức gắn liền với Dữ liệu lớn. Hadoop được tạo
thành từ bốn phần chính: 
Yet Another Resource Negotiator, hay YARN, là một chương trình lên lịch thực
thi các công việc trên các nút cụm và gán tài nguyên hệ thống cho chúng. 
Hadoop MapReduce, một công cụ xử lý hàng loạt tích hợp sẵn giúp phân chia các
phép tính lớn và chạy chúng trên các nút khác nhau để cân bằng tốc độ và tải; và
Hadoop MapReduce, một công cụ xử lý hàng loạt tích hợp sẵn giúp phân chia các 11
phép tính lớn và chạy chúng trên các nút khác nhau để cân bằng tốc độ và tải; và Hadoop MapReduce. 
HDFS (Hệ thống tệp phân tán Hadoop) chia dữ liệu thành các khối để lưu trữ trên
các nút cụm, sử dụng cơ chế sao chép để ngăn ngừa mất dữ liệu và điều chỉnh việc truy cập dữ liệu. 
Hadoop Common là tập hợp các tiện ích và thư viện mà mọi người đều có thể sử dụng.
Trường hợp điển hình: Công cụ dữ liệu lớn dựa trên Hadoop để phân tích thống kê sử
dụng thiết bị Luồng khí
Airflow là phần mềm quản lý quy trình làm việc dành cho các hệ thống dữ liệu lớn, cho phép
chúng lên lịch và chạy các đường ống dữ liệu phức tạp. Nó cho phép các kỹ sư dữ liệu và
những người dùng khác đảm bảo rằng mỗi bước trong quy trình làm việc được hoàn thành
theo đúng thứ tự và tất cả tài nguyên hệ thống đều có sẵn. Airflow cũng được tiếp thị là dễ sử
dụng: Quy trình làm việc được viết bằng Python, ngôn ngữ lập trình có thể được sử dụng để
xây dựng mô hình học máy, truyền dữ liệu và thực hiện nhiều tác vụ khác. Đây là một số yếu tố chính của Airflow: 
giao diện người dùng ứng dụng web để trực quan hóa đường dẫn dữ liệu, theo dõi
trạng thái sản xuất và khắc phục sự cố; 
một thiết kế mô-đun và có thể mở rộng dựa trên khái niệm biểu đồ tuần hoàn có
hướng (DAG), mô tả sự phụ thuộc lẫn nhau giữa các nhiệm vụ của quy trình công việc; 
và các kết nối được tạo sẵn với các nền tảng đám mây chính và các dịch vụ bên thứ ba khác. Tổ ong
Hive là phần mềm cơ sở hạ tầng kho dữ liệu sử dụng SQL để đọc, ghi và quản lý các tập dữ
liệu khổng lồ trong các hệ thống lưu trữ phân tán. Facebook đã phát minh ra nó, nhưng sau
đó nó được mở nguồn cho Apache, công ty này vẫn tiếp tục phát triển và hỗ trợ nó. 12
Hive là một khung xử lý dữ liệu có cấu trúc hoạt động trên nền tảng Hadoop. Nó được sử
dụng để tóm tắt và phân tích dữ liệu cũng như truy vấn lượng dữ liệu khổng lồ. Các nhà phát
triển của Hive mô tả nó là có khả năng mở rộng, nhanh chóng và linh hoạt, mặc dù thực tế là
nó không thể được sử dụng để xử lý giao dịch trực tuyến, cập nhật theo thời gian thực hoặc
truy vấn hoặc quy trình cần truy xuất dữ liệu có độ trễ thấp. Dưới đây là một số tính năng chính khác: 
một phương pháp tích hợp để hỗ trợ người dùng áp đặt cấu trúc trên các định dạng dữ liệu khác nhau; 
chức năng SQL thông thường để truy vấn và phân tích dữ liệu; 
và truy cập vào các tệp HDFS cũng như các tệp được lưu trữ trong các hệ thống
khác, chẳng hạn như cơ sở dữ liệu Apache HBase. Nháy mắt
Flink là một khung xử lý luồng dành cho các ứng dụng được nối mạng, hiệu suất cao và luôn
khả dụng và đó là một dự án nguồn mở khác của Apache. Nó có thể được sử dụng để xử lý
hàng loạt, đồ thị và lặp lại, đồng thời cho phép tính toán trạng thái trên cả luồng dữ liệu hữu hạn và không giới hạn.
Flink có thể xử lý hàng triệu sự kiện trong thời gian thực với độ trễ thấp và thông lượng
lớn, đồng thời bao gồm các đặc điểm sau, nhằm chạy trong tất cả các môi trường cụm phổ biến: 
ba cấp độ API để tạo các loại ứng dụng khác nhau; 
một bộ thư viện để xử lý sự kiện phức tạp, học máy và các trường hợp sử dụng Dữ liệu lớn khác; 
một bộ thư viện để tính toán trong bộ nhớ với khả năng truy cập vào bộ lưu trữ đĩa nếu cần. 13
Tảng băng trôi
Iceberg là một định dạng bảng mở để quản lý dữ liệu trong hồ dữ liệu, điều này đạt được một
phần bằng cách giữ các tệp dữ liệu riêng lẻ thay vì các thư mục trong bảng. Theo trang web
của dự án, Iceberg hiện là một dự án của Apache và thường được "sử dụng trong sản xuất
trong đó một bảng duy nhất có thể chứa hàng chục petabyte dữ liệu".
Định dạng bảng Iceberg được tạo để cải thiện các bố cục phổ biến thường thấy trong các
công cụ như Hive, Presto, Spark và Trino. Hoạt động của nó tương tự như các bảng SQL
trong cơ sở dữ liệu quan hệ. Tuy nhiên, nó hỗ trợ một số công cụ hoạt động trên cùng một bộ
sưu tập dữ liệu. Sau đây là một số tính năng quan trọng hơn: 
phân vùng dữ liệu ẩn, giúp loại bỏ nhu cầu người dùng duy trì phân vùng; 
tiến hóa lược đồ, cho phép người dùng thay đổi bảng mà không cần phải viết lại
hoặc di chuyển dữ liệu; 
khả năng "du hành thời gian", cho phép người dùng chạy các truy vấn lặp lại bằng
cách sử dụng cùng một ảnh chụp nhanh bảng. Tia lửa
Spark là một công cụ phân tích và xử lý dữ liệu trong bộ nhớ có thể chạy trên các cụm hoặc
cụm độc lập do Hadoop YARN, Mesos và Kubernetes quản lý. Nó có thể được sử dụng cho
các ứng dụng hàng loạt và phát trực tuyến, cũng như xử lý đồ thị và học máy. Tất cả đều có
thể thực hiện được nhờ bộ sưu tập các mô-đun và thư viện được cài đặt sẵn sau đây: 
Spark SQL, trình tối ưu hóa truy vấn SQL cho dữ liệu có cấu trúc; 
Spark Streaming và Structured Streaming, hai mô-đun xử lý luồng; 
MLlib, thư viện máy học với các kỹ thuật và công cụ; 
và GraphX, một API bổ sung hỗ trợ cho các ứng dụng đồ thị. Kafka
Kafka là một nền tảng phát trực tuyến sự kiện phân tán, chủ yếu được sử dụng cho các đường
ống dữ liệu hiệu suất cao, phân tích phát trực tuyến, tích hợp dữ liệu và các ứng dụng quan
trọng. Về cơ bản, Kafka là một framework để lưu trữ, đọc và phân tích dữ liệu truyền phát ở
dạng đơn giản nhất.Công nghệ tách các luồng dữ liệu khỏi hệ thống, cho phép các luồng dữ
liệu được lưu trữ và tái sử dụng ở nơi khác. Nó chạy trong môi trường phân tán và giao tiếp
với các hệ thống và ứng dụng bằng giao thức mạng TCP hiệu suất cao. Dưới đây là một số
yếu tố quan trọng nhất của Kafka: 
một bộ năm API Java và Scala cơ bản; 14 
khả năng chịu lỗi cho cả máy chủ và máy khách trong cụm Kafka; 
và khả năng mở rộng linh hoạt tới 1.000 "nhà môi giới" hoặc máy chủ lưu trữ trên mỗi cụm. Bão
Storm là một hệ thống xử lý thời gian thực phân tán được thiết kế để xử lý các luồng dữ liệu
không giới hạn một cách an toàn và nó cũng là một phần của công nghệ nguồn mở
Apache. Theo trang web của dự án, nó có thể được sử dụng để phân tích thời gian thực, học
máy trực tuyến và tính toán liên tục, cũng như các hoạt động trích xuất, chuyển đổi và tải
(ETL). Các yếu tố sau đây cũng có mặt trong một cơn bão: 
Storm SQL, cho phép thực hiện các truy vấn SQL dựa trên các tập dữ liệu truyền trực tuyến; 
API Trident và Streams, hai giao diện xử lý Storm cấp cao hơn; và phối hợp cụm
bằng cách sử dụng Apache Zookeeper.
1.7.2. Bộ kỹ năng cho Big Data trong ngân hàng
Theo phân tích từ Tập đoàn Dữ liệu Quốc tế (IDC), ngành phân tích kinh doanh và Dữ liệu
lớn toàn cầu đã phát triển với tốc độ nhanh chóng trong những năm gần đây và đang trên đà
đạt 274 tỷ USD vào cuối năm nay, 2022. Với Sự tăng trưởng nhanh chóng này mang đến cơ
hội lớn để cải thiện kỹ năng phân tích dữ liệu của bạn, chẳng hạn như bằng cách tham gia
chương trình đào tạo về phân tích dữ liệu được thiết kế riêng cho những người mới bước vào
nghề. Để thành công trong lĩnh vực này, các nhà phân tích dữ liệu cần một nhóm tài năng cụ
thể, hầu hết có bản chất là kỹ thuật; tuy nhiên, họ cũng yêu cầu một bộ kỹ năng mềm.
1. Trực quan hóa dữ liệu. Khả năng sử dụng hình ảnh hoặc các bản vẽ khác để trình bày kết
quả dữ liệu với mục tiêu là hiểu rõ hơn về những hiểu biết sâu sắc dựa trên dữ liệu.
2. Làm sạch dữ liệu. Các nhà phân tích dữ liệu yêu cầu kỹ năng làm sạch dữ liệu mạnh mẽ
vì dữ liệu không được làm sạch có thể dẫn đến các mẫu dữ liệu không thực tế hoặc sai lệch.
3. MATLAB. Việc triển khai thuật toán, thao tác ma trận và vẽ đồ thị dữ liệu, cùng với các
khả năng khác, được hỗ trợ bởi ngôn ngữ lập trình và môi trường điện toán số đa mô hình
này. R. Trong phân tích dữ liệu, R là một trong những ngôn ngữ được sử dụng rộng rãi và
rộng rãi nhất. Cú pháp và cấu trúc của R được thiết kế để hỗ trợ công việc phân tích và
theo mặc định, nó đi kèm với một số lệnh tổ chức dữ liệu đơn giản, tích hợp sẵn. Các
doanh nghiệp thích ngôn ngữ lập trình này vì nó có thể quản lý lượng dữ liệu phức tạp hoặc khổng lồ.
4. Trăn. Đối với các nhà phân tích dữ liệu đầy tham vọng, việc học Python phải là ưu tiên
hàng đầu. Sự phù hợp của Python để phát triển AI đặc biệt đáng chú ý. 15
5. SQL/NoSQL. SQL vẫn là phương pháp tiêu chuẩn để truy vấn và thao tác dữ liệu trong
cơ sở dữ liệu quan hệ trong phân tích hiện đại. Các khung NoSQL có thể tổ chức dữ liệu
theo bất kỳ cách nào chúng chọn, miễn là cách tiếp cận này không mang tính quan hệ.
6. Kỹ năng toán học nâng cao. Trong phân tích, hai nhánh nghiên cứu toán học cụ thể nổi
bật: đại số tuyến tính và phép tính. Đại số tuyến tính được sử dụng trong học máy và học
sâu để thực hiện các phép toán vectơ, ma trận và tensor. Phép tính cũng được sử dụng để
xây dựng các hàm mục tiêu/chi phí/tổn thất hướng dẫn các thuật toán cách đạt được mục tiêu của chúng.
7. Tư duy phản biện. Bạn có thể suy nghĩ phân tích về dữ liệu với tư cách là một nhà tư
tưởng phản biện, phát hiện các mẫu và rút ra thông tin cũng như hiểu biết sâu sắc có thể
hành động từ dữ liệu bạn có. Nó đòi hỏi phải vượt lên trên và áp dụng bản thân vào việc
suy nghĩ thay vì chỉ xử lý.
8. Giao tiếp. Trở thành một nhà phân tích dữ liệu thành công đòi hỏi phải trở thành "song
ngữ". Bạn sẽ có thể thảo luận các vấn đề kỹ thuật cao với các đồng nghiệp đã được đào
tạo của mình và đưa ra những giải thích rõ ràng, cấp cao theo cách giúp ích - thay vì gây
nhầm lẫn - cho những người ra quyết định tập trung vào hoạt động kinh doanh. Nếu
không thể, bạn vẫn có thể cần cải thiện kỹ năng phân tích dữ liệu của mình.
CHƯƠNG 2. ĐẶC ĐIỂM VÀ ỨNG DỤNG CỦA BIG DATA TRONG LĨNH VỰC NGÂN HÀNG
Big data là một trong những công nghệ ứng
dụng trong nhiều lĩnh vực. Điển hình như trong
ngành ngân hàng, ta thấy big data được coi là
chìa khóa vàng giúp cho ngành ngân hàng vươn
tầm mạnh mẽ. Ngay khi áp dụng big data đã có
những thy đổi tích cực, đặc biệt trong quy trình chăm sóc khách hàng.
Vậy các ứng dụng của big data trong ngân hàng
gồm những gì? Và chúng mang lại lợi ích như thế nào?
16
2.1. Phân tích thói quen hành vi chi tiêu của khách hàng
Nhờ dữ liệu lớn, các ngân hàng có khả năng thu thập thông tin liên quan đến thói quen, hành
vi chi tiêu và nguồn thu chủ yếu của khách hàng trong năm hoặc những dịch vụ mà khách
hàng đang sử dụng ... diều này trở thành cơ sở giúp cho ngân hàng năm bắt được những thông
tin quan trọng, có một góc nhìn sâu hơn về khác hàng, cho phép ngân hàng tạo ra các chiến
lược khuyễn mãi cá nhân hóa hơn, dựa trên hành vi và nhu cầu của từng người sử dụng.
Nền tảng dữ liệu này cũng là cơ sở để ngân hàng đánh giá rủi ro một cách chính xác, thẩm
định khả năng vay vốn của khách hàng, và mở rộng danh mục dịch vụ theo hướng phù hợp.
Bên cạnh đó, nhờ nắm được thông tin về nguồn tiền nhàn rỗi của khách hàng, ngân hàng có
thể tận Áp dụng các chức năng sàng lọc thông tin, ví dụ như, khi lọc ra thời điểm dịp lễ hay
mùa lễ và điều kiện vĩ mô (lạm phát, tỷ lệ thất nghiệp…) mà nhân viên ngân hàng có thể hiểu
được nguyên nhân của biến động trong thu nhập hay chi tiêu của dụng thu hút tiền gửi để
thực hiện các hoạt động đầu tư.
2.2.Xác định phân khúc khách hàng và đánh giá hồ sơ
Phân khúc khách hàng là một trong những hoạt động quan trọng nằm trong chiến lược
marketing và thiết kế sản phẩm của ngân hàng
Những thông tin mà ngân hàng thu thập được về nhu cầu, thói quen hay xu hướng tiêu dùng
với xác định các loại hình dịch vụ, kênh giao dịch được khách hàng ưu tiên (ví dụ khách hàng
muốn gửi tiết kiệm hay muốn đầu tư các khoản vay) được hoàn tất thì các ngân hàng sẽ có
được một cơ sở dữ liệu phục vụ cho quá trình phân khúc, phân loại khách hàng đưa ra những
dịch vụ phù hợp với từng đối tượng. 17
Big Data sẽ cung cấp cho các ngân hàng những hiểu biết, kiến thức chuyên môn sâu về nhu
cầu tiềm ẩn bên trong, thói quen và xu hướng chi tiêu của khách hàng, trợ giúp cho nhiệm vụ
xác định nhu cầu và mong muốn của họ.
Bằng cách nắm các thông tin liên quan đến giao dịch, ngân hàng có thể xác định được khách
hàng của mình thuộc các nhóm nào, ví dụ nhóm có chi tiêu dễ dàng, nhóm nhà đầu tư thận
trọng, nhóm thanh toán nợ nhanh chóng, nhóm khách hàng trung thành… Bên cạnh đó, biết
được hồ sơ cá nhân của tất cả các khách hàng giúp ngân hàng đánh giá chi tiêu và thu nhập
dự kiến trong tháng tới và lập kế hoạch chi tiết để đảm bảo lợi nhuận cho chính tổ chức và lợi ích cho chính khách hàng.
Ví dụ: McKinsey nhận thấy rằng việc sử dụng dữ liệu để đưa ra quyết định tốt hơn có thể tiết
kiệm tới 15-20% ngân sách tiếp thị của bạn. Tính đến việc các ngân hàng chi trung bình 8%
tổng ngân sách cho tiếp thị, việc khai thác dữ liệu lớn có vẻ là một cơ hội tuyệt vời để không
chỉ tiết kiệm mà còn tạo thêm doanh thu thông qua các chiến lược tiếp thị có mục tiêu cao.
Bằng cách sử dụng dữ liệu lớn, bạn có thể hiểu rõ hơn nhu cầu của khách hàng, xác định các
vấn đề trong việc nhắm mục tiêu sản phẩm của mình và tìm ra cách tốt nhất để khắc phục các vấn đề hiện có.
Barclays đã sử dụng cái gọi là “lắng nghe xã hội”, tức là phân tích cảm tính, để tìm ra những
hiểu biết sâu sắc có thể hành động từ hoạt động của người dùng trên mạng xã hội.
Khi công ty ra mắt ứng dụng di động, nhiều người không hài lòng với việc người dùng dưới
18 tuổi không thể chuyển hoặc nhận tiền. Những khách hàng không hài lòng đã phản ứng
bằng cách bày tỏ sự thất vọng của họ trên mạng xã hội.
Ngay sau khi dữ liệu do Barclays thu thập tiết lộ sự cố, công ty đã có thể khắc phục sự cố
bằng cách cho phép người dùng từ 16 tuổi trở lên truy cập toàn bộ khả năng của ứng dụng.
2.3. Marketing cá nhân hóa
Marketing cá nhân hóa là bước tiến quan trọng sau khi xác định phân khúc khách hàng. Ngân
hàng sử dụng thông tin này để nhằm đến đối tượng mục tiêu dựa trên thói quen chi tiêu cá nhân của họ.
ùng với đó các ngân hàng sẽ có cái nhìn bao quát hơn về các nhu cầu của người dùng, những
mong muốn của họ thông qua việc kết hợp dữ liệu phi cấu trúc từ mạng xã hội và dữ liệu của giao dịch
Thông qua những thông tin này, ngân hàng thiết kế những chiến dịch marketing tối ưu, ví dụ
(vay vốn với lãi xuất thấp, áp dụng các trương trình khuyến mãi dể nhận được phản hồi tích
cực từ khác hàng), ngân hàng tạo ra những ưu đãi đáp ứng mong muốn của khách hàng.
Kết quả là tỷ lệ phản hồi cao hơn và mối quan hệ gắn kết với khách hàng mạnh mẽ hơn. Ví
dụ các ngân hàng sử dụng công cụ email marketing để gửi đến khách hàng các thông tin mới 18
nhất về những dịch vụ cho vay ngắn hạn với lãi suất vừa phải hay gửi tiết kiệm với lãi suất
hấp dẫn, hoặc các chương trình ưu đãi khác,…
2.4. Nâng cao chất lượng dịch vụ chăm sóc khách hàng
Theo Oracle , 84% giám đốc điều hành được khảo sát đồng ý rằng khách hàng đang tìm kiếm
trải nghiệm cá nhân hóa, phù hợp hơn. Báo cáo cũng cho biết khả năng cung cấp cho người
dùng những gì họ cần có thể mang lại cho bạn doanh thu hàng năm cao hơn 18%.
Khách hàng góp phần quan trọng vào việc cải thiện dịch vụ ngân hàng bằng cách phản hồi
thông tin qua nhiều kênh thông tin như Zalo, Facebook và biểu mẫu sau mỗi lần nhận tư vấn
dịch vụ từ trung tâm chăm sóc khách hàng hay thực hiẹn giao dịch.
Nhờ việc thu thập, chọn lọc phân tích phản hồi của khách hàng từ big data, nhân viên tư vấn
có thể giải quyết những thắc mắc của khách hàng kịp thời
Ngân hàng cũng có thể ngăn chặn những tin đồn gây thiệt hại đến hoạt động kinh doanh
nhanh chóng lập kế hoạch cải tiến xây dựng niềm tin từ khách hàng, tạo nên vị thế thương
hiệu vững mạnh và thu hút sự quan tâm từ thị trường.
2.5. Thay đổi cách thức cung cấp dịch vụ đến khách hàng
Hệ thống Big Data có thể là một hệ thống lớn liên kết giữa nhiều bộ phận chức năng khác
nhau với công việc chính là giúp các nhà điều hành dưa ra các quyết định dễ dàng dựa trên
việc phân tích các thông tin dao dịch của khách hàng được nhập vào hệ thống.
Bất cứ khi nào tên một khách hàng hoặc số tài khoản được nhập vào hệ thống, hệ thống Big
Data sẽ hỗ trợ sàng lọc tất cả các dữ liệu và chỉ truyền đi hay cung cấp các dữ liệu được yêu
cầu để phục vụ cho quá trình phân tích. 19
Điều này cho phép các ngân hàng tối ưu hóa quy trình làm việc, rút ngắn được cả thời gian và
tiết kiệm chi phí. Big Data cũng cho phép các tổ chức xác định và khắc phục các vấn đề trước
khi khách hàng bị ảnh hưởng.
2.6. Ngăn chặn các hành vi lừa đảo, vi phạm pháp luật
Một trong những vấn đề nan giải lớn nhất mà ngành ngân hàng phải đối mặt là gian lận, tội
phạm trong tín dụng. Big Data sẽ giúp cho ngân hàng đảm bảo rằng không có giao dịch trái
phép nào được thực hiện, đảm bảo mức độ an toàn, tiêu chuẩn bảo mật của toàn bộ ngành nâng cao.
Nhờ vào dữ liệu về lịch sử giao dịch và hồ sơ tín dụng của khách hàng, ngân hàng sẽ có thể
xác định và nhận được cảnh báo nếu có điều gì bất thường xảy ra trong quá trình hoạt động,
cung cấp dịch vụ đến khách hàng.
Ví dụ: Một khách hàng nào đó thường thanh toán chi tiêu cho sinh hoạt hằng ngày hoặc gửi
tiết kiệm trong tài khoản lấy lãi nhưng bất chợt lại rút toàn bộ số tiền mình có trong tài khoản
qua ATM, điều này có nghĩa là thẻ có thể đã bị mất cắp và đang được sử dụng. Nhân viên
ngân hàng sẽ gọi điện đến chủ tài khoản hoặc thông báo đến khách hàng bằng bất kỳ hình
thức nào để xác minh lại giao dịch đó một cách rõ hơn.Xem đây có đang là giao dịch hợp pháp hay không?
Vậy, việc phân tích dữ liệu giao dịch lịch sử và làm cơ sở để kiểm tra tính hợp pháp, an toàn
bảo mật của các giao dịch hiện tại sẽ giảm thiểu được hành vi vi phạm pháp luật có thể xảy ra.
Các ngân hàng khai thác Big Data để phân biệt giữa các giao dịch hợp pháp hay không bằng
cách áp dụng các thuật toán phân tích dữ liệu và “học máy” . Các hệ thống phân tích sẽ tự
động phát hiện, và đề xuất các hành động ngay lập tức, chẳng hạn như chặn các giao dịch bất 20
thường, hành vi lừa đảo trước khi nó xảy ra để đảm bảo lợi ích của khách hàng hay là lợi
nhuận của chính ngân hàng.
2.7. Kiểm soát rủi ro, tuân thủ luật pháp và minh bạch trong báo cáo tài chính
Trong ngành tài chính Big Data, phân tích Big Data cũng cho phép bạn nhận thức được các mối
đe dọa tiềm ẩn của công ty bạn. Bạn cũng có thể tư vấn cho họ về tình trạng rủi ro của họ. Các
khoản đầu tư rủi ro có thể dễ dàng được xác định bằng cách sử dụng kỹ thuật học máy. Đây là
cơ hội quan trọng để tránh đưa ra những quyết định tài chính sai lầm và xem xét lại việc tham
gia vào một thảm họa tài chính.
Ngoài phát hiện các hành vi phạm tội, bảo vệ lợi ích của người tiêu dùng, các ngân hàng ứng
dụng Big Data để đo lường, kiểm soát rủi ro trong thực hiện các giao dịch bằng cổ phiếu với
những nhà đầu tư và kiểm tra hồ sơ vay của khách hàng.Dĩ nhiên tất cả phải dựa trên sự phân
tích có kết quả từ mọi dữ liệu lịch sử liên quan.
Ngoài ra các thuật toán Big Data còn giúp giải quyết các vấn đề về tuân thủ quy định pháp
luật về kế, kiểm và báo cáo tài chính minh bạch nhằm hợp lý hoá các hoạt động của tổ chức
từ đó giảm được chi phí quản lý.
Hệ thống Big Data thu thập và lưu trữ các dữ liệu lớn giúp cho ngân hàng tiến hành phân tích
một cách nhanh chóng khi có các dấu hiệu rủi ro xảy ra, rồi đưa ra các biện pháp xử lý.
Big Data có một vai trò tất yếu trong việc phối hợp giữa các bộ phận, phòng, ban và yêu cầu
xử lý dữ liệu của ngân hàng vào một hệ thống trung tâm; qua đó, hỗ trợ kiểm soát, ngăn chặn
vấn đề mất dữ liệu, giảm rủi ro và gian lận.
2.8. Bán chéo thêm các dịch vụ
Dựa vào cơ sở dữ liệu ngân hàng có được, ngân hàng có thể giữ chân hoặc thu hút thêm
khách hàng bằng cách giới thiệu thêm các dịch vụ khác. 21
Ví dụ, ngân hàng có thể đề xuất các khoản vay ngắn hạn cho các khách hàng bình thường cho
việc chi tiêu hàng ngày của họ hoặc các khoản vay đáp ứng nhu cầu thanh toán ngắn hạn đối với doanh nghiệp
Phân tích về hồ sơ cá nhân của người sử dụng một cách tương đối, bên ngân hàng có thể bán
kèm các dịch vụ khác với các ưu đãi khác phù hợp với nhu cầu khách
2.9. Tham gia vào việc kiểm soát đánh giá và nâng cao hiệu quả làm việc của nhân viên
Hệ thống Big Data hỗ trợ tổng hợp phân tích, đánh giá và truyền tải những dữ liệu về hiệu
suất làm việc của nhân viên.
Trước đây, để thu thập các thông tin này phải cần rất nhiều công đoạn mang tính thủ công, thì
nay với sự phát triển của công nghệ, Big Data sẽ xử lý được các công việc này một cách
nhanh chóng hiệu quả . Kết quả phân tích sẽ giúp các lãnh đạo có cái nhìn về tình trạng chung
về các nhân viên khi làm việc, đặc biệt là xem xét mức độ hài lòng của ngân viên đối với môi
trường làm việc cũng như là những phúc lợi mà ngân hàng dành cho họ.
Các công cụ của Big Data khai thác tất cả dữ liệu đều ở thời gian thực, do đó khi giải pháp
được đưa ra sẽ mang tính phù hợp và tạo nên những sự thay đổi.
Các giải pháp Big Data trong ngân hàng cho phép các công ty thu thập, hiểu và chia sẻ các số
liệu hiệu suất của chi nhánh (cũng như từng nhân viên) giữa các phòng ban trong thời gian
thực. Điều này có nghĩa là tầm nhìn tốt hơn về các hoạt động hàng ngày và khả năng nâng
cao để chủ động giải quyết mọi vấn đề.
Ngoài ra đo lường hiệu suất làm việc của cá nhân của các ngân hàng, mà còn tinh thần đồng
đội, sự tương tác giữa các ban và văn hóa tổng thể của công ty. Nhân viên sẽ giảm được thời
gian dành cho các công việc gồm nhiều quy trình phức tạp mang tính thủ công bằng cách dựa
vào hệ thống Big Data gồm các phần mềm đã được lập trình sẵn để giải quyết các công việc
ấy một cách nhanh chóng và chính xác. Từ đó nhân viên có thời gian dành nhiều cho các
công việc, nhiệm vụ khó hơn, cấp bách từ cấp trên giao xuống.
2.10. Dự đoán xu hướng tài chính
Một trong những lợi thế chính của Dữ liệu lớn đối với ngân hàng là khả năng dự đoán các xu
hướng trong tương lai trước khi chúng xảy ra. Bạn có thể nhìn thấy những xu hướng tiêu cực và
chọn không đi theo chúng. Bạn cũng có thể tận dụng xu hướng tích cực và đi trước đối thủ cạnh
tranh. Hơn nữa, việc có trong tay dữ liệu tài chính cụ thể cho phép bạn đưa ra các quyết định 22
đầu tư, dịch vụ và sản phẩm trong tương lai. Trên thực tế, phân tích dữ liệu tài chính cho phép
bạn hỗ trợ khách hàng của mình trong các quy trình của công ty họ.
2.11. Tự động hóa các quy trình chính
Bạn có thể quản lý mọi quy trình tài chính với tốc độ, hiệu suất và giá trị cao hơn với sự trợ giúp
của tự động hóa. Các nhà phân tích, người giám sát và đồng nghiệp có thể hoàn thành bất kỳ
hoạt động đơn giản nào nhanh hơn, tốt hơn và hiệu quả hơn đáng kể so với các nhân viên khác.
Nhờ tự động hóa tiên tiến, các ngân hàng có thể tiết kiệm đáng kể chi phí và giảm nguy cơ
thất bại bằng cách loại bỏ yếu tố con người khỏi một số quy trình quan trọng.
Ví dụ: JP Morgan Chase & Co. là một trong những công ty tiên phong về tự động hóa trong
ngành dịch vụ ngân hàng. Công ty hiện đang sử dụng một số chương trình trí tuệ nhân tạo và
máy học để tối ưu hóa một số quy trình của họ, bao gồm giao dịch thuật toán và giải thích các
thỏa thuận cho vay thương mại.
Một trong những chương trình của nó, được gọi là LOXM, dựa trên dữ liệu lịch sử được rút
ra từ hàng tỷ giao dịch cho phép họ giao dịch cổ phiếu “ở tốc độ tối đa và ở mức giá tối
ưu”, Business Insider đưa tin . Quá trình này đã được chứng minh là hiệu quả hơn nhiều so
với cả giao dịch thủ công và tự động được sử dụng trước đó và mang lại khoản tiết kiệm đáng kể cho công ty.
Một sáng kiến tự động hóa dựa trên dữ liệu khác của JP Morgan Chase được gọi
là COIN . Thuật toán học máy, được hỗ trợ bởi mạng đám mây riêng của công ty, được sử
dụng để giảm thời gian cần thiết để xem xét tài liệu: nhiệm vụ này trước đây cần khoảng
360.000 giờ làm việc, giờ chỉ mất vài giây để hoàn thành.
CHƯƠNG 3. THÁCH THỨC, HẠN CHẾ VÀ GIẢI PHÁP KHI ỨNG DỤNG BIG
DATA Ở TRONG NGÂN HÀNG
3.1. Thách thức, hạn chế khi ứng dụng Big Data ở trong lĩnh vực ngân hàng
3.1.1.Khó tích hợp các hệ thống kế thừa
Trước khi vận hành Big Data, doanh nghiệp cần tiến hành tích hợp tất cả các nguồn dữ liệu
khác nhau lên hệ thống. Thế nhưng, đại đa số doanh nghiệp có thể đã lưu trữ dữ liệu trên
nhiều ứng dụng hoặc phần mềm khác nhau qua nhiều năm. Tuy nhiên, khi nói đến dữ liệu
lớn, mọi thứ thậm chí còn tồi tệ hơn: hầu hết các hệ thống cũ không có khả năng xử lý khối
lượng công việc ngày càng tăng. Việc cố gắng thu thập, lưu trữ và phân tích lượng dữ liệu
cần thiết bằng cơ sở hạ tầng lỗi thời có thể gây nguy hiểm cho sự ổn định của toàn bộ hệ
thống. Do đó, các tổ chức phải tăng khả năng xử lý hoặc xây dựng lại hoàn toàn hệ thống của
mình để đáp ứng thách thức. 23
3.1.2.Big data 4.0 liên tục thay đổi
Big Data 4.0 đang là một xu thế đang gây ảnh hưởng mạnh mẽ đến các lĩnh vực kinh doanh,
nhưng việc sử dụng Big Data cũng đối mặt với nhiều khó khăn. Một trong những khó khăn
chính là tính liên tục của việc thay đổi của Big Data. Nó tạo ra sự khó khăn cho doanh nghiệp
khi họ cần phải dựa vào dữ liệu mới nhất để đưa ra quyết định hoặc cải thiện hoạt động. Do
đó, doanh nghiệp cần phải cập nhật liên tục về các xu thế mới của Big Data để có thể tận
dụng hết các tiện ích của nó.
3.1.3.Dữ liệu lớn đang trở nên không thể quản lý
Với rất nhiều loại dữ liệu khác nhau và khối lượng tổng hợp của chúng không
có gì ngạc nhiên khi các doanh nghiệp phải vật lộn để theo kịp. Điều này càng trở nên rõ ràng
hơn khi cố gắng tách dữ liệu hữu ích khỏi dữ liệu vô ích.
Mặc dù tỷ lệ dữ liệu có khả năng hữu ích đang tăng lên, nhưng vẫn còn rất nhiều dữ liệu
không liên quan cần sắp xếp. Điều này có nghĩa là các doanh nghiệp phải chuẩn bị và củng cố
các phương pháp của họ để phân tích nhiều dữ liệu hơn nữa và nếu có thể, hãy tìm một ứng
dụng mới cho dữ liệu trước đây được cho là không liên quan.
3.1.4.Đòi hỏi thay đổi văn hóa doanh nghiệp
Đòi hỏi thay đổi văn hóa doanh nghiệp là một trong những vấn đề khác khi sử dụng Big Data.
Để sử dụng Big Data, doanh nghiệp cần phải tạo ra một văn hóa mới về cách quản lý dữ liệu
và cách sử dụng dữ liệu để đạt được mục tiêu của họ.
Điều này có thể gây ra sự khó chịu cho những người chưa quen với công nghệ mới này. Khó
khăn này dễ thấy trong thực tiễn, khi nhân viên đã quen với lối làm việc truyền thống, việc
thích ứng cần cả quá trình dài. Ví dụ: Trong cuộc khảo sát thực tế của New Vantage đã chỉ ra
rằng, chỉ có 32,4% doanh nghiệp thành công trong việc thay đổi văn hóa doanh nghiệp theo hướng hiện đại mới. 24
3.1.5.Rủi ro an ninh mạng
Một trong những khó khăn chính khi sử dụng Big Data là bảo mật và rủi ro an ninh mạng.
Khi lưu trữ và xử lý lượng lớn dữ liệu, cần phải đảm bảo rằng dữ liệu được bảo vệ chặt chẽ
khỏi truy cập trái phép hoặc tấn công mạng. Nếu không, dữ liệu có thể bị rò rỉ hoặc sử dụng cho mục đích xấu.
Big Data cần được quản lý chặt chẽ bằng cách sử dụng các giải pháp bảo mật phù hợp và cập
nhật. Điều này bao gồm việc mã hóa dữ liệu, sử dụng tường lửa và bảo vệ mạng, xác thực
người dùng và giám sát hoạt động hệ thống.
3.1.6.Thiếu chuyên gia công nghệ gây cản trở trong việc ứng dụng Big Data Industry 4.0.
Công nghệ 4.0 phát triển, sự can thiệp của máy móc, các thiết bị tự động hóa càng nhiều. Thế
nhưng, nếu không có con người vận hành và quản lý, tất cả vật dụng hiện đại đến đâu cũng
khó có thể hoạt động và đem lại hiệu quả tốt nhất. Đối với Big Data cũng vậy.
Việc thuê chuyên gia công nghệ để vận hành Big Data mất nhiều thời gian và chi phí đầu tự
cao. Xử lý toàn bộ Big Data trước đó của doanh nghiệp là vấn đề không hề dễ đối với bất kỳ
chuyên gia nào. Đặc biệt, chính sự thiếu hụt nhân lực chuyên môn đã tạo ra thách thức trong việc ứng dụng Big Data.
3.2. Giải pháp khi ứng dụng Big Data trong lĩnh vực ngân hàng
Theo nghiên cứu, 71% tổ chức tài chính ngân hàng sử dụng phân tích thông tin và dữ liệu tài
chính có lợi thế cạnh tranh so với đối thủ. Các ngân hàng ngày càng nhận thức được tầm quan
trọng của việc hợp tác với những người chơi có uy tín trên thị trường để nhúng Big Data cho các
công cụ ngân hàng vào các lĩnh vực kinh doanh của họ, nơi tác động sẽ được cảm nhận rõ rệt
nhất, vì thị trường toàn cầu về phân tích Big Data trong ngân hàng dự kiến sẽ tăng trưởng với
tốc độ tỷ lệ trên 22% mỗi năm cho đến năm 2026 .
Trở thành định hướng dữ liệu là một sự thay đổi mang tính đột phá và hiếm khi các tổ chức
tiếp cận nó với sự chuẩn bị đầy đủ. Theo quy định, phải mất rất nhiều công việc sơ bộ để phát
triển một chiến lược triển khai dữ liệu lớn rõ ràng. Dưới đây là danh sách những cân nhắc
quan trọng để giúp bạn triển khai sáng kiến dữ liệu lớn tiếp theo của mình.
1. Bạn sẽ sử dụng loại dữ liệu nào để thúc đẩy tổ chức của mình hướng tới những thay đổi mong muốn?
2. Dữ liệu nào không liên quan đến mục tiêu của bạn và có thể bị loại bỏ?
3. Dữ liệu không hoạt động hoặc di chuyển qua mạng và được sử dụng liên tục?
4. Chính xác thì dữ liệu này sẽ giúp bạn đạt được mục tiêu như thế nào? 25
Xác định khoảng trống dữ liệu
Khi bạn bắt đầu với dự án ban đầu của mình, hãy xác định dữ liệu chính bạn cần để bắt đầu
và chạy dự án. Những số liệu nào bạn sẽ cần để có được một bức tranh rõ ràng? Bạn sẽ thu
thập chúng như thế nào? Biết dữ liệu nào bạn sẽ thu thập sẽ giúp bạn thực hiện các điều chỉnh
quan trọng cho quy trình của mình.
Tinh chỉnh dữ liệu hiện có của bạn
Chất lượng dữ liệu là một trong những rào cản được báo cáo thường xuyên trên con đường
triển khai các giải pháp mới cho phân tích dữ liệu lớn. Trong lịch sử, dữ liệu kế thừa thường
nằm trong các cơ sở dữ liệu khác nhau hoặc tồn tại ở các định dạng không tương thích với
phần mềm dữ liệu hiện đại. Việc tổng hợp dữ liệu của bạn vào một nhóm dữ liệu duy nhất là
một dự án dài có thể mất vài tháng nhưng đó là điều cần thiết phải làm nếu bạn muốn hưởng
lợi từ trải nghiệm độc đáo của tổ chức mình.
Chọn phần mềm phân tích dữ liệu
Sau khi bạn đã quyết định nhu cầu dữ liệu của mình, bây giờ bạn có thể bắt đầu chọn phần
mềm phân tích dữ liệu của mình. Một trong những điều quan trọng cần tìm trong giải pháp
bạn lựa chọn là khảnăng mở rộng – nó sẽ mở rộng đến mức nào nếu bạn chọn mở rộng các dự
án dữ liệu của mình sang các khía cạnh khác trong tổ chức của mình? Một điều khác cần tính
đến là khả năng trực quan hóa dữ liệu: phần mềm được đề cập có cung cấp thông tin chi tiết ở
định dạng rõ ràng và dễ hiểu không?
Tuy nhiên, trong nhiều trường hợp, công ty của bạn sẽ yêu cầu một giải pháp được thiết kế
riêng để phù hợp hoàn toàn với hệ sinh thái của mình và bạn sẽ cần tìm một nhà cung cấp
đáng tin cậy để xây dựng nền tảng phân tích dữ liệu tùy chỉnh cho tổ chức của mình.
Kiểm tra để cải thiện. Sau khi bạn đã triển khai giai đoạn đầu của dự án phân tích dữ liệu, hãy
đánh giá các thay đổi và kết quả. Bạn có hài lòng với kết quả dự án của mình không? Hãy suy
nghĩ về những gì cần được cải thiện để tối đa hóa hiệu quả của các quy trình dựa trên dữ liệu 26
của bạn. Lý tưởng nhất là nhà cung cấp phân tích dữ liệu của bạn nên cung cấp hỗ trợ kỹ
thuật và trợ giúp trong việc điều chỉnh nền tảng dữ liệu theo nhu cầu thay đổi của bạn. KẾT LUẬN
Công nghệ dữ liệu lớn đã thâm nhập vào mọi ngành công nghiệp, giúp tăng doanh thu, hiệu
quả và đẩy nhanh quá trình chuyển đổi kỹ thuật số. Đến bây giờ, rõ ràng là những người
chậm triển khai dữ liệu lớn sẽ sớm thấy mình ở vị trí rất dễ bị tổn thương, không thể chịu
được sự cạnh tranh ngày càng tăng và theo kịp các tiêu chuẩn đang thay đổi.
Mặt khác, việc triển khai thành công các giải pháp dữ liệu lớn đòi hỏi một cách tiếp cận
mang tính chiến lược và được xác định rõ ràng. Bằng cách phác thảo chính xác các mục tiêu
kinh doanh trước mắt và lâu dài, đánh giá các nguồn lực của bạn và truyền đạt giá trị của dữ
liệu lớn cho nhân viên của mình, bạn sẽ đảm bảo rằng việc chuyển sang sử dụng dữ liệu lớn
diễn ra suôn sẻ và không bị gián đoạn. Quan hệ đối tác công nghệ thành công cũng là yếu tố
quan trọng để thúc đẩy giá trị kinh doanh từ dữ liệu lớn.
Các ngân hàng hiện ngày nay có quyền truy cập hàng triệu hoặc thậm chí hàng tỷ thông tin,
dữ liệu về nhu cầu và cảm nghĩ của khách hàng. Giờ đây họ có thể sử dụng các công cụ Big
Data để khai thác chúng nhằm mang lại hiệu quả kinh doanh tốt hơn – như đang tận dụng
nguồn lực thứ ba ngoài nhân lực và tài chính. Big Data sẽ mở rộng hoạt động của ngành ngân
hàng theo cách mà sẽ cho phép họ vừa gia tăng lợi nhuận và giảm các chi phí phát sinh. Bằng
cách cập nhật, ứng dụng không chỉ Big Data và các xu hướng mới nổi trên toàn cầu như trí
tuệ nhân tạo hay Machine Learning trong thời đại công nghệ 4.0, các ngân hàng và tổ chức
tài chính sẽ nắm bắt tốt hơn nhu cầu của khách hàng, hiểu rõ mục tiêu hoạt động trong nội
bộ tổ chức nhằm cung cấp các dịch vụ được cải tiến một cách kịp thời với chi phí hoạt động
tối ưu đến khách hàng hay đưa ra các giải pháp cải thiện năng suất làm việc của nhân viên. 27 TÀI LIỆU THAM KHẢO
1.https://www.dvms.com.vn/tin-tuc/big-data/75985-ung-dung-cua-big-data-trong-linh-vuc- ngan-hang-phan-2.html
2. https://luanvans.com/cac-ung-dung-cua-big-data-trong-linh-vuc-ngan-hang/
3.https://www.dvms.com.vn/tin-tuc/big-data/75986-ung-dung-cua-big-data-trong-linh-vuc- ngan-hang-phan-1.html
4. https://www.mpbpo.com.vn/big-data-trong-ngan-hang/
5.https://dembuon.vn/threads/ung-dung-cua-big-data-trong-linh-vuc-tai-chinh-ngan-hang-va- giai-phap.112517/
6 http://iottuonglai.com/ung-dung-big-data-trong-ngan-hang.html
7.https://123docz.net/trich-doan/3657132-ung-dung-cua-big-data-trong-linh-vuc-ngan- hang.htm 8.Datacenters.vn
9.https://easternpeak.com/blog/7-big-data-solutions-examples-and-a-roadmap-for-their- implementation/
10.https://easternpeak.com/blog/big-data-in-banking-and-financial-services/#:~:text=The
%20benefits%20of%20big%20data,%2C%20subsequently%2C%20obtain%20business %20results.
11.https://viblo.asia/p/big-data-trong-ung-dung-va-cuoc-song-3OEqGjWwv9bL
12.https://www.pace.edu.vn/tin-kho-tri-thuc/big-data-la-gi?fbclid=IwAR006eshp1O-
NyF0LN21RzyQXTEFm-bjTlea8UiHwKC8E1CZwf4xgn4_S7Q#co-so-ha-tang-big-data 28