B XÂY DNG
HC VIN HÀNG KHÔNG VIT NAM
KHOA K THUT HÀNG KHÔNG
BÁO CÁO
Ging viên hướng dn: Trn Trung Hiếu/Võ Phi Sơn
Nhóm sinh viên thc hin: Nhóm 1
STT
H và Tên
Mã s sinh viên
Lp
1
Lương Văn Đnh
2433520068
24ĐHKT01
2
Phm Thanh Hiếu
2433520221
24ĐHKT01
3
Trần Quang Khôi
2433520084
24ĐHKT02
Hc phn: Trí Tu Nhân To AI
Mã lp hc phn: 011100117301
TÊN Đ TÀI: Ti Ưu Hoá Kế Hoch Chuyến Bay Khi B
Gián Đon Bng AI ( Airline planning after flight disruption )
1
STT
H và tên
Mc đ hoàn thành
Ch ký
1
Lương Văn Đnh
100%
2
Phm Thanh Hiếu
100%
3
Trần Quang Khôi
100%
BNG PHÂN CÔNG NHIM V TRONG NHÓM
Bng 1.1
2
LI CM ƠN
Vi nhng kiến thc đã hc được t b môn Trí Tu Nhân To AI thuc khoa K
Thut Hàng Không, em đã la chn đ tài: Ti Ưu Hoá Kế Hoch Chuyến Bay Khi B
Gián Đon Bng AI ( Airline planning after flight disruption ) là đ tài thc hin bài
tiu lun. Trong quá trình hoàn thin bài, em đã nhn được rt nhiu s tr giúp,
hướng dn t thy Võ Phi Sơn. Nhng li góp ý ca thy đã giúp em rt nhiu trong
vic đính hướng và trin khai bài tiu lun.
Tuy đã c gng thc hin đ tài nhưng chc chn bài làm vn còn nhiu thiếu sót, em
rt mong tiếp tc nhn được nhng li góp ý ca quý thy, cô thuc b môn Trí Tu
Nhân To AI khoa K Thut Hàng Không đ bài tiu lun ngày càng hoàn thin hơn.
Em xin chân thành cm ơn!
3
L
i Cam Đoan
Nhóm cam đoan r
ng báo cáo này là do chính nhóm th
c hi
n, các s
li
u thu th
p và
k
ế
t qu
phân tích trong báo cáo là trung th
c, không sao chép t
b
t c
tài liêu, đ
tài
nghiên c
u khoa h
c nào.
Ngày 28 tháng 6 năm 2025
NHÓM TR
Ư
NG
Đ
NH
L
ƯƠ
NG VĂN Đ
NH
4
NH
N XÉT C
A GI
NG VIÊN H
Ư
NG DÂ
N
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
Ngày.......tháng.......năm...........
Gi
ng Viên H
ư
ng D
n
(Ký và ghi rõ h
tên)
5
M
C L
C
O CÁO T
I
Ư
U HOÁ K
HO
CH CHUY
N BAY KHI B
GIÁN ĐO
N
B
NG AI (Airline planning after flight disruption)
L
I C
M
Ơ
N..................................................................................................................03
L
I CAM ĐOAN............................................................................................................04
NH
N XÉT C
A GI
NG VIÊN H
Ư
NG D
N..........................................................05
M
C L
C.......................................................................................................................06
DANH M
C KÝ HI
U VÀ CH
VI
T T
T.................................................................08
DANH M
C HÌNH
NH..............................................................................................09
DANH M
C B
NG.......................................................................................................10
CH
ƯƠ
NG I: GI
I THI
U Đ
TÀI ...............................................................................11
1.1. M
c tiêu đ
tài .........................................................................................................11
1.2. Các thách th
c và v
n đ
trong vi
c t
i
ư
u hóa k
ế
ho
ch chuy
ế
n bay khi b
gián đo
n.........................................................................................................................12
1.3. Các công ngh
AI đ
ư
c s
d
ng đ
gi
i quy
ế
t v
n đ
............................................13
CH
ƯƠ
NG II: THU TH
P VÀ TI
N X
LÝ D
LI
U ................................................15
2.1. Ngu
n G
c D
Li
u: Khám Phá Kho Tàng Thông Tin Hàng Không.....................15
2.2. Ti
n X
Lý D
Li
u: Bi
ế
n D
Li
u Thô Thành Vàng ...........................................17
2.3. L
a ch
n Thông Tin Quan Tr
ng: "Tách Vàng" T
"Qu
ng Thô" ..........................17
2.4. Chu
n Hóa Đ
c Tr
ư
ng: Đ
t M
i Th
Lên Cùng M
t "Th
ư
c Đo".......................18
2.5. Gán Nhãn D
Li
u: T
o "La Bàn" Cho Mô Hình H
c H
i ...................................18
2.6. Chia D
Li
u: Chu
n B
Cho Hu
n Luy
n và Đánh Giá........................................19
CH
ƯƠ
NG III: BI
U DI
N VÀ HU
N LUY
N MÔ HÌNH ........................................20
3.1. Lý Do Ch
n Mô Hình Và Vì Sao H
c Tăng C
ư
ng (Reinforcement Learning
-RL).................................................................................................................................20
3.2. Mô T
Chi Ti
ế
t Mô Hình: C
u Trúc và Ki
ế
n Trúc "Sân Ch
ơ
i" ...............................21
* C
u trúc các thành ph
n c
a Mô hình Mô ph
ng: ......................................................21
* Module Qu
n lý L
ch trình bay ....................................................................................21
* Module Qu
n lý Đ
i bay (Tàu bay) .............................................................................21
* Module Qu
n lý Phi hành đoàn ...................................................................................21
* Module Phát sinh Gián đo
n .......................................................................................21
* Module Tính toán Chi phí/Ph
n th
ư
ng .....................................................................22
* Mô t
lu
ng ho
t đ
ng................................................................................................22
3.3. L
a Ch
n và Đi
u Ch
nh Các Siêu Tham S
: Tinh Ch
nh "Kim Ch
Nam"
Cho H
Th
ng................................................................................................................23
* T
c đ
h
c (Learning Rate) ........................................................................................23
* S
l
ư
ng chu kỳ h
c (Episodes/Iterations) ..................................................................23
* Kích th
ư
c lô (Batch Size) ..........................................................................................23
* H
s
chi
ế
t kh
u (Discount Factor - Gamma) ...........................................................24
* Chi
ế
n l
ư
c khám phá (Exploration Strategy - Epsilon-greedy) ...................................24
6
3.4. K
Thu
t Hu
n Luy
n: Quy Trình “Đào T
o” Cho “B
Não” Thông Minh......... 24
* B
t
i
ư
u hóa (Optimizer) ...........................................................................................24
* H
i quy kinh nghi
m (Experience Replay) ..................................................................25
* C
p nh
t m
ng m
c tiêu (Target Network Updates)...................................................25
* S
l
ư
ng b
ư
c (Episode) ............................................................................................25
3.5. Chính Quy Hóa (Regularization).............................................................................25
* Dropout ......................................................................................................................26
* D
ng s
m (Early Stopping) .......................................................................................26
* Chính quy hóa L1/L2 .................................................................................................26
3.6. Các Th
ư
c Đo Khi Hu
n Luy
n............................................................................26
* T
ng ph
n th
ư
ng (Total Reward per Episode) .........................................................26
* Th
i gian x
lý gián đo
n trung bình (Average Disruption Resolution Time)............27
* Chi phí phát sinh trung bình (Average Disruption Cost).............................................27
* T
l
tuân th
quy đ
nh (Compliance Rate)................................................................27
* T
l
hành khách đ
ế
n đích đúng gi
/đúng k
ế
t n
i (On-time/Connection Success
Rate for Disrupted Passengers)......................................................................................27
* T
l
s
d
ng tài nguyên (Resource Utilization Rate - Phi hành đoàn, Tàu
bay)................................................................................................................................27
3.7. Code Minh Ho
(Snippet Python kèm mô t
) ........................................................27
* Hình 3.1 .....................................................................................................................28
* Hình 3.2 .....................................................................................................................29
* Hình 3.3 .....................................................................................................................30
CH
ƯƠ
NG IV: T
I
Ư
U HÓA MÔ HÌNH ...................................................................32
4.1. T
i
ư
u Hyperparameters: Phân tích Đ
nh
y Tham s
Đ
u vào ..........................32
1. B
i c
nh và M
c tiêu Mô hình T
i
ư
u hóa .............................................................32
2. Các bi
ế
n quy
ế
t đ
nh, m
c tiêu và ràng bu
c ...........................................................32
3. Gi
đ
nh và H
n ch
ế
...............................................................................................33
4. T
i
ư
u hóa Mô hình và Phân tích K
ế
t qu
.............................................................33
4.2. So sánh các Phiên b
n Mô hình và K
ế
t qu
...........................................................34
* Hình 4.1 .....................................................................................................................35
* Hình 4.2 .....................................................................................................................36
* Hình 4.3 .....................................................................................................................36
CH
ƯƠ
NG V: ĐÁNH GIÁ MÔ HÌNH ........................................................................37
5.1. Các Metric Đ
ư
c S
D
ng ...................................................................................37
* T
n th
t ($) ...............................................................................................................37
* S
chuy
ế
n bay t
i
ư
u đ
ư
c ph
c v
..........................................................................37
* S
hành khách t
i
ư
u đ
ư
c v
n chuy
n ...................................................................37
* S
y bay đ
ư
c s
d
ng .........................................................................................37
7
5.2. Gi
i thích Lý do Ch
n Metric Này ........................................................................37
5.3. So Sánh Mô hình Chính v
i Baseline ho
c Các Mô hình Khác..............................37
* So sánh v
i K
ch b
n "Không T
i
ư
u hóa" (Heuristic ho
c Baseline Logic)..............38
* So sánh gi
a các M
c đ
Gián đo
n..........................................................................38
5.4. Trình Bày K
ế
t Qu
B
ng B
ng, Bi
u Đ
Rõ Ràng ................................................38
* B
ng Tóm t
t K
ế
t qu
V
n hành ...............................................................................38
* Bi
u đ
M
ng l
ư
i Ho
t đ
ng Toàn b
.....................................................................39
* Bi
u đ
L
ch trình Máy bay (Directed Acyclic Graph - DAG)....................................39
CH
ƯƠ
NG VI: TRI
N KHAI VÀ
NG D
NG ..........................................................39
6.1. Tích h
p Inference vào Đâu?..................................................................................39
*
ng d
ng Desktop (Tkinter, PyQt) /
ng d
ng di đ
ng (Kivy, React Native)............40
* H
th
ng Nhúng / Ph
n c
ng (Raspberry Pi, Jetson, UAV th
c t
ế
)..........................40
6.2. Demo Ho
t đ
ng v
i Test Case..............................................................................40
* Tình Hu
ng Th
Nghi
m .........................................................................................40
* Quy trình Demo ........................................................................................................41
6.3. K
ế
t qu
đ
u ra .....................................................................................................41
* Thông tin Đ
nh l
ư
ng ...............................................................................................41
* Tr
c quan hóa M
ng l
ư
i ........................................................................................41
6.4. K
ế
t lu
n và H
ư
ng Phát Tri
n .............................................................................42
* K
ế
t lu
n ....................................................................................................................42
* H
n ch
ế
Hi
n t
i ......................................................................................................42
* H
ư
ng Phát Tri
n T
ươ
ng lai.....................................................................................42
CH
ƯƠ
NG VII: TÀI LI
U VÀ TRÍCH D
N, VIDEO DEMO ...................................43
7.1. Ngu
n tài li
u, công c
, dataset s
d
ng ..............................................................43
7.1.1. Ngu
n Tài li
u Tham kh
o ................................................................................43
7.1.2. Công c
s
d
ng ................................................................................................43
* Gurobi Optimizer........................................................................................................43
* Jupyter Notebook .....................................................................................................43
7.1.3. Dataset s
d
ng .................................................................................................43
7.2. Th
ư
vi
n Python s
d
ng .....................................................................................43
* Pandas.......................................................................................................................43
* NetworkX .................................................................................................................43
* Pygraphviz (ho
c networkx.drawing.nx_agraph).......................................................44
* Matplotlib..................................................................................................................44
* Ipywidgets.................................................................................................................44
7.3. Video Demo ho
t đ
ng c
a mô hình....................................................................44
K
T LU
N CHUNG..................................................................................................45
8
NCE
Sân bay Nice Côte d'Azur (Nice, Pháp)
CDG
Sân bay Paris-Charles de Gaulle (Paris, Pháp)
LYS
Sân bay Lyon-Saint Exupéry (Lyon, Pháp)
ORY
Sân bay Paris-Orly (Paris, Pháp)
Đường đi ca các chuyến bay
DANH MC KÝ HIU VÀ CH VIT TT
9
DANH M
C HÌNH
NH
CH
ƯƠ
NG I: GI
I THI
U Đ
TÀI
Hình 1.1 D
li
u gi
đ
nh các chuy
ế
n bay
Hình 1.2 Thông tin v
các máy bay, sân bay, chuy
ế
n bay
Hình 1.3 M
ng l
ư
i chuy
ế
n bay mô ph
ng
CH
ƯƠ
NG III: BI
U DI
N VÀ HU
N LUY
N MÔ HÌNH
Hình 3.1 Code mô hình th
nghi
m
Hình 3.2 M
ng l
ư
i chuy
ế
n bay c
a A320 khi áp d
ng mô hình
Hình 3.3 M
ng l
ư
i chuy
ế
n bay c
a A321 khi áp d
ng mô hình
CH
ƯƠ
NG IV: T
I
Ư
U HÓA MÔ HÌNH
Hình 4.1 Code mô hình t
i
ư
u hóa
Hình 4.2 K
ế
t qu
mô hình th
nghi
m sau khi đã t
i
ư
u
Hình 4.3 K
ế
t qu
mô hình th
nghi
m sau khi đã t
i
ư
u
CH
ƯƠ
NG 7: TÀI LI
U VÀ TRÍCH D
N, VIDEO DEMO
Hình 7.1 Mã qr code video thuy
ế
t trình
10
DANH M
C B
NG
B
ng 1.1 B
ng phân công nhi
m v
trong nhóm
11
CH
ƯƠ
NG I: Gi
i Thi
u Đ
Tài
1.1. M
c tiêu đ
tài
V
n đ
th
c t
ế
mà đ
tài gi
i quy
ế
t là s
gián đo
n trong ho
t đ
ng hàng không,
th
ư
ng xuyên x
y ra do nhi
u y
ế
u t
b
t kh
kháng nh
ư
th
i ti
ế
t x
u, s
c
k
thu
t, đình công, t
c ngh
n sân bay, ho
c các y
ế
u t
b
t ng
khác. Khi x
y ra gián
đo
n, các hãng hàng không ph
i đ
i m
t v
i m
t lo
t thách th
c ph
c t
p, bao g
m:
Thay đ
i l
ch trình bay: Các chuy
ế
n bay có th
b
hoãn, h
y, ho
c chuy
n h
ư
ng,
y
nh h
ư
ng đ
ế
n l
ch trình c
a các chuy
ế
n bay ti
ế
p theo và các k
ế
t n
i.
Qu
n lý phi hành đoàn: Vi
c s
p x
ế
p l
i l
ch làm vi
c c
a phi hành đoàn tr
nên
c
c kỳ ph
c t
p đ
đ
m b
o tuân th
các quy đ
nh v
th
i gian bay và ngh
ng
ơ
i,
đ
ng th
i t
i thi
u hóa chi phí phát sinh.
Đi
u ph
i tàu bay: Tàu bay b
m
c k
t t
i các sân bay không mong mu
n ho
c
không th
c
t cánh đúng gi
, d
n đ
ế
n thi
ế
u h
t tàu bay cho các ch
ng bay ti
ế
p
theo.
Hành khách b
nh h
ư
ng: Hàng ngàn hành khách có th
b
tr
chuy
ế
n, l
các
chuy
ế
n bay n
i chuy
ế
n, ho
c b
m
c k
t, d
n đ
ế
n s
không hài lòng và yêu c
u
b
i th
ư
ng.
Chi phí phát sinh: Gián đo
n gây ra các chi phí đáng k
cho hãng hàng không, bao
g
m chi phí b
i th
ư
ng cho hành khách, chi phí l
ư
u trú, chi phí nhiên li
u do bay
vòng, và t
n th
t doanh thu.
M
c tiêu c
a đ
tài là xây d
ng m
t gi
i pháp d
a trên AI đ
t
i
ư
u hóa k
ế
ho
ch
chuy
ế
n bay sau gián đo
n, nh
m gi
m thi
u tác đ
ng tiêu c
c, t
i
ư
u hóa các ngu
n
l
c (phi hành đoàn, tàu bay), gi
m chi phí, và nâng cao s
hài lòng c
a hành khách.
1.2. Các thách th
c k
thu
t ho
c d
li
u g
p ph
i.
Vi
c t
i
ư
u hóa k
ế
ho
ch chuy
ế
n bay sau gián đo
n b
ng AI đ
i m
t v
i nhi
u thách
th
c k
thu
t và d
li
u đáng k
:
Tính ph
c t
p c
a bài toán t
i
ư
u:
Không gian tìm ki
ế
m l
n: S
l
ư
ng bi
ế
n và ràng bu
c trong bài toán t
i
ư
u hóa
k
ế
ho
ch chuy
ế
n bay là c
c kỳ l
n, bao g
m hàng trăm chuy
ế
n bay, hàng ngàn
phi công và ti
ế
p viên, và hàng trăm tàu bay.
Đa m
c tiêu: C
n t
i
ư
u hóa nhi
u m
c tiêu cùng lúc nh
ư
gi
m thi
u chi phí, t
i
thi
u hóa s
ch
m tr
c
a hành khách, t
i đa hóa s
d
ng tài nguyên, và tuân th
các quy đ
nh nghiêm ng
t.
Ràng bu
c ph
c t
p: Có vô s
ràng bu
c ph
c t
p c
n đ
ư
c tuân th
, bao g
m
gi
i h
n th
i gian làm vi
c c
a phi hành đoàn (FATIGUE, FTL - Flight Time
Limitations), quy đ
nh b
o d
ư
ng tàu bay, năng l
c sân bay, và quy đ
nh v
visa/gi
y phép c
a phi hành đoàn.
12
Tính đ
ng: Tình hu
ng gián đo
n có th
thay đ
i liên t
c, yêu c
u h
th
ng ph
i
có kh
năng c
p nh
t và tái t
i
ư
u hóa nhanh chóng trong th
i gian th
c.
a).Ch
t l
ư
ng và kh
i l
ư
ng d
li
u:
D
li
u đa d
ng và l
n: D
li
u c
n thi
ế
t bao g
m l
ch trình bay, thông tin v
phi
hành đoàn (k
năng, th
i gian làm vi
c, v
trí), thông tin v
tàu bay (lo
i, tr
ng
thái b
o d
ư
ng, v
trí), d
li
u th
i ti
ế
t, d
li
u v
năng l
c sân bay, và d
li
u
l
ch s
gián đo
n.
Thi
ế
u d
li
u th
c t
ế
v
gián đo
n: D
li
u chi ti
ế
t v
các k
ch b
n gián đo
n và
cách các hãng hàng không x
lý chúng có th
không đ
y đ
ho
c khó ti
ế
p c
n.
D
li
u không đ
ng nh
t và nhi
u: D
li
u có th
đ
ế
n t
nhi
u ngu
n khác
nhau, không đ
ng nh
t v
đ
nh d
ng và ch
t l
ư
ng, ch
a l
i ho
c nhi
u.
V
n đ
v
quy
n riêng t
ư
và b
o m
t: D
li
u v
phi hành đoàn và ho
t đ
ng
c
a hãng hàng không có th
nh
y c
m, đ
t ra thách th
c v
quy
n riêng t
ư
và
b
o m
t khi x
lý.
b).L
a ch
n và phát tri
n mô hình AI:
Khó khăn trong vi
c l
a ch
n thu
t toán phù h
p: V
i tính ph
c t
p c
a bài
toán, vi
c l
a ch
n thu
t toán AI phù h
p (ví d
: t
i
ư
u hóa t
h
p, h
c tăng
c
ư
ng, h
c sâu) là m
t thách th
c.
Tính gi
i thích đ
ư
c (Explainability): Các mô hình AI ph
c t
p có th
khó gi
i
thích, gây khó khăn cho các nhà qu
n lý trong vi
c hi
u và tin t
ư
ng vào các
quy
ế
t đ
nh do AI đ
xu
t.
Tích h
p v
i h
th
ng hi
n có: Vi
c tích h
p gi
i pháp AI vào h
th
ng đi
u
hành bay hi
n có c
a các hãng hàng không có th
ph
c t
p và t
n kém.
c).Hi
u su
t và th
i gian th
c:
Yêu c
u x
lý nhanh: Khi có gián đo
n, c
n có gi
i pháp nhanh chóng đ
đ
ư
a ra
quy
ế
t đ
nh, do đó mô hình AI ph
i có kh
năng x
lý và đ
ư
a ra k
ế
t qu
trong th
i
gian ng
n nh
t có th
.
Kh
năng m
r
ng: H
th
ng ph
i có kh
năng m
r
ng đ
x
lý l
ư
ng d
li
u
và tình hu
ng ngày càng tăng.
1.3. Các gi
i pháp đ
ư
c đ
xu
t: Áp d
ng AI nh
ư
th
ế
nào đ
gi
i quy
ế
t?
Đ
gi
i quy
ế
t các thách th
c trên và t
i
ư
u hóa k
ế
ho
ch chuy
ế
n bay khi b
gián
đo
n, đ
tài đ
xu
t áp d
ng AI thông qua các ph
ươ
ng pháp sau:
1. Mô hình d
đoán gián đo
n (Predictive Disruption Modeling):
Machine Learning (ML): S
d
ng các thu
t toán h
c máy (nh
ư
Random Forest,
Gradient Boosting, ho
c m
ng n
ơ
-ron h
i quy) đ
phân tích d
li
u l
ch s
(th
i
ti
ế
t, s
c
k
thu
t, tình tr
ng sân bay, d
li
u v
n hành) nh
m d
đoán kh
năng x
y ra gián đo
n.
13
X
lý ngôn ng
t
nhiên (NLP): Phân tích các thông báo, báo cáo s
c
không
c
u trúc đ
s
m phát hi
n các d
u hi
u ti
m
n c
a gián đo
n.
M
c tiêu: Giúp hãng hàng không ch
đ
ng đ
ư
a ra các bi
n pháp phòng ng
a
ho
c chu
n b
tr
ư
c khi gián đo
n x
y ra, gi
m thi
u tác đ
ng ban đ
u.
2. T
i
ư
u hóa t
h
p và H
c tăng c
ư
ng (Combinatorial Optimization &
Reinforcement Learning):
Thu
t toán t
i
ư
u hóa t
h
p: S
d
ng các thu
t toán nh
ư
l
p trình tuy
ế
n tính
nguyên (Integer Linear Programming - ILP), l
p trình ràng bu
c (Constraint
Programming - CP), ho
c các thu
t toán heuristic/meta-heuristic (Genetic
Algorithms, Simulated Annealing) đ
tìm ra gi
i pháp t
i
ư
u cho vi
c phân b
l
i
tài nguyên (phi hành đoàn, tàu bay) và đi
u ch
nh l
ch trình bay.
H
c tăng c
ư
ng (Reinforcement Learning - RL): Hu
n luy
n các tác t
AI đ
h
c
cách đ
ư
a ra các quy
ế
t đ
nh t
i
ư
u trong môi tr
ư
ng đ
ng. RL có th
đ
ư
c s
d
ng đ
:
L
p l
ch l
i chuy
ế
n bay: H
c cách đi
u ch
nh l
ch trình chuy
ế
n bay m
t cách linh
ho
t, cân b
ng gi
a chi phí, s
ch
m tr
c
a hành khách và các ràng bu
c v
n
hành.
Phân công l
i phi hành đoàn: H
c cách phân công l
i phi hành đoàn m
t cách
hi
u qu
, xem xét các quy đ
nh v
th
i gian làm vi
c, k
năng và v
trí hi
n t
i.
T
i
ư
u hóa v
trí tàu bay: H
c cách đi
u chuy
n tàu bay đ
ế
n các sân bay khác
ho
c đi
u ch
nh l
ch b
o d
ư
ng đ
t
i
ư
u hóa vi
c s
d
ng tàu bay.
M
c tiêu: Tìm ra các gi
i pháp tái l
p k
ế
ho
ch t
i
ư
u nh
t, cân b
ng gi
a các
m
c tiêu khác nhau (chi phí, th
i gian, s
hài lòng c
a khách hàng) và tuân th
t
t c
các ràng bu
c ph
c t
p trong th
i gian th
c.
3. H
th
ng h
tr
ra quy
ế
t đ
nh thông minh (Intelligent Decision Support
System):
AI gi
i thích đ
ư
c (Explainable AI - XAI): Phát tri
n các mô hình AI có kh
năng
gi
i thích lý do đ
ng sau các quy
ế
t đ
nh đ
ư
c đ
ư
a ra, giúp các nhà đi
u hành hi
u
rõ và tin t
ư
ng vào các đ
xu
t c
a h
th
ng.
Giao di
n ng
ư
i dùng tr
c quan: Xây d
ng giao di
n cho phép ng
ư
i dùng t
ươ
ng
tác v
i h
th
ng AI, xem xét các k
ch b
n khác nhau, và đi
u ch
nh các tham s
đ
phù h
p v
i các
ư
u tiên c
th
.
M
c tiêu: H
tr
các nhà qu
n lý trong vi
c đ
ư
a ra quy
ế
t đ
nh nhanh chóng và
hi
u qu
h
ơ
n, đ
c bi
t trong các tình hu
ng ph
c t
p và áp l
c cao.
4. H
c sâu (Deep Learning) cho phân tích d
li
u phi c
u trúc:
M
ng n
ơ
-ron tích ch
p (CNN) ho
c m
ng n
ơ
-ron h
i quy (RNN): Phân tích d
li
u t
camera giám sát t
i sân bay, báo cáo gi
ng nói t
phi công/phi hành đoàn,
ho
c các thông tin t
m
ng xã h
i đ
nhanh chóng nh
n di
n tình hu
ng và m
c
đ
nh h
ư
ng c
a gián đo
n.
M
c tiêu: Cung c
p cái nhìn toàn di
n h
ơ
n v
tình hình th
c t
ế
, giúp h
th
ng t
i
ư
u hóa có đ
ư
c thông tin đ
y đ
và chính xác nh
t.
14
Trong b
i c
nh t
i
ư
u hóa k
ế
ho
ch chuy
ế
n bay sau gián đo
n, d
li
u chính là
huy
ế
t m
ch, là n
n t
ng đ
y d
ng nên m
t h
th
ng thông minh và linh ho
t. Vi
c
thu th
p, làm s
ch và chu
n b
d
li
u m
t cách k
l
ư
ng không ch
đ
m b
o tính
chính xác cho các phân tích và d
báo mà còn quy
ế
t đ
nh đáng k
đ
ế
n hi
u qu
c
a
toàn b
gi
i pháp đ
ra. Ch
ươ
ng này s
đi sâu vào hành trình c
a d
li
u, t
các
ngu
n g
c đa d
ng cho đ
ế
n khi đ
ư
c tinh ch
nh và s
n sàng cho các mô hình v
n
hành.
2.1. Ngu
n G
c D
Li
u: Khám Phá Kho Tàng Thông Tin Hàng Không
Đ
y d
ng m
t b
c tranh toàn di
n v
ho
t đ
ng bay và các y
ế
u t
y gián đo
n,
chúng ta c
n khai thác t
nhi
u ngu
n d
li
u khác nhau, m
i ngu
n mang m
t giá
tr
và vai trò riêng:
D
Li
u Công Khai (Public Datasets): M
c dù không đi sâu vào chi ti
ế
t v
n hành
n
i b
, các b
d
li
u công khai v
n cung c
p m
t cái nhìn t
ng quan và b
i c
nh
quan tr
ng. Chúng ta có th
tìm th
y thông tin v
l
ch s
các chuy
ế
n bay, d
li
u
v
hi
u su
t đúng gi
t
các c
ơ
quan qu
n lý hàng không, ho
c các b
d
li
u khí
t
ư
ng toàn c
u đ
phân tích xu h
ư
ng th
i ti
ế
t. Nh
ng thông tin này giúp xác
đ
nh các y
ế
u t
khách quan, ph
bi
ế
n có th
y ra gián đo
n nh
ư
bão, s
ươ
ng
mù, hay các khu v
c th
ư
ng xuyên t
c ngh
n.
D
Li
u N
i B
(Internal Data - T
Thu Th
p): Đây là "kho báu" th
c s
, n
ơ
i
ch
a đ
ng nh
ng thông tin chi ti
ế
t và đ
c quy
n v
ho
t đ
ng c
a hãng hàng
không. Vi
c ti
ế
p c
n và t
ch
c d
li
u này là chìa khóa đ
gi
i quy
ế
t bài toán t
i
ư
u hóa.
Các lo
i d
li
u bao g
m:
L
ch trình bay chi ti
ế
t: K
ế
ho
ch bay ban đ
u, các đi
u ch
nh theo th
i gian th
c,
thông tin v
các chuy
ế
n bay n
i chuy
ế
n.
Thông tin v
phi hành đoàn: L
ch làm vi
c, th
i gian bay đã th
c hi
n, th
i gian
ngh
ng
ơ
i b
t bu
c theo quy đ
nh an toàn bay nghiêm ng
t, v
trí hi
n t
i, và kh
năng đi
u khi
n các lo
i máy bay khác nhau. Đây là y
ế
u t
c
c kỳ nh
y c
m và
ph
c t
p khi x
y ra gián đo
n.
Thông tin v
đ
i bay (tàu bay): Lo
i máy bay, tình tr
ng b
o d
ư
ng (đã hoàn
thành hay đang ch
), l
ch s
h
ng hóc, và v
trí hi
n t
i c
a t
ng chi
ế
c.
D
li
u hành khách: S
l
ư
ng hành khách trên m
i chuy
ế
n bay, thông tin v
các
chuy
ế
n bay n
i chuy
ế
n c
a h
– m
t y
ế
u t
quan tr
ng đ
đánh giá tác đ
ng và
ư
u tiên hành khách.
L
ch s
s
c
và gián đo
n: Chi ti
ế
t v
các s
ki
n đã x
y ra, nguyên nhân g
c r
,
th
i gian kéo dài, và cách th
c hãng hàng không đã x
lý. Đây là d
li
u vô cùng
quý giá đ
h
c h
i t
quá kh
.
Ch
ươ
ng II: Thu thâp và x
lý ngu
n d
li
u
15
Hình 1.1
Hình 1.2
Hình 1.3
16
D
li
u chi phí: Chi phí v
n hành, chi phí b
i th
ư
ng cho hành khách, chi phí l
ư
u
trú cho phi hành đoàn và hành khách, và các chi phí phát sinh khác do gián đo
n.
D
Li
u Mô Ph
ng (Simulation): Trong tr
ư
ng h
p d
li
u th
c t
ế
v
các k
ch
b
n gián đo
n hi
ế
m g
p ho
c ph
c t
p không đ
, mô ph
ng tr
thành m
t công
c
không th
thi
ế
u. B
ng cách xây d
ng các môi tr
ư
ng gi
l
p ph
n ánh ho
t
đ
ng hàng không th
c t
ế
, chúng ta có th
t
o ra vô s
k
ch b
n gián đo
n khác
nhau. Đi
u này cho phép h
th
ng "h
c" cách ph
n
ng và đ
ư
a ra quy
ế
t đ
nh t
i
ư
u trong các tình hu
ng mà ch
ư
a t
ng x
y ra trên th
c t
ế
, ho
c x
y ra quá ít đ
có đ
d
li
u.
2.2. Ti
n X
Lý D
Li
u: Bi
ế
n D
Li
u Thô Thành Vàng
D
li
u thô hi
ế
m khi hoàn h
o. Chúng th
ư
ng ch
a đ
ng nh
ng "t
p ch
t" nh
ư
thông tin d
ư
th
a, thi
ế
u sót, ho
c không nh
t quán. Quá trình ti
n x
lý chính là
công đo
n "tinh luy
n" đ
d
li
u tr
nên s
ch s
, đáng tin c
y và s
n sàng cho các
phân tích sâu h
ơ
n.
Làm S
ch D
Li
u: Đây là b
ư
c c
ơ
b
n nh
t. Chúng ta c
n xác đ
nh và lo
i b
các b
n ghi trùng l
p, đ
m b
o m
i thông tin là duy nh
t. Các đ
nh d
ng d
li
u
(ví d
: ngày/gi
, mã sân bay, mã máy bay) c
n đ
ư
c chu
n hóa đ
d
dàng so
sánh và x
lý. Ngoài ra, vi
c phát hi
n và x
lý các "ngo
i l
" – nh
ng giá tr
quá
l
n ho
c quá nh
, có th
là l
i nh
p li
u ho
c m
t s
ki
n b
t th
ư
ng – cũng r
t
quan tr
ng đ
tránh làm sai l
ch k
ế
t qu
.
Lo
i B
Nhi
u và X
Lý Giá Tr
Thi
ế
u: D
li
u có th
ch
a "nhi
u" – nh
ng
thông tin không liên quan ho
c b
sai l
ch, c
n đ
ư
c làm m
n ho
c l
c b
. Đ
c
bi
t, "giá tr
thi
ế
u" là m
t v
n đ
ph
bi
ế
n. Chúng ta c
n phân tích nguyên nhân
c
a s
thi
ế
u h
t này và quy
ế
t đ
nh cách x
lý phù h
p. Có th
là lo
i b
các b
n
ghi b
thi
ế
u n
ế
u s
l
ư
ng ít, ho
c "đi
n khuy
ế
t" b
ng cách s
d
ng giá tr
trung
bình, trung v
, hay th
m chí là d
a trên các thông tin lân c
n ho
c các mô hình d
đoán đ
ư
c l
ư
ng giá tr
còn thi
ế
u m
t cách h
p lý nh
t.
X
Lý D
Li
u Phi C
u Trúc: Nhi
u thông tin quan tr
ng nh
ư
báo cáo s
c
, ghi
chú c
a phi công, ho
c ph
n h
i t
hành khách th
ư
ng
d
ng văn b
n t
do.
Chúng c
n đ
ư
c x
lý đ
trích xu
t nh
ng thông tin có giá tr
, ví d
nh
ư
nh
n
di
n các t
khóa ch
nguyên nhân gián đo
n, m
c đ
nghiêm tr
ng, hay các bên
liên quan.
2.3. L
a Ch
n Đ
c Tr
ư
ng: Xác Đ
nh Y
ế
u T
then Ch
t
Không ph
i t
t c
thông tin đ
u có giá tr
nh
ư
nhau. B
ư
c l
a ch
n đ
c tr
ư
ng là quá
trình "ch
t l
c" đ
gi
l
i nh
ng y
ế
u t
th
c s
có s
c
nh h
ư
ng đ
ế
n bài toán t
i
ư
u hóa, giúp mô hình ho
t đ
ng hi
u qu
h
ơ
n và d
hi
u h
ơ
n.
17
Ki
ế
n Th
c Chuyên Sâu Ngành (Domain Knowledge): Đây là y
ế
u t
quan tr
ng
nh
t. Nh
ng chuyên gia trong ngành hàng không, v
i kinh nghi
m dày d
n, có
th
ch
ra ngay nh
ng thông tin nào là c
t lõi đ
đ
ư
a ra quy
ế
t đ
nh sau gián đo
n.
Ví d
, h
s
bi
ế
t r
ng lo
i máy bay, s
l
ư
ng phi công có ch
ng ch
cho lo
i máy
bay đó, th
i gian ngh
b
t bu
c c
a phi hành đoàn, và năng l
c c
a sân bay đích là
nh
ng y
ế
u t
không th
b
qua.
Phân Tích Th
ng Kê: Các ph
ươ
ng pháp th
ng kê giúp đ
nh l
ư
ng m
i quan h
gi
a các thông tin và k
ế
t qu
mong mu
n. Chúng ta có th
dùng các phép đo
t
ươ
ng quan đ
xác đ
nh nh
ng thông tin nào có m
i liên h
ch
t ch
v
i tình
tr
ng gián đo
n ho
c hi
u qu
c
a các gi
i pháp.
Ph
ươ
ng Pháp Tính Toán: Ngoài ra, có nh
ng ph
ươ
ng pháp tính toán t
đ
ng
giúp đánh giá m
c đ
quan tr
ng c
a t
ng thông tin và ch
n ra t
p h
p t
i
ư
u.
Nh
ng ph
ươ
ng pháp này có th
giúp khám phá ra nh
ng m
i liên h
ti
m
n mà
con ng
ư
i có th
b
qua.
2.4. Chu
n Hóa Đ
c Tr
ư
ng: Đ
t M
i Th
Lên Cùng M
t "Th
ư
c Đo"
Khi các đ
c tr
ư
ng có ph
m vi giá tr
khác nhau (ví d
: s
l
ư
ng hành khách có th
hàng trăm, trong khi nhi
t đ
sân bay ch
vài ch
c đ
), các mô hình có th
b
"thiên v
"
b
i nh
ng đ
c tr
ư
ng có giá tr
l
n h
ơ
n. Chu
n hóa đ
c tr
ư
ng giúp đ
ư
a t
t c
v
cùng
m
t "th
ư
c đo", đ
m b
o chúng có t
m
nh h
ư
ng t
ươ
ng đ
ươ
ng trong quá trình
phân tích.
Chuy
n Đ
i V
Kho
ng [0, 1] (Min-Max Scaling): Ph
ươ
ng pháp này đ
ơ
n gi
n là
đ
ư
a t
t c
các giá tr
v
m
t kho
ng t
0 đ
ế
n 1. Đi
u này giúp các mô hình ho
t
đ
ng
n đ
nh h
ơ
n, đ
c bi
t là các mô hình nh
y c
m v
i thang đo c
a d
li
u.
Chu
n Hóa Theo Phân Ph
i Chu
n (Z-score Standardization): Ph
ươ
ng pháp này
đi
u ch
nh d
li
u sao cho chúng có giá tr
trung bình b
ng 0 và đ
l
ch chu
n
b
ng 1. Đây là l
a ch
n t
t khi d
li
u có xu h
ư
ng phân ph
i theo hình chuông,
giúp các mô hình d
a trên kho
ng cách ho
t đ
ng hi
u qu
h
ơ
n. Vi
c l
a ch
n
ph
ươ
ng pháp chu
n hóa phù h
p ph
thu
c vào tính ch
t c
a t
ng lo
i d
li
u
và yêu c
u c
th
c
a mô hình đ
ư
c s
d
ng.
2.5. Gán Nhãn: Đ
t Tên Cho Các Tình Hu
ng
Đ
các h
th
ng thông minh có th
h
c h
i t
d
li
u, chúng c
n bi
ế
t "đáp án đúng"
cho m
i tình hu
ng. Đây là quá trình gán nhãn, hay "đ
t tên" cho các lo
i gián đo
n
ho
c các gi
i pháp x
lý.
D
a trên Lu
t (Rule-based Labeling): Trong ngành hàng không, có r
t nhi
u quy
đ
nh và quy trình rõ ràng. Chúng ta có th
y d
ng các "lu
t" đ
t
đ
ng gán
nhãn. Ví d
, n
ế
u m
t chuy
ế
n bay b
hoãn h
ơ
n 3 gi
do s
ươ
ng mù dày đ
c, chúng
ta có th
gán nhãn là "Gián đo
n do th
i ti
ế
t – Hoãn chuy
ế
n". Cách này hi
u qu
và nh
t quán cho các tình hu
ng đã đ
ư
c đ
nh nghĩa rõ ràng.
18
Th
Công (Manual Labeling): Đ
i v
i nh
ng tình hu
ng ph
c t
p, không rõ ràng
ho
c mang tính ch
t đ
c bi
t, s
can thi
p c
a chuyên gia là c
n thi
ế
t. Các
chuyên gia s
xem xét và gán nhãn th
công, đ
m b
o đ
chính xác tuy
t đ
i cho
các tr
ư
ng h
p này. Dù t
n th
i gian, đây là cách t
o ra "d
li
u vàng" cho các
mô hình h
c h
i.
H
c Bán Giám Sát (Semi-supervised Learning): Khi có m
t l
ư
ng l
n d
li
u
ch
ư
a đ
ư
c gán nhãn nh
ư
ng ch
m
t ph
n nh
đã có nhãn, ph
ươ
ng pháp này phát
huy tác d
ng. H
th
ng có th
h
c t
d
li
u đã có nhãn, sau đó t
tin "d
đoán"
và gán nhãn cho ph
n d
li
u còn l
i, gi
m đáng k
công s
c th
công.
H
c Tăng C
ư
ng (Reinforcement Learning - Đ
nh nghĩa ph
n th
ư
ng): Đ
c bi
t
trong bài toán t
i
ư
u hóa, "gán nhãn" không ch
là phân lo
i. H
th
ng h
c cách
đ
ư
a ra các quy
ế
t đ
nh t
t thông qua vi
c nh
n đ
ư
c "ph
n th
ư
ng" ho
c "hình
ph
t" t
môi tr
ư
ng. Ph
n th
ư
ng đ
ư
c đ
nh nghĩa d
a trên các m
c tiêu kinh
doanh: ví d
, m
t k
ế
ho
ch gi
m thi
u chi phí b
i th
ư
ng hành khách s
nh
n
đ
ư
c "ph
n th
ư
ng" cao.
2.6. Chia D
Li
u: Đánh Giá Công B
ng
Đ
đ
m b
o r
ng mô hình đ
ư
c xây d
ng không ch
ho
t đ
ng t
t v
i d
li
u đã
th
y mà còn có th
khái quát hóa t
t trên d
li
u m
i, chúng ta c
n chia d
li
u m
t
cách chi
ế
n l
ư
c.
T
L
Hu
n Luy
n/Ki
m Đ
nh/ (Train/Test/:
T
p hu
n luy
n (Training Set): Ph
n l
n d
li
u đ
ư
c dành đ
"d
y" mô hình
cách nh
n di
n các quy lu
t và m
i quan h
.
T
p ki
m đ
nh (Validation Set): M
t ph
n nh
h
ơ
n đ
ư
c s
d
ng trong quá trình
y d
ng mô hình đ
tinh ch
nh các thông s
và tránh tình tr
ng mô hình "h
c
thu
c lòng" d
li
u hu
n luy
n mà không hi
u b
n ch
t (overfitting).
Ki
m Đ
nh Chéo (Cross-Validation): Đ
c bi
t h
u ích khi l
ư
ng d
li
u không quá
l
n, ho
c khi mu
n đ
m b
o k
ế
t qu
đánh giá mô hình là th
t s
đáng tin c
y.
Ph
ươ
ng pháp này chia d
li
u thành nhi
u ph
n, luân phiên s
d
ng t
ng ph
n làm
t
p ki
m đ
nh và các ph
n còn l
i đ
hu
n luy
n. B
ng cách l
p l
i quá trình này
nhi
u l
n, chúng ta s
có m
t cái nhìn toàn di
n và v
ng ch
c h
ơ
n v
kh
năng c
a
mô hình.
19
L
ư
u ý v
i D
Li
u Th
i Gian: Đ
i v
i d
li
u có y
ế
u t
th
i gian (nh
ư
l
ch s
gián đo
n), vi
c chia d
li
u ph
i tuân theo trình t
th
i gian. D
li
u t
quá
kh
đ
ư
c dùng đ
hu
n luy
n, và d
li
u t
t
ươ
ng lai (ch
ư
a x
y ra) đ
ư
c dùng
đ
ki
m tra, mô ph
ng đúng tình hu
ng th
c t
ế
khi h
th
ng c
n đ
ư
a ra d
đoán
ho
c quy
ế
t đ
nh trong t
ươ
ng lai.
Vi
c đ
u t
ư
vào quá trình thu th
p và x
lý d
li
u m
t cách c
n tr
ng s
t
o n
n
t
ng v
ng ch
c cho vi
c xây d
ng m
t gi
i pháp t
i
ư
u hóa k
ế
ho
ch chuy
ế
n bay
hi
u qu
, giúp các hãng hàng không v
ư
t qua nh
ng "c
ơ
n bão" gián đo
n m
t cách
linh ho
t và thông minh h
ơ
n.
CH
ƯƠ
NG III: BI
U DI
N VÀ HU
N LUY
N MÔ HÌNH
3.1. Lý Do Ch
n Mô Hình Và Vì Sao
H
c Tăng c
ư
ng (Reinforcement Learning - RL) là c
t lõi đ
gi
i quy
ế
t bài toán t
i
ư
u hóa đ
ng này. Tuy nhiên, đ
RL ho
t đ
ng hi
u qu
, chúng ta c
n m
t Mô hình
Mô ph
ng (Simulation Model) đóng vai trò là "sân ch
ơ
i" n
ơ
i tác t
RL có th
th
c
hành và h
c h
i.
Mô hình Mô ph
ng Lý do phù h
p:
Th
c t
ế
kh
c nghi
t: Trong ngành hàng không, vi
c th
nghi
m các chi
ế
n l
ư
c x
lý gián đo
n tr
c ti
ế
p trên h
th
ng th
c t
ế
là không th
, do r
i ro v
an toàn, chi
phí kh
ng l
và tác đ
ng tiêu c
c đ
ế
n hàng ngàn hành khách.
H
c h
i không r
i ro: Mô hình mô ph
ng cung c
p m
t môi tr
ư
ng an toàn, không
r
i ro đ
tác t
RL "th
và sai" hàng tri
u l
n. Qua m
i l
n th
, tác t
s
nh
n
đ
ư
c ph
n h
i (ph
n th
ư
ng/hình ph
t) và đi
u ch
nh hành vi c
a mình.
T
o ra đa d
ng k
ch b
n: Chúng ta có th
d
dàng t
o ra vô s
k
ch b
n gián đo
n
khác nhau (th
i ti
ế
t, k
thu
t, nhân s
, quy mô l
n/nh
) trong mô ph
ng, bao g
m
c
nh
ng k
ch b
n hi
ế
m g
p trong th
c t
ế
, giúp tác t
h
c cách đ
i phó v
i m
i
tình hu
ng.
Đánh giá hi
u qu
: Mô hình mô ph
ng cũng là công c
lý t
ư
ng đ
đánh giá hi
u
su
t c
a các chi
ế
n l
ư
c t
i
ư
u hóa tr
ư
c khi tri
n khai vào th
c t
ế
, giúp so sánh
các ph
ươ
ng án và ch
n ra gi
i pháp t
t nh
t.
Môi tr
ư
ng ph
n h
i nhanh: Môi tr
ư
ng mô ph
ng có th
ph
n h
i các hành đ
ng
c
a tác t
trong th
i gian ng
n h
ơ
n nhi
u so v
i th
ế
gi
i th
c, giúp tăng t
c quá
trình h
c c
a tác t
.
Tóm l
i, trong bài toán này, mô hình mô ph
ng không ch
là m
t công c
h
tr
mà là
m
t thành ph
n không th
thi
ế
u đ
hu
n luy
n và đánh giá h
th
ng t
i
ư
u hóa d
a
trên H
c Tăng c
ư
ng. Nó là "phi công t
p s
" c
a h
th
ng, n
ơ
i m
i sai l
m đ
u có
th
ch
p nh
n đ
ư
c và tr
thành bài h
c quý giá.
20

Preview text:

BỘ XÂY DỰNG
HỌC VIỆN HÀNG KHÔNG VIỆT NAM
KHOA KỸ THUẬT HÀNG KHÔNG BÁO CÁO
Học phần: Trí Tuệ Nhân Tạo AI
Mã lớp học phần: 011100117301
TÊN ĐỀ TÀI: Tối Ưu Hoá Kế Hoạch Chuyến Bay Khi Bị
Gián Đoạn Bằng AI ( Airline planning after flight disruption )

Giảng viên hướng dẫn: Trần Trung Hiếu/Võ Phi Sơn
Nhóm sinh viên thực hiện: Nhóm 1 STT Họ và Tên Mã số sinh viên Lớp 1 Lương Văn Định 2433520068 24ĐHKT01 2 Phạm Thanh Hiếu 2433520221 24ĐHKT01 3 Trần Quang Khôi 2433520084 24ĐHKT02 1
BẢNG PHÂN CÔNG NHIỆM VỤ TRONG NHÓM STT Họ và tên Nhiệm vụ Mức độ hoàn thành Chữ ký Làm Tiểu Luận Tìm Nội Dung 1 Lương Văn Định 100% Thuyết Trình Làm Slide Tìm Nội Dung 2 Phạm Thanh Hiếu 100% Thuyết Trình Làm Slide Tìm Nội Dung 3 Trần Quang Khôi 100% Thuyết Trình Bảng 1.1 2 LỜI CẢM ƠN
Với những kiến thức đã học được từ bộ môn Trí Tuệ Nhân Tạo AI thuộc khoa Kỹ
Thuật Hàng Không, em đã lựa chọn đề tài: Tối Ưu Hoá Kế Hoạch Chuyến Bay Khi Bị
Gián Đoạn Bằng AI ( Airline planning after flight disruption ) là đề tài thực hiện bài
tiểu luận. Trong quá trình hoàn thiện bài, em đã nhận được rất nhiều sự trợ giúp,
hướng dẫn từ thầy Võ Phi Sơn. Những lời góp ý của thầy đã giúp em rất nhiều trong
việc đính hướng và triển khai bài tiểu luận.
Tuy đã cố gắng thực hiện đề tài nhưng chắc chắn bài làm vẫn còn nhiều thiếu sót, em
rất mong tiếp tục nhận được những lời góp ý của quý thầy, cô thuộc bộ môn Trí Tuệ
Nhân Tạo AI khoa Kỹ Thuật Hàng Không để bài tiểu luận ngày càng hoàn thiện hơn. Em xin chân thành cảm ơn! 3 Lời Cam Đoan
Nhóm cam đoan rằng báo cáo này là do chính nhóm thực hiện, các số liệu thu thập và
kết quả phân tích trong báo cáo là trung thực, không sao chép từ bất cứ tài liêu, đề tài nghiên cứu khoa học nào. Ngày 28 tháng 6 năm 2025 NHÓM TRƯỞNG ĐỊNH LƯƠNG VĂN ĐỊNH 4
NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DÂN
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
............................................................................................................................................
Ngày.......tháng.......năm...........
Giảng Viên Hướng Dẫn (Ký và ghi rõ họ tên) 5 MỤC LỤC
BÁO CÁO TỐI ƯU HOÁ KẾ HOẠCH CHUYẾN BAY KHI BỊ GIÁN ĐOẠN
BẰNG AI (Airline planning after flight disruption)
LỜI CẢM ƠN..................................................................................................................03
LỜI CAM ĐOAN............................................................................................................04
NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN..........................................................05
MỤC LỤC.......................................................................................................................06
DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT.................................................................08
DANH MỤC HÌNH ẢNH..............................................................................................09
DANH MỤC BẢNG.......................................................................................................10
CHƯƠNG I: GIỚI THIỆU ĐỀ TÀI ...............................................................................11
1.1. Mục tiêu đề tài .........................................................................................................11
1.2. Các thách thức và vấn đề trong việc tối ưu hóa kế hoạch chuyến bay khi bị
gián đoạn.........................................................................................................................12
1.3. Các công nghệ AI được sử dụng để giải quyết vấn đề............................................13
CHƯƠNG II: THU THẬP VÀ TIỀN XỬ LÝ DỮ LIỆU ................................................15
2.1. Nguồn Gốc Dữ Liệu: Khám Phá Kho Tàng Thông Tin Hàng Không.....................15
2.2. Tiền Xử Lý Dữ Liệu: Biến Dữ Liệu Thô Thành Vàng ...........................................17
2.3. Lựa chọn Thông Tin Quan Trọng: "Tách Vàng" Từ "Quặng Thô" ..........................17
2.4. Chuẩn Hóa Đặc Trưng: Đặt Mọi Thứ Lên Cùng Một "Thước Đo".......................18
2.5. Gán Nhãn Dữ Liệu: Tạo "La Bàn" Cho Mô Hình Học Hỏi ...................................18
2.6. Chia Dữ Liệu: Chuẩn Bị Cho Huấn Luyện và Đánh Giá........................................19
CHƯƠNG III: BIỂU DIỄN VÀ HUẤN LUYỆN MÔ HÌNH ........................................20
3.1. Lý Do Chọn Mô Hình Và Vì Sao Học Tăng Cường (Reinforcement Learning
-RL).................................................................................................................................20
3.2. Mô Tả Chi Tiết Mô Hình: Cấu Trúc và Kiến Trúc "Sân Chơi" ...............................21
* Cấu trúc các thành phần của Mô hình Mô phỏng: ......................................................21
* Module Quản lý Lịch trình bay ....................................................................................21
* Module Quản lý Đội bay (Tàu bay) .............................................................................21
* Module Quản lý Phi hành đoàn ...................................................................................21
* Module Phát sinh Gián đoạn .......................................................................................21
* Module Tính toán Chi phí/Phần thưởng .....................................................................22
* Mô tả luồng hoạt động................................................................................................22
3.3. Lựa Chọn và Điều Chỉnh Các Siêu Tham Số: Tinh Chỉnh "Kim Chỉ Nam"
Cho Hệ Thống................................................................................................................23
* Tốc độ học (Learning Rate) ........................................................................................23
* Số lượng chu kỳ học (Episodes/Iterations) ..................................................................23
* Kích thước lô (Batch Size) ..........................................................................................23
* Hệ số chiết khấu (Discount Factor - Gamma) ...........................................................24
* Chiến lược khám phá (Exploration Strategy - Epsilon-greedy) ...................................24 6
3.4. Kỹ Thuật Huấn Luyện: Quy Trình “Đào Tạo” Cho “Bộ Não” Thông Minh......... 24
* Bộ tối ưu hóa (Optimizer) ...........................................................................................24
* Hồi quy kinh nghiệm (Experience Replay) ..................................................................25
* Cập nhật mạng mục tiêu (Target Network Updates)...................................................25
* Số lượng bước (Episode) ............................................................................................25
3.5. Chính Quy Hóa (Regularization).............................................................................25
* Dropout ......................................................................................................................26
* Dừng sớm (Early Stopping) .......................................................................................26
* Chính quy hóa L1/L2 .................................................................................................26
3.6. Các Thước Đo Khi Huấn Luyện............................................................................26
* Tổng phần thưởng (Total Reward per Episode) .........................................................26
* Thời gian xử lý gián đoạn trung bình (Average Disruption Resolution Time)............27
* Chi phí phát sinh trung bình (Average Disruption Cost).............................................27
* Tỷ lệ tuân thủ quy định (Compliance Rate)................................................................27
* Tỷ lệ hành khách đến đích đúng giờ/đúng kết nối (On-time/Connection Success
Rate for Disrupted Passengers)......................................................................................27
* Tỷ lệ sử dụng tài nguyên (Resource Utilization Rate - Phi hành đoàn, Tàu
bay)................................................................................................................................27
3.7. Code Minh Hoạ (Snippet Python kèm mô tả) ........................................................27
* Hình 3.1 .....................................................................................................................28
* Hình 3.2 .....................................................................................................................29
* Hình 3.3 .....................................................................................................................30
CHƯƠNG IV: TỐI ƯU HÓA MÔ HÌNH ...................................................................32
4.1. Tối ưu Hyperparameters: Phân tích Độ nhạy Tham số Đầu vào ..........................32
1. Bối cảnh và Mục tiêu Mô hình Tối ưu hóa .............................................................32
2. Các biến quyết định, mục tiêu và ràng buộc ...........................................................32
3. Giả định và Hạn chế ...............................................................................................33
4. Tối ưu hóa Mô hình và Phân tích Kết quả .............................................................33
4.2. So sánh các Phiên bản Mô hình và Kết quả...........................................................34
* Hình 4.1 .....................................................................................................................35
* Hình 4.2 .....................................................................................................................36
* Hình 4.3 .....................................................................................................................36
CHƯƠNG V: ĐÁNH GIÁ MÔ HÌNH ........................................................................37
5.1. Các Metric Được Sử Dụng ...................................................................................37
* Tổn thất ($) ...............................................................................................................37
* Số chuyến bay tối ưu được phục vụ..........................................................................37
* Số hành khách tối ưu được vận chuyển ...................................................................37
* Số máy bay được sử dụng .........................................................................................37 7
5.2. Giải thích Lý do Chọn Metric Này ........................................................................37
5.3. So Sánh Mô hình Chính với Baseline hoặc Các Mô hình Khác..............................37
* So sánh với Kịch bản "Không Tối ưu hóa" (Heuristic hoặc Baseline Logic)..............38
* So sánh giữa các Mức độ Gián đoạn..........................................................................38
5.4. Trình Bày Kết Quả Bằng Bảng, Biểu Đồ Rõ Ràng ................................................38
* Bảng Tóm tắt Kết quả Vận hành ...............................................................................38
* Biểu đồ Mạng lưới Hoạt động Toàn bộ.....................................................................39
* Biểu đồ Lịch trình Máy bay (Directed Acyclic Graph - DAG)....................................39
CHƯƠNG VI: TRIỂN KHAI VÀ ỨNG DỤNG ..........................................................39
6.1. Tích hợp Inference vào Đâu?..................................................................................39
* Ứng dụng Desktop (Tkinter, PyQt) / Ứng dụng di động (Kivy, React Native)............40
* Hệ thống Nhúng / Phần cứng (Raspberry Pi, Jetson, UAV thực tế)..........................40
6.2. Demo Hoạt động với Test Case..............................................................................40
* Tình Huống Thử Nghiệm .........................................................................................40
* Quy trình Demo ........................................................................................................41
6.3. Kết quả đầu ra .....................................................................................................41
* Thông tin Định lượng ...............................................................................................41
* Trực quan hóa Mạng lưới ........................................................................................41
6.4. Kết luận và Hướng Phát Triển .............................................................................42
* Kết luận ....................................................................................................................42
* Hạn chế Hiện tại ......................................................................................................42
* Hướng Phát Triển Tương lai.....................................................................................42
CHƯƠNG VII: TÀI LIỆU VÀ TRÍCH DẪN, VIDEO DEMO ...................................43
7.1. Nguồn tài liệu, công cụ, dataset sử dụng ..............................................................43
7.1.1. Nguồn Tài liệu Tham khảo ................................................................................43
7.1.2. Công cụ sử dụng ................................................................................................43
* Gurobi Optimizer........................................................................................................43
* Jupyter Notebook .....................................................................................................43
7.1.3. Dataset sử dụng .................................................................................................43
7.2. Thư viện Python sử dụng .....................................................................................43
* Pandas.......................................................................................................................43
* NetworkX .................................................................................................................43
* Pygraphviz (hoặc networkx.drawing.nx_agraph).......................................................44
* Matplotlib..................................................................................................................44
* Ipywidgets.................................................................................................................44
7.3. Video Demo hoạt động của mô hình....................................................................44
KẾT LUẬN CHUNG..................................................................................................45 8
DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT NCE
Sân bay Nice Côte d'Azur (Nice, Pháp) CDG
Sân bay Paris-Charles de Gaulle (Paris, Pháp) LYS
Sân bay Lyon-Saint Exupéry (Lyon, Pháp) ORY
Sân bay Paris-Orly (Paris, Pháp)
Đường đi của các chuyến bay 9 DANH MỤC HÌNH ẢNH
CHƯƠNG I: GIỚI THIỆU ĐỀ TÀI
Hình 1.1 Dữ liệu giả định các chuyến bay
Hình 1.2 Thông tin về các máy bay, sân bay, chuyến bay
Hình 1.3 Mạng lưới chuyến bay mô phỏng

CHƯƠNG III: BIỂU DIỄN VÀ HUẤN LUYỆN MÔ HÌNH
Hình 3.1 Code mô hình thử nghiệm
Hình 3.2 Mạng lưới chuyến bay của A320 khi áp dụng mô hình
Hình 3.3 Mạng lưới chuyến bay của A321 khi áp dụng mô hình

CHƯƠNG IV: TỐI ƯU HÓA MÔ HÌNH
Hình 4.1 Code mô hình tối ưu hóa
Hình 4.2 Kết quả mô hình thử nghiệm sau khi đã tối ưu
Hình 4.3 Kết quả mô hình thử nghiệm sau khi đã tối ưu

CHƯƠNG 7: TÀI LIỆU VÀ TRÍCH DẪN, VIDEO DEMO
Hình 7.1 Mã qr code video thuyết trình 10 DANH MỤC BẢNG
Bảng 1.1 Bảng phân công nhiệm vụ trong nhóm 11
CHƯƠNG I: Giới Thiệu Đề Tài 1.1. Mục tiêu đề tài
Vấn đề thực tế mà đề tài giải quyết là sự gián đoạn trong hoạt động hàng không,
thường xuyên xảy ra do nhiều yếu tố bất khả kháng như thời tiết xấu, sự cố kỹ
thuật, đình công, tắc nghẽn sân bay, hoặc các yếu tố bất ngờ khác. Khi xảy ra gián
đoạn, các hãng hàng không phải đối mặt với một loạt thách thức phức tạp, bao gồm:
Thay đổi lịch trình bay: Các chuyến bay có thể bị hoãn, hủy, hoặc chuyển hướng,
gây ảnh hưởng đến lịch trình của các chuyến bay tiếp theo và các kết nối.
Quản lý phi hành đoàn: Việc sắp xếp lại lịch làm việc của phi hành đoàn trở nên
cực kỳ phức tạp để đảm bảo tuân thủ các quy định về thời gian bay và nghỉ ngơi,
đồng thời tối thiểu hóa chi phí phát sinh.
Điều phối tàu bay: Tàu bay bị mắc kẹt tại các sân bay không mong muốn hoặc
không thể cất cánh đúng giờ, dẫn đến thiếu hụt tàu bay cho các chặng bay tiếp theo.
Hành khách bị ảnh hưởng: Hàng ngàn hành khách có thể bị trễ chuyến, lỡ các
chuyến bay nối chuyến, hoặc bị mắc kẹt, dẫn đến sự không hài lòng và yêu cầu bồi thường.
Chi phí phát sinh: Gián đoạn gây ra các chi phí đáng kể cho hãng hàng không, bao
gồm chi phí bồi thường cho hành khách, chi phí lưu trú, chi phí nhiên liệu do bay
vòng, và tổn thất doanh thu.
Mục tiêu của đề tài là xây dựng một giải pháp dựa trên AI để tối ưu hóa kế hoạch
chuyến bay sau gián đoạn, nhằm giảm thiểu tác động tiêu cực, tối ưu hóa các nguồn
lực (phi hành đoàn, tàu bay), giảm chi phí, và nâng cao sự hài lòng của hành khách.
1.2. Các thách thức kỹ thuật hoặc dữ liệu gặp phải.
Việc tối ưu hóa kế hoạch chuyến bay sau gián đoạn bằng AI đối mặt với nhiều thách
thức kỹ thuật và dữ liệu đáng kể:
Tính phức tạp của bài toán tối ưu:
Không gian tìm kiếm lớn: Số lượng biến và ràng buộc trong bài toán tối ưu hóa
kế hoạch chuyến bay là cực kỳ lớn, bao gồm hàng trăm chuyến bay, hàng ngàn
phi công và tiếp viên, và hàng trăm tàu bay.
Đa mục tiêu: Cần tối ưu hóa nhiều mục tiêu cùng lúc như giảm thiểu chi phí, tối
thiểu hóa sự chậm trễ của hành khách, tối đa hóa sử dụng tài nguyên, và tuân thủ
các quy định nghiêm ngặt.
Ràng buộc phức tạp: Có vô số ràng buộc phức tạp cần được tuân thủ, bao gồm
giới hạn thời gian làm việc của phi hành đoàn (FATIGUE, FTL - Flight Time
Limitations), quy định bảo dưỡng tàu bay, năng lực sân bay, và quy định về
visa/giấy phép của phi hành đoàn. 12
Tính động: Tình huống gián đoạn có thể thay đổi liên tục, yêu cầu hệ thống phải
có khả năng cập nhật và tái tối ưu hóa nhanh chóng trong thời gian thực.
a).Chất lượng và khối lượng dữ liệu:
Dữ liệu đa dạng và lớn: Dữ liệu cần thiết bao gồm lịch trình bay, thông tin về phi
hành đoàn (kỹ năng, thời gian làm việc, vị trí), thông tin về tàu bay (loại, trạng
thái bảo dưỡng, vị trí), dữ liệu thời tiết, dữ liệu về năng lực sân bay, và dữ liệu lịch sử gián đoạn.
Thiếu dữ liệu thực tế về gián đoạn: Dữ liệu chi tiết về các kịch bản gián đoạn và
cách các hãng hàng không xử lý chúng có thể không đầy đủ hoặc khó tiếp cận.
Dữ liệu không đồng nhất và nhiễu: Dữ liệu có thể đến từ nhiều nguồn khác
nhau, không đồng nhất về định dạng và chất lượng, chứa lỗi hoặc nhiễu.
Vấn đề về quyền riêng tư và bảo mật: Dữ liệu về phi hành đoàn và hoạt động
của hãng hàng không có thể nhạy cảm, đặt ra thách thức về quyền riêng tư và bảo mật khi xử lý.
b).Lựa chọn và phát triển mô hình AI:
Khó khăn trong việc lựa chọn thuật toán phù hợp: Với tính phức tạp của bài
toán, việc lựa chọn thuật toán AI phù hợp (ví dụ: tối ưu hóa tổ hợp, học tăng
cường, học sâu) là một thách thức.
Tính giải thích được (Explainability): Các mô hình AI phức tạp có thể khó giải
thích, gây khó khăn cho các nhà quản lý trong việc hiểu và tin tưởng vào các
quyết định do AI đề xuất.
Tích hợp với hệ thống hiện có: Việc tích hợp giải pháp AI vào hệ thống điều
hành bay hiện có của các hãng hàng không có thể phức tạp và tốn kém.
c).Hiệu suất và thời gian thực:
Yêu cầu xử lý nhanh: Khi có gián đoạn, cần có giải pháp nhanh chóng để đưa ra
quyết định, do đó mô hình AI phải có khả năng xử lý và đưa ra kết quả trong thời gian ngắn nhất có thể.
Khả năng mở rộng: Hệ thống phải có khả năng mở rộng để xử lý lượng dữ liệu
và tình huống ngày càng tăng.
1.3. Các giải pháp được đề xuất: Áp dụng AI như thế nào để giải quyết?
Để giải quyết các thách thức trên và tối ưu hóa kế hoạch chuyến bay khi bị gián
đoạn, đề tài đề xuất áp dụng AI thông qua các phương pháp sau:
1. Mô hình dự đoán gián đoạn (Predictive Disruption Modeling):
Machine Learning (ML): Sử dụng các thuật toán học máy (như Random Forest,
Gradient Boosting, hoặc mạng nơ-ron hồi quy) để phân tích dữ liệu lịch sử (thời
tiết, sự cố kỹ thuật, tình trạng sân bay, dữ liệu vận hành) nhằm dự đoán khả năng xảy ra gián đoạn. 13
Xử lý ngôn ngữ tự nhiên (NLP): Phân tích các thông báo, báo cáo sự cố không
cấu trúc để sớm phát hiện các dấu hiệu tiềm ẩn của gián đoạn.
Mục tiêu: Giúp hãng hàng không chủ động đưa ra các biện pháp phòng ngừa
hoặc chuẩn bị trước khi gián đoạn xảy ra, giảm thiểu tác động ban đầu.
2. Tối ưu hóa tổ hợp và Học tăng cường (Combinatorial Optimization & Reinforcement Learning):
Thuật toán tối ưu hóa tổ hợp: Sử dụng các thuật toán như lập trình tuyến tính
nguyên (Integer Linear Programming - ILP), lập trình ràng buộc (Constraint
Programming - CP), hoặc các thuật toán heuristic/meta-heuristic (Genetic
Algorithms, Simulated Annealing) để tìm ra giải pháp tối ưu cho việc phân bổ lại
tài nguyên (phi hành đoàn, tàu bay) và điều chỉnh lịch trình bay.
Học tăng cường (Reinforcement Learning - RL): Huấn luyện các tác tử AI để học
cách đưa ra các quyết định tối ưu trong môi trường động. RL có thể được sử dụng để:
Lập lịch lại chuyến bay: Học cách điều chỉnh lịch trình chuyến bay một cách linh
hoạt, cân bằng giữa chi phí, sự chậm trễ của hành khách và các ràng buộc vận hành.
Phân công lại phi hành đoàn: Học cách phân công lại phi hành đoàn một cách
hiệu quả, xem xét các quy định về thời gian làm việc, kỹ năng và vị trí hiện tại.
Tối ưu hóa vị trí tàu bay: Học cách điều chuyển tàu bay đến các sân bay khác
hoặc điều chỉnh lịch bảo dưỡng để tối ưu hóa việc sử dụng tàu bay.
Mục tiêu: Tìm ra các giải pháp tái lập kế hoạch tối ưu nhất, cân bằng giữa các
mục tiêu khác nhau (chi phí, thời gian, sự hài lòng của khách hàng) và tuân thủ
tất cả các ràng buộc phức tạp trong thời gian thực.
3. Hệ thống hỗ trợ ra quyết định thông minh (Intelligent Decision Support System):
AI giải thích được (Explainable AI - XAI): Phát triển các mô hình AI có khả năng
giải thích lý do đằng sau các quyết định được đưa ra, giúp các nhà điều hành hiểu
rõ và tin tưởng vào các đề xuất của hệ thống.
Giao diện người dùng trực quan: Xây dựng giao diện cho phép người dùng tương
tác với hệ thống AI, xem xét các kịch bản khác nhau, và điều chỉnh các tham số
để phù hợp với các ưu tiên cụ thể.
Mục tiêu: Hỗ trợ các nhà quản lý trong việc đưa ra quyết định nhanh chóng và
hiệu quả hơn, đặc biệt trong các tình huống phức tạp và áp lực cao.
4. Học sâu (Deep Learning) cho phân tích dữ liệu phi cấu trúc:
Mạng nơ-ron tích chập (CNN) hoặc mạng nơ-ron hồi quy (RNN): Phân tích dữ
liệu từ camera giám sát tại sân bay, báo cáo giọng nói từ phi công/phi hành đoàn,
hoặc các thông tin từ mạng xã hội để nhanh chóng nhận diện tình huống và mức
độ ảnh hưởng của gián đoạn.
Mục tiêu: Cung cấp cái nhìn toàn diện hơn về tình hình thực tế, giúp hệ thống tối
ưu hóa có được thông tin đầy đủ và chính xác nhất. 14
Chương II: Thu thâp và xử lý nguồn dữ liệu
Trong bối cảnh tối ưu hóa kế hoạch chuyến bay sau gián đoạn, dữ liệu chính là
huyết mạch, là nền tảng để xây dựng nên một hệ thống thông minh và linh hoạt. Việc
thu thập, làm sạch và chuẩn bị dữ liệu một cách kỹ lưỡng không chỉ đảm bảo tính
chính xác cho các phân tích và dự báo mà còn quyết định đáng kể đến hiệu quả của
toàn bộ giải pháp đề ra. Chương này sẽ đi sâu vào hành trình của dữ liệu, từ các
nguồn gốc đa dạng cho đến khi được tinh chỉnh và sẵn sàng cho các mô hình vận hành.
2.1. Nguồn Gốc Dữ Liệu: Khám Phá Kho Tàng Thông Tin Hàng Không
Để xây dựng một bức tranh toàn diện về hoạt động bay và các yếu tố gây gián đoạn,
chúng ta cần khai thác từ nhiều nguồn dữ liệu khác nhau, mỗi nguồn mang một giá trị và vai trò riêng:
Dữ Liệu Công Khai (Public Datasets): Mặc dù không đi sâu vào chi tiết vận hành
nội bộ, các bộ dữ liệu công khai vẫn cung cấp một cái nhìn tổng quan và bối cảnh
quan trọng. Chúng ta có thể tìm thấy thông tin về lịch sử các chuyến bay, dữ liệu
về hiệu suất đúng giờ từ các cơ quan quản lý hàng không, hoặc các bộ dữ liệu khí
tượng toàn cầu để phân tích xu hướng thời tiết. Những thông tin này giúp xác
định các yếu tố khách quan, phổ biến có thể gây ra gián đoạn như bão, sương
mù, hay các khu vực thường xuyên tắc nghẽn.
Dữ Liệu Nội Bộ (Internal Data - Tự Thu Thập): Đây là "kho báu" thực sự, nơi
chứa đựng những thông tin chi tiết và độc quyền về hoạt động của hãng hàng
không. Việc tiếp cận và tổ chức dữ liệu này là chìa khóa để giải quyết bài toán tối ưu hóa.
Các loại dữ liệu bao gồm:
Lịch trình bay chi tiết: Kế hoạch bay ban đầu, các điều chỉnh theo thời gian thực,
thông tin về các chuyến bay nối chuyến.
Thông tin về phi hành đoàn: Lịch làm việc, thời gian bay đã thực hiện, thời gian
nghỉ ngơi bắt buộc theo quy định an toàn bay nghiêm ngặt, vị trí hiện tại, và khả
năng điều khiển các loại máy bay khác nhau. Đây là yếu tố cực kỳ nhạy cảm và
phức tạp khi xảy ra gián đoạn.
Thông tin về đội bay (tàu bay): Loại máy bay, tình trạng bảo dưỡng (đã hoàn
thành hay đang chờ), lịch sử hỏng hóc, và vị trí hiện tại của từng chiếc.
Dữ liệu hành khách: Số lượng hành khách trên mỗi chuyến bay, thông tin về các
chuyến bay nối chuyến của họ – một yếu tố quan trọng để đánh giá tác động và ưu tiên hành khách.
Lịch sử sự cố và gián đoạn: Chi tiết về các sự kiện đã xảy ra, nguyên nhân gốc rễ,
thời gian kéo dài, và cách thức hãng hàng không đã xử lý. Đây là dữ liệu vô cùng
quý giá để học hỏi từ quá khứ. 15 Hình 1.1 Hình 1.2 Hình 1.3 16
Dữ liệu chi phí: Chi phí vận hành, chi phí bồi thường cho hành khách, chi phí lưu
trú cho phi hành đoàn và hành khách, và các chi phí phát sinh khác do gián đoạn.
Dữ Liệu Mô Phỏng (Simulation): Trong trường hợp dữ liệu thực tế về các kịch
bản gián đoạn hiếm gặp hoặc phức tạp không đủ, mô phỏng trở thành một công
cụ không thể thiếu. Bằng cách xây dựng các môi trường giả lập phản ánh hoạt
động hàng không thực tế, chúng ta có thể tạo ra vô số kịch bản gián đoạn khác
nhau. Điều này cho phép hệ thống "học" cách phản ứng và đưa ra quyết định tối
ưu trong các tình huống mà chưa từng xảy ra trên thực tế, hoặc xảy ra quá ít để có đủ dữ liệu.
2.2. Tiền Xử Lý Dữ Liệu: Biến Dữ Liệu Thô Thành Vàng
Dữ liệu thô hiếm khi hoàn hảo. Chúng thường chứa đựng những "tạp chất" như
thông tin dư thừa, thiếu sót, hoặc không nhất quán. Quá trình tiền xử lý chính là
công đoạn "tinh luyện" để dữ liệu trở nên sạch sẽ, đáng tin cậy và sẵn sàng cho các phân tích sâu hơn.
Làm Sạch Dữ Liệu: Đây là bước cơ bản nhất. Chúng ta cần xác định và loại bỏ
các bản ghi trùng lặp, đảm bảo mỗi thông tin là duy nhất. Các định dạng dữ liệu
(ví dụ: ngày/giờ, mã sân bay, mã máy bay) cần được chuẩn hóa để dễ dàng so
sánh và xử lý. Ngoài ra, việc phát hiện và xử lý các "ngoại lệ" – những giá trị quá
lớn hoặc quá nhỏ, có thể là lỗi nhập liệu hoặc một sự kiện bất thường – cũng rất
quan trọng để tránh làm sai lệch kết quả.
Loại Bỏ Nhiễu và Xử Lý Giá Trị Thiếu: Dữ liệu có thể chứa "nhiễu" – những
thông tin không liên quan hoặc bị sai lệch, cần được làm mịn hoặc lọc bỏ. Đặc
biệt, "giá trị thiếu" là một vấn đề phổ biến. Chúng ta cần phân tích nguyên nhân
của sự thiếu hụt này và quyết định cách xử lý phù hợp. Có thể là loại bỏ các bản
ghi bị thiếu nếu số lượng ít, hoặc "điền khuyết" bằng cách sử dụng giá trị trung
bình, trung vị, hay thậm chí là dựa trên các thông tin lân cận hoặc các mô hình dự
đoán để ước lượng giá trị còn thiếu một cách hợp lý nhất.
Xử Lý Dữ Liệu Phi Cấu Trúc: Nhiều thông tin quan trọng như báo cáo sự cố, ghi
chú của phi công, hoặc phản hồi từ hành khách thường ở dạng văn bản tự do.
Chúng cần được xử lý để trích xuất những thông tin có giá trị, ví dụ như nhận
diện các từ khóa chỉ nguyên nhân gián đoạn, mức độ nghiêm trọng, hay các bên liên quan.
2.3. Lựa Chọn Đặc Trưng: Xác Định Yếu Tố then Chốt
Không phải tất cả thông tin đều có giá trị như nhau. Bước lựa chọn đặc trưng là quá
trình "chắt lọc" để giữ lại những yếu tố thực sự có sức ảnh hưởng đến bài toán tối
ưu hóa, giúp mô hình hoạt động hiệu quả hơn và dễ hiểu hơn. 17
Kiến Thức Chuyên Sâu Ngành (Domain Knowledge): Đây là yếu tố quan trọng
nhất. Những chuyên gia trong ngành hàng không, với kinh nghiệm dày dặn, có
thể chỉ ra ngay những thông tin nào là cốt lõi để đưa ra quyết định sau gián đoạn.
Ví dụ, họ sẽ biết rằng loại máy bay, số lượng phi công có chứng chỉ cho loại máy
bay đó, thời gian nghỉ bắt buộc của phi hành đoàn, và năng lực của sân bay đích là
những yếu tố không thể bỏ qua.
Phân Tích Thống Kê: Các phương pháp thống kê giúp định lượng mối quan hệ
giữa các thông tin và kết quả mong muốn. Chúng ta có thể dùng các phép đo
tương quan để xác định những thông tin nào có mối liên hệ chặt chẽ với tình
trạng gián đoạn hoặc hiệu quả của các giải pháp.
Phương Pháp Tính Toán: Ngoài ra, có những phương pháp tính toán tự động
giúp đánh giá mức độ quan trọng của từng thông tin và chọn ra tập hợp tối ưu.
Những phương pháp này có thể giúp khám phá ra những mối liên hệ tiềm ẩn mà
con người có thể bỏ qua.
2.4. Chuẩn Hóa Đặc Trưng: Đặt Mọi Thứ Lên Cùng Một "Thước Đo"
Khi các đặc trưng có phạm vi giá trị khác nhau (ví dụ: số lượng hành khách có thể là
hàng trăm, trong khi nhiệt độ sân bay chỉ vài chục độ), các mô hình có thể bị "thiên vị"
bởi những đặc trưng có giá trị lớn hơn. Chuẩn hóa đặc trưng giúp đưa tất cả về cùng
một "thước đo", đảm bảo chúng có tầm ảnh hưởng tương đương trong quá trình phân tích.
Chuyển Đổi Về Khoảng [0, 1] (Min-Max Scaling): Phương pháp này đơn giản là
đưa tất cả các giá trị về một khoảng từ 0 đến 1. Điều này giúp các mô hình hoạt
động ổn định hơn, đặc biệt là các mô hình nhạy cảm với thang đo của dữ liệu.
Chuẩn Hóa Theo Phân Phối Chuẩn (Z-score Standardization): Phương pháp này
điều chỉnh dữ liệu sao cho chúng có giá trị trung bình bằng 0 và độ lệch chuẩn
bằng 1. Đây là lựa chọn tốt khi dữ liệu có xu hướng phân phối theo hình chuông,
giúp các mô hình dựa trên khoảng cách hoạt động hiệu quả hơn. Việc lựa chọn
phương pháp chuẩn hóa phù hợp phụ thuộc vào tính chất của từng loại dữ liệu
và yêu cầu cụ thể của mô hình được sử dụng.
2.5. Gán Nhãn: Đặt Tên Cho Các Tình Huống
Để các hệ thống thông minh có thể học hỏi từ dữ liệu, chúng cần biết "đáp án đúng"
cho mỗi tình huống. Đây là quá trình gán nhãn, hay "đặt tên" cho các loại gián đoạn
hoặc các giải pháp xử lý.
Dựa trên Luật (Rule-based Labeling): Trong ngành hàng không, có rất nhiều quy
định và quy trình rõ ràng. Chúng ta có thể xây dựng các "luật" để tự động gán
nhãn. Ví dụ, nếu một chuyến bay bị hoãn hơn 3 giờ do sương mù dày đặc, chúng
ta có thể gán nhãn là "Gián đoạn do thời tiết – Hoãn chuyến". Cách này hiệu quả
và nhất quán cho các tình huống đã được định nghĩa rõ ràng. 18
Thủ Công (Manual Labeling): Đối với những tình huống phức tạp, không rõ ràng
hoặc mang tính chất đặc biệt, sự can thiệp của chuyên gia là cần thiết. Các
chuyên gia sẽ xem xét và gán nhãn thủ công, đảm bảo độ chính xác tuyệt đối cho
các trường hợp này. Dù tốn thời gian, đây là cách tạo ra "dữ liệu vàng" cho các mô hình học hỏi.
Học Bán Giám Sát (Semi-supervised Learning): Khi có một lượng lớn dữ liệu
chưa được gán nhãn nhưng chỉ một phần nhỏ đã có nhãn, phương pháp này phát
huy tác dụng. Hệ thống có thể học từ dữ liệu đã có nhãn, sau đó tự tin "dự đoán"
và gán nhãn cho phần dữ liệu còn lại, giảm đáng kể công sức thủ công.
Học Tăng Cường (Reinforcement Learning - Định nghĩa phần thưởng): Đặc biệt
trong bài toán tối ưu hóa, "gán nhãn" không chỉ là phân loại. Hệ thống học cách
đưa ra các quyết định tốt thông qua việc nhận được "phần thưởng" hoặc "hình
phạt" từ môi trường. Phần thưởng được định nghĩa dựa trên các mục tiêu kinh
doanh: ví dụ, một kế hoạch giảm thiểu chi phí bồi thường hành khách sẽ nhận
được "phần thưởng" cao.
2.6. Chia Dữ Liệu: Đánh Giá Công Bằng
Để đảm bảo rằng mô hình được xây dựng không chỉ hoạt động tốt với dữ liệu đã
thấy mà còn có thể khái quát hóa tốt trên dữ liệu mới, chúng ta cần chia dữ liệu một cách chiến lược.
Tỷ Lệ Huấn Luyện/Kiểm Định/ (Train/Test/:
Tập huấn luyện (Training Set): Phần lớn dữ liệu được dành để "dạy" mô hình
cách nhận diện các quy luật và mối quan hệ.
Tập kiểm định (Validation Set): Một phần nhỏ hơn được sử dụng trong quá trình
xây dựng mô hình để tinh chỉnh các thông số và tránh tình trạng mô hình "học
thuộc lòng" dữ liệu huấn luyện mà không hiểu bản chất (overfitting).
Kiểm Định Chéo (Cross-Validation): Đặc biệt hữu ích khi lượng dữ liệu không quá
lớn, hoặc khi muốn đảm bảo kết quả đánh giá mô hình là thật sự đáng tin cậy.
Phương pháp này chia dữ liệu thành nhiều phần, luân phiên sử dụng từng phần làm
tập kiểm định và các phần còn lại để huấn luyện. Bằng cách lặp lại quá trình này
nhiều lần, chúng ta sẽ có một cái nhìn toàn diện và vững chắc hơn về khả năng của mô hình. 19
Lưu ý với Dữ Liệu Thời Gian: Đối với dữ liệu có yếu tố thời gian (như lịch sử
gián đoạn), việc chia dữ liệu phải tuân theo trình tự thời gian. Dữ liệu từ quá
khứ được dùng để huấn luyện, và dữ liệu từ tương lai (chưa xảy ra) được dùng
để kiểm tra, mô phỏng đúng tình huống thực tế khi hệ thống cần đưa ra dự đoán
hoặc quyết định trong tương lai.
Việc đầu tư vào quá trình thu thập và xử lý dữ liệu một cách cẩn trọng sẽ tạo nền
tảng vững chắc cho việc xây dựng một giải pháp tối ưu hóa kế hoạch chuyến bay
hiệu quả, giúp các hãng hàng không vượt qua những "cơn bão" gián đoạn một cách
linh hoạt và thông minh hơn.
CHƯƠNG III: BIỂU DIỄN VÀ HUẤN LUYỆN MÔ HÌNH
3.1. Lý Do Chọn Mô Hình Và Vì Sao
Học Tăng cường (Reinforcement Learning - RL) là cốt lõi để giải quyết bài toán tối
ưu hóa động này. Tuy nhiên, để RL hoạt động hiệu quả, chúng ta cần một Mô hình
Mô phỏng (Simulation Model) đóng vai trò là "sân chơi" nơi tác tử RL có thể thực hành và học hỏi.
Mô hình Mô phỏng Lý do phù hợp:
Thực tế khắc nghiệt: Trong ngành hàng không, việc thử nghiệm các chiến lược xử
lý gián đoạn trực tiếp trên hệ thống thực tế là không thể, do rủi ro về an toàn, chi
phí khổng lồ và tác động tiêu cực đến hàng ngàn hành khách.
Học hỏi không rủi ro: Mô hình mô phỏng cung cấp một môi trường an toàn, không
rủi ro để tác tử RL "thử và sai" hàng triệu lần. Qua mỗi lần thử, tác tử sẽ nhận
được phản hồi (phần thưởng/hình phạt) và điều chỉnh hành vi của mình.
Tạo ra đa dạng kịch bản: Chúng ta có thể dễ dàng tạo ra vô số kịch bản gián đoạn
khác nhau (thời tiết, kỹ thuật, nhân sự, quy mô lớn/nhỏ) trong mô phỏng, bao gồm
cả những kịch bản hiếm gặp trong thực tế, giúp tác tử học cách đối phó với mọi tình huống.
Đánh giá hiệu quả: Mô hình mô phỏng cũng là công cụ lý tưởng để đánh giá hiệu
suất của các chiến lược tối ưu hóa trước khi triển khai vào thực tế, giúp so sánh
các phương án và chọn ra giải pháp tốt nhất.
Môi trường phản hồi nhanh: Môi trường mô phỏng có thể phản hồi các hành động
của tác tử trong thời gian ngắn hơn nhiều so với thế giới thực, giúp tăng tốc quá trình học của tác tử.
Tóm lại, trong bài toán này, mô hình mô phỏng không chỉ là một công cụ hỗ trợ mà là
một thành phần không thể thiếu để huấn luyện và đánh giá hệ thống tối ưu hóa dựa
trên Học Tăng cường. Nó là "phi công tập sự" của hệ thống, nơi mọi sai lầm đều có
thể chấp nhận được và trở thành bài học quý giá. 20