PGS. TS. NGUYỄN ĐÌNH VIỆT
BÀI GIẢNG
ĐÁNH GIÁ HIỆU NĂNG MẠNG
MÁY TÍNH
NỘI - 2008
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
2
MỤC LỤC
CHƯƠNG 1 GIỚI THIỆU........................................................................................................ 5
1.1 Khái niệm hiệu năng các độ đo hiu năng mạng................................................................ 5
1.1.1
Khái niệm hiệu năng mạng........................................................................................................5
1.1.2
Các độ đo hiệu năng mạng.........................................................................................................5
1.2 Tầm quan trọng của việc đánh giá hiệu năng mạng máy nh..................................................6
1.3 Phân loại các phương pháp đánh giá hiệu năng mạng.............................................................6
1.4 Các lỗi thường gặp...................................................................................................................8
1.5 Tiếp cận một cách hệ thống để tránh mắc lỗi....................................................................15
1.6 Tài liệu tham khảo cho Chương 1..........................................................................................18
CHƯƠNG 2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU NĂNG MẠNG........................... 19
2.2 hình Giải ch...................................................................................................................19
2.2.1
Quá trình Poisson các tính chất của nó............................................................................... 20
2.2.2
Hàng đợi M/M/1 một số kết qu.........................................................................................21
2.2.2.1
Xác suất trạng thái cân bằng của hàng đợi M/M/1...........................................................21
2.2.2.2
Đặc trưng thông lượng của hàng đợi M/M/1 hữu hạn...................................................... 22
2.2.2.3
Kích thước trung bình của hàng đợi M/M/1 hữu hạn.......................................................23
2.2.2.4
Công thức Little L=W áp dụng để tính thời gian trễ trung nh................................24
2.3 phỏng mạng bằng chương trình máy nh........................................................................25
2.3.1
Giới thiệu chung (under construction)..................................................................................... 25
2.3.2
Ý tưởng xây dựng bộ phỏng mạng vận hành theo các sự kiện rời rạc............................... 25
2.4 Đo trên mạng thực (under construction)................................................................................ 27
2.5 Tài liệu tham khảo cho Chương 2..........................................................................................27
CHƯƠNG 3 ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG HÌNH HÀNG ĐỢI..............28
3.1 hình mạch ảo................................................................................................................... 28
3.2 Thí dụ 3.1: Đánh giá hiệu năng của các chế kiểm soát lỗi................................................29
3.2.1
Kiểm soát lỗi đầu cuối - đầu cuối (end-to-end)........................................................................30
3.2.2
Kiểm soát lỗi theo chặng (link-by-link)...................................................................................33
3.2.3
Áp dụng: So sánh chế kiểm soát lỗi đầu cuối - đầu cuối theo chặng..............................35
3.2.3.1
So sánh các chế theo chặng đầu cuối - đầu cuối mạng tốc độ thấp......................35
3.2.3.2
So sánh các chế theo chặng đầu cuối - đầu cuối mạng tốc độ cao....................... 37
3.3 Thí dụ 3.2: Đánh giá hiệu năng của chế điều khiển lưu lượng bằng cửa s trượt............ 39
3.3.1
hình cửa sổ trượt với sự biên nhận từng gói số liệu...........................................................39
3.3.1.1
Trường hợp tải rất nặng....................................................................................................40
3.3.1.2
Trường hợp tải xấp xỉ bằng khả năng vận chuyển của đường truyền...............................41
3.3.2
hình cửa sổ trượt với sự biên nhận cuối cửa sổ.............................................................. 42
3.3.2.1
Trường hợp tải rất nặng....................................................................................................43
3.3.2.2
Trường hợp tải xấp xỉ bằng khả năng vận chuyển của đường truyền...............................44
3.4 Tài liệu tham khảo cho Chương 3..........................................................................................45
CHƯƠNG 4 ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG BỘ PHỎNG NS-2............... 46
4.1 Bộ phỏng mạng NS-2...................................................................................................... 46
4.1.1
Giới thiệu.................................................................................................................................46
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
3
4.1.2
Cấu trúc phần mềm của NS.....................................................................................................48
4.1.3
Lập trình phỏng bằng NS.................................................................................................. 49
4.1.4
Cấu trúc tệp vết (trace file) chứa kết quả mô phỏng................................................................49
4.1.4.1
Cấu trúc tệp vết chứa kết quả phỏng mạng y.....................................................50
Tài liệu tham khảo (cho 4.1.4.1):................................................................................................. 51
4.1.4.2
Cấu trúc tệp vết chứa kết quả phỏng mạng không dây (under construction)..............51
4.1.4.3
Cấu trúc tệp vết chứa kết quả phỏng mạng hỗn hợp (under construction)................. 51
4.2 NAM......................................................................................................................................51
Tài liệu tham khảo cho “4.2 NAM”:............................................................................................52
4.3 Giới thiệu một số công cụ hỗ trợ việc phân tích hiển thị kết quả phỏng.................... 52
4.3.1
Giới thiệu dự án GNU............................................................................................................. 52
4.3.2
Grep.........................................................................................................................................52
4.3.3
Awk.........................................................................................................................................53
4.3.4
Perl.......................................................................................................................................... 53
4.3.5
GNUPLOT.............................................................................................................................. 53
4.3.6
XGRAPH................................................................................................................................ 54
4.3.7
Trace graph..............................................................................................................................54
Tài liệu tham khảo cho “4.3 Giới thiệu một số công c hỗ trợ việc phân tích hiển thị kết quả
phỏng”:........................................................................................................................................54
4.4 Các bước chính trong việc tiến hành phỏng mạng.......................................................... 54
4.4.1
Tạo bộ lập lịch các sự kiện (Creating Event Scheduler)..........................................................54
4.4.2
Ghi lại vết các sự kiện của mạng phỏng (vào file “*.tr” và/hoặc “*.nam”).......................55
4.4.3
Thiết lập mạng phỏng........................................................................................................55
4.4.3.1
Thiết lập tô-pô..................................................................................................................55
4.4.3.2
Đưa hình lỗi vào đường truyền:................................................................................. 55
4.4.3.3
Chọn thuật toán routing:.................................................................................................. 56
4.4.4
Tạo ra các kết nối tầng giao vận (giao thức TCP, UDP...)................................................... 56
4.4.4.1
Tạo ra các kết nối TCP.....................................................................................................56
4.4.4.2
Tạo ra các kết nối UDP.................................................................................................... 56
4.4.5
Tạo ra các nguồn sinh lưu lượng............................................................................................. 56
4.4.5.1
Lưu lượng do TCP vận chuyển........................................................................................57
4.4.5.2
Lưu lượng do UDP vận chuyển....................................................................................... 57
4.4.6
Xác định thời gian phỏng cần thiết....................................................................................57
4.5 Tài liệu tham khảo cho Chương 4......................................................................................... 57
CHƯƠNG 5 CÁC THÍ DỤ ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG NS-2.....................59
5.1 Thí dụ 1: Tính các tham số hiệu suất chính sự chia sẻ đường truyền của các kết nối TCP,
UDP......................................................................................................................................59
5.1.1
Viết simulation script theo yêu cầu của bài toán..................................................................... 60
5.1.2
Tính các tham số hiệu suất trung bình trong một khoảng thời gian.........................................61
5.1.2.1
Tính thông lượng trung bình của từng kết nối (tcp: 3, udp: 1)......................................... 61
5.1.2.2
Tính độ trễ trung nh của các gói tin theo từng kết nối (tcp: 3, udp: 1)..........................64
5.1.3
Tính các tham số hiệu suất trung nh tại từng thời điểm trong quá trình phỏng.............. 66
5.1.3.1
Vẽ đồ thị thông lượng trung bình của 4 kết nối trong quá trình phỏng...................... 66
5.1.3.2
Tính thăng giáng độ trễ của từng gói tin (Jitter) trong quá trình phỏng..................... 67
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
4
PHỤ LỤC...................................................................................................................................68
1. Chương trình chapter5_sample1.tcl......................................................................................... 68
2. Chương trình avg_throughput_during_sim_time.pl.................................................................70
3. Chương trình avg_delay_during_sim_time.pl..........................................................................71
4. Chương trình throughput.pl..................................................................................................... 72
Thí dụ 1: RED Queue Monitor.................................................................................................... 73
CÁC ĐỀ TÀI SEMINAR CHO HVCH...................................................................................78
Sách:............................................................................................................................................ 78
1.
Chapter 4: Type of Workloads..................................................................................................... 78
2.
Chapter 5: The Art of Workload Selection...................................................................................78
3.
Chapter 6: Workload Characterization Techniques......................................................................78
4.
Chapter 7: Monitors......................................................................................................................78
5.
Chapter 8: Program Execution Monitors and Accounting Logs...................................................78
6.
Chapter 9: Capacity Planning and Benchmarking........................................................................78
7.
Chapter 10: The Art of Data Presentation. Chapter 11: Ratio Games.......................................... 78
8.
Chapter 11: Ratio Games..............................................................................................................78
9.
Chapter 12: Summerizing Measured data.....................................................................................78
10.
Chapter 13: Comparing Systems Using Sample Data................................................................ 78
Bài báo:........................................................................................................................................78
1........................................................................................................................................................78
DANH MỤC I LIỆU THAM KHẢO.................................................................................78
BẢNG CHÚ GIẢI (Index)........................................................................................................80
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
5
CHƯƠNG 1 GIỚI THIỆU
1.1 Khái niệm hiệu năng và các độ đo hiệu năng mạng
1.1.1 Khái niệm hiệu năng mạng
Theo nghĩa chung, hiệu ng một độ đo công việc một hệ thống thực hiện được.
Hiệu năng chủ yếu được xác định bởi sự kết hợp của các nhân tố: nh sẵn sàng để dùng
(availability), thông lượng (throughput) thời gian đáp ứng (response time). Đối với
mạng máy tính, hiệu năng cũng n được xác định dựa trên các nhân tố khác nữa, thí dụ:
thời gian tr (delay), độ tin cậy (reliability), t suất lỗi (error rate), hiệu năng của ứng dụng
v.v.
Tuỳ theo mục đích nghiên cứu cụ thể, hiệu năng thể chỉ bao gồm một nhân tố nào đó
hoặc sự kết hợp một s trong các nhân tố nêu trên.
1.1.2 Các độ đo hiệu năng mạng
th phân các độ đo hiệu năng thành hai loại: các độ đo hướng tới người sử dụng
các độ đo ớng tới hệ thống. Trong các độ đo hướng tới người sử dụng, thời gian đáp
ứng (response time) thường được sử dụng trong các hệ thời gian thực hoặc các môi trường
hệ thống tương tác. Đó khoảng thời gian từ khi một yêu cầu (request) đến hệ thống
cho đến khi được hệ thống thực hiện xong. Trong các hệ thống tương tác, đôi khi người
ta s dụng độ đo thời gian phản ứng của hệ thống (system reaction time) thay cho thời
gian đáp ứng. Đó khoảng thời gian nh từ khi input đến hệ thống cho đến khi yêu cầu
chứa trong input đó nhận được khe thời gian (slice time) phục vụ đầu tiên. Độ đo này đo
mức độ hiệu dụng của bộ lập lịch của hệ thống trong việc nhanh chóng cung cấp dịch vụ
cho một yêu cầu mới đến. Trong các hệ thống mạng máy tính, các đại ợng thời gian đáp
ứng, thời gian phản ứng của hệ thống đều được xem các biến ngẫu nhiên, vậy người
ta thường nói về phân bố, k vọng, phương sai... của chúng [20].
Các độ đo hướng tới hệ thống điển hình thông lượng (throughput) thời gian tr
(delay time, delay). Thông lượng được định nghĩa số đơn vị thông tin tính trung bình
được vận chuyển qua mạng trong một đơn vị thời gian. Đơn v thông tin đây thể bit,
byte hay gói số liệu... Nếu c đơn v thông tin đi o mạng theo một chế độc lập với
trạng thái của mạng, thì thông lượng cũng chính bằng tốc độ đến trung bình nếu mạng vẫn
còn khả năng vận chuyển, không dẫn đến trạng thái bị tắc nghẽn. Một số trường hợp
người ta sử dụng đại ợng không thứ nguyên Hệ số sử dụng đường truyền (Line
Utilization) hay còn gọi thông lượng chuẩn hoá, đó tỉ số của thông lượng trên năng lực
vận chuyển của đường truyền (line capacity). Thời gian trễ thời gian trung bình để vận
chuyển một gói số liệu qua mạng, từ nguồn tới đích. Cũng trường hợp người ta sử dụng
đại lượng thời gian trễ chuẩn hoá, đó tỉ số của thời gian tr trên một tham số thời gian
nào đó, t dụ thời gian cần thiết để truyền một i tin (packet transmition time).
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
6
1.2 Tầm quan trọng của việc đánh giá hiệu năng mạng máy nh
Trong suốt lịch sử tiến hoá của mạng y tính, vấn đề đánh giá và dự đoán hiệu năng
mạng luôn thu hút sự quan m của những người nghiên cứu và thiết kế mạng; mục đích
chính là để nắm được cải thiện đặc trưng giá - hiệu năng (cost-performance). u
cầu đánh giá và dự đoán hiệu năng mạng đặt ra ngay từ khi người ta thiết kế kiến trúc của
hệ thống cho đến khi mạng đã được lắp đặt đưa vào hoạt động. Trong giai đoạn đầu của
quá trình thiết kế, người ta thường phải dự đoán hai điều. Thứ nhất bản chất của các ứng
dụng sẽ chạy trên mạng các yêu cầu dịch vụ c ứng dụng này đòi hỏi hệ thống
mạng phải đáp ứng. Điều dự đoán thứ hai liên quan tới việc lựa chọn một trong các thiết
kế kiến trúc, dựa trên các công nghệ phần cứng phần mềm sẽ được phát triển đưa ra
thị trường trong tương lai, khi hệ thống mạng bước vào giai đoạn triển khai thực hiện.
Sau khi đã lựa chọn kiến trúc bắt đầu thiết kế, triển khai h thống mạng, việc d
đoán đánh giá hiệu năng sẽ trở nên cụ thể hơn. Thí dụ sẽ chọn đường truyền vật như
thế nào, các đặc tính của đường truyền được chọn s nh hưởng thế nào đến hiệu năng của
mạng. Các k thuật được dùng để dự đoán đánh g hiệu năng mạng trong giai đoạn
thiết kế triển khai thực hiện khi chỉ các tính toán bằng tay, nhưng cũng khi
các phỏng rất tinh vi. Việc so sánh hiệu năng dự đoán với hiệu ng thực tế đạt được
thường giúp cho nhà nghiên cứu thấy được c khiếm khuyết chính trong thiết kế hoặc các
lỗi trong việc lập trình hệ thống. Ngày nay, việc dự đoán đánh giá hiệu năng thường
được người ta coi một phần không thể thiếu được của công việc thiết kế triển khai
thực hiện hệ thống.
Định cấu hình mạng: Sau khi mạng đã được triển khai thực hiện, việc dự đoán đánh
giá hiệu năng mạng đối với các ng dụng c thể cũng ý nghĩa quan trọng. Nhằm đạt
được sự tối ưu hoá, nhà sản xuất phải chỉ ra được các cách kết hợp tổ chức phần cứng
phần mềm mạng để đem lại một giải pháp tốt nhất cho các yêu cầu của khách hàng,
việc này thường được gọi định cấu hình mạng. Mặc thể vẫn sử dụng các công cụ
phương pháp đã được sử dụng trong giai đoạn phát triển hệ thống, nhưng cần phải bổ
sung thêm một số yếu tố nữa. Đặc điểm môi trường của người sử dụng sản phẩm mạng
cần được biểu diễn bằng các tham số định lượng đưa vào nh phỏng hiệu năng.
Tinh chỉnh hệ thống: Sau khi hệ thống sản phẩm đã được lắp đặt tại địa điểm của
khách hàng, nhà cung cấp sản phẩm cần phải làm sao cho hệ thống họ bán cho khách
hàng đạt được hiệu năng hoạt động như họ đã hứa hẹn khi chào hàng, việc này được gọi
tinh chỉnh hệ thống. Đối với các hệ thống mạng, việc tìm ra được điểm làm việc tối ưu
ổn định trên toàn mạng rất khó.
1.3 Phân loại các phương pháp đánh giá hiệu năng mạng
nhiều phương pháp đánh giá hiệu năng mạng y tính, thể chia chúng làm ba
loại: hình Giải tích (Analytic Models), hình phỏng (Simulation Models) Đo
hiệu năng (Measurement).
hình Giải tích
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
7
Trong các mạng chuyển mạch gói, gói số liệu các khối d liệu chiều dài thay đổi
được, được truyền qua mạng t nguồn tới đích theo một con đường nào đó do hệ thống
mạng quyết định. Các tài nguyên mạng sẽ được chia sẻ giữa các gói số liệu khi chúng đi
qua mạng. Số ợng chiều dài các gói số liệu đi vào hoặc đi qua mạng tại mọi thời điểm,
thời gian o dài các cuộc kết nối v.v., tất c các tham số này nói chung, thay đổi một cách
thống kê. vậy, để u ra các tiêu chuẩn đo ờng định lượng về hiệu ng, cần phải sử
dụng các khái niệm về xác suất để nghiên cứu sự ơng tác của chúng với mạng. thuyết
Hàng đợi đóng vai trò mấu chốt trong việc phân tích mạng, bởi đó công cụ Toán học
thích hợp nhất để phát biểu giải các bài toán về hiệu năng. Theo phương pháp này,
chúng ta viết ra các mối quan h hàm giữa các tiêu chuẩn hiệu năng cần quan tâm các
tham số của hệ thống mạng bằng các phương trình thể giải được bằng giải tích.
phỏng
Theo nghĩa chung nhất, phỏng sự bắt chước một hay nhiều khía cạnh của sự vật
thực, bằng một cách nào đó càng giống càng tốt. Trong các lĩnh vực nghiên cứu hiện
đại, như lĩnh vực đánh giá hiệu ng mạng, phỏng được hiểu một kỹ thuật sử dụng
máy tính điện tử số để làm các thí nghiệm về mạng liên quan đến thời gian. hình
phỏng tả hành vi động của mạng, ngay c khi người nghiên cứu chỉ quan tâm đến
giá trị trung bình của một số độ đo trong trạng thái dừng. Cấu trúc độ phức tạp của bộ
phỏng phụ thuộc vào phạm vi của thí nghiệm mô phỏng. thường được xây dựng
cấu trúc, cho phép mô-đun hoá chương trình phỏng thành tập các chương trình con,
sao cho việc sửa đổi, bổ sung các chương trình con được dễ dàng. Ngoài ra, chương trình
phỏng cũng phải được xây dựng sao cho đạt được tốc độ cao nhằm làm giảm thời gian
chạy phỏng càng nhiều càng tốt.
Đo
Đó là phương pháp xác định hiệu ng dựa trên việc đo trên mạng thực các tham số
mạng cấu thành độ đo hiệu năng cần quan tâm. Việc đo hiệu năng nhằm thực hiện một
trong các nhiệm vụ sau. Một là, giám sát hiệu năng của mạng . Hai là, thu thập số liệu để
lập hình d liệu vào cho các phương pháp đánh giá hiệu năng bằng giải tích hoặc
phỏng. Nhiệm vụ thứ ba kiểm chứng các mô hình khác dựa trên các số liệu đo được. Đo
hiệu năng không ch quan trọng trong các giai đoạn triển khai thực hiện tích hợp hệ
thống còn cả trong các giai đoạn lắp đặt vận hành hệ thống. Bởi sau khi lắp đặt
đưa vào sử dụng, mỗi một hệ thống cụ thể sẽ một tải hệ thống các độ đo hiệu
năng được quan tâm riêng của nó, cho nên sau khi lắp đặt, người ta thường phải điều chỉnh
cấu hình cho phù hợp. Các tham số cấu hình sẽ được chọn sau khi các phép đo hiệu năng
cho thấy các tham số cấu hình này làm cho hệ thống đạt được hiệu năng tốt nhất. Trong
thực tế, mọi người đều thừa nhận tầm quan trọng của việc đo đánh giá hiệu năng.
Chúng ta thể thấy điều này qua việc, hầu như tất cả các hệ thống mạng đều tích hợp
bên trong c công cụ đo và đánh giá hiệu năng; nhờ đó thể đo hiệu năng bất cứ c
nào trong suốt vòng đời của hệ thống.
So sánh các phương pháp đánh giá hiệu ng
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
8
hình Giải tích: Nếu thể sử dụng hình Giải tích thì đó điều tốt nhất, bởi
chúng ta thể thay đổi các tham số hệ thống cấu hình mạng trong một miền rộng với
chi phí thấp vẫn thể đạt được các kết quả mong muốn. Tuy nhiên, các hình Giải
tích chúng ta xây dựng thường không thể giải được nếu không được đơn giản hoá
nhờ các giả thiết, hoặc được phân thành các nh nhiều cấp. Các nh giải được
thường rất đơn giản hoặc khác xa thực tế, cho nên phương pháp này thường chỉ được sử
dụng ngay trong giai đoạn đầu của việc thiết kế mạng, giúp cho người thiết kế dự đoán
được c giá trị giới hạn của hiệu năng. Ngoài ra, các kết quả của phương pháp này bắt
buộc phải được kiểm nghiệm bằng kết quả của các phương pháp khác, như phỏng hoặc
đo.
phỏng: Trong những trường hợp hình Giải tích chúng ta nhận được, đã
được đơn giản hoá, hoặc phân nhưng vẫn không thể giải được bằng Toán học, khi đó,
nói chung, chúng ta s chỉ còn một phương pháp phỏng. Phương pháp phỏng có
thể được sử dụng ngay trong giai đoạn đầu của việc thiết kế hệ thống mạng, cho đến giai
đoạn triển khai thực hiện tích hợp hệ thống. Phương pháp này nói chung, đòi hỏi một
chi phí rất cao cho việc xây dựng b mô phỏng cũng như kiểm chứng tính đúng đắn của
nó. Tuy nhiên, sau khi đã xây dựng xong bộ phỏng, người nghiên cứu thể tiến hành
chạy chương trình phỏng bao nhiêu lần tuỳ ý, với độ chính xác theo u cầu chi phí
cho mỗi lần chạy thường rất thấp. c kết quả phỏng nói chung vẫn cần được kiểm
chứng, bằng phương pháp giải tích hoặc đo, nhất bằng phương pháp đo. Phương pháp
hình Giải tích mô hình phỏng đóng vai trò rất quan trọng trong việc thiết kế và
triển khai thực hiện h thống, đặc biệt giai đoạn đầu.
Đo: Phương pháp đo chỉ thể thực hiện được trên mạng thực, đang hoạt động,
cũng đòi hỏi chi phí cho các công cụ đo cho việc tiến hành đo. Việc đo cần được tiến
hành tại nhiều điểm trên mạng thực, những thời điểm khác nhau cần lặp đi lặp lại
trong một khoảng thời gian đủ dài, thậm chí thể dài đến hàng tháng. Ngoài ra, người
nghiên cứu phải kiến thức về thuyết thống thì mới có thể rút ra được c kết luận
hữu ích từ các số liệu thu thập được. Mặc dầu vậy, bằng phương pháp đo thể vẫn không
phát hiện ra được hoặc dự đoán được các hành vi đặc biệt của mạng.
Các phương pháp được trình bày trong giáo trình này: giáo trình này trình bày hai
phương pháp đánh giá hiệu năng mạng hình Giải tích phỏng (trong ơng lai,
tác giả sẽ bổ sung thêm phương pháp đo). Bằng hai phương pháp y, đặc biệt bằng
phương pháp phỏng, chúng ta có thể nghiên cứu rất sâu các phương pháp cải thiện
hiệu năng các giao thức, thí dụ các giao thức giao vận như TCP c giao thức MAC
802.3, 802.11, chúng ta có thể “thực hiện” các cải tiến đối với các giao thức đó đánh
giá hiệu quả của c đề xuất cải tiến với một chi phí thấp về thời gian sở vật chất.
1.4 Các lỗi thường gặp
Trong việc đánh giá hiệu suất mạng, người nghiên cứu thể tình mắc phải một số
lỗi do bỏ sót một hay một số yếu tố, hiểu sai vấn đề, thiếu kiến thức v các kỹ thuật đánh
giá hiệu suất...
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
9
Dưới đây liệt các lỗi thường mắc phải khi đánh giá hiệu suất mạng.
1. Không mục đích rõ ràng (No Goal). Trước khi thực hiện đánh giá hiệu suất mạng,
nhất thiết phải xác định các mục tiêu cụ thể cần đạt được gì, trên cơ sở đó lựa
chọn các độ đo hiệu suất, tải đưa vào mạng phương pháp đánh giá v.v. phù hợp.
Nhiệm vụ y nghe qua vẻ đơn giản tầm thường nhưng thực sự không luôn luôn
như vậy.
2. Mục đích thiên lệch (Bias goals). Khi phát biểu mục đích, thể thiên vị một các hiển
nhiên hay thiên vị kiểu ngầm. Thí dụ, nếu như mục đích là: “Hãy chỉ ra rằng h thống
của chúng ta tốt hơn hệ thống của họ”, thì i toán trở thành tìm các độ đo tải sao
cho hệ thống của chúng ta th hiện tốt hơn, chứ không phải việc tìm ra các độ đo
tải đúng đắn để so sánh hai hệ thống. một quy tắc bất thành văn của giới chuyên
gia về đánh giá hiệu suất không thiên vị, người đánh giá hiệu suất cần đóng vai trò
của người giám khảo đưa ra các kết luận dựa trên sự phân tích chứ không dựa trên
niềm tin.
3. Sự tiếp cận thiếu tính hệ thống (Unsystermatic Approach). Người phân tích thường
phỏng theo một cách tiếp cận không tính hệ thống khi chọn một cách tuỳ tiện các
tham s h thống, các nhân tố (factor), các độ đo tải. Vấn đề này sẽ được bàn thêm
kỹ hơn mục 1.5 sau đây.
4. Phân tích không hiểu bài toán (Analysis without Understanding the Problem).
Người phân tích thiếu kinh nghiệm cảm thấy thực sự không đạt được điều khi chưa
xây dựng xong hình chưa nhận được một kết quả bằng con số nào. Đối với
người phân tích kinh nghiệm, họ biết rằng việc xác định bài toán chiếm phần
lớn n lực của họ, tỉ lệ này thể n đến 40%. Điều này củng cố cho một câu châm
ngôn cũ: “một bài toán được phát biểu tốt đã giải được một nửa”. Trong 60% nỗ
lực còn lại, phần ch yếu dành cho các lựa chọn thiết kế, diễn giải các kết quả trình
bày các kết luận. Việc phát triển mô hình bản thân một phần nhỏ của quá trình
giải bài toán, giống như ô tô tàu hoả các phương tiện để đi đến một địa điểm nào
đó chứ không phải chính địa điểm đến. nh là phương tiện để đạt được kết luận
chứ không phải kết luận cuối cùng. Những người phân tích được đào tạo về việc
lập mô hình để đánh giá hiệu suất nhưng không được đào tạo về việc xác định bài toán
hay trình bày kết quả thường thấy c hình của họ bị những người ra quyết định lờ
đi trong khi họ chỉ tìm kiếm sự hỗ trợ của hình chứ không phải chính bản thân
hình.
5. Các độ đo hiệu suất không đúng (Incorrect Performance Metrics): Nói về độ đo nói
về các tiêu chuẩn được sử dụng để lượng hoá hiệu suất của hệ thống. T dụ về các độ
đo hiệu suất thường được sử dụng là: thông ợng (throughput) thời gian đáp ứng
(response time). Việc lựa chọn độ đo hiệu suất đúng phụ thuộc o c dịch vụ hệ
thống hoặc hệ thống con được hình hoá cung cấp. Thí dụ hiệu suất của các CPU
được so sánh trên sở thông lượng của chúng, thường được đo bằng đơn vị MIPS
(Million of Íntruction Per Second). Tuy nhiên việc so sánh MIPS của 2 CPU kiến
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
10
trúc khác nhau, thí dụ RISC CISC nghĩa, bởi c chỉ th mà 2 CPU này thi
hành không ơng đương.
Lỗi thường mắc khi chọn độ đo hiệu suất là: người phân tích thường chọn các độ đo dễ
tính toán, dễ đo đạc chứ không chọn các độ đo thích đáng.
6. Tải mạng không tính chất đại diện (Unrepresentative Workload): Tải được sử dụng
để so sánh 2 hệ thống cần phải đại diện cho việc sử dụng thật sự của hệ thống trong
phạm vi nghiên cứu. Thí dụ, nếu các gói tin trong mạng tính chung sự trộn lẫn của 2
loại kích thước ngắn dài , thì tải được sử dụng để so sánh 2 mạng cần bao gồm bao
gồm các gói tin kích thước dài kích thước ngắn.
Việc lựa chọn tải ảnh hưởng quan trọng đến kết quả của việc nghiên cứu về hiệu
suất. Việc lựa chọn sai tải sẽ dẫn đến các kết luận không chính c.
7. Kỹ thuật đánh giá sai (Wrong Evaluation Technique): 3 kỹ thuật đánh giá: đo,
phỏng và lập hình giải tích. Người phân tích thường có sở thích sử dụng một kỹ
thuật đánh giá cho mọi bài toán đánh giá hiệu suất phải giải quyết. Thí dụ những người
thành thạo thuyết hàng đợi sẽ khuynh hướng chuyển mọi bài toán đánh giá hiệu
suất về bài toán ng đợi, cho hệ thống quá phức tạp thể áp dụng kỹ thuật
đo một cách dễ dàng. Những người thành thạo về lập trình lại có khuynh ớng giải
mọi bài toán bằng kỹ thuật phỏng. Việc người nghiên cứu gắn chặt với một kỹ
thuật duy nhất sẽ dẫn đến một hình anh ta thể giải một cách tốt nhất chứ
không phải một hình giúp giải bài toán theo cách tốt nhất. Vấn đề xảy ra đối với
những sự biến đổi như vậy chúng thể gây ra các hiện tượng lạ trong hình
không trong hệ thống nguyên bản hoặc có thể làm mất đi một số hiện tượng quan
trọng trong hệ thống nguyên bản.
Người phân tích cần các kiến thức bản về cả 3 kỹ thuật. một số nhân tố cần
được xem xét khi phải lựa chọn lấy một kỹ thuật thích hợp. (sẽ được trình bày tại ...).
8. Xem nh các tham số quan trọng (Overlooking Important Parameters): một ý tưởng
tốt liệt đầy đủ các đặc tính (characteristics) của hệ thống của tải nh hưởng
đến hiệu suất của hệ thống. Các đặc tính này được gọi các tham số (parameters). Thí
dụ, các tham số hệ thống thể bao gồm kích thước ợng tử (quantum size) để phân
bổ CPU hay kích thước tập làm việc (working set size) để phân bổ bộ nhớ. Các tham
số về tải thể bao gồm: số NSD, mẫu đến của các yêu cầu (request arrival patterns),
quyền ưu tiên v.v. Người phân tích thể chọn một tập các giá trị cho mỗi một trong
các tham số này; kết quả cuối cùng của việc nghiên cứu phụ thuộc rất mạnh o các
lựa chọn này. Việc xem nhẹ một hay một số tham số quan trọng thể làm cho các kết
quả trở thành dụng.
9. Bỏ qua các yếu tố quan trọng (Ignoring Significant Factors): c tham số sẽ thay đổi
trong quá trình nghiên cứu được gọi nhân tố (factor). T dụ, trong các tham số về
tải đã được liệt trên, chỉ số NSD thể được chọn làm factor; các tham s
khác thể được giữ cố định các giá trị điển hình của chúng. Không phải tất cả các
tham số đều nh hưởng bằng nhau đến hiệu suất. Một việc quan trọng chỉ ra các
tham số nếu chúng thay đổi sẽ ảnh hưởng đáng k đến hiệu suất. Các tham số
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
11
này cần được sử dụng làm factor khi nghiên cứu về hiệu suất. Thí dụ tốc độ đến của
các gói tin ch không phải kích thước gói tin ảnh hưởng đến thời gian phản ứng của
một network gateway, vậy tốt nhất sử dụng một vài giá tr tốc độ đến khác nhau
khi nghiên cứu hiệu suất của (network gateway).
Những factor NSD cuối (hoặc người ra quyết định) th điều khiển được một các
dễ ng cần được ưu tiên hơn các factor không thay đổi được. Đừng ng phí thời
gian vào việc so nh c lựa chọn (alternatives) NSD cuối không thể chấp nhận
hoặc chúng liên quan đến những hành động không thể chấp nhận được đối với
người ra quyết định hoặc vì chúng nằm ngoài phạm vi ảnh hưởng của chúng.
Điều quan trọng hiểu được tính ngẫu nhiên của một hệ thống riêng lẻ các tham số
tải ảnh hưởng đến hiệu suất. Một số trong các tham số này dễ biết được hơn các
tham số khác. Thí dụ một người phân tích thể biết được phân bố của sự tham khảo
trang (page references) trong một hệ thống máy nh nhưng không một ý niệm về
phân bố của sự tham khảo đĩa (distribution of disk references). Trong trường hợp này,
lỗi thường mắc phải việc sử dụng phân bố tham khảo trang như là một factor lại
không sử dụng phân bố tham khảo đĩa, mặc đĩa thể cái cổ chai ảnh
hưởng nhiều hơn đến hiệu suất so với việc tham khảo trang. Việc chọn các factor cần
dựa trên sự liên quan của chúng ch không n dựa trên hiểu biết của người phân ch
về các factor. Cần phải nỗ lực để nhận được các giá trị thực tế của tất cả các tham số
liên quan các phân bố của chúng. Đối với các tham số còn chưa biết, cần phải thực
hiện một sự phân tích nhạy bén (sensitivity analysis) cho thấy ảnh hưởng của sự thay
đổi của các tham số này so với các giá trị được giả định của chúng, để định lượng ảnh
hưởng của các tham s chưa biết.
10.Thiết kế thí nghiệm không thích hợp (Inappropriate Experimental Design): Việc thiết
kế thí nghiệm liên quan đến số các thí nghiệm đo hoặc thí nghiệm phỏng sẽ được
thực hiện các giá trị của tham số được sử dụng trong từng thí nghiệm. Việc chọn c
giá trị này một cách thích hợp sẽ m cho với cùng một số lần làm thí nghiệm thể
nhận được nhiều thông tin hơn. Việc chọn không thích hợp sẽ gây ra lãng phí thời gian
tài nguyên của người phân tích.
Trong một thiết kế non nớt (naive), từng factor được lần ợt thay đổi. Thiết kế y
thể dẫn đến các kết luận sai nếu các tham số tương c đến mức ảnh hưởng của một
tham số phụ thuộc vào các giá tr của các tham số khác. các cách thiết kế khác tốt
hơn, sử dụng thiết kế thực nghiệm phân chia thành thừa số đầy đủ (full factorial
experimental designs) thiết kế phân chia thành thừa số phân đoạn (fractional
factorial designs), được giải thích trong Phần IV [].
11.Mức độ chi tiết không thích hợp (Inappropriate Level of Detail): mức độ chi tiết được
sử dụng trong lập nh một hệ thống ảnh hưởng lớn đến việc phát biểu bài toán.
Cần tránh các phát biểu quá rộng hoặc quá hẹp. Để so sánh các lựa chọn khác nhau
các biến thể khác chút ít của một cách tiếp cận chung, việc xây dựng một hình tích
hợp các biến th hữu ích hơn việc xây dựng một hình mức cao. Mặt khác, để
so sánh các lựa chọn rất khác nhau, c hình mức cao đơn giản thể cho phép
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
12
phân ch một vài lựa chọn một cách nhanh chóng không tốn kém. Một lỗi thường
mắc chọn cách tiếp cận chi tiết khi một mô hình mức cao thể làm được
ngược lại. ràng các mục đích của việc nghiên cứu ảnh hưởng lớn đến những
cái được lập hình việc chúng sẽ được phân tích như thế nào.
12.Thiếu phân ch (No Analysis): Một trong các vấn đề chung của các kế hoạch (project)
đo chúng thường được vận hành bởi những người phân tích hiệu suất, h giỏi về các
kỹ thuật đo nhưng thiếu tinh thông về phân tích số liệu. Họ thu thập một lượng lớn số
liệu, nhưng không biết phải phân ch hoặc diễn dải chúng như thế nào. Kết quả một
bộ băng từ (hoặc bộ đĩa) chứa đầy số liệu mà không một bản m tắt nào. Giỏi lăm,
người phân tích thể tạo ra một bản báo o dày chứa đầy các số liệu thô c đồ
thị không một giải thích về việc người ta th sử dụng các kết quả này như
thế nào. vậy, tốt nhất một đội c nhà phân tích hiệu suất có c kiến thức
sở về đo phân tích.
13.Phân tích sai (Erroneous Analysis): Có một số lỗi chung mà những người phân tích
thường mắc phải trong việc đo, phỏng lập hình giải ch, thí d lấy trung
bình của các tỉ số các phỏng quá ngắn.
14.Thiếu phân tích nhạy bén (No Sensitivity Analysis): c nhà phân tích thường nhấn
mạnh quá mức o các kết quả của s phân ch của họ, bằng cách trình bày chúng như
các sự kiện (fact) chứ không phải là các bằng chứng (evidence). một sự thật
các kết qu có th nhạy cảm đối với tải các tham số hệ thống thường bị bỏ t
(overlook). Nếu thiếu sự phân tích nhạy bén, người ta sẽ không thể chắc chắn rằng các
kết luận có thay đổi hay không nếu sự phân tích được thực hiện với một sự thiết lập
(setting) hơi khác một chút. ng như vậy, nếu thiếu sự phân tích nhạy bén, khó thể
biết được sự quan trọng tương đối của các tham số khác nhau.
15.Bỏ qua các lỗi input (Ignoring Error in Input): Thông thường các tham số cần quan
tâm lại không thể đo được. Thay vào đó, lại thể đo được một biến khác sử dụng
để ước ợng (giá trị của) tham số. T dụ trong một thiết bị mạng, c gói tin được
chứa trong một danh ch móc nối của các b đệm (buffer), mỗi bộ đệm chiều dài
512 byte. Khi biết được số bộ đệm cần để chứa các gói tin, không thể dự đoán được
một cách chính xác số i tin hay số byte trong các gói tin. Những tình huống như
vậy dẫn đến các nh huống bất định bổ sung trong số liệu vào. Người phân tích cần
phải điều chỉnh mức độ tin cậy đầu ra của hình nhận được từ những số liệu như
vậy. Ngoài ra, cũng thể không đáng để lập hình một cách chính xác kích
thước gói tin khi input thể được tắt đi nhiều đến 512 bytes. Thí dụ này còn minh ho
thêm một điểm nữa, đó là các lỗi input không luôn luôn được phân bố đều quanh giá
trị trung bình. Trong trường hợp y, không gian bộ đệm luôn lớn hơn số lượng byte
thực sự được truyền lên mạng hoặc được nhận từ mạng. Nói ch khác, input bị thiên
lệch.
16.Xử không đúng đắn các giá trị khác thường (Improper Treatment of Outlier): Các
giá trị quá cao hoặc quá thấp so với đa số các giá trị trong một tập được gọi các giá
trị khác thường (outliers). Các giá trị khác thường input hoặc output của hình
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
13
biểu thị một vấn đề. Nếu một giá trị khác thường không phải do một hiện tượng của hệ
thống thực gây ra, thì cần bỏ qua nó. Việc sử dụng cả giá trị y có thể tạo ra một
hình hỏng. Mặt khác, nếu giá trị khác thường thể xuất hiện trong hệ thống thực,
cần được đưa vào hình một cách thích hợp. Việc bỏ qua không sử dụng giá trị y
sẽ tạo ra một hình hỏng. Việc xác định giá trị khác thường nào cần bỏ qua, giá trị
khác thường nào cần đưa vào một phần của nghệ thuật đánh giá hiệu suất đòi hỏi
sự hiểu biết kỹ càng về hệ thống được lập nh.
17.Giả thiết sẽ không thay đổi trong tương lai (Assuming No Change in the Future):
Người ta thường giả thiết rằng ơng lai giống với quá khứ. Một hình dựa trên
việc sử dụng tải hiệu suất quan t được trong quá kh để dự đoán hiệu suất trong
tương lai. Tải hành vi hệ thống trong tương lai được gi thiết ơng tự với tải
hành vi hệ thống đã được đo. Người phân tích những người ra quyết định cần thảo
luận về giả thiết y định giới hạn thời gian trong tương lai cho việc áp dụng các dự
đoán.
18.Bỏ qua nh biến thiên (Ignoring Variability): Người ta thường chỉ phân tích hiệu suất
trung bình bởi việc xác định tính biến thiên thường khó, thậm chí không thể
thực hiện được. Nếu tính biến thiên cao, việc chỉ sử dụng giá trị trung nh thể
làm người ra quyết định bị sai lầm. T dụ, các quyết định dựa trên việc nh giá trị
trung bình hàng ngày của yêu cầu sử dụng y tính th không giá trị nếu u cầu
về tải nhiều giá trị cao điểm (peak) ng giờ, chúng ảnh ởng bất lợi đến hiệu suất
của người sử dụng.
19.Phân tích quá phức tạp (Too Complex Analysis): Khi đã biết 2 phép phân tích dẫn đến
cùng một kết luận, thì phép phân tích đơn giản hơn, dễ giải thích hơn ràng nên được
sử dụng. Người phân tích hiệu suất cần truyền đạt các kết luận cuối cùng theo cách
càng đơn giản càng tốt. Một số người phân tích bắt đầu với các mô hình phức tạp
các mục tiêu quá tham vọng, dẫn đến việc không thể giải được, hoặc không thể đo
được hoặc phỏng được, kết cục không th đạt được mục đích. Tốt nhất hãy bắt
đầu nghiên cứu với c hình hay phép đo đơn giản, sau khi nhận được một số kết
quả hoặc thấu hiểu được vấn đề, sẽ tăng độ phức tạp của hình hoặc phép đo.
sự khác nhau đáng kể giữa các kiểu hình được công bố trong tài liệu các
hình được sử dụng trong thực tế. Các hình trình bày trong các i liệu thường
được giảng dạy trong các nhà trường thường quá phức tạp. do các hình
tầm thường, cho rất sáng tỏ, cũng thường không được chấp nhận cho xuất bản.
một số do, khả năng phát triển giải một mô hình phức tạp được giới hàn lâm đánh
giá cao hơn so với việc rút ra được các kết luận từ các hình đơn giản. Tuy nhiên,
trong giới công nghiệp, những người ra quyết định hiếm khi quan tâm đến kỹ thuật lập
hình hay tính mới của nó. Quan m chủ yếu của họ sự tính dẫn dắt của hình
cùng với thời gian chi phí để phát triển hình. Thời hạn ra quyết định thường dẫn
đến việc chọn các hình đơn giản. Chính vậy, đa số các vấn đề về hiệu suất hàng
ngày trong thế giới thực được giải quyết bằng các mô hình đơn giản; các hình phức
tạp hiếm khi, thậm chí không bao gi được s dụng. Ngay cả khi thời gian để phát
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
14
triển hình không bị hạn chế, người ra quyết định cũng không dễ ràng hiểu được các
hình phức tạp, vì vậy kết quả của các hình này cũng không được tin ởng.
Chính điều này làm những người mới tốt nghiệp, được đào tạo rất tốt về các kỹ thuật
lập hình phức tạp thất vọng họ thấy rất ít hội sử dụng chúng trong thực tế.
20.Biểu diễn kết quả không thích hợp (Improper Presentation of Results): Mục đích cuối
cùng của việc nghiên cứu hiệu suất trợ giúp cho việc ra quyết định. Việc phân tích
không tạo ra được các kết quả hữu dụng việc làm thất bại. ơng tự như vậy, việc
phân ch với các kết quả người ra quyết định không thể hiểu nổi ng thất bại.
Người ra quyết định th nhà thiết kế hệ thống, người mua hệ thống hoặc người
tài trợ cho dự án. Việc truyền đạt (hoặc bán) các kết quả của việc phân tích cho người
ra quyết định trách nhiệm của người phân tích. Điều này đòi hỏi việc sử dụng không
ngoan từ ngữ, các bức ảnh và đồ thị để giải thích các kết quả việc phân tích. Độ đo
đúng để đo hiệu suất của một người phân tích không phải số phép phân tích đã được
thực hiện số phép phân tích đã giúp ích cho người ra quyết định.
21.Bỏ qua các yếu tố hội (Ignoring Social Aspects): Việc trình y thành công các kết
quả phân tích đòi hỏi phải 2 loại k năng: kỹ ng về hội kỹ ng thực s
(substantive skills). Viết nói các kỹ năng về hội, trong khi đó việc lập hình
phân tích các kỹ năng thật sự. Hầu hết các nhà phân tích đều loại kỹ ng thực
sự tốt; tuy nhiên chỉ những người kỹ năng hội tốt thành công trong việc bán
các kết quả của họ cho những người ra quyết định. Việc chấp nhận các kết quả phân
tích đòi hỏi việc th hiện sự tin cậy giữa những người ra quyết định người phân tích
việc trình bày các kết quả trước người ra quyết định thao một cách thức người ra
quyết định thể hiểu được. Nếu người ra quyết định không tin hoặc không hiểu sự
phân tích, thì người phân tích đã thất bại trong việc gây ảnh hưởng lên quyết định cuối
cùng. Các k năng v mặt hội đặc biệt quan trọng trong việc trình bày các kết quả
trái với những điều người ra quyết định vẫn tin hoặc trong việc trình bày các giá trị
đòi hỏi những sự thay đổi lớn trong thiết kế.
Những người phân tích mới vào nghề thường không hiểu được rằng, các kỹ năng về
mặt xã hội thường quan trọng hơn so với các kỹ năng thực sự. Các phân ch chất
lượng cao có thể bị từ chối chỉ do người phân tích thiếu nỗ lực thời gian trong việc
trình bày các kết quả. Người ra quyết định thường bị sức ép về thời gian muốn đi
đến các kết qu cuối cùng càng sớm càng tốt. Họ thường không quan tâm đến tính chất
mới của sự tiếp cận hay chính sự tiếp cận. Mặt khác, người phân tích sau khi đã bỏ ra
rất nhiều thời gian cho việc phân tích, lại cố nói với người ra quyết định về tính chất
mới của việc tiếp cận lập hình, ch không phải v các kết quả cuối ng. Sự
khác biệt về quan điểm này thể dẫn đến một báo cáo quá dài, không gây được ảnh
hưởng. Vấn đề này lại b m cho trầm trọng thêm bởi việc người phân tích cũng muốn
trình y các kết quả cho các đồng nghiệp của mình, họ cũng là những nhà phân tích
muốn hiểu biết thêm chủ yếu về việc tiếp cận chứ không phải c kết quả cuối
cùng. vậy, một giải pháp cho vấn đề này chuẩn bị 2 bài trình y (hoặcbáo cáo)
riêng biệt cho 2 đối tượng người nghe. Bài trình bày cho người ra quyết định cần
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
15
thật ít các thuật ng chuyên môn về phân tích cần nhấn mạnh đến các kết quả cuối
cùng; trong khi đó i trình bày cho các nhà phân tích khác cần được bổ sung thêm tất
cả các chi tiết của các kỹ thuật phân tích. Việc kết hợp 2 bài trình bày này làm một
thể làm cho trở nên nghĩa cho cả 2 đối tượng nghe.
Người phân tích không kinh nghiệm thường cho rằng người ra quyết định cũng
giống như họ cùng chia sẽ những niềm tin, các giá trị, ngôn ng các thuật ngữ
chuyên môn. Điều này thương sai. Người ra quyết định thể giỏi trong việc đánh
giá các kết quả phân tích, nhưng thể không hiểu biết nhiều về chính việc phân tích.
vị trí của người ra quyết định, họ phải cân nhắc một vài yếu tố (factor) người
phân tích thể cho không quan trọng, thí dụ như ảnh hưởng chính trị của quyết
định, sự chậm trễ trong các thủ tục của dự án hoặc việc sẵn người hay không để
thực thi một quyết định cụ thể nhất định. Người phân tích cố gắng hiểu được những
điều quan tâm của người ra quyết định tích hợp chúng vào trong bài trình bày của
mình càng nhiều càng tốt sẽ được cơ hội tốt n để bán” kết quả phân tích của
mình, so với những người chỉ nhìn thấy sự vật theo quan điểm của chính mình.
22.Lờ đi các giả thiết hạn chế đã sử dụng khi trình bày phân tích (Omitting
Assumptions and Limitations): Các giả thiết hạn chế của sự phân tích thường bị l
đi trong báo cáo cuối cùng. Điều này thể làm cho NSD áp dụng sự phân tích vào
ngữ cảnh khác, trong đó các giả thiết không giá trị. Đôi khi người phân tích liệt
các gi thiết tại đầu báo cáo sau đó quên mất các hạn chế tại cuối (báo cáo) đưa
ra các kết luận về những môi trường phân tích của anh ta không áp dụng được.
1.5 Tiếp cận một cách hệ thống để tránh mắc lỗi
Hầu hết các bài toán về đánh giá hiệu suất duy nhất. Các độ đo, tải mạng các kỹ
thuật đánh giá được sử dụng cho i toán này thường không s dụng được cho c bài
toán khác. Tuy nhiên, các i toán đánh giá hiệu suất mạng vẫn các bước đi chung, cần
tuân theo để tránh mắc c lỗi trình bày trên.
1. Phát biểu mục tiêu xác định hệ thống (State Goals and Define the System): Bước
đầu tiên trong mọi dự án đánh giá hiệu suất phát biểu các mục đích của việc nghiên
cứu xác định những cấu thành nên hệ thống bằng việc vạch ra biên giới của hệ
thống. Khi đã cho cùng một một tập hardware software, định nghĩa của hệ thống
thể thay đổi phụ thuộc vào các mục đích của việc nghiên cứu. T dụ cho biết 2 CPU,
mục đích có thể đánh giá ảnh ởng của chúng lên thời gian phản ng của những
NSD ơng tác. Trong trường hợp này hệ thống thể bao gồm hệ thống chia sẻ thời
gian, các kết luận của việc nghiên cứu thể phụ thuộc mạnh vào các thành phần n
ngoài CPU. Mặt khác, nếu 2 CPU về căn bản giống nhau ngoại trừ các ALU của
chúng, còn mục đích của sự nghiên cứu là quyết định nên chọn ALU nào, thì thể coi
CPU là một hệ thống ch các thành phần bên trong CPU thể được coi thành
phần của hệ thống.
Việc lựa chọn biên giới của hệ thống ảnh hưởng đến các độ đo hiệu suất cũng như đến
tải được sử dụng để so sánh các hệ thống. vậy, việc biết được biên giới của hệ thống
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
16
quan trọng. Mặc dầu trong các đối tượng của việc nghiên cứu, việc thiết lập biên
giới hệ thống sự xem t chủ yếu, vẫn cần phải tính đến những sự xem xét khác nữa,
chẳng hạn như việc quản lý hành chính của những người bảo trợ cho việc nghiên cứu.
Nếu những người bảo trợ không quyền điều khiển một số thành phần, h có thể
muốn để các thành phần y nằm ngoài biên giới của hệ thống.
2. Lên danh sách các dịch vụ các kết quả thể (List Services and Outcomes): Mỗi
hệ thống cung cấp một tập các dịch vụ. Thí dụ, một mạng y tính cho phép NSD của
gửi các gói tin đến các đích được ch ra. Một hệ thống CSDL đáp ng các truy vấn.
Một bộ xử thực hiện một số ch thị khác nhau. Bước tiếp theo của việc phân tích một
hệ thống lên danh ch các dịch vụ này. Khi NSD yêu cầu bất kỳ dịch vụ nào trong
số các dịch vụ, thể một s kết quả. Một số trong các kết qu này được mong
đợi còn một số không. Thí dụ, một hệ thống CSDL có thể trả lời một truy vấn một
cách đúng đắn, không đúng (do cập nhật không nhất quán) hoặc thậm c không tr lời
(do deadlock hay các vấn đề tương tự). Một danh sách các dịch vụ và các kết quả
thể rất hữu ích sau này cho việc lựa chọn các độ đo tải đúng.
3. Chọn lựa các độ đo hiệu suất (Select Metrics): Bước tiếp theo chọn các tiêu chuẩn
để so sách hiệu suất. Các tiêu chuẩn này được gọi độ đo. Nói chung, các độ đo liên
quan đến tốc độ, độ chính xác tính sẵn sàng sử dụng của các dịch vụ. Hiệu suất của
mạng, t dụ được đo bởi tốc độ (thông lượng độ trễ), độ chính xác (t suất lỗi)
tính sẵn sàng để dùng (availability) của các gói tin được gửi. Hiệu suất của một bộ xử
được đo bằng tốc độ (thời gian thi hành) của các ch thị khác nhau.
4. Lên danh sách các tham số (List Parameter): ớc tiếp theo trong các dự án v hiệu
suất tạo ra một danh sách tất cả các tham số ảnh hưởng đến hiệu suất. Danh sách
này thể được chia thành các tham số hệ thống các tham số tải. Các tham số hệ
thống bao gồm cả các tham số phần cứng lẫn các tham số phần mềm, chúng thường
không thay đổi trong số các sự cài đặt khác nhau của hệ thống. Các tham số tải được
đặc trưng bởi các yêu cầu của NSD, chúng thường thay đổi từ sự i đặt đến sự cài đặt
khác.
Danh sách các tham số có thể không đầy đủ; nghĩa là, sau khi trải qua một lần phân
tích, bạn thể phát hiện ra rằng, các tham số bổ sung thêm ảnh ởng đến hiệu
suất. Sau đó bạn thể bổ sung các tham số này vào danh sách; Tuy nhiên tại mọi thời
điểm cần phải giữ cho danh sách này ng bao gồm toàn diện càng tốt. Điều này cho
phép người phân tích người ra quyết định thảo luận về ảnh ởng của các tham số
khác nhau định dữ liệu nào cần được thu thập trước hoặc trong khi phân tích.
5. Lựa chọn các yếu tố để nghiên cứu (Select Factors to Study): Danh sách các tham số
được chia thành 2 phần: các tham số sẽ thay đổi trong quá trình đánh giá các tham
số sẽ không thay đổi. Các tham số sẽ thay đổi được gọi là factor (yếu tố) các giá trị
của chúng được gọi các mức (levels). Nói chung, danh sách các factor các mức
thể của chúng lớn hơn so với giới hạn các tài nguyên sẵn cho phép. Nói
cách khác, danh sách này tiếp tục lớn dần lên cho đến khi người ta thấy rằng không
đủ i nguyên để nghiên cứu vấn đề. Tốt hơn cả bắt đầu nghiên cứu với một danh
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
17
sách ngắn các factor một số lượng nhỏ các mức cho mỗi factor mở rộng danh
sách pha tiếp theo của dự án nếu các tài nguyên còn cho phép. Thí dụ, bạn thể
quyết định chỉ 2 factor: kích thước ợng tử số người sử dụng. Với mỗi một
trong 2 factor này bạn chỉ thể chọn 2 mức: nhỏ lớn. Kích thước tập m việc
kiểu của tải thể được c định.
Các tham số được cho rằng ảnh ởng lớn đến hiệu suất tốt nhất được chọn làm
factor. Giống như các độ đo, lỗi thường gặp trong việc lựa chọn các factor là: các tham
số dễ làm thay đổi đo được sử dụng làm factor, trong khi đó các tham số ảnh
hưởng hơn bị lờ đi đơn giản chỉ bởi các khó khăn liên quan đến chúng.
Trong việc chọn factor, điều quan trọng xem xét các ràng buộc về kinh tế, chính trị
công nghệ đang có cũng như việc bổ sung thêm vào các giới hạn sự điều khiển
của người ra quyết định áp đặt lên thời gian hiệu lực của quyết định. Điều y
làm tăng may của việc tìm một giải pháp chấp nhận được thực hiện được.
6. Lựa chọn kỹ thuật đánh giá hiệu suất (Select Evaluation Technique): Ba kỹ thuật được
sử dụng rộng rãi cho việc đánh giá hiệu suất là: lập hình giải tích, phỏng đo
trên hệ thống thực. Việc lựa chọn một kỹ thuật đúng phụ thuộc vào thời gian các tài
nguyên sẵn để giải bài toán mức độ đòi hỏi v độ chính xác.
7. Lựa chọn tải đưa vào mạng (Select Workload): Tải bao gồm một danh sách các yêu
cầu (request) dịch vụ đối với hệ thống. Thí dụ, tải cho việc so sánh một s hệ cơ sở dữ
liệu có thể bao gồm một tập các truy vấn (queries). Tuỳ thuộc vào kỹ thuật đánh giá đã
được chọn, tải thể được biểu diễn ới các dạng khác nhau. Đối với kỹ thuật Lập
hình giải tích, tải thường được biểu diễn như xác suất của các u cầu khác
nhau. Đối với phỏng, người ta thể sử dụng vết (trace) của các yêu cầu được đo
trên hệ thống thực. Đối với kỹ thuật đo, tải thể bao gồm các script của người sử
dụng sẽ được thi nh trên hệ thống. Trong mọi trường hợp, điều cốt yếu là tải phải
mẫu đại diện của việc sử dụng hệ thống trong thực tế (real life). Để sinh ra tải tính
chất đại diện, cần phải đo tả (characterize) tải trên các hệ thống đang tồn tại.
8. Thiết kế thí nghiệm (Design Experiments): Một khi bạn đã danh sách c factor
các mức của chúng, bạn cần quyết định một dãy các thí nghiệm để cho ra một lượng
thông tin lớn nhất với nỗ lực nh nhất. Trong thực tế, tiến hành thí nghiệm trong 2 pha
hữu ích. Trong pha thứ nhất, số factor thể lớn nhưng s mức thì nhỏ. Mục đích
để xác định ảnh hưởng liên quan của các factor khác nhau. Trong hầu hết c trường
hợp, việc này thể thực hiện bằng thiết kế thí nghiệm thừa số phân đoạn (fractional
factorial experimental designs) (được trình bày tại Part IV của cuốn sách). Trong pha
thứ hai, số factor được giảm xuống còn số mức của các factor ảnh ởng đánh kể
được tăng lên.
9. Phân tích diễn giải số liệu thu được (Analyze and Interpret Data): Một điều quan
trọng cần phải nhận thức các kết quả của việc đo hoặc phỏng các đại ợng
ngẫu nhiên theo nghĩa kết quả thể khác mỗi khi thí nghiệm được lặp lại. Trong
việc so sánh 2 lựa chọn (alternatives), cần phải xét đến sự thay đổi của các kết quả.
Nếu ch so nh các giá trị trung bình thể dẫn đến các kết luận không chính xác.
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
18
(Các kỹ thuật thống để so sách 2 lựa chọn được trình y chương 13 của cuốn
sách).
Việc biểu diễn các kết qu của một phép phân tích một phần cốt yếu của ngh thuật
phân tích. Cần phải hiểu rằng, sự phân tích chỉ sinh ra các kết quả chứ không sinh ra
các kết luận. Kết quả tạo ra sở, dựa trên đó người phân tích hoặc người ra quyết
định thể rút ra c kết luận. Khi một số người phân tích được trao cùng một tập c
kết quả, mỗi người phân tích thể rút ra một kết luận khác nhau.
10.Trình bày kết quả (Present Results): ớc cuối cùng của mọi đề án về hiệu suất
truyền đạt các kết quả đến các thành viên khác của nhóm ra quyết định (decision-
making team). Điều quan trọng các kết quả phải được trình bày theo cách dễ hiểu.
Việc này thường đòi hỏi trình bày kết quả dưới dạng đồ th chứ không phải bằng các
thuật ngũ chuyên môn về thống kê. Các đồ thị cần chia tỉ lệ thích hợp. Vấn đề vẽ đồ thị
đúng được bàn luận tiếp chương 10).
Thông thường, đến giai đoạn này của dự án, các kiến thức thu được từ việc nghiên cứu
thể đòi hỏi người phân tích quay trở lại xem xét lại một s quyết định các bước
trước đó. Thí dụ, người phân tích thể muốn định nghĩa lại các ranh giới của hệ
thống hay bổ sung thêm các factor các độ đo hiệu suất khác trước đó chưa được
xem xét. vậy ,dự án toàn bộ bao gồm một vài chu trình qua các bước chứ không
phải chỉ đi một lần qua các bước.
1.6 Tài liệu tham khảo cho Chương 1
[1.1] Rij Jain (1992), The art of Computer systems Performance Analysis: Techniques for
Experimental Design, Measurement, Simulation, and Modeling, Wiley, 1992.
[1.2] Hiashi Kobayashi (1978), Modeling and Analyis: An Introduction to System Performance
Evaluation Methodology, Addition-Wesley, Massachusetts.
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
19
CHƯƠNG 2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU NĂNG MẠNG
2.2 hình Giải tích
Khi sử dụng thuyết Hàng đợi để giải bài toán đánh giá hiệu ng, người ta thường
phải đưa ra nhiều giả thuyết để đơn giản hoá mô hình. những giả thuyết có vẻ như phi
thực tế hoặc đơn giản hoá quá mức, tuy nhiên, kết qu thu được lại rất phù hợp với các kết
quả của phương pháp phỏng hoặc phương pháp thực nghiệm. Điều quan trọng đối với
nhà nghiên cứu đưa ra được các giả thiết làm cho hình trở nên càng đơn giản càng
tốt vẫn đạt được một độ chính c cần thiết của các kết quả dự đoán đánh giá hiệu
năng [39].
Mạng máy tính thể được lập hình như một mạng hàng đợi. Khách hàng
(customer) của các hàng đợi các gói số liệu đến yêu cầu được truyền đi, còn người
phục vụ (server) chính các phương tiện truyền, bao gồm hệ chuyển mạch đường kết
nối vật lý, hoặc nói đơn giản hơn đường truyền. Hầu hết các vấn đề liên quan đến hiệu
năng đều liên quan tới thời gian các gói số liệu phải xếp hàng chờ được phục vụ. Đây
một độ đo quan trọng để đánh giá hiệu năng, bởi là một thành phần của thời gian
trễ chuyển tiếp gói số liệu từ thực thể nguồn tới thực thể đích, được gọi tắt thời gian trễ
đầu cuối - đầu cuối, một yếu tố của hiệu năng mạng người sử dụng nhận thấy được.
Tất nhiên, thời gian chờ cũng phụ thuộc vào thời gian x của nút và chiều dài của gói số
liệu. cũng còn ph thuộc vào dung lượng đường truyền, tức khả năng truyền, đo
bằng packet/s, phụ thuộc vào chiến lược phục vụ được áp dụng các hàng đợi. thuyết
Hàng đợi thể đưa tất c các yếu tố này o trong hình; tuy nhiên, khi nghiên cứu
định lượng về chuyển mạch gói, trong những điều kiện cụ thể, người ta th bỏ qua một
số tham số, làm cho bài toán đơn giản n vẫn không làm giảm nhiều độ chính xác của
kết quả thu được.
Chúng ta hãy xem xét hình đơn giản nhất của một hàng đợi được tả trên hình
2.1, với ngữ cảnh mạng chuyển mạch gói. Giả sử rằng các gói số liệu đến một cách ngẫu
nhiên với tốc độ đến trung nh packet/s, tốc độ phục vụ của người phục vụ
packet/s. Hàng đợi trên hình vẽ chứa c gói số liệu, chúng đang xếp hàng chờ được phục
vụ - được phát ra đường truyền; người phục vụ phương tiện truyền hay đường truyền,
tốc độ truyền hay còn gọi dung lượng đường truyền thường được tính theo đơn vị bit/s,
dưới đây được ký hiệu C. Nếu chiều dài gói số liệu trung bình tính bằng bit 1/
được cho bằng đơn vị bit/packet, thì = ’C tốc độ truyền tính bằng đơn vị packet/s.
Hình 2.1 hình hàng đợi một người phục vụ
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng y tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN
.
20
ràng rằng, khi tốc độ đến của các i số liệu tiến tới dung lượng đường truyền
thì hàng đợi bắt đầu hình thành. Với một hàng đợi hữu hạn, khi vượt quá tiếp tục
tăng lên, bộ đệm sẽ đầy, tất cả các gói số liệu đến sau sẽ bị chặn lại, trong hàng đợi
không còn chỗ trống cho chúng. Nếu giả thiết bộ đệm hạn cho đơn giản (đây giả
thiết nhằm đơn giản hoá việc phân tích), hàng đợi sẽ trở nên không ổn định khi .
Người ta đã chứng minh được rằng < điều kiện đảm bảo cho sự ổn định của một hàng
đợi một người phục vụ [38], [41]. Đặc biệt, chúng ta sẽ tìm tham số /, thường
được gọi độ sử dụng đường truyền hoặc tải chuẩn hoá, đó tỉ số của tải của hệ thống
trên năng lực của hệ thống. Tham số đóng vai trò then chốt trong việc phân tích hàng đợi.
Đối với hàng đợi có một người phục vụ, khi tiến tới vượt quá một, vùng tắc nghẽn
sẽ xuất hiện, thời gian trễ bắt đầu ng nhanh, các gói số liệu đến sẽ bị chặn lại một ch
thường xuyên hơn.
Để nghiên cứu định lượng về thời gian trễ, sự chặn (blocking), thông ợng mối
quan hệ của chúng với cả tốc độ phục vụ lẫn kích thước của bộ đệm, chúng ta cần một
hình hệ thống hàng đợi chi tiết hơn mô nh hàng đợi trên hình 2.1. Trong nh này
các tham số hiệu năng phụ thuộc vào các xác suất trạng thái hàng đợi, với trạng thái được
định nghĩa số gói số liệu trong hàng đợi, k cả gói số liệu đang được phục vụ nếu
hàng đợi không rỗng. Để tính các xác suất trạng thái, ta phải biết:
Quá trình đến của các gói số liệu (thống các gói s liệu mới đến).
Phân bố của chiều dài các gói số liệu (phân bố thời gian phục vụ).
Chiến ợc phục vụ (thí dụ: FCFS, FIFO - đến trước phục vụ trước, hay LCFS - đến
sau phục vụ trước v.v).
Đối với các hàng đợi nhiều người phục vụ, xác suất trạng thái còn phụ thuộc vào số
lượng người phục vụ nữa.
Dưới đây, trong nhóm tiểu mục 2.2.1 2.2.2, chúng tôi trình bày tóm tắt một số kết
quả nghiên cứu về thuyết Hàng đợi [38], [41], trong ng cảnh mạng máy tính, được
chúng tôi áp dụng trong Chương 3, mục 3.2 của bản Luận án này.
2.2.1 Quá trình Poisson các tính chất của
Đây quá trình ngẫu nhiên được sử dụng thường xuyên nhất trong thuyết Hàng đợi
để lập hình cho sự đến sự phục vụ trong một hệ thống mạng máy nh. Quá trình
Poisson tả một tập hợp các sự đến của các gói số liệu, trong đó khoảng thời gian giữa
hai gói đến liên tiếp độc lập được phân b theo hàm với giá trị trung bình
t 1/ , với tốc độ đến trung bình. Xác suất k i đến trong khoảng thời gian t là:
P
k
(t)
(t)
k
k!
e
t
(2-1)

Preview text:

PGS. TS. NGUYỄN ĐÌNH VIỆT BÀI GIẢNG
ĐÁNH GIÁ HIỆU NĂNG MẠNG MÁY TÍNH HÀ NỘI - 2008
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 2 MỤC LỤC
CHƯƠNG 1 GIỚI THIỆU. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1 Khái niệm hiệu năng và các độ đo hiệu năng mạng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.1 Khái niệm hiệu năng mạng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.2 Các độ đo hiệu năng mạng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5
1.2 Tầm quan trọng của việc đánh giá hiệu năng mạng máy tính. . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Phân loại các phương pháp đánh giá hiệu năng mạng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6
1.4 Các lỗi thường gặp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8
1.5 Tiếp cận một cách có hệ thống để tránh mắc lỗi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6 Tài liệu tham khảo cho Chương 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
CHƯƠNG 2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU NĂNG MẠNG. . . . . . . . . . . . . . 19
2.2 Mô hình Giải tích. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19
2.2.1 Quá trình Poisson và các tính chất của nó. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2.2 Hàng đợi M/M/1 và một số kết quả. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.2.1 Xác suất trạng thái cân bằng của hàng đợi M/M/1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21
2.2.2.2 Đặc trưng thông lượng của hàng đợi M/M/1 hữu hạn. . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.2.3 Kích thước trung bình của hàng đợi M/M/1 hữu hạn. . . . . . . . . . . . . . . . . . . . . . . . . . . .23
2.2.2.4 Công thức Little L=W và áp dụng để tính thời gian trễ trung bình. . . . . . . . . . . . . . . . 24
2.3 Mô phỏng mạng bằng chương trình máy tính. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.1 Giới thiệu chung (under construction). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.2 Ý tưởng xây dựng bộ mô phỏng mạng vận hành theo các sự kiện rời rạc. . . . . . . . . . . . . . . . 25
2.4 Đo trên mạng thực (under construction). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.5 Tài liệu tham khảo cho Chương 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
CHƯƠNG 3 ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG MÔ HÌNH HÀNG ĐỢI. . . . . . . 28
3.1 Mô hình mạch ảo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2 Thí dụ 3.1: Đánh giá hiệu năng của các cơ chế kiểm soát lỗi. . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.1 Kiểm soát lỗi đầu cuối - đầu cuối (end-to-end). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.2 Kiểm soát lỗi theo chặng (link-by-link). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .33
3.2.3 Áp dụng: So sánh cơ chế kiểm soát lỗi đầu cuối - đầu cuối và theo chặng. . . . . . . . . . . . . . . 35
3.2.3.1 So sánh các cơ chế theo chặng và đầu cuối - đầu cuối ở mạng tốc độ thấp. . . . . . . . . . . 35
3.2.3.2 So sánh các cơ chế theo chặng và đầu cuối - đầu cuối ở mạng tốc độ cao. . . . . . . . . . . .37
3.3 Thí dụ 3.2: Đánh giá hiệu năng của cơ chế điều khiển lưu lượng bằng cửa sổ trượt. . . . . . 39
3.3.1 Mô hình cửa sổ trượt với sự biên nhận từng gói số liệu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .39
3.3.1.1 Trường hợp tải rất nặng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3.1.2 Trường hợp tải xấp xỉ bằng khả năng vận chuyển của đường truyền. . . . . . . . . . . . . . . .41
3.3.2 Mô hình cửa sổ trượt với sự biên nhận ở cuối cửa sổ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3.2.1 Trường hợp tải rất nặng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3.2.2 Trường hợp tải xấp xỉ bằng khả năng vận chuyển của đường truyền. . . . . . . . . . . . . . . .44
3.4 Tài liệu tham khảo cho Chương 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
CHƯƠNG 4 ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG BỘ MÔ PHỎNG NS-2. . . . . . . . 46
4.1 Bộ mô phỏng mạng NS-2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.1.1 Giới thiệu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 3
4.1.2 Cấu trúc phần mềm của NS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .48
4.1.3 Lập trình mô phỏng bằng NS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.1.4 Cấu trúc tệp vết (trace file) chứa kết quả mô phỏng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.1.4.1 Cấu trúc tệp vết chứa kết quả mô phỏng mạng có dây. . . . . . . . . . . . . . . . . . . . . . . . . . .50
Tài liệu tham khảo (cho 4.1.4.1):. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.1.4.2 Cấu trúc tệp vết chứa kết quả mô phỏng mạng không dây (under construction). . . . . . . 51
4.1.4.3 Cấu trúc tệp vết chứa kết quả mô phỏng mạng hỗn hợp (under construction). . . . . . . . . 51
4.2 NAM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Tài liệu tham khảo cho “4.2 NAM”:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.3 Giới thiệu một số công cụ hỗ trợ việc phân tích và hiển thị kết quả mô phỏng. . . . . . . . . . 52
4.3.1 Giới thiệu dự án GNU. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.3.2 Grep. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .52
4.3.3 Awk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .53
4.3.4 Perl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3.5 GNUPLOT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3.6 XGRAPH. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.3.7 Trace graph. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Tài liệu tham khảo cho “4.3 Giới thiệu một số công cụ hỗ trợ việc phân tích và hiển thị kết quả
mô phỏng”:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.4 Các bước chính trong việc tiến hành mô phỏng mạng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.4.1 Tạo bộ lập lịch các sự kiện (Creating Event Scheduler). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.4.2 Ghi lại vết các sự kiện của mạng mô phỏng (vào file “*.tr” và/hoặc “*.nam”). . . . . . . . . . . .55
4.4.3 Thiết lập mạng mô phỏng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4.3.1 Thiết lập tô-pô. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4.3.2 Đưa mô hình lỗi vào đường truyền:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4.3.3 Chọn thuật toán routing:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.4 Tạo ra các kết nối ở tầng giao vận (giao thức TCP, UDP. .). . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.4.1 Tạo ra các kết nối TCP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .56
4.4.4.2 Tạo ra các kết nối UDP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.5 Tạo ra các nguồn sinh lưu lượng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.5.1 Lưu lượng do TCP vận chuyển. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4.5.2 Lưu lượng do UDP vận chuyển. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4.6 Xác định thời gian mô phỏng cần thiết. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.5 Tài liệu tham khảo cho Chương 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
CHƯƠNG 5 CÁC THÍ DỤ ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG NS-2. . . . . . . . . . .59
5.1 Thí dụ 1: Tính các tham số hiệu suất chính và sự chia sẻ đường truyền của các kết nối TCP,
UDP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.1.1 Viết simulation script theo yêu cầu của bài toán. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.1.2 Tính các tham số hiệu suất trung bình trong một khoảng thời gian. . . . . . . . . . . . . . . . . . . . .61
5.1.2.1 Tính thông lượng trung bình của từng kết nối (tcp: 3, udp: 1). . . . . . . . . . . . . . . . . . . . . 61
5.1.2.2 Tính độ trễ trung bình của các gói tin theo từng kết nối (tcp: 3, udp: 1). . . . . . . . . . . . . 64
5.1.3 Tính các tham số hiệu suất trung bình tại từng thời điểm trong quá trình mô phỏng. . . . . . . 66
5.1.3.1 Vẽ đồ thị thông lượng trung bình của 4 kết nối trong quá trình mô phỏng. . . . . . . . . . . 66
5.1.3.2 Tính thăng giáng độ trễ của từng gói tin (Jitter) trong quá trình mô phỏng. . . . . . . . . . . 67
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 4
PHỤ LỤC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .68
1. Chương trình chapter5_sample1.tcl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2. Chương trình avg_throughput_during_sim_time.pl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .70
3. Chương trình avg_delay_during_sim_time.pl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4. Chương trình throughput.pl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Thí dụ 1: RED Queue Monitor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
CÁC ĐỀ TÀI SEMINAR CHO HVCH. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78
Sách:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
1. Chapter 4: Type of Workloads. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2. Chapter 5: The Art of Workload Selection. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78
3. Chapter 6: Workload Characterization Techniques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4. Chapter 7: Monitors. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5. Chapter 8: Program Execution Monitors and Accounting Logs. . . . . . . . . . . . . . . . . . . . . . . . . .78
6. Chapter 9: Capacity Planning and Benchmarking. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
7. Chapter 10: The Art of Data Presentation. Chapter 11: Ratio Games. . . . . . . . . . . . . . . . . . . . . 78
8. Chapter 11: Ratio Games. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
9. Chapter 12: Summerizing Measured data. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78
10. Chapter 13: Comparing Systems Using Sample Data. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
Bài báo:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
DANH MỤC TÀI LIỆU THAM KHẢO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78
BẢNG CHÚ GIẢI (Index). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 5
CHƯƠNG 1 GIỚI THIỆU
1.1 Khái niệm hiệu năng và các độ đo hiệu năng mạng
1.1.1 Khái niệm hiệu năng mạng
Theo nghĩa chung, hiệu năng là một độ đo công việc mà một hệ thống thực hiện được.
Hiệu năng chủ yếu được xác định bởi sự kết hợp của các nhân tố: tính sẵn sàng để dùng
(availability), thông lượng (throughput) và thời gian đáp ứng (response time). Đối với
mạng máy tính, hiệu năng cũng còn được xác định dựa trên các nhân tố khác nữa, thí dụ:
thời gian trễ (delay), độ tin cậy (reliability), tỉ suất lỗi (error rate), hiệu năng của ứng dụng v.v.
Tuỳ theo mục đích nghiên cứu cụ thể, hiệu năng có thể chỉ bao gồm một nhân tố nào đó
hoặc là sự kết hợp một số trong các nhân tố nêu trên.
1.1.2 Các độ đo hiệu năng mạng
Có thể phân các độ đo hiệu năng thành hai loại: các độ đo hướng tới người sử dụng và
các độ đo hướng tới hệ thống. Trong các độ đo hướng tới người sử dụng, thời gian đáp
ứng (response time) thường được sử dụng trong các hệ thời gian thực hoặc các môi trường
hệ thống tương tác. Đó là khoảng thời gian từ khi có một yêu cầu (request) đến hệ thống
cho đến khi nó được hệ thống thực hiện xong. Trong các hệ thống tương tác, đôi khi người
ta sử dụng độ đo thời gian phản ứng của hệ thống (system reaction time) thay cho thời
gian đáp ứng. Đó là khoảng thời gian tính từ khi input đến hệ thống cho đến khi yêu cầu
chứa trong input đó nhận được khe thời gian (slice time) phục vụ đầu tiên. Độ đo này đo
mức độ hiệu dụng của bộ lập lịch của hệ thống trong việc nhanh chóng cung cấp dịch vụ
cho một yêu cầu mới đến. Trong các hệ thống mạng máy tính, các đại lượng thời gian đáp
ứng, thời gian phản ứng của hệ thống đều được xem là các biến ngẫu nhiên, vì vậy người
ta thường nói về phân bố, kỳ vọng, phương sai. . của chúng [20].
Các độ đo hướng tới hệ thống điển hình là thông lượng (throughput) và thời gian trễ
(delay time, delay). Thông lượng được định nghĩa là số đơn vị thông tin tính trung bình
được vận chuyển qua mạng trong một đơn vị thời gian. Đơn vị thông tin ở đây có thể là bit,
byte hay gói số liệu. . Nếu các đơn vị thông tin đi vào mạng theo một cơ chế độc lập với
trạng thái của mạng, thì thông lượng cũng chính bằng tốc độ đến trung bình nếu mạng vẫn
còn có khả năng vận chuyển, không dẫn đến trạng thái bị tắc nghẽn. Một số trường hợp
người ta sử dụng đại lượng không thứ nguyên Hệ số sử dụng đường truyền (Line
Utilization) hay còn gọi thông lượng chuẩn hoá, đó là tỉ số của thông lượng trên năng lực
vận chuyển của đường truyền (line capacity). Thời gian trễ là thời gian trung bình để vận
chuyển một gói số liệu qua mạng, từ nguồn tới đích. Cũng có trường hợp người ta sử dụng
đại lượng thời gian trễ chuẩn hoá, đó là tỉ số của thời gian trễ trên một tham số thời gian
nào đó, thí dụ thời gian cần thiết để truyền một gói tin (packet transmition time).
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 6
1.2 Tầm quan trọng của việc đánh giá hiệu năng mạng máy tính
Trong suốt lịch sử tiến hoá của mạng máy tính, vấn đề đánh giá và dự đoán hiệu năng
mạng luôn thu hút sự quan tâm của những người nghiên cứu và thiết kế mạng; mục đích
chính là để nắm được và cải thiện đặc trưng giá - hiệu năng (cost-performance). Yêu
cầu đánh giá và dự đoán hiệu năng mạng đặt ra ngay từ khi người ta thiết kế kiến trúc của
hệ thống cho đến khi mạng đã được lắp đặt và đưa vào hoạt động. Trong giai đoạn đầu của
quá trình thiết kế, người ta thường phải dự đoán hai điều. Thứ nhất là bản chất của các ứng
dụng sẽ chạy trên mạng và các yêu cầu dịch vụ mà các ứng dụng này đòi hỏi hệ thống
mạng phải đáp ứng. Điều dự đoán thứ hai liên quan tới việc lựa chọn một trong các thiết
kế kiến trúc, dựa trên các công nghệ phần cứng và phần mềm sẽ được phát triển và đưa ra
thị trường trong tương lai, khi hệ thống mạng bước vào giai đoạn triển khai thực hiện.
Sau khi đã lựa chọn kiến trúc và bắt đầu thiết kế, triển khai hệ thống mạng, việc dự
đoán và đánh giá hiệu năng sẽ trở nên cụ thể hơn. Thí dụ sẽ chọn đường truyền vật lý như
thế nào, các đặc tính của đường truyền được chọn sẽ ảnh hưởng thế nào đến hiệu năng của
mạng. Các kỹ thuật được dùng để dự đoán và đánh giá hiệu năng mạng trong giai đoạn
thiết kế và triển khai thực hiện có khi chỉ là các tính toán bằng tay, nhưng cũng có khi là
các mô phỏng rất tinh vi. Việc so sánh hiệu năng dự đoán với hiệu năng thực tế đạt được
thường giúp cho nhà nghiên cứu thấy được các khiếm khuyết chính trong thiết kế hoặc các
lỗi trong việc lập trình hệ thống. Ngày nay, việc dự đoán và đánh giá hiệu năng thường
được người ta coi là một phần không thể thiếu được của công việc thiết kế và triển khai thực hiện hệ thống.
Định cấu hình mạng: Sau khi mạng đã được triển khai thực hiện, việc dự đoán và đánh
giá hiệu năng mạng đối với các ứng dụng cụ thể cũng có ý nghĩa quan trọng. Nhằm đạt
được sự tối ưu hoá, nhà sản xuất phải chỉ ra được các cách kết hợp và tổ chức phần cứng
và phần mềm mạng để đem lại một giải pháp tốt nhất cho các yêu cầu của khách hàng,
việc này thường được gọi là định cấu hình mạng. Mặc dù có thể vẫn sử dụng các công cụ
và phương pháp đã được sử dụng trong giai đoạn phát triển hệ thống, nhưng cần phải bổ
sung thêm một số yếu tố nữa. Đặc điểm môi trường của người sử dụng sản phẩm mạng
cần được biểu diễn bằng các tham số định lượng và đưa vào mô hình mô phỏng hiệu năng.
Tinh chỉnh hệ thống: Sau khi hệ thống sản phẩm đã được lắp đặt tại địa điểm của
khách hàng, nhà cung cấp sản phẩm cần phải làm sao cho hệ thống mà họ bán cho khách
hàng đạt được hiệu năng hoạt động như họ đã hứa hẹn khi chào hàng, việc này được gọi là
tinh chỉnh hệ thống. Đối với các hệ thống mạng, việc tìm ra được điểm làm việc tối ưu và
ổn định trên toàn mạng là rất khó.
1.3 Phân loại các phương pháp đánh giá hiệu năng mạng
Có nhiều phương pháp đánh giá hiệu năng mạng máy tính, có thể chia chúng làm ba
loại: mô hình Giải tích (Analytic Models), mô hình Mô phỏng (Simulation Models) và Đo hiệu năng (Measurement).
Mô hình Giải tích
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 7
Trong các mạng chuyển mạch gói, gói số liệu là các khối dữ liệu có chiều dài thay đổi
được, được truyền qua mạng từ nguồn tới đích theo một con đường nào đó do hệ thống
mạng quyết định. Các tài nguyên mạng sẽ được chia sẻ giữa các gói số liệu khi chúng đi
qua mạng. Số lượng và chiều dài các gói số liệu đi vào hoặc đi qua mạng tại mọi thời điểm,
thời gian kéo dài các cuộc kết nối v.v., tất cả các tham số này nói chung, thay đổi một cách
thống kê. Vì vậy, để nêu ra các tiêu chuẩn đo lường định lượng về hiệu năng, cần phải sử
dụng các khái niệm về xác suất để nghiên cứu sự tương tác của chúng với mạng. Lý thuyết
Hàng đợi đóng vai trò mấu chốt trong việc phân tích mạng, bởi vì đó là công cụ Toán học
thích hợp nhất để phát biểu và giải các bài toán về hiệu năng. Theo phương pháp này,
chúng ta viết ra các mối quan hệ hàm giữa các tiêu chuẩn hiệu năng cần quan tâm và các
tham số của hệ thống mạng bằng các phương trình có thể giải được bằng giải tích. Mô phỏng
Theo nghĩa chung nhất, mô phỏng là sự bắt chước một hay nhiều khía cạnh của sự vật
có thực, bằng một cách nào đó càng giống càng tốt. Trong các lĩnh vực nghiên cứu hiện
đại, như lĩnh vực đánh giá hiệu năng mạng, mô phỏng được hiểu là một kỹ thuật sử dụng
máy tính điện tử số để làm các thí nghiệm về mạng có liên quan đến thời gian. Mô hình
Mô phỏng mô tả hành vi động của mạng, ngay cả khi người nghiên cứu chỉ quan tâm đến
giá trị trung bình của một số độ đo trong trạng thái dừng. Cấu trúc và độ phức tạp của bộ
mô phỏng phụ thuộc vào phạm vi của thí nghiệm mô phỏng. Nó thường được xây dựng có
cấu trúc, cho phép mô-đun hoá chương trình mô phỏng thành tập các chương trình con,
sao cho việc sửa đổi, bổ sung các chương trình con được dễ dàng. Ngoài ra, chương trình
mô phỏng cũng phải được xây dựng sao cho đạt được tốc độ cao nhằm làm giảm thời gian
chạy mô phỏng càng nhiều càng tốt. Đo
Đó là phương pháp xác định hiệu năng dựa trên việc đo trên mạng thực các tham số
mạng cấu thành độ đo hiệu năng cần quan tâm. Việc đo hiệu năng nhằm thực hiện một
trong các nhiệm vụ sau. Một là, giám sát hiệu năng của mạng . Hai là, thu thập số liệu để
lập mô hình dữ liệu vào cho các phương pháp đánh giá hiệu năng bằng giải tích hoặc mô
phỏng. Nhiệm vụ thứ ba là kiểm chứng các mô hình khác dựa trên các số liệu đo được. Đo
hiệu năng không chỉ quan trọng trong các giai đoạn triển khai thực hiện và tích hợp hệ
thống mà còn cả trong các giai đoạn lắp đặt và vận hành hệ thống. Bởi vì sau khi lắp đặt
và đưa vào sử dụng, mỗi một hệ thống cụ thể sẽ có một tải hệ thống và các độ đo hiệu
năng được quan tâm riêng của nó, cho nên sau khi lắp đặt, người ta thường phải điều chỉnh
cấu hình cho phù hợp. Các tham số cấu hình sẽ được chọn sau khi các phép đo hiệu năng
cho thấy các tham số cấu hình này làm cho hệ thống đạt được hiệu năng tốt nhất. Trong
thực tế, mọi người đều thừa nhận tầm quan trọng của việc đo và đánh giá hiệu năng.
Chúng ta có thể thấy rõ điều này qua việc, hầu như tất cả các hệ thống mạng đều tích hợp
bên trong nó các công cụ đo và đánh giá hiệu năng; nhờ đó có thể đo hiệu năng bất cứ lúc
nào trong suốt vòng đời của hệ thống.
So sánh các phương pháp đánh giá hiệu năng
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 8
Mô hình Giải tích: Nếu có thể sử dụng mô hình Giải tích thì đó là điều tốt nhất, bởi vì
chúng ta có thể thay đổi các tham số hệ thống và cấu hình mạng trong một miền rộng với
chi phí thấp mà vẫn có thể đạt được các kết quả mong muốn. Tuy nhiên, các mô hình Giải
tích mà chúng ta xây dựng thường là không thể giải được nếu không được đơn giản hoá
nhờ các giả thiết, hoặc được phân rã thành các mô hình nhiều cấp. Các mô hình giải được
thường rất đơn giản hoặc khác xa thực tế, cho nên phương pháp này thường chỉ được sử
dụng ngay trong giai đoạn đầu của việc thiết kế mạng, giúp cho người thiết kế dự đoán
được các giá trị giới hạn của hiệu năng. Ngoài ra, các kết quả của phương pháp này bắt
buộc phải được kiểm nghiệm bằng kết quả của các phương pháp khác, như mô phỏng hoặc đo.
Mô phỏng: Trong những trường hợp mô hình Giải tích mà chúng ta nhận được, dù đã
được đơn giản hoá, hoặc phân rã nhưng vẫn không thể giải được bằng Toán học, khi đó,
nói chung, chúng ta sẽ chỉ còn một phương pháp là mô phỏng. Phương pháp mô phỏng có
thể được sử dụng ngay trong giai đoạn đầu của việc thiết kế hệ thống mạng, cho đến giai
đoạn triển khai thực hiện và tích hợp hệ thống. Phương pháp này nói chung, đòi hỏi một
chi phí rất cao cho việc xây dựng bộ mô phỏng cũng như kiểm chứng tính đúng đắn của
nó. Tuy nhiên, sau khi đã xây dựng xong bộ mô phỏng, người nghiên cứu có thể tiến hành
chạy chương trình mô phỏng bao nhiêu lần tuỳ ý, với độ chính xác theo yêu cầu và chi phí
cho mỗi lần chạy thường là rất thấp. Các kết quả mô phỏng nói chung vẫn cần được kiểm
chứng, bằng phương pháp giải tích hoặc đo, nhất là bằng phương pháp đo. Phương pháp
mô hình Giải tích và mô hình Mô phỏng đóng vai trò rất quan trọng trong việc thiết kế và
triển khai thực hiện hệ thống, đặc biệt là ở giai đoạn đầu.
Đo: Phương pháp đo chỉ có thể thực hiện được trên mạng thực, đang hoạt động, nó
cũng đòi hỏi chi phí cho các công cụ đo và cho việc tiến hành đo. Việc đo cần được tiến
hành tại nhiều điểm trên mạng thực, ở những thời điểm khác nhau và cần lặp đi lặp lại
trong một khoảng thời gian đủ dài, thậm chí có thể dài đến hàng tháng. Ngoài ra, người
nghiên cứu phải có kiến thức về Lý thuyết thống kê thì mới có thể rút ra được các kết luận
hữu ích từ các số liệu thu thập được. Mặc dầu vậy, bằng phương pháp đo có thể vẫn không
phát hiện ra được hoặc dự đoán được các hành vi đặc biệt của mạng.
Các phương pháp được trình bày trong giáo trình này: giáo trình này trình bày hai
phương pháp đánh giá hiệu năng mạng là mô hình Giải tích và Mô phỏng (trong tương lai,
tác giả sẽ bổ sung thêm phương pháp đo). Bằng hai phương pháp này, đặc biệt là bằng
phương pháp Mô phỏng, chúng ta có thể nghiên cứu rất sâu các phương pháp cải thiện
hiệu năng các giao thức, thí dụ các giao thức giao vận như TCP và các giao thức MAC
802.3, 802.11, chúng ta có thể “thực hiện” các cải tiến đối với các giao thức đó và đánh
giá hiệu quả của các đề xuất cải tiến với một chi phí thấp về thời gian và cơ sở vật chất.
1.4 Các lỗi thường gặp
Trong việc đánh giá hiệu suất mạng, người nghiên cứu có thể vô tình mắc phải một số
lỗi do bỏ sót một hay một số yếu tố, hiểu sai vấn đề, thiếu kiến thức về các kỹ thuật đánh giá hiệu suất. .
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 9
Dưới đây liệt kê các lỗi thường mắc phải khi đánh giá hiệu suất mạng.
1. Không có mục đích rõ ràng (No Goal). Trước khi thực hiện đánh giá hiệu suất mạng,
nhất thiết phải xác định rõ các mục tiêu cụ thể cần đạt được là gì, trên cơ sở đó lựa
chọn các độ đo hiệu suất, tải đưa vào mạng và phương pháp đánh giá v.v. phù hợp.
Nhiệm vụ này nghe qua có vẻ đơn giản và tầm thường nhưng thực sự không luôn luôn như vậy.
2. Mục đích thiên lệch (Bias goals). Khi phát biểu mục đích, có thể thiên vị một các hiển
nhiên hay thiên vị kiểu ngầm. Thí dụ, nếu như mục đích là: “Hãy chỉ ra rằng hệ thống
của chúng ta tốt hơn hệ thống của họ”, thì bài toán trở thành tìm các độ đo và tải sao
cho hệ thống của chúng ta thể hiện là tốt hơn, chứ không phải là việc tìm ra các độ đo
và tải đúng đắn để so sánh hai hệ thống. Có một quy tắc bất thành văn của giới chuyên
gia về đánh giá hiệu suất là không thiên vị, người đánh giá hiệu suất cần đóng vai trò
của người giám khảo và đưa ra các kết luận dựa trên sự phân tích chứ không dựa trên niềm tin.
3. Sự tiếp cận thiếu tính hệ thống (Unsystermatic Approach). Người phân tích thường
phỏng theo một cách tiếp cận không có tính hệ thống khi chọn một cách tuỳ tiện các
tham số hệ thống, các nhân tố (factor), các độ đo và tải. Vấn đề này sẽ được bàn thêm
kỹ hơn ở mục 1.5 sau đây.
4. Phân tích mà không hiểu bài toán (Analysis without Understanding the Problem).
Người phân tích thiếu kinh nghiệm cảm thấy thực sự không đạt được điều gì khi chưa
xây dựng xong mô hình và chưa nhận được một kết quả bằng con số nào. Đối với
người phân tích có kinh nghiệm, họ biết rõ rằng việc xác định rõ bài toán chiếm phần
lớn nỗ lực của họ, tỉ lệ này có thể lên đến 40%. Điều này củng cố cho một câu châm
ngôn cũ: “một bài toán được phát biểu tốt là đã giải được một nửa”. Trong 60% nỗ
lực còn lại, phần chủ yếu dành cho các lựa chọn thiết kế, diễn giải các kết quả và trình
bày các kết luận. Việc phát triển mô hình bản thân nó là một phần nhỏ của quá trình
giải bài toán, giống như ô tô và tàu hoả là các phương tiện để đi đến một địa điểm nào
đó chứ không phải là chính địa điểm đến. Mô hình là phương tiện để đạt được kết luận
chứ nó không phải là kết luận cuối cùng. Những người phân tích được đào tạo về việc
lập mô hình để đánh giá hiệu suất nhưng không được đào tạo về việc xác định bài toán
hay trình bày kết quả thường thấy các mô hình của họ bị những người ra quyết định lờ
đi trong khi họ chỉ tìm kiếm sự hỗ trợ của mô hình chứ không phải chính bản thân mô hình.
5. Các độ đo hiệu suất không đúng (Incorrect Performance Metrics): Nói về độ đo là nói
về các tiêu chuẩn được sử dụng để lượng hoá hiệu suất của hệ thống. Thí dụ về các độ
đo hiệu suất thường được sử dụng là: thông lượng (throughput) và thời gian đáp ứng
(response time). Việc lựa chọn độ đo hiệu suất đúng phụ thuộc vào các dịch vụ mà hệ
thống hoặc hệ thống con được mô hình hoá cung cấp. Thí dụ hiệu suất của các CPU
được so sánh trên cơ sở thông lượng của chúng, thường được đo bằng đơn vị MIPS
(Million of Íntruction Per Second). Tuy nhiên việc so sánh MIPS của 2 CPU có kiến
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 10
trúc khác nhau, thí dụ RISC và CISC là vô nghĩa, bởi vì các chỉ thị mà 2 CPU này thi
hành là không tương đương.
Lỗi thường mắc khi chọn độ đo hiệu suất là: người phân tích thường chọn các độ đo dễ
tính toán, dễ đo đạc chứ không chọn các độ đo thích đáng.
6. Tải mạng không có tính chất đại diện (Unrepresentative Workload): Tải được sử dụng
để so sánh 2 hệ thống cần phải là đại diện cho việc sử dụng thật sự của hệ thống trong
phạm vi nghiên cứu. Thí dụ, nếu các gói tin trong mạng tính chung là sự trộn lẫn của 2
loại kích thước ngắn và dài , thì tải được sử dụng để so sánh 2 mạng cần bao gồm bao
gồm các gói tin có kích thước dài và kích thước ngắn.
Việc lựa chọn tải có ảnh hưởng quan trọng đến kết quả của việc nghiên cứu về hiệu
suất. Việc lựa chọn sai tải sẽ dẫn đến các kết luận không chính xác.
7. Kỹ thuật đánh giá sai (Wrong Evaluation Technique): Có 3 kỹ thuật đánh giá: đo, mô
phỏng và lập mô hình giải tích. Người phân tích thường có sở thích sử dụng một kỹ
thuật đánh giá cho mọi bài toán đánh giá hiệu suất phải giải quyết. Thí dụ những người
thành thạo Lý thuyết hàng đợi sẽ có khuynh hướng chuyển mọi bài toán đánh giá hiệu
suất về bài toán hàng đợi, dù cho hệ thống có quá phức tạp và có thể áp dụng kỹ thuật
đo một cách dễ dàng. Những người thành thạo về lập trình lại có khuynh hướng giải
mọi bài toán bằng kỹ thuật mô phỏng. Việc người nghiên cứu gắn chặt với một kỹ
thuật duy nhất sẽ dẫn đến một mô hình mà anh ta có thể giải một cách tốt nhất chứ
không phải một mô hình giúp giải bài toán theo cách tốt nhất. Vấn đề xảy ra đối với
những sự biến đổi như vậy là chúng có thể gây ra các hiện tượng lạ trong mô hình
không có trong hệ thống nguyên bản hoặc có thể làm mất đi một số hiện tượng quan
trọng có trong hệ thống nguyên bản.
Người phân tích cần có các kiến thức cơ bản về cả 3 kỹ thuật. Có một số nhân tố cần
được xem xét khi phải lựa chọn lấy một kỹ thuật thích hợp. (sẽ được trình bày tại . .).
8. Xem nhẹ các tham số quan trọng (Overlooking Important Parameters): Có một ý tưởng
tốt là liệt kê đầy đủ các đặc tính (characteristics) của hệ thống và của tải có ảnh hưởng
đến hiệu suất của hệ thống. Các đặc tính này được gọi là các tham số (parameters). Thí
dụ, các tham số hệ thống có thể bao gồm kích thước lượng tử (quantum size) để phân
bổ CPU hay kích thước tập làm việc (working set size) để phân bổ bộ nhớ. Các tham
số về tải có thể bao gồm: số NSD, mẫu đến của các yêu cầu (request arrival patterns),
quyền ưu tiên v.v. Người phân tích có thể chọn một tập các giá trị cho mỗi một trong
các tham số này; kết quả cuối cùng của việc nghiên cứu phụ thuộc rất mạnh vào các
lựa chọn này. Việc xem nhẹ một hay một số tham số quan trọng có thể làm cho các kết quả trở thành vô dụng.
9. Bỏ qua các yếu tố quan trọng (Ignoring Significant Factors): Các tham số sẽ thay đổi
trong quá trình nghiên cứu được gọi là nhân tố (factor). Thí dụ, trong các tham số về
tải đã được liệt kê ở trên, chỉ có số NSD là có thể được chọn làm factor; các tham số
khác có thể được giữ cố định ở các giá trị điển hình của chúng. Không phải tất cả các
tham số đều có ảnh hưởng bằng nhau đến hiệu suất. Một việc quan trọng là chỉ ra các
tham số mà nếu chúng thay đổi sẽ có ảnh hưởng đáng kể đến hiệu suất. Các tham số
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 11
này cần được sử dụng làm factor khi nghiên cứu về hiệu suất. Thí dụ tốc độ đến của
các gói tin chứ không phải kích thước gói tin ảnh hưởng đến thời gian phản ứng của
một network gateway, vì vậy tốt nhất là sử dụng một vài giá trị tốc độ đến khác nhau
khi nghiên cứu hiệu suất của nó (network gateway).
Những factor mà NSD cuối (hoặc người ra quyết định) có thể điều khiển được một các
dễ dàng cần được ưu tiên hơn các factor không thay đổi được. Đừng có lãng phí thời
gian vào việc so sánh các lựa chọn (alternatives) mà NSD cuối không thể chấp nhận
hoặc là vì chúng liên quan đến những hành động không thể chấp nhận được đối với
người ra quyết định hoặc là vì chúng nằm ngoài phạm vi ảnh hưởng của chúng.
Điều quan trọng là hiểu được tính ngẫu nhiên của một hệ thống riêng lẻ và các tham số
tải có ảnh hưởng đến hiệu suất. Một số trong các tham số này là dễ biết được hơn các
tham số khác. Thí dụ một người phân tích có thể biết được phân bố của sự tham khảo
trang (page references) trong một hệ thống máy tính nhưng không có một ý niệm gì về
phân bố của sự tham khảo đĩa (distribution of disk references). Trong trường hợp này,
lỗi thường mắc phải là việc sử dụng phân bố tham khảo trang như là một factor mà lại
không sử dụng phân bố tham khảo đĩa, mặc dù đĩa có thể là cái cổ chai và có ảnh
hưởng nhiều hơn đến hiệu suất so với việc tham khảo trang. Việc chọn các factor cần
dựa trên sự liên quan của chúng chứ không nên dựa trên hiểu biết của người phân tích
về các factor. Cần phải nỗ lực để nhận được các giá trị thực tế của tất cả các tham số có
liên quan và các phân bố của chúng. Đối với các tham số còn chưa biết, cần phải thực
hiện một sự phân tích nhạy bén (sensitivity analysis) cho thấy ảnh hưởng của sự thay
đổi của các tham số này so với các giá trị được giả định của chúng, để định lượng ảnh
hưởng của các tham số chưa biết.
10.Thiết kế thí nghiệm không thích hợp (Inappropriate Experimental Design): Việc thiết
kế thí nghiệm liên quan đến số các thí nghiệm đo hoặc thí nghiệm mô phỏng sẽ được
thực hiện và các giá trị của tham số được sử dụng trong từng thí nghiệm. Việc chọn các
giá trị này một cách thích hợp sẽ làm cho với cùng một số lần làm thí nghiệm có thể
nhận được nhiều thông tin hơn. Việc chọn không thích hợp sẽ gây ra lãng phí thời gian
và tài nguyên của người phân tích.
Trong một thiết kế non nớt (naive), từng factor được lần lượt thay đổi. Thiết kế này có
thể dẫn đến các kết luận sai nếu các tham số tương tác đến mức mà ảnh hưởng của một
tham số phụ thuộc vào các giá trị của các tham số khác. Có các cách thiết kế khác tốt
hơn, sử dụng thiết kế thực nghiệm phân chia thành thừa số đầy đủ (full factorial
experimental designs) thiết kế phân chia thành thừa số phân đoạn (fractional
factorial designs), được giải thích trong Phần IV [].
11.Mức độ chi tiết không thích hợp (Inappropriate Level of Detail): mức độ chi tiết được
sử dụng trong lập mô hình một hệ thống có ảnh hưởng lớn đến việc phát biểu bài toán.
Cần tránh các phát biểu quá rộng hoặc quá hẹp. Để so sánh các lựa chọn khác nhau là
các biến thể khác chút ít của một cách tiếp cận chung, việc xây dựng một mô hình tích
hợp các biến thể là hữu ích hơn việc xây dựng một mô hình ở mức cao. Mặt khác, để
so sánh các lựa chọn rất khác nhau, các mô hình mức cao đơn giản có thể cho phép
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 12
phân tích một vài lựa chọn một cách nhanh chóng và không tốn kém. Một lỗi thường
mắc là chọn cách tiếp cận chi tiết khi mà một mô hình mức cao có thể làm được và
ngược lại. Rõ ràng là các mục đích của việc nghiên cứu có ảnh hưởng lớn đến những
cái được lập mô hình và việc chúng sẽ được phân tích như thế nào.
12.Thiếu phân tích (No Analysis): Một trong các vấn đề chung của các kế hoạch (project)
đo là chúng thường được vận hành bởi những người phân tích hiệu suất, họ giỏi về các
kỹ thuật đo nhưng thiếu tinh thông về phân tích số liệu. Họ thu thập một lượng lớn số
liệu, nhưng không biết phải phân tích hoặc diễn dải chúng như thế nào. Kết quả là một
bộ băng từ (hoặc bộ đĩa) chứa đầy số liệu mà không có một bản tóm tắt nào. Giỏi lăm,
người phân tích có thể tạo ra một bản báo cáo dày chứa đầy các số liệu thô và các đồ
thị mà không có một giải thích về việc người ta có thể sử dụng các kết quả này như
thế nào. Vì vậy, tốt nhất là có một đội các nhà phân tích hiệu suất có các kiến thức cơ sở về đo và phân tích.
13.Phân tích sai (Erroneous Analysis): Có một số lỗi chung mà những người phân tích
thường mắc phải trong việc đo, mô phỏng và lập mô hình giải tích, thí dụ lấy trung
bình của các tỉ số và các mô phỏng quá ngắn.
14.Thiếu phân tích nhạy bén (No Sensitivity Analysis): Các nhà phân tích thường nhấn
mạnh quá mức vào các kết quả của sự phân tích của họ, bằng cách trình bày chúng như
là các sự kiện (fact) chứ không phải là các bằng chứng (evidence). Có một sự thật là
các kết quả có thể nhạy cảm đối với tải và các tham số hệ thống thường bị bỏ sót
(overlook). Nếu thiếu sự phân tích nhạy bén, người ta sẽ không thể chắc chắn rằng các
kết luận có thay đổi hay không nếu sự phân tích được thực hiện với một sự thiết lập
(setting) hơi khác một chút. Cũng như vậy, nếu thiếu sự phân tích nhạy bén, khó có thể
biết được sự quan trọng tương đối của các tham số khác nhau.
15.Bỏ qua các lỗi ở input (Ignoring Error in Input): Thông thường các tham số cần quan
tâm lại không thể đo được. Thay vào đó, lại có thể đo được một biến khác và sử dụng
nó để ước lượng (giá trị của) tham số. Thí dụ trong một thiết bị mạng, các gói tin được
chứa trong một danh sách móc nối của các bộ đệm (buffer), mỗi bộ đệm có chiều dài
512 byte. Khi biết được số bộ đệm cần có để chứa các gói tin, không thể dự đoán được
một cách chính xác số gói tin hay số byte có trong các gói tin. Những tình huống như
vậy dẫn đến các tình huống bất định bổ sung trong số liệu vào. Người phân tích cần
phải điều chỉnh mức độ tin cậy ở đầu ra của mô hình nhận được từ những số liệu như
vậy. Ngoài ra, cũng có thể là không đáng để lập mô hình một cách chính xác kích
thước gói tin khi input có thể được tắt đi nhiều đến 512 bytes. Thí dụ này còn minh hoạ
thêm một điểm nữa, đó là các lỗi ở input không luôn luôn được phân bố đều quanh giá
trị trung bình. Trong trường hợp này, không gian bộ đệm luôn lớn hơn số lượng byte
thực sự được truyền lên mạng hoặc được nhận từ mạng. Nói cách khác, input bị thiên lệch.
16.Xử lý không đúng đắn các giá trị khác thường (Improper Treatment of Outlier): Các
giá trị quá cao hoặc quá thấp so với đa số các giá trị trong một tập được gọi là các giá
trị khác thường (outliers). Các giá trị khác thường ở input hoặc output của mô hình
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 13
biểu thị một vấn đề. Nếu một giá trị khác thường không phải do một hiện tượng của hệ
thống thực gây ra, thì cần bỏ qua nó. Việc sử dụng cả giá trị này có thể tạo ra một mô
hình hỏng. Mặt khác, nếu giá trị khác thường có thể xuất hiện trong hệ thống thực, nó
cần được đưa vào mô hình một cách thích hợp. Việc bỏ qua không sử dụng giá trị này
sẽ tạo ra một mô hình hỏng. Việc xác định giá trị khác thường nào cần bỏ qua, giá trị
khác thường nào cần đưa vào là một phần của nghệ thuật đánh giá hiệu suất và đòi hỏi
sự hiểu biết kỹ càng về hệ thống được lập mô hình.
17.Giả thiết sẽ không có thay đổi gì trong tương lai (Assuming No Change in the Future):
Người ta thường giả thiết rằng tương lai là giống với quá khứ. Một mô hình dựa trên
việc sử dụng tải và hiệu suất quan sát được trong quá khứ để dự đoán hiệu suất trong
tương lai. Tải và hành vi hệ thống trong tương lai được giả thiết là tương tự với tải và
hành vi hệ thống đã được đo. Người phân tích và những người ra quyết định cần thảo
luận về giả thiết này và định giới hạn thời gian trong tương lai cho việc áp dụng các dự đoán.
18.Bỏ qua tính biến thiên (Ignoring Variability): Người ta thường chỉ phân tích hiệu suất
trung bình bởi vì việc xác định tính biến thiên thường là khó, thậm chí là không thể
thực hiện được. Nếu tính biến thiên là cao, việc chỉ sử dụng giá trị trung bình có thể
làm người ra quyết định bị sai lầm. Thí dụ, các quyết định dựa trên việc tính giá trị
trung bình hàng ngày của yêu cầu sử dụng máy tính có thể không có giá trị nếu yêu cầu
về tải có nhiều giá trị cao điểm (peak) hàng giờ, chúng ảnh hưởng bất lợi đến hiệu suất của người sử dụng.
19.Phân tích quá phức tạp (Too Complex Analysis): Khi đã biết 2 phép phân tích dẫn đến
cùng một kết luận, thì phép phân tích đơn giản hơn, dễ giải thích hơn rõ ràng nên được
sử dụng. Người phân tích hiệu suất cần truyền đạt các kết luận cuối cùng theo cách
càng đơn giản càng tốt. Một số người phân tích bắt đầu với các mô hình phức tạp và
các mục tiêu quá tham vọng, dẫn đến việc không thể giải được, hoặc không thể đo
được hoặc mô phỏng được, kết cục là không thể đạt được mục đích. Tốt nhất là hãy bắt
đầu nghiên cứu với các mô hình hay phép đo đơn giản, sau khi nhận được một số kết
quả hoặc thấu hiểu được vấn đề, sẽ tăng độ phức tạp của mô hình hoặc phép đo.
Có sự khác nhau đáng kể giữa các kiểu mô hình được công bố trong tài liệu và các mô
hình được sử dụng trong thực tế. Các mô hình trình bày trong các tài liệu và thường
được giảng dạy trong các nhà trường thường là quá phức tạp. Lý do là vì các mô hình
tầm thường, dù cho rất sáng tỏ, cũng thường không được chấp nhận cho xuất bản. Vì
một số lý do, khả năng phát triển và giải một mô hình phức tạp được giới hàn lâm đánh
giá cao hơn so với việc rút ra được các kết luận từ các mô hình đơn giản. Tuy nhiên,
trong giới công nghiệp, những người ra quyết định hiếm khi quan tâm đến kỹ thuật lập
mô hình hay tính mới của nó. Quan tâm chủ yếu của họ là sự tính dẫn dắt của mô hình
cùng với thời gian và chi phí để phát triển mô hình. Thời hạn ra quyết định thường dẫn
đến việc chọn các mô hình đơn giản. Chính vì vậy, đa số các vấn đề về hiệu suất hàng
ngày trong thế giới thực được giải quyết bằng các mô hình đơn giản; các mô hình phức
tạp hiếm khi, thậm chí là không bao giờ được sử dụng. Ngay cả khi thời gian để phát
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 14
triển mô hình không bị hạn chế, người ra quyết định cũng không dễ ràng hiểu được các
mô hình phức tạp, vì vậy kết quả của các mô hình này cũng không được tin tưởng.
Chính điều này làm những người mới tốt nghiệp, được đào tạo rất tốt về các kỹ thuật
lập mô hình phức tạp thất vọng vì họ thấy có rất ít cơ hội sử dụng chúng trong thực tế.
20.Biểu diễn kết quả không thích hợp (Improper Presentation of Results): Mục đích cuối
cùng của việc nghiên cứu hiệu suất là trợ giúp cho việc ra quyết định. Việc phân tích
không tạo ra được các kết quả hữu dụng là việc làm thất bại. Tương tự như vậy, việc
phân tích với các kết quả mà người ra quyết định không thể hiểu nổi cũng là thất bại.
Người ra quyết định có thể là nhà thiết kế hệ thống, người mua hệ thống hoặc là người
tài trợ cho dự án. Việc truyền đạt (hoặc bán) các kết quả của việc phân tích cho người
ra quyết định là trách nhiệm của người phân tích. Điều này đòi hỏi việc sử dụng không
ngoan từ ngữ, các bức ảnh và đồ thị để giải thích các kết quả và việc phân tích. Độ đo
đúng để đo hiệu suất của một người phân tích không phải là số phép phân tích đã được
thực hiện mà là số phép phân tích đã giúp ích cho người ra quyết định.
21.Bỏ qua các yếu tố xã hội (Ignoring Social Aspects): Việc trình bày thành công các kết
quả phân tích đòi hỏi phải có 2 loại kỹ năng: kỹ năng về xã hội và kỹ năng thực sự
(substantive skills). Viết và nói là các kỹ năng về xã hội, trong khi đó việc lập mô hình
và phân tích là các kỹ năng thật sự. Hầu hết các nhà phân tích đều có loại kỹ năng thực
sự là tốt; tuy nhiên chỉ có những người có kỹ năng xã hội tốt thành công trong việc bán
các kết quả của họ cho những người ra quyết định. Việc chấp nhận các kết quả phân
tích đòi hỏi việc thể hiện sự tin cậy giữa những người ra quyết định và người phân tích
và việc trình bày các kết quả trước người ra quyết định thao một cách thức mà người ra
quyết định có thể hiểu được. Nếu người ra quyết định không tin hoặc không hiểu sự
phân tích, thì người phân tích đã thất bại trong việc gây ảnh hưởng lên quyết định cuối
cùng. Các kỹ năng về mặt xã hội là đặc biệt quan trọng trong việc trình bày các kết quả
trái với những điều mà người ra quyết định vẫn tin hoặc trong việc trình bày các giá trị
đòi hỏi những sự thay đổi lớn trong thiết kế.
Những người phân tích mới vào nghề thường không hiểu được rằng, các kỹ năng về
mặt xã hội thường là quan trọng hơn so với các kỹ năng thực sự. Các phân tích có chất
lượng cao có thể bị từ chối chỉ do người phân tích thiếu nỗ lực và thời gian trong việc
trình bày các kết quả. Người ra quyết định thường bị sức ép về thời gian và muốn đi
đến các kết quả cuối cùng càng sớm càng tốt. Họ thường không quan tâm đến tính chất
mới của sự tiếp cận hay chính sự tiếp cận. Mặt khác, người phân tích sau khi đã bỏ ra
rất nhiều thời gian cho việc phân tích, lại cố nói với người ra quyết định về tính chất
mới của việc tiếp cận lập mô hình, chứ không phải là về các kết quả cuối cùng. Sự
khác biệt về quan điểm này có thể dẫn đến một báo cáo quá dài, không gây được ảnh
hưởng. Vấn đề này lại bị làm cho trầm trọng thêm bởi việc người phân tích cũng muốn
trình bày các kết quả cho các đồng nghiệp của mình, họ cũng là những nhà phân tích
và muốn hiểu biết thêm chủ yếu về việc tiếp cận chứ không phải là các kết quả cuối
cùng. Vì vậy, một giải pháp cho vấn đề này là chuẩn bị 2 bài trình bày (hoặcbáo cáo)
riêng biệt cho 2 đối tượng người nghe. Bài trình bày cho người ra quyết định cần có
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 15
thật ít các thuật ngữ chuyên môn về phân tích và cần nhấn mạnh đến các kết quả cuối
cùng; trong khi đó bài trình bày cho các nhà phân tích khác cần được bổ sung thêm tất
cả các chi tiết của các kỹ thuật phân tích. Việc kết hợp 2 bài trình bày này làm một có
thể làm cho nó trở nên vô nghĩa cho cả 2 đối tượng nghe.
Người phân tích không có kinh nghiệm thường cho rằng người ra quyết định cũng
giống như họ và cùng chia sẽ những niềm tin, các giá trị, ngôn ngữ và các thuật ngữ
chuyên môn. Điều này thương là sai. Người ra quyết định có thể giỏi trong việc đánh
giá các kết quả phân tích, nhưng có thể không hiểu biết nhiều về chính việc phân tích.
Ở vị trí của người ra quyết định, họ phải cân nhắc một vài yếu tố (factor) mà người
phân tích có thể cho là không quan trọng, thí dụ như ảnh hưởng chính trị của quyết
định, sự chậm trễ trong các thủ tục của dự án hoặc là việc có sẵn người hay không để
thực thi một quyết định cụ thể nhất định. Người phân tích cố gắng hiểu được những
điều quan tâm của người ra quyết định và tích hợp chúng vào trong bài trình bày của
mình càng nhiều càng tốt sẽ có được cơ hội tốt hơn để “bán” kết quả phân tích của
mình, so với những người chỉ nhìn thấy sự vật theo quan điểm của chính mình.
22.Lờ đi các giả thiết và hạn chế đã sử dụng khi trình bày phân tích (Omitting
Assumptions and Limitations): Các giả thiết và hạn chế của sự phân tích thường bị lờ
đi trong báo cáo cuối cùng. Điều này có thể làm cho NSD áp dụng sự phân tích vào
ngữ cảnh khác, trong đó các giả thiết không có giá trị. Đôi khi người phân tích liệt kê
các giả thiết tại đầu báo cáo và sau đó quên mất các hạn chế tại cuối (báo cáo) và đưa
ra các kết luận về những môi trường mà phân tích của anh ta không áp dụng được.
1.5 Tiếp cận một cách có hệ thống để tránh mắc lỗi
Hầu hết các bài toán về đánh giá hiệu suất là duy nhất. Các độ đo, tải mạng và các kỹ
thuật đánh giá được sử dụng cho bài toán này thường không sử dụng được cho các bài
toán khác. Tuy nhiên, các bài toán đánh giá hiệu suất mạng vẫn có các bước đi chung, cần
tuân theo để tránh mắc các lỗi trình bày ở trên.
1. Phát biểu rõ mục tiêu và xác định hệ thống (State Goals and Define the System): Bước
đầu tiên trong mọi dự án đánh giá hiệu suất là phát biểu các mục đích của việc nghiên
cứu và xác định những gì cấu thành nên hệ thống bằng việc vạch ra biên giới của hệ
thống. Khi đã cho cùng một một tập hardware và software, định nghĩa của hệ thống có
thể thay đổi phụ thuộc vào các mục đích của việc nghiên cứu. Thí dụ cho biết 2 CPU,
mục đích có thể là đánh giá ảnh hưởng của chúng lên thời gian phản ứng của những
NSD tương tác. Trong trường hợp này hệ thống có thể bao gồm hệ thống chia sẻ thời
gian, các kết luận của việc nghiên cứu có thể phụ thuộc mạnh vào các thành phần bên
ngoài CPU. Mặt khác, nếu 2 CPU về căn bản là giống nhau ngoại trừ các ALU của
chúng, còn mục đích của sự nghiên cứu là quyết định nên chọn ALU nào, thì có thể coi
CPU là một hệ thống và chỉ có các thành phần bên trong CPU có thể được coi là thành phần của hệ thống.
Việc lựa chọn biên giới của hệ thống ảnh hưởng đến các độ đo hiệu suất cũng như đến
tải được sử dụng để so sánh các hệ thống. Vì vậy, việc biết được biên giới của hệ thống
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 16
là quan trọng. Mặc dầu trong các đối tượng của việc nghiên cứu, việc thiết lập biên
giới hệ thống là sự xem xét chủ yếu, vẫn cần phải tính đến những sự xem xét khác nữa,
chẳng hạn như việc quản lý hành chính của những người bảo trợ cho việc nghiên cứu.
Nếu những người bảo trợ không có quyền điều khiển một số thành phần, họ có thể
muốn để các thành phần này nằm ngoài biên giới của hệ thống.
2. Lên danh sách các dịch vụ và các kết quả có thể có (List Services and Outcomes): Mỗi
hệ thống cung cấp một tập các dịch vụ. Thí dụ, một mạng máy tính cho phép NSD của
nó gửi các gói tin đến các đích được chỉ ra. Một hệ thống CSDL đáp ứng các truy vấn.
Một bộ xử lý thực hiện một số chỉ thị khác nhau. Bước tiếp theo của việc phân tích một
hệ thống là lên danh sách các dịch vụ này. Khi NSD yêu cầu bất kỳ dịch vụ nào trong
số các dịch vụ, có thể có một số kết quả. Một số trong các kết quả này là được mong
đợi còn một số là không. Thí dụ, một hệ thống CSDL có thể trả lời một truy vấn một
cách đúng đắn, không đúng (do cập nhật không nhất quán) hoặc thậm chí không trả lời
(do deadlock hay các vấn đề tương tự). Một danh sách các dịch vụ và các kết quả có
thể có là rất hữu ích sau này cho việc lựa chọn các độ đo và tải đúng.
3. Chọn lựa các độ đo hiệu suất (Select Metrics): Bước tiếp theo là chọn các tiêu chuẩn
để so sách hiệu suất. Các tiêu chuẩn này được gọi là độ đo. Nói chung, các độ đo liên
quan đến tốc độ, độ chính xác và tính sẵn sàng sử dụng của các dịch vụ. Hiệu suất của
mạng, thí dụ được đo bởi tốc độ (thông lượng và độ trễ), độ chính xác (tỉ suất lỗi) và
tính sẵn sàng để dùng (availability) của các gói tin được gửi. Hiệu suất của một bộ xử
lý được đo bằng tốc độ (thời gian thi hành) của các chỉ thị khác nhau.
4. Lên danh sách các tham số (List Parameter): Bước tiếp theo trong các dự án về hiệu
suất là tạo ra một danh sách tất cả các tham số có ảnh hưởng đến hiệu suất. Danh sách
này có thể được chia thành các tham số hệ thống và các tham số tải. Các tham số hệ
thống bao gồm cả các tham số phần cứng lẫn các tham số phần mềm, chúng thường
không thay đổi trong số các sự cài đặt khác nhau của hệ thống. Các tham số tải được
đặc trưng bởi các yêu cầu của NSD, chúng thường thay đổi từ sự cài đặt đến sự cài đặt khác.
Danh sách các tham số có thể là không đầy đủ; nghĩa là, sau khi trải qua một lần phân
tích, bạn có thể phát hiện ra rằng, có các tham số bổ sung thêm có ảnh hưởng đến hiệu
suất. Sau đó bạn có thể bổ sung các tham số này vào danh sách; Tuy nhiên tại mọi thời
điểm cần phải giữ cho danh sách này càng bao gồm toàn diện càng tốt. Điều này cho
phép người phân tích và người ra quyết định thảo luận về ảnh hưởng của các tham số
khác nhau và định rõ dữ liệu nào cần được thu thập trước hoặc trong khi phân tích.
5. Lựa chọn các yếu tố để nghiên cứu (Select Factors to Study): Danh sách các tham số
được chia thành 2 phần: các tham số sẽ thay đổi trong quá trình đánh giá và các tham
số sẽ không thay đổi. Các tham số sẽ thay đổi được gọi là factor (yếu tố) và các giá trị
của chúng được gọi là các mức (levels). Nói chung, danh sách các factor và các mức có
thể có của chúng là lớn hơn so với giới hạn mà các tài nguyên sẵn có cho phép. Nói
cách khác, danh sách này tiếp tục lớn dần lên cho đến khi người ta thấy rõ rằng không
có đủ tài nguyên để nghiên cứu vấn đề. Tốt hơn cả là bắt đầu nghiên cứu với một danh
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 17
sách ngắn các factor và một số lượng nhỏ các mức cho mỗi factor và mở rộng danh
sách ở pha tiếp theo của dự án nếu các tài nguyên còn cho phép. Thí dụ, bạn có thể
quyết định chỉ có 2 factor: kích thước lượng tử và số người sử dụng. Với mỗi một
trong 2 factor này bạn chỉ có thể chọn 2 mức: nhỏ và lớn. Kích thước tập làm việc và
kiểu của tải có thể được cố định.
Các tham số được cho rằng có ảnh hưởng lớn đến hiệu suất tốt nhất là được chọn làm
factor. Giống như các độ đo, lỗi thường gặp trong việc lựa chọn các factor là: các tham
số dễ làm thay đổi và đo được sử dụng làm factor, trong khi đó các tham số có ảnh
hưởng hơn bị lờ đi đơn giản chỉ bởi vì các khó khăn có liên quan đến chúng.
Trong việc chọn factor, điều quan trọng là xem xét các ràng buộc về kinh tế, chính trị
và công nghệ đang có cũng như việc bổ sung thêm vào các giới hạn mà sự điều khiển
của người ra quyết định áp đặt lên và thời gian có hiệu lực của quyết định. Điều này
làm tăng cơ may của việc tìm một giải pháp chấp nhận được và thực hiện được.
6. Lựa chọn kỹ thuật đánh giá hiệu suất (Select Evaluation Technique): Ba kỹ thuật được
sử dụng rộng rãi cho việc đánh giá hiệu suất là: lập mô hình giải tích, mô phỏng và đo
trên hệ thống thực. Việc lựa chọn một kỹ thuật đúng phụ thuộc vào thời gian và các tài
nguyên sẵn có để giải bài toán và mức độ đòi hỏi về độ chính xác.
7. Lựa chọn tải đưa vào mạng (Select Workload): Tải bao gồm một danh sách các yêu
cầu (request) dịch vụ đối với hệ thống. Thí dụ, tải cho việc so sánh một số hệ cơ sở dữ
liệu có thể bao gồm một tập các truy vấn (queries). Tuỳ thuộc vào kỹ thuật đánh giá đã
được chọn, tải có thể được biểu diễn dưới các dạng khác nhau. Đối với kỹ thuật Lập
mô hình giải tích, tải thường được biểu diễn như là xác suất của các yêu cầu khác
nhau. Đối với mô phỏng, người ta có thể sử dụng vết (trace) của các yêu cầu được đo
trên hệ thống thực. Đối với kỹ thuật đo, tải có thể bao gồm các script của người sử
dụng sẽ được thi hành trên hệ thống. Trong mọi trường hợp, điều cốt yếu là tải phải là
mẫu đại diện của việc sử dụng hệ thống trong thực tế (real life). Để sinh ra tải có tính
chất đại diện, cần phải đo và mô tả (characterize) tải trên các hệ thống đang tồn tại.
8. Thiết kế thí nghiệm (Design Experiments): Một khi bạn đã có danh sách các factor và
các mức của chúng, bạn cần quyết định một dãy các thí nghiệm để cho ra một lượng
thông tin lớn nhất với nỗ lực nhỏ nhất. Trong thực tế, tiến hành thí nghiệm trong 2 pha
là hữu ích. Trong pha thứ nhất, số factor có thể là lớn nhưng số mức thì nhỏ. Mục đích
là để xác định ảnh hưởng liên quan của các factor khác nhau. Trong hầu hết các trường
hợp, việc này có thể thực hiện bằng thiết kế thí nghiệm thừa số phân đoạn (fractional
factorial experimental designs) (được trình bày tại Part IV của cuốn sách). Trong pha
thứ hai, số factor được giảm xuống còn số mức của các factor có ảnh hưởng đánh kể được tăng lên.
9. Phân tích và diễn giải số liệu thu được (Analyze and Interpret Data): Một điều quan
trọng cần phải nhận thức là các kết quả của việc đo hoặc mô phỏng là các đại lượng
ngẫu nhiên theo nghĩa là kết quả có thể khác mỗi khi thí nghiệm được lặp lại. Trong
việc so sánh 2 lựa chọn (alternatives), cần phải xét đến sự thay đổi của các kết quả.
Nếu chỉ so sánh các giá trị trung bình có thể dẫn đến các kết luận không chính xác.
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 18
(Các kỹ thuật thống kê để so sách 2 lựa chọn được trình bày ở chương 13 của cuốn sách).
Việc biểu diễn các kết quả của một phép phân tích là một phần cốt yếu của nghệ thuật
phân tích. Cần phải hiểu rằng, sự phân tích chỉ sinh ra các kết quả chứ không sinh ra
các kết luận. Kết quả tạo ra cơ sở, dựa trên đó người phân tích hoặc người ra quyết
định có thể rút ra các kết luận. Khi một số người phân tích được trao cùng một tập các
kết quả, mỗi người phân tích có thể rút ra một kết luận khác nhau.
10.Trình bày kết quả (Present Results): Bước cuối cùng của mọi đề án về hiệu suất là
truyền đạt các kết quả đến các thành viên khác của nhóm ra quyết định (decision-
making team). Điều quan trọng là các kết quả phải được trình bày theo cách dễ hiểu.
Việc này thường đòi hỏi trình bày kết quả dưới dạng đồ thị chứ không phải bằng các
thuật ngũ chuyên môn về thống kê. Các đồ thị cần chia tỉ lệ thích hợp. Vấn đề vẽ đồ thị
đúng được bàn luận tiếp ở chương 10).
Thông thường, đến giai đoạn này của dự án, các kiến thức thu được từ việc nghiên cứu
có thể đòi hỏi người phân tích quay trở lại và xem xét lại một số quyết định ở các bước
trước đó. Thí dụ, người phân tích có thể muốn định nghĩa lại các ranh giới của hệ
thống hay bổ sung thêm các factor và các độ đo hiệu suất khác mà trước đó chưa được
xem xét. Vì vậy ,dự án toàn bộ bao gồm một vài chu trình qua các bước chứ không
phải chỉ đi một lần qua các bước.
1.6 Tài liệu tham khảo cho Chương 1
[1.1] Rij Jain (1992), The art of Computer systems Performance Analysis: Techniques for
Experimental Design, Measurement, Simulation, and Modeling, Wiley, 1992.
[1.2] Hiashi Kobayashi (1978), Modeling and Analyis: An Introduction to System Performance
Evaluation Methodology, Addition-Wesley, Massachusetts.
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 19
CHƯƠNG 2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU NĂNG MẠNG
2.2 Mô hình Giải tích
Khi sử dụng lý thuyết Hàng đợi để giải bài toán đánh giá hiệu năng, người ta thường
phải đưa ra nhiều giả thuyết để đơn giản hoá mô hình. Có những giả thuyết có vẻ như phi
thực tế hoặc đơn giản hoá quá mức, tuy nhiên, kết quả thu được lại rất phù hợp với các kết
quả của phương pháp mô phỏng hoặc phương pháp thực nghiệm. Điều quan trọng đối với
nhà nghiên cứu là đưa ra được các giả thiết làm cho mô hình trở nên càng đơn giản càng
tốt mà vẫn đạt được một độ chính xác cần thiết của các kết quả dự đoán và đánh giá hiệu năng [39].
Mạng máy tính có thể được lập mô hình như một mạng hàng đợi. Khách hàng
(customer) của các hàng đợi là các gói số liệu đến và yêu cầu được truyền đi, còn người
phục vụ (server) chính là các phương tiện truyền, bao gồm hệ chuyển mạch và đường kết
nối vật lý, hoặc nói đơn giản hơn là đường truyền. Hầu hết các vấn đề liên quan đến hiệu
năng đều liên quan tới thời gian mà các gói số liệu phải xếp hàng chờ được phục vụ. Đây
là một độ đo quan trọng để đánh giá hiệu năng, bởi vì nó là một thành phần của thời gian
trễ chuyển tiếp gói số liệu từ thực thể nguồn tới thực thể đích, được gọi tắt là thời gian trễ
đầu cuối - đầu cuối, một yếu tố của hiệu năng mạng mà người sử dụng nhận thấy được.
Tất nhiên, thời gian chờ cũng phụ thuộc vào thời gian xử lý của nút và chiều dài của gói số
liệu. Nó cũng còn phụ thuộc vào dung lượng đường truyền, tức là khả năng truyền, đo
bằng packet/s, phụ thuộc vào chiến lược phục vụ được áp dụng ở các hàng đợi. Lý thuyết
Hàng đợi có thể đưa tất cả các yếu tố này vào trong mô hình; tuy nhiên, khi nghiên cứu
định lượng về chuyển mạch gói, trong những điều kiện cụ thể, người ta có thể bỏ qua một
số tham số, làm cho bài toán đơn giản hơn mà vẫn không làm giảm nhiều độ chính xác của kết quả thu được.
Chúng ta hãy xem xét mô hình đơn giản nhất của một hàng đợi được mô tả trên hình
2.1, với ngữ cảnh mạng chuyển mạch gói. Giả sử rằng các gói số liệu đến một cách ngẫu
nhiên với tốc độ đến trung bình là  packet/s, tốc độ phục vụ của người phục vụ là 
packet/s. Hàng đợi trên hình vẽ chứa các gói số liệu, chúng đang xếp hàng chờ được phục
vụ - được phát ra đường truyền; người phục vụ là phương tiện truyền hay đường truyền,
tốc độ truyền hay còn gọi dung lượng đường truyền thường được tính theo đơn vị bit/s,
dưới đây được ký hiệu là C. Nếu chiều dài gói số liệu trung bình tính bằng bit là 1/’ và
được cho bằng đơn vị bit/packet, thì  = ’C là tốc độ truyền tính bằng đơn vị packet/s.
Hình 2.1 Mô hình hàng đợi có một người phục vụ
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 20
Rõ ràng rằng, khi tốc độ đến của các gói số liệu  tiến tới dung lượng đường truyền 
thì hàng đợi bắt đầu hình thành. Với một hàng đợi hữu hạn, khi  vượt quá  và tiếp tục
tăng lên, bộ đệm sẽ đầy, tất cả các gói số liệu đến sau sẽ bị chặn lại, vì trong hàng đợi
không còn chỗ trống cho chúng. Nếu giả thiết bộ đệm là vô hạn cho đơn giản (đây là giả
thiết nhằm đơn giản hoá việc phân tích), hàng đợi sẽ trở nên không ổn định khi .
Người ta đã chứng minh được rằng < là điều kiện đảm bảo cho sự ổn định của một hàng
đợi có một người phục vụ [38], [41]. Đặc biệt, chúng ta sẽ tìm tham số   /, thường
được gọi là độ sử dụng đường truyền hoặc tải chuẩn hoá, đó là tỉ số của tải của hệ thống
trên năng lực của hệ thống. Tham số  đóng vai trò then chốt trong việc phân tích hàng đợi.
Đối với hàng đợi có một người phục vụ, khi  tiến tới và vượt quá một, vùng tắc nghẽn
sẽ xuất hiện, thời gian trễ bắt đầu tăng nhanh, các gói số liệu đến sẽ bị chặn lại một cách thường xuyên hơn.
Để nghiên cứu định lượng về thời gian trễ, sự chặn (blocking), thông lượng và mối
quan hệ của chúng với cả tốc độ phục vụ  lẫn kích thước của bộ đệm, chúng ta cần một
mô hình hệ thống hàng đợi chi tiết hơn mô hình hàng đợi trên hình 2.1. Trong mô hình này
các tham số hiệu năng phụ thuộc vào các xác suất trạng thái hàng đợi, với trạng thái được
định nghĩa là số gói số liệu ở trong hàng đợi, kể cả gói số liệu đang được phục vụ nếu
hàng đợi không rỗng. Để tính các xác suất trạng thái, ta phải biết:
 Quá trình đến của các gói số liệu (thống kê các gói số liệu mới đến).
 Phân bố của chiều dài các gói số liệu (phân bố thời gian phục vụ).
 Chiến lược phục vụ (thí dụ: FCFS, FIFO - đến trước phục vụ trước, hay LCFS - đến sau phục vụ trước v.v).
Đối với các hàng đợi có nhiều người phục vụ, xác suất trạng thái còn phụ thuộc vào số
lượng người phục vụ nữa.
Dưới đây, trong nhóm tiểu mục 2.2.1 và 2.2.2, chúng tôi trình bày tóm tắt một số kết
quả nghiên cứu về lý thuyết Hàng đợi [38], [41], trong ngữ cảnh mạng máy tính, được
chúng tôi áp dụng trong Chương 3, mục 3.2 của bản Luận án này.
2.2.1 Quá trình Poisson và các tính chất của nó
Đây là quá trình ngẫu nhiên được sử dụng thường xuyên nhất trong lý thuyết Hàng đợi
để lập mô hình cho sự đến và sự phục vụ trong một hệ thống mạng máy tính. Quá trình
Poisson mô tả một tập hợp các sự đến của các gói số liệu, trong đó khoảng thời gian giữa
hai gói đến liên tiếp là độc lập và được phân bố theo hàm mũ với giá trị trung bình
t  1/  , với  là tốc độ đến trung bình. Xác suất có k gói đến trong khoảng thời gian t là: P et (2-1)
k (t)  (t)k k!