80 trang 37 lượt tải

Bài Giảng Đánh Giá Hiệu Năng Mạng Máy Tính - 2008

Môn: Xã hội 2.2 K tài liệu

Trường: Văn hóa - Xã hội - Nghệ thuật 2.6 K tài liệu

Tác giả:

VietJack

4 tháng trước

Tải xuống Báo cáo

Danh sách Quiz

PGS. TS. NGUYỄN ĐÌNH VIỆT

BÀI GIẢNG

ĐÁNH GIÁ HIỆU NĂNG MẠNG

MÁY TÍNH

HÀ NỘI - 2008

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

MỤC LỤC

CHƯƠNG 1 GIỚI THIỆU........................................................................................................ 5

1.1 Khái niệm hiệu năng và các độ đo hiệu năng mạng................................................................ 5

1.1.1

Khái niệm hiệu năng mạng........................................................................................................5

1.1.2

Các độ đo hiệu năng mạng.........................................................................................................5

1.2 Tầm quan trọng của việc đánh giá hiệu năng mạng máy tính..................................................6

1.3 Phân loại các phương pháp đánh giá hiệu năng mạng.............................................................6

1.4 Các lỗi thường gặp...................................................................................................................8

1.5 Tiếp cận một cách có hệ thống để tránh mắc lỗi....................................................................15

1.6 Tài liệu tham khảo cho Chương 1..........................................................................................18

CHƯƠNG 2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU NĂNG MẠNG........................... 19

2.2 Mô hình Giải tích...................................................................................................................19

2.2.1

Quá trình Poisson và các tính chất của nó............................................................................... 20

2.2.2

Hàng đợi M/M/1 và một số kết quả.........................................................................................21

2.2.2.1

Xác suất trạng thái cân bằng của hàng đợi M/M/1...........................................................21

2.2.2.2

Đặc trưng thông lượng của hàng đợi M/M/1 hữu hạn...................................................... 22

2.2.2.3

Kích thước trung bình của hàng đợi M/M/1 hữu hạn.......................................................23

2.2.2.4

Công thức Little L=W và áp dụng để tính thời gian trễ trung bình................................24

2.3 Mô phỏng mạng bằng chương trình máy tính........................................................................25

2.3.1

Giới thiệu chung (under construction)..................................................................................... 25

2.3.2

Ý tưởng xây dựng bộ mô phỏng mạng vận hành theo các sự kiện rời rạc............................... 25

2.4 Đo trên mạng thực (under construction)................................................................................ 27

2.5 Tài liệu tham khảo cho Chương 2..........................................................................................27

CHƯƠNG 3 ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG MÔ HÌNH HÀNG ĐỢI..............28

3.1 Mô hình mạch ảo................................................................................................................... 28

3.2 Thí dụ 3.1: Đánh giá hiệu năng của các cơ chế kiểm soát lỗi................................................29

3.2.1

Kiểm soát lỗi đầu cuối - đầu cuối (end-to-end)........................................................................30

3.2.2

Kiểm soát lỗi theo chặng (link-by-link)...................................................................................33

3.2.3

Áp dụng: So sánh cơ chế kiểm soát lỗi đầu cuối - đầu cuối và theo chặng..............................35

3.2.3.1

So sánh các cơ chế theo chặng và đầu cuối - đầu cuối ở mạng tốc độ thấp......................35

3.2.3.2

So sánh các cơ chế theo chặng và đầu cuối - đầu cuối ở mạng tốc độ cao....................... 37

3.3 Thí dụ 3.2: Đánh giá hiệu năng của cơ chế điều khiển lưu lượng bằng cửa sổ trượt............ 39

3.3.1

Mô hình cửa sổ trượt với sự biên nhận từng gói số liệu...........................................................39

3.3.1.1

Trường hợp tải rất nặng....................................................................................................40

3.3.1.2

Trường hợp tải xấp xỉ bằng khả năng vận chuyển của đường truyền...............................41

3.3.2

Mô hình cửa sổ trượt với sự biên nhận ở cuối cửa sổ.............................................................. 42

3.3.2.1

Trường hợp tải rất nặng....................................................................................................43

3.3.2.2

Trường hợp tải xấp xỉ bằng khả năng vận chuyển của đường truyền...............................44

3.4 Tài liệu tham khảo cho Chương 3..........................................................................................45

CHƯƠNG 4 ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG BỘ MÔ PHỎNG NS-2............... 46

4.1 Bộ mô phỏng mạng NS-2...................................................................................................... 46

4.1.1

Giới thiệu.................................................................................................................................46

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

4.1.2

Cấu trúc phần mềm của NS.....................................................................................................48

4.1.3

Lập trình mô phỏng bằng NS.................................................................................................. 49

4.1.4

Cấu trúc tệp vết (trace file) chứa kết quả mô phỏng................................................................49

4.1.4.1

Cấu trúc tệp vết chứa kết quả mô phỏng mạng có dây.....................................................50

Tài liệu tham khảo (cho 4.1.4.1):................................................................................................. 51

4.1.4.2

Cấu trúc tệp vết chứa kết quả mô phỏng mạng không dây (under construction)..............51

4.1.4.3

Cấu trúc tệp vết chứa kết quả mô phỏng mạng hỗn hợp (under construction)................. 51

4.2 NAM......................................................................................................................................51

Tài liệu tham khảo cho “4.2 NAM”:............................................................................................52

4.3 Giới thiệu một số công cụ hỗ trợ việc phân tích và hiển thị kết quả mô phỏng.................... 52

4.3.1

Giới thiệu dự án GNU............................................................................................................. 52

4.3.2

Grep.........................................................................................................................................52

4.3.3

Awk.........................................................................................................................................53

4.3.4

Perl.......................................................................................................................................... 53

4.3.5

GNUPLOT.............................................................................................................................. 53

4.3.6

XGRAPH................................................................................................................................ 54

4.3.7

Trace graph..............................................................................................................................54

Tài liệu tham khảo cho “4.3 Giới thiệu một số công cụ hỗ trợ việc phân tích và hiển thị kết quả

mô phỏng”:........................................................................................................................................54

4.4 Các bước chính trong việc tiến hành mô phỏng mạng.......................................................... 54

4.4.1

Tạo bộ lập lịch các sự kiện (Creating Event Scheduler)..........................................................54

4.4.2

Ghi lại vết các sự kiện của mạng mô phỏng (vào file “*.tr” và/hoặc “*.nam”).......................55

4.4.3

Thiết lập mạng mô phỏng........................................................................................................55

4.4.3.1

Thiết lập tô-pô..................................................................................................................55

4.4.3.2

Đưa mô hình lỗi vào đường truyền:................................................................................. 55

4.4.3.3

Chọn thuật toán routing:.................................................................................................. 56

4.4.4

Tạo ra các kết nối ở tầng giao vận (giao thức TCP, UDP...)................................................... 56

4.4.4.1

Tạo ra các kết nối TCP.....................................................................................................56

4.4.4.2

Tạo ra các kết nối UDP.................................................................................................... 56

4.4.5

Tạo ra các nguồn sinh lưu lượng............................................................................................. 56

4.4.5.1

Lưu lượng do TCP vận chuyển........................................................................................57

4.4.5.2

Lưu lượng do UDP vận chuyển....................................................................................... 57

4.4.6

Xác định thời gian mô phỏng cần thiết....................................................................................57

4.5 Tài liệu tham khảo cho Chương 4......................................................................................... 57

CHƯƠNG 5 CÁC THÍ DỤ ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG NS-2.....................59

5.1 Thí dụ 1: Tính các tham số hiệu suất chính và sự chia sẻ đường truyền của các kết nối TCP,

UDP......................................................................................................................................59

5.1.1

Viết simulation script theo yêu cầu của bài toán..................................................................... 60

5.1.2

Tính các tham số hiệu suất trung bình trong một khoảng thời gian.........................................61

5.1.2.1

Tính thông lượng trung bình của từng kết nối (tcp: 3, udp: 1)......................................... 61

5.1.2.2

Tính độ trễ trung bình của các gói tin theo từng kết nối (tcp: 3, udp: 1)..........................64

5.1.3

Tính các tham số hiệu suất trung bình tại từng thời điểm trong quá trình mô phỏng.............. 66

5.1.3.1

Vẽ đồ thị thông lượng trung bình của 4 kết nối trong quá trình mô phỏng...................... 66

5.1.3.2

Tính thăng giáng độ trễ của từng gói tin (Jitter) trong quá trình mô phỏng..................... 67

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

PHỤ LỤC...................................................................................................................................68

1. Chương trình chapter5_sample1.tcl......................................................................................... 68

2. Chương trình avg_throughput_during_sim_time.pl.................................................................70

3. Chương trình avg_delay_during_sim_time.pl..........................................................................71

4. Chương trình throughput.pl..................................................................................................... 72

Thí dụ 1: RED Queue Monitor.................................................................................................... 73

CÁC ĐỀ TÀI SEMINAR CHO HVCH...................................................................................78

Sách:............................................................................................................................................ 78

Chapter 4: Type of Workloads..................................................................................................... 78

Chapter 5: The Art of Workload Selection...................................................................................78

Chapter 6: Workload Characterization Techniques......................................................................78

Chapter 7: Monitors......................................................................................................................78

Chapter 8: Program Execution Monitors and Accounting Logs...................................................78

Chapter 9: Capacity Planning and Benchmarking........................................................................78

Chapter 10: The Art of Data Presentation. Chapter 11: Ratio Games.......................................... 78

Chapter 11: Ratio Games..............................................................................................................78

Chapter 12: Summerizing Measured data.....................................................................................78

10.

Chapter 13: Comparing Systems Using Sample Data................................................................ 78

Bài báo:........................................................................................................................................78

1........................................................................................................................................................78

DANH MỤC TÀI LIỆU THAM KHẢO.................................................................................78

BẢNG CHÚ GIẢI (Index)........................................................................................................80

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

CHƯƠNG 1 GIỚI THIỆU

1.1 Khái niệm hiệu năng và các độ đo hiệu năng mạng

1.1.1 Khái niệm hiệu năng mạng

Theo nghĩa chung, hiệu năng là một độ đo công việc mà một hệ thống thực hiện được.

Hiệu năng chủ yếu được xác định bởi sự kết hợp của các nhân tố: tính sẵn sàng để dùng

(availability), thông lượng (throughput) và thời gian đáp ứng (response time). Đối với

mạng máy tính, hiệu năng cũng còn được xác định dựa trên các nhân tố khác nữa, thí dụ:

thời gian trễ (delay), độ tin cậy (reliability), tỉ suất lỗi (error rate), hiệu năng của ứng dụng

v.v.

Tuỳ theo mục đích nghiên cứu cụ thể, hiệu năng có thể chỉ bao gồm một nhân tố nào đó

hoặc là sự kết hợp một số trong các nhân tố nêu trên.

1.1.2 Các độ đo hiệu năng mạng

Có thể phân các độ đo hiệu năng thành hai loại: các độ đo hướng tới người sử dụng và

các độ đo hướng tới hệ thống. Trong các độ đo hướng tới người sử dụng, thời gian đáp

ứng (response time) thường được sử dụng trong các hệ thời gian thực hoặc các môi trường

hệ thống tương tác. Đó là khoảng thời gian từ khi có một yêu cầu (request) đến hệ thống

cho đến khi nó được hệ thống thực hiện xong. Trong các hệ thống tương tác, đôi khi người

ta sử dụng độ đo thời gian phản ứng của hệ thống (system reaction time) thay cho thời

gian đáp ứng. Đó là khoảng thời gian tính từ khi input đến hệ thống cho đến khi yêu cầu

chứa trong input đó nhận được khe thời gian (slice time) phục vụ đầu tiên. Độ đo này đo

mức độ hiệu dụng của bộ lập lịch của hệ thống trong việc nhanh chóng cung cấp dịch vụ

cho một yêu cầu mới đến. Trong các hệ thống mạng máy tính, các đại lượng thời gian đáp

ứng, thời gian phản ứng của hệ thống đều được xem là các biến ngẫu nhiên, vì vậy người

ta thường nói về phân bố, kỳ vọng, phương sai... của chúng [20].

Các độ đo hướng tới hệ thống điển hình là thông lượng (throughput) và thời gian trễ

(delay time, delay). Thông lượng được định nghĩa là số đơn vị thông tin tính trung bình

được vận chuyển qua mạng trong một đơn vị thời gian. Đơn vị thông tin ở đây có thể là bit,

byte hay gói số liệu... Nếu các đơn vị thông tin đi vào mạng theo một cơ chế độc lập với

trạng thái của mạng, thì thông lượng cũng chính bằng tốc độ đến trung bình nếu mạng vẫn

còn có khả năng vận chuyển, không dẫn đến trạng thái bị tắc nghẽn. Một số trường hợp

người ta sử dụng đại lượng không thứ nguyên Hệ số sử dụng đường truyền (Line

Utilization) hay còn gọi thông lượng chuẩn hoá, đó là tỉ số của thông lượng trên năng lực

vận chuyển của đường truyền (line capacity). Thời gian trễ là thời gian trung bình để vận

chuyển một gói số liệu qua mạng, từ nguồn tới đích. Cũng có trường hợp người ta sử dụng

đại lượng thời gian trễ chuẩn hoá, đó là tỉ số của thời gian trễ trên một tham số thời gian

nào đó, thí dụ thời gian cần thiết để truyền một gói tin (packet transmition time).

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

1.2 Tầm quan trọng của việc đánh giá hiệu năng mạng máy tính

Trong suốt lịch sử tiến hoá của mạng máy tính, vấn đề đánh giá và dự đoán hiệu năng

mạng luôn thu hút sự quan tâm của những người nghiên cứu và thiết kế mạng; mục đích

chính là để nắm được và cải thiện đặc trưng giá - hiệu năng (cost-performance). Yêu

cầu đánh giá và dự đoán hiệu năng mạng đặt ra ngay từ khi người ta thiết kế kiến trúc của

hệ thống cho đến khi mạng đã được lắp đặt và đưa vào hoạt động. Trong giai đoạn đầu của

quá trình thiết kế, người ta thường phải dự đoán hai điều. Thứ nhất là bản chất của các ứng

dụng sẽ chạy trên mạng và các yêu cầu dịch vụ mà các ứng dụng này đòi hỏi hệ thống

mạng phải đáp ứng. Điều dự đoán thứ hai liên quan tới việc lựa chọn một trong các thiết

kế kiến trúc, dựa trên các công nghệ phần cứng và phần mềm sẽ được phát triển và đưa ra

thị trường trong tương lai, khi hệ thống mạng bước vào giai đoạn triển khai thực hiện.

Sau khi đã lựa chọn kiến trúc và bắt đầu thiết kế, triển khai hệ thống mạng, việc dự

đoán và đánh giá hiệu năng sẽ trở nên cụ thể hơn. Thí dụ sẽ chọn đường truyền vật lý như

thế nào, các đặc tính của đường truyền được chọn sẽ ảnh hưởng thế nào đến hiệu năng của

mạng. Các kỹ thuật được dùng để dự đoán và đánh giá hiệu năng mạng trong giai đoạn

thiết kế và triển khai thực hiện có khi chỉ là các tính toán bằng tay, nhưng cũng có khi là

các mô phỏng rất tinh vi. Việc so sánh hiệu năng dự đoán với hiệu năng thực tế đạt được

thường giúp cho nhà nghiên cứu thấy được các khiếm khuyết chính trong thiết kế hoặc các

lỗi trong việc lập trình hệ thống. Ngày nay, việc dự đoán và đánh giá hiệu năng thường

được người ta coi là một phần không thể thiếu được của công việc thiết kế và triển khai

thực hiện hệ thống.

Định cấu hình mạng: Sau khi mạng đã được triển khai thực hiện, việc dự đoán và đánh

giá hiệu năng mạng đối với các ứng dụng cụ thể cũng có ý nghĩa quan trọng. Nhằm đạt

được sự tối ưu hoá, nhà sản xuất phải chỉ ra được các cách kết hợp và tổ chức phần cứng

và phần mềm mạng để đem lại một giải pháp tốt nhất cho các yêu cầu của khách hàng,

việc này thường được gọi là định cấu hình mạng. Mặc dù có thể vẫn sử dụng các công cụ

và phương pháp đã được sử dụng trong giai đoạn phát triển hệ thống, nhưng cần phải bổ

sung thêm một số yếu tố nữa. Đặc điểm môi trường của người sử dụng sản phẩm mạng

cần được biểu diễn bằng các tham số định lượng và đưa vào mô hình mô phỏng hiệu năng.

Tinh chỉnh hệ thống: Sau khi hệ thống sản phẩm đã được lắp đặt tại địa điểm của

khách hàng, nhà cung cấp sản phẩm cần phải làm sao cho hệ thống mà họ bán cho khách

hàng đạt được hiệu năng hoạt động như họ đã hứa hẹn khi chào hàng, việc này được gọi là

tinh chỉnh hệ thống. Đối với các hệ thống mạng, việc tìm ra được điểm làm việc tối ưu và

ổn định trên toàn mạng là rất khó.

1.3 Phân loại các phương pháp đánh giá hiệu năng mạng

Có nhiều phương pháp đánh giá hiệu năng mạng máy tính, có thể chia chúng làm ba

loại: mô hình Giải tích (Analytic Models), mô hình Mô phỏng (Simulation Models) và Đo

hiệu năng (Measurement).

Mô hình Giải tích

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

Trong các mạng chuyển mạch gói, gói số liệu là các khối dữ liệu có chiều dài thay đổi

được, được truyền qua mạng từ nguồn tới đích theo một con đường nào đó do hệ thống

mạng quyết định. Các tài nguyên mạng sẽ được chia sẻ giữa các gói số liệu khi chúng đi

qua mạng. Số lượng và chiều dài các gói số liệu đi vào hoặc đi qua mạng tại mọi thời điểm,

thời gian kéo dài các cuộc kết nối v.v., tất cả các tham số này nói chung, thay đổi một cách

thống kê. Vì vậy, để nêu ra các tiêu chuẩn đo lường định lượng về hiệu năng, cần phải sử

dụng các khái niệm về xác suất để nghiên cứu sự tương tác của chúng với mạng. Lý thuyết

Hàng đợi đóng vai trò mấu chốt trong việc phân tích mạng, bởi vì đó là công cụ Toán học

thích hợp nhất để phát biểu và giải các bài toán về hiệu năng. Theo phương pháp này,

chúng ta viết ra các mối quan hệ hàm giữa các tiêu chuẩn hiệu năng cần quan tâm và các

tham số của hệ thống mạng bằng các phương trình có thể giải được bằng giải tích.

Mô phỏng

Theo nghĩa chung nhất, mô phỏng là sự bắt chước một hay nhiều khía cạnh của sự vật

có thực, bằng một cách nào đó càng giống càng tốt. Trong các lĩnh vực nghiên cứu hiện

đại, như lĩnh vực đánh giá hiệu năng mạng, mô phỏng được hiểu là một kỹ thuật sử dụng

máy tính điện tử số để làm các thí nghiệm về mạng có liên quan đến thời gian. Mô hình

Mô phỏng mô tả hành vi động của mạng, ngay cả khi người nghiên cứu chỉ quan tâm đến

giá trị trung bình của một số độ đo trong trạng thái dừng. Cấu trúc và độ phức tạp của bộ

mô phỏng phụ thuộc vào phạm vi của thí nghiệm mô phỏng. Nó thường được xây dựng có

cấu trúc, cho phép mô-đun hoá chương trình mô phỏng thành tập các chương trình con,

sao cho việc sửa đổi, bổ sung các chương trình con được dễ dàng. Ngoài ra, chương trình

mô phỏng cũng phải được xây dựng sao cho đạt được tốc độ cao nhằm làm giảm thời gian

chạy mô phỏng càng nhiều càng tốt.

Đo

Đó là phương pháp xác định hiệu năng dựa trên việc đo trên mạng thực các tham số

mạng cấu thành độ đo hiệu năng cần quan tâm. Việc đo hiệu năng nhằm thực hiện một

trong các nhiệm vụ sau. Một là, giám sát hiệu năng của mạng . Hai là, thu thập số liệu để

lập mô hình dữ liệu vào cho các phương pháp đánh giá hiệu năng bằng giải tích hoặc mô

phỏng. Nhiệm vụ thứ ba là kiểm chứng các mô hình khác dựa trên các số liệu đo được. Đo

hiệu năng không chỉ quan trọng trong các giai đoạn triển khai thực hiện và tích hợp hệ

thống mà còn cả trong các giai đoạn lắp đặt và vận hành hệ thống. Bởi vì sau khi lắp đặt

và đưa vào sử dụng, mỗi một hệ thống cụ thể sẽ có một tải hệ thống và các độ đo hiệu

năng được quan tâm riêng của nó, cho nên sau khi lắp đặt, người ta thường phải điều chỉnh

cấu hình cho phù hợp. Các tham số cấu hình sẽ được chọn sau khi các phép đo hiệu năng

cho thấy các tham số cấu hình này làm cho hệ thống đạt được hiệu năng tốt nhất. Trong

thực tế, mọi người đều thừa nhận tầm quan trọng của việc đo và đánh giá hiệu năng.

Chúng ta có thể thấy rõ điều này qua việc, hầu như tất cả các hệ thống mạng đều tích hợp

bên trong nó các công cụ đo và đánh giá hiệu năng; nhờ đó có thể đo hiệu năng bất cứ lúc

nào trong suốt vòng đời của hệ thống.

So sánh các phương pháp đánh giá hiệu năng

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

Mô hình Giải tích: Nếu có thể sử dụng mô hình Giải tích thì đó là điều tốt nhất, bởi vì

chúng ta có thể thay đổi các tham số hệ thống và cấu hình mạng trong một miền rộng với

chi phí thấp mà vẫn có thể đạt được các kết quả mong muốn. Tuy nhiên, các mô hình Giải

tích mà chúng ta xây dựng thường là không thể giải được nếu không được đơn giản hoá

nhờ các giả thiết, hoặc được phân rã thành các mô hình nhiều cấp. Các mô hình giải được

thường rất đơn giản hoặc khác xa thực tế, cho nên phương pháp này thường chỉ được sử

dụng ngay trong giai đoạn đầu của việc thiết kế mạng, giúp cho người thiết kế dự đoán

được các giá trị giới hạn của hiệu năng. Ngoài ra, các kết quả của phương pháp này bắt

buộc phải được kiểm nghiệm bằng kết quả của các phương pháp khác, như mô phỏng hoặc

đo.

Mô phỏng: Trong những trường hợp mô hình Giải tích mà chúng ta nhận được, dù đã

được đơn giản hoá, hoặc phân rã nhưng vẫn không thể giải được bằng Toán học, khi đó,

nói chung, chúng ta sẽ chỉ còn một phương pháp là mô phỏng. Phương pháp mô phỏng có

thể được sử dụng ngay trong giai đoạn đầu của việc thiết kế hệ thống mạng, cho đến giai

đoạn triển khai thực hiện và tích hợp hệ thống. Phương pháp này nói chung, đòi hỏi một

chi phí rất cao cho việc xây dựng bộ mô phỏng cũng như kiểm chứng tính đúng đắn của

nó. Tuy nhiên, sau khi đã xây dựng xong bộ mô phỏng, người nghiên cứu có thể tiến hành

chạy chương trình mô phỏng bao nhiêu lần tuỳ ý, với độ chính xác theo yêu cầu và chi phí

cho mỗi lần chạy thường là rất thấp. Các kết quả mô phỏng nói chung vẫn cần được kiểm

chứng, bằng phương pháp giải tích hoặc đo, nhất là bằng phương pháp đo. Phương pháp

mô hình Giải tích và mô hình Mô phỏng đóng vai trò rất quan trọng trong việc thiết kế và

triển khai thực hiện hệ thống, đặc biệt là ở giai đoạn đầu.

Đo: Phương pháp đo chỉ có thể thực hiện được trên mạng thực, đang hoạt động, nó

cũng đòi hỏi chi phí cho các công cụ đo và cho việc tiến hành đo. Việc đo cần được tiến

hành tại nhiều điểm trên mạng thực, ở những thời điểm khác nhau và cần lặp đi lặp lại

trong một khoảng thời gian đủ dài, thậm chí có thể dài đến hàng tháng. Ngoài ra, người

nghiên cứu phải có kiến thức về Lý thuyết thống kê thì mới có thể rút ra được các kết luận

hữu ích từ các số liệu thu thập được. Mặc dầu vậy, bằng phương pháp đo có thể vẫn không

phát hiện ra được hoặc dự đoán được các hành vi đặc biệt của mạng.

Các phương pháp được trình bày trong giáo trình này: giáo trình này trình bày hai

phương pháp đánh giá hiệu năng mạng là mô hình Giải tích và Mô phỏng (trong tương lai,

tác giả sẽ bổ sung thêm phương pháp đo). Bằng hai phương pháp này, đặc biệt là bằng

phương pháp Mô phỏng, chúng ta có thể nghiên cứu rất sâu các phương pháp cải thiện

hiệu năng các giao thức, thí dụ các giao thức giao vận như TCP và các giao thức MAC

802.3, 802.11, chúng ta có thể “thực hiện” các cải tiến đối với các giao thức đó và đánh

giá hiệu quả của các đề xuất cải tiến với một chi phí thấp về thời gian và cơ sở vật chất.

1.4 Các lỗi thường gặp

Trong việc đánh giá hiệu suất mạng, người nghiên cứu có thể vô tình mắc phải một số

lỗi do bỏ sót một hay một số yếu tố, hiểu sai vấn đề, thiếu kiến thức về các kỹ thuật đánh

giá hiệu suất...

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

Dưới đây liệt kê các lỗi thường mắc phải khi đánh giá hiệu suất mạng.

1. Không có mục đích rõ ràng (No Goal). Trước khi thực hiện đánh giá hiệu suất mạng,

nhất thiết phải xác định rõ các mục tiêu cụ thể cần đạt được là gì, trên cơ sở đó lựa

chọn các độ đo hiệu suất, tải đưa vào mạng và phương pháp đánh giá v.v. phù hợp.

Nhiệm vụ này nghe qua có vẻ đơn giản và tầm thường nhưng thực sự không luôn luôn

như vậy.

2. Mục đích thiên lệch (Bias goals). Khi phát biểu mục đích, có thể thiên vị một các hiển

nhiên hay thiên vị kiểu ngầm. Thí dụ, nếu như mục đích là: “Hãy chỉ ra rằng hệ thống

của chúng ta tốt hơn hệ thống của họ”, thì bài toán trở thành tìm các độ đo và tải sao

cho hệ thống của chúng ta thể hiện là tốt hơn, chứ không phải là việc tìm ra các độ đo

và tải đúng đắn để so sánh hai hệ thống. Có một quy tắc bất thành văn của giới chuyên

gia về đánh giá hiệu suất là không thiên vị, người đánh giá hiệu suất cần đóng vai trò

của người giám khảo và đưa ra các kết luận dựa trên sự phân tích chứ không dựa trên

niềm tin.

3. Sự tiếp cận thiếu tính hệ thống (Unsystermatic Approach). Người phân tích thường

phỏng theo một cách tiếp cận không có tính hệ thống khi chọn một cách tuỳ tiện các

tham số hệ thống, các nhân tố (factor), các độ đo và tải. Vấn đề này sẽ được bàn thêm

kỹ hơn ở mục 1.5 sau đây.

4. Phân tích mà không hiểu bài toán (Analysis without Understanding the Problem).

Người phân tích thiếu kinh nghiệm cảm thấy thực sự không đạt được điều gì khi chưa

xây dựng xong mô hình và chưa nhận được một kết quả bằng con số nào. Đối với

người phân tích có kinh nghiệm, họ biết rõ rằng việc xác định rõ bài toán chiếm phần

lớn nỗ lực của họ, tỉ lệ này có thể lên đến 40%. Điều này củng cố cho một câu châm

ngôn cũ: “một bài toán được phát biểu tốt là đã giải được một nửa”. Trong 60% nỗ

lực còn lại, phần chủ yếu dành cho các lựa chọn thiết kế, diễn giải các kết quả và trình

bày các kết luận. Việc phát triển mô hình bản thân nó là một phần nhỏ của quá trình

giải bài toán, giống như ô tô và tàu hoả là các phương tiện để đi đến một địa điểm nào

đó chứ không phải là chính địa điểm đến. Mô hình là phương tiện để đạt được kết luận

chứ nó không phải là kết luận cuối cùng. Những người phân tích được đào tạo về việc

lập mô hình để đánh giá hiệu suất nhưng không được đào tạo về việc xác định bài toán

hay trình bày kết quả thường thấy các mô hình của họ bị những người ra quyết định lờ

đi trong khi họ chỉ tìm kiếm sự hỗ trợ của mô hình chứ không phải chính bản thân mô

hình.

5. Các độ đo hiệu suất không đúng (Incorrect Performance Metrics): Nói về độ đo là nói

về các tiêu chuẩn được sử dụng để lượng hoá hiệu suất của hệ thống. Thí dụ về các độ

đo hiệu suất thường được sử dụng là: thông lượng (throughput) và thời gian đáp ứng

(response time). Việc lựa chọn độ đo hiệu suất đúng phụ thuộc vào các dịch vụ mà hệ

thống hoặc hệ thống con được mô hình hoá cung cấp. Thí dụ hiệu suất của các CPU

được so sánh trên cơ sở thông lượng của chúng, thường được đo bằng đơn vị MIPS

(Million of Íntruction Per Second). Tuy nhiên việc so sánh MIPS của 2 CPU có kiến

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

trúc khác nhau, thí dụ RISC và CISC là vô nghĩa, bởi vì các chỉ thị mà 2 CPU này thi

hành là không tương đương.

Lỗi thường mắc khi chọn độ đo hiệu suất là: người phân tích thường chọn các độ đo dễ

tính toán, dễ đo đạc chứ không chọn các độ đo thích đáng.

6. Tải mạng không có tính chất đại diện (Unrepresentative Workload): Tải được sử dụng

để so sánh 2 hệ thống cần phải là đại diện cho việc sử dụng thật sự của hệ thống trong

phạm vi nghiên cứu. Thí dụ, nếu các gói tin trong mạng tính chung là sự trộn lẫn của 2

loại kích thước ngắn và dài , thì tải được sử dụng để so sánh 2 mạng cần bao gồm bao

gồm các gói tin có kích thước dài và kích thước ngắn.

Việc lựa chọn tải có ảnh hưởng quan trọng đến kết quả của việc nghiên cứu về hiệu

suất. Việc lựa chọn sai tải sẽ dẫn đến các kết luận không chính xác.

7. Kỹ thuật đánh giá sai (Wrong Evaluation Technique): Có 3 kỹ thuật đánh giá: đo, mô

phỏng và lập mô hình giải tích. Người phân tích thường có sở thích sử dụng một kỹ

thuật đánh giá cho mọi bài toán đánh giá hiệu suất phải giải quyết. Thí dụ những người

thành thạo Lý thuyết hàng đợi sẽ có khuynh hướng chuyển mọi bài toán đánh giá hiệu

suất về bài toán hàng đợi, dù cho hệ thống có quá phức tạp và có thể áp dụng kỹ thuật

đo một cách dễ dàng. Những người thành thạo về lập trình lại có khuynh hướng giải

mọi bài toán bằng kỹ thuật mô phỏng. Việc người nghiên cứu gắn chặt với một kỹ

thuật duy nhất sẽ dẫn đến một mô hình mà anh ta có thể giải một cách tốt nhất chứ

không phải một mô hình giúp giải bài toán theo cách tốt nhất. Vấn đề xảy ra đối với

những sự biến đổi như vậy là chúng có thể gây ra các hiện tượng lạ trong mô hình

không có trong hệ thống nguyên bản hoặc có thể làm mất đi một số hiện tượng quan

trọng có trong hệ thống nguyên bản.

Người phân tích cần có các kiến thức cơ bản về cả 3 kỹ thuật. Có một số nhân tố cần

được xem xét khi phải lựa chọn lấy một kỹ thuật thích hợp. (sẽ được trình bày tại ...).

8. Xem nhẹ các tham số quan trọng (Overlooking Important Parameters): Có một ý tưởng

tốt là liệt kê đầy đủ các đặc tính (characteristics) của hệ thống và của tải có ảnh hưởng

đến hiệu suất của hệ thống. Các đặc tính này được gọi là các tham số (parameters). Thí

dụ, các tham số hệ thống có thể bao gồm kích thước lượng tử (quantum size) để phân

bổ CPU hay kích thước tập làm việc (working set size) để phân bổ bộ nhớ. Các tham

số về tải có thể bao gồm: số NSD, mẫu đến của các yêu cầu (request arrival patterns),

quyền ưu tiên v.v. Người phân tích có thể chọn một tập các giá trị cho mỗi một trong

các tham số này; kết quả cuối cùng của việc nghiên cứu phụ thuộc rất mạnh vào các

lựa chọn này. Việc xem nhẹ một hay một số tham số quan trọng có thể làm cho các kết

quả trở thành vô dụng.

9. Bỏ qua các yếu tố quan trọng (Ignoring Significant Factors): Các tham số sẽ thay đổi

trong quá trình nghiên cứu được gọi là nhân tố (factor). Thí dụ, trong các tham số về

tải đã được liệt kê ở trên, chỉ có số NSD là có thể được chọn làm factor; các tham số

khác có thể được giữ cố định ở các giá trị điển hình của chúng. Không phải tất cả các

tham số đều có ảnh hưởng bằng nhau đến hiệu suất. Một việc quan trọng là chỉ ra các

tham số mà nếu chúng thay đổi sẽ có ảnh hưởng đáng kể đến hiệu suất. Các tham số

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

này cần được sử dụng làm factor khi nghiên cứu về hiệu suất. Thí dụ tốc độ đến của

các gói tin chứ không phải kích thước gói tin ảnh hưởng đến thời gian phản ứng của

một network gateway, vì vậy tốt nhất là sử dụng một vài giá trị tốc độ đến khác nhau

khi nghiên cứu hiệu suất của nó (network gateway).

Những factor mà NSD cuối (hoặc người ra quyết định) có thể điều khiển được một các

dễ dàng cần được ưu tiên hơn các factor không thay đổi được. Đừng có lãng phí thời

gian vào việc so sánh các lựa chọn (alternatives) mà NSD cuối không thể chấp nhận

hoặc là vì chúng liên quan đến những hành động không thể chấp nhận được đối với

người ra quyết định hoặc là vì chúng nằm ngoài phạm vi ảnh hưởng của chúng.

Điều quan trọng là hiểu được tính ngẫu nhiên của một hệ thống riêng lẻ và các tham số

tải có ảnh hưởng đến hiệu suất. Một số trong các tham số này là dễ biết được hơn các

tham số khác. Thí dụ một người phân tích có thể biết được phân bố của sự tham khảo

trang (page references) trong một hệ thống máy tính nhưng không có một ý niệm gì về

phân bố của sự tham khảo đĩa (distribution of disk references). Trong trường hợp này,

lỗi thường mắc phải là việc sử dụng phân bố tham khảo trang như là một factor mà lại

không sử dụng phân bố tham khảo đĩa, mặc dù đĩa có thể là cái cổ chai và có ảnh

hưởng nhiều hơn đến hiệu suất so với việc tham khảo trang. Việc chọn các factor cần

dựa trên sự liên quan của chúng chứ không nên dựa trên hiểu biết của người phân tích

về các factor. Cần phải nỗ lực để nhận được các giá trị thực tế của tất cả các tham số có

liên quan và các phân bố của chúng. Đối với các tham số còn chưa biết, cần phải thực

hiện một sự phân tích nhạy bén (sensitivity analysis) cho thấy ảnh hưởng của sự thay

đổi của các tham số này so với các giá trị được giả định của chúng, để định lượng ảnh

hưởng của các tham số chưa biết.

10.Thiết kế thí nghiệm không thích hợp (Inappropriate Experimental Design): Việc thiết

kế thí nghiệm liên quan đến số các thí nghiệm đo hoặc thí nghiệm mô phỏng sẽ được

thực hiện và các giá trị của tham số được sử dụng trong từng thí nghiệm. Việc chọn các

giá trị này một cách thích hợp sẽ làm cho với cùng một số lần làm thí nghiệm có thể

nhận được nhiều thông tin hơn. Việc chọn không thích hợp sẽ gây ra lãng phí thời gian

và tài nguyên của người phân tích.

Trong một thiết kế non nớt (naive), từng factor được lần lượt thay đổi. Thiết kế này có

thể dẫn đến các kết luận sai nếu các tham số tương tác đến mức mà ảnh hưởng của một

tham số phụ thuộc vào các giá trị của các tham số khác. Có các cách thiết kế khác tốt

hơn, sử dụng thiết kế thực nghiệm phân chia thành thừa số đầy đủ (full factorial

experimental designs) và thiết kế phân chia thành thừa số phân đoạn (fractional

factorial designs), được giải thích trong Phần IV [].

11.Mức độ chi tiết không thích hợp (Inappropriate Level of Detail): mức độ chi tiết được

sử dụng trong lập mô hình một hệ thống có ảnh hưởng lớn đến việc phát biểu bài toán.

Cần tránh các phát biểu quá rộng hoặc quá hẹp. Để so sánh các lựa chọn khác nhau là

các biến thể khác chút ít của một cách tiếp cận chung, việc xây dựng một mô hình tích

hợp các biến thể là hữu ích hơn việc xây dựng một mô hình ở mức cao. Mặt khác, để

so sánh các lựa chọn rất khác nhau, các mô hình mức cao đơn giản có thể cho phép

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

phân tích một vài lựa chọn một cách nhanh chóng và không tốn kém. Một lỗi thường

mắc là chọn cách tiếp cận chi tiết khi mà một mô hình mức cao có thể làm được và

ngược lại. Rõ ràng là các mục đích của việc nghiên cứu có ảnh hưởng lớn đến những

cái được lập mô hình và việc chúng sẽ được phân tích như thế nào.

12.Thiếu phân tích (No Analysis): Một trong các vấn đề chung của các kế hoạch (project)

đo là chúng thường được vận hành bởi những người phân tích hiệu suất, họ giỏi về các

kỹ thuật đo nhưng thiếu tinh thông về phân tích số liệu. Họ thu thập một lượng lớn số

liệu, nhưng không biết phải phân tích hoặc diễn dải chúng như thế nào. Kết quả là một

bộ băng từ (hoặc bộ đĩa) chứa đầy số liệu mà không có một bản tóm tắt nào. Giỏi lăm,

người phân tích có thể tạo ra một bản báo cáo dày chứa đầy các số liệu thô và các đồ

thị mà không có một giải thích về việc người ta có thể sử dụng các kết quả này như

thế nào. Vì vậy, tốt nhất là có một đội các nhà phân tích hiệu suất có các kiến thức cơ

sở về đo và phân tích.

13.Phân tích sai (Erroneous Analysis): Có một số lỗi chung mà những người phân tích

thường mắc phải trong việc đo, mô phỏng và lập mô hình giải tích, thí dụ lấy trung

bình của các tỉ số và các mô phỏng quá ngắn.

14.Thiếu phân tích nhạy bén (No Sensitivity Analysis): Các nhà phân tích thường nhấn

mạnh quá mức vào các kết quả của sự phân tích của họ, bằng cách trình bày chúng như

là các sự kiện (fact) chứ không phải là các bằng chứng (evidence). Có một sự thật là

các kết quả có thể nhạy cảm đối với tải và các tham số hệ thống thường bị bỏ sót

(overlook). Nếu thiếu sự phân tích nhạy bén, người ta sẽ không thể chắc chắn rằng các

kết luận có thay đổi hay không nếu sự phân tích được thực hiện với một sự thiết lập

(setting) hơi khác một chút. Cũng như vậy, nếu thiếu sự phân tích nhạy bén, khó có thể

biết được sự quan trọng tương đối của các tham số khác nhau.

15.Bỏ qua các lỗi ở input (Ignoring Error in Input): Thông thường các tham số cần quan

tâm lại không thể đo được. Thay vào đó, lại có thể đo được một biến khác và sử dụng

nó để ước lượng (giá trị của) tham số. Thí dụ trong một thiết bị mạng, các gói tin được

chứa trong một danh sách móc nối của các bộ đệm (buffer), mỗi bộ đệm có chiều dài

512 byte. Khi biết được số bộ đệm cần có để chứa các gói tin, không thể dự đoán được

một cách chính xác số gói tin hay số byte có trong các gói tin. Những tình huống như

vậy dẫn đến các tình huống bất định bổ sung trong số liệu vào. Người phân tích cần

phải điều chỉnh mức độ tin cậy ở đầu ra của mô hình nhận được từ những số liệu như

vậy. Ngoài ra, cũng có thể là không đáng để lập mô hình một cách chính xác kích

thước gói tin khi input có thể được tắt đi nhiều đến 512 bytes. Thí dụ này còn minh hoạ

thêm một điểm nữa, đó là các lỗi ở input không luôn luôn được phân bố đều quanh giá

trị trung bình. Trong trường hợp này, không gian bộ đệm luôn lớn hơn số lượng byte

thực sự được truyền lên mạng hoặc được nhận từ mạng. Nói cách khác, input bị thiên

lệch.

16.Xử lý không đúng đắn các giá trị khác thường (Improper Treatment of Outlier): Các

giá trị quá cao hoặc quá thấp so với đa số các giá trị trong một tập được gọi là các giá

trị khác thường (outliers). Các giá trị khác thường ở input hoặc output của mô hình

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

biểu thị một vấn đề. Nếu một giá trị khác thường không phải do một hiện tượng của hệ

thống thực gây ra, thì cần bỏ qua nó. Việc sử dụng cả giá trị này có thể tạo ra một mô

hình hỏng. Mặt khác, nếu giá trị khác thường có thể xuất hiện trong hệ thống thực, nó

cần được đưa vào mô hình một cách thích hợp. Việc bỏ qua không sử dụng giá trị này

sẽ tạo ra một mô hình hỏng. Việc xác định giá trị khác thường nào cần bỏ qua, giá trị

khác thường nào cần đưa vào là một phần của nghệ thuật đánh giá hiệu suất và đòi hỏi

sự hiểu biết kỹ càng về hệ thống được lập mô hình.

17.Giả thiết sẽ không có thay đổi gì trong tương lai (Assuming No Change in the Future):

Người ta thường giả thiết rằng tương lai là giống với quá khứ. Một mô hình dựa trên

việc sử dụng tải và hiệu suất quan sát được trong quá khứ để dự đoán hiệu suất trong

tương lai. Tải và hành vi hệ thống trong tương lai được giả thiết là tương tự với tải và

hành vi hệ thống đã được đo. Người phân tích và những người ra quyết định cần thảo

luận về giả thiết này và định giới hạn thời gian trong tương lai cho việc áp dụng các dự

đoán.

18.Bỏ qua tính biến thiên (Ignoring Variability): Người ta thường chỉ phân tích hiệu suất

trung bình bởi vì việc xác định tính biến thiên thường là khó, thậm chí là không thể

thực hiện được. Nếu tính biến thiên là cao, việc chỉ sử dụng giá trị trung bình có thể

làm người ra quyết định bị sai lầm. Thí dụ, các quyết định dựa trên việc tính giá trị

trung bình hàng ngày của yêu cầu sử dụng máy tính có thể không có giá trị nếu yêu cầu

về tải có nhiều giá trị cao điểm (peak) hàng giờ, chúng ảnh hưởng bất lợi đến hiệu suất

của người sử dụng.

19.Phân tích quá phức tạp (Too Complex Analysis): Khi đã biết 2 phép phân tích dẫn đến

cùng một kết luận, thì phép phân tích đơn giản hơn, dễ giải thích hơn rõ ràng nên được

sử dụng. Người phân tích hiệu suất cần truyền đạt các kết luận cuối cùng theo cách

càng đơn giản càng tốt. Một số người phân tích bắt đầu với các mô hình phức tạp và

các mục tiêu quá tham vọng, dẫn đến việc không thể giải được, hoặc không thể đo

được hoặc mô phỏng được, kết cục là không thể đạt được mục đích. Tốt nhất là hãy bắt

đầu nghiên cứu với các mô hình hay phép đo đơn giản, sau khi nhận được một số kết

quả hoặc thấu hiểu được vấn đề, sẽ tăng độ phức tạp của mô hình hoặc phép đo.

Có sự khác nhau đáng kể giữa các kiểu mô hình được công bố trong tài liệu và các mô

hình được sử dụng trong thực tế. Các mô hình trình bày trong các tài liệu và thường

được giảng dạy trong các nhà trường thường là quá phức tạp. Lý do là vì các mô hình

tầm thường, dù cho rất sáng tỏ, cũng thường không được chấp nhận cho xuất bản. Vì

một số lý do, khả năng phát triển và giải một mô hình phức tạp được giới hàn lâm đánh

giá cao hơn so với việc rút ra được các kết luận từ các mô hình đơn giản. Tuy nhiên,

trong giới công nghiệp, những người ra quyết định hiếm khi quan tâm đến kỹ thuật lập

mô hình hay tính mới của nó. Quan tâm chủ yếu của họ là sự tính dẫn dắt của mô hình

cùng với thời gian và chi phí để phát triển mô hình. Thời hạn ra quyết định thường dẫn

đến việc chọn các mô hình đơn giản. Chính vì vậy, đa số các vấn đề về hiệu suất hàng

ngày trong thế giới thực được giải quyết bằng các mô hình đơn giản; các mô hình phức

tạp hiếm khi, thậm chí là không bao giờ được sử dụng. Ngay cả khi thời gian để phát

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

triển mô hình không bị hạn chế, người ra quyết định cũng không dễ ràng hiểu được các

mô hình phức tạp, vì vậy kết quả của các mô hình này cũng không được tin tưởng.

Chính điều này làm những người mới tốt nghiệp, được đào tạo rất tốt về các kỹ thuật

lập mô hình phức tạp thất vọng vì họ thấy có rất ít cơ hội sử dụng chúng trong thực tế.

20.Biểu diễn kết quả không thích hợp (Improper Presentation of Results): Mục đích cuối

cùng của việc nghiên cứu hiệu suất là trợ giúp cho việc ra quyết định. Việc phân tích

không tạo ra được các kết quả hữu dụng là việc làm thất bại. Tương tự như vậy, việc

phân tích với các kết quả mà người ra quyết định không thể hiểu nổi cũng là thất bại.

Người ra quyết định có thể là nhà thiết kế hệ thống, người mua hệ thống hoặc là người

tài trợ cho dự án. Việc truyền đạt (hoặc bán) các kết quả của việc phân tích cho người

ra quyết định là trách nhiệm của người phân tích. Điều này đòi hỏi việc sử dụng không

ngoan từ ngữ, các bức ảnh và đồ thị để giải thích các kết quả và việc phân tích. Độ đo

đúng để đo hiệu suất của một người phân tích không phải là số phép phân tích đã được

thực hiện mà là số phép phân tích đã giúp ích cho người ra quyết định.

21.Bỏ qua các yếu tố xã hội (Ignoring Social Aspects): Việc trình bày thành công các kết

quả phân tích đòi hỏi phải có 2 loại kỹ năng: kỹ năng về xã hội và kỹ năng thực sự

(substantive skills). Viết và nói là các kỹ năng về xã hội, trong khi đó việc lập mô hình

và phân tích là các kỹ năng thật sự. Hầu hết các nhà phân tích đều có loại kỹ năng thực

sự là tốt; tuy nhiên chỉ có những người có kỹ năng xã hội tốt thành công trong việc bán

các kết quả của họ cho những người ra quyết định. Việc chấp nhận các kết quả phân

tích đòi hỏi việc thể hiện sự tin cậy giữa những người ra quyết định và người phân tích

và việc trình bày các kết quả trước người ra quyết định thao một cách thức mà người ra

quyết định có thể hiểu được. Nếu người ra quyết định không tin hoặc không hiểu sự

phân tích, thì người phân tích đã thất bại trong việc gây ảnh hưởng lên quyết định cuối

cùng. Các kỹ năng về mặt xã hội là đặc biệt quan trọng trong việc trình bày các kết quả

trái với những điều mà người ra quyết định vẫn tin hoặc trong việc trình bày các giá trị

đòi hỏi những sự thay đổi lớn trong thiết kế.

Những người phân tích mới vào nghề thường không hiểu được rằng, các kỹ năng về

mặt xã hội thường là quan trọng hơn so với các kỹ năng thực sự. Các phân tích có chất

lượng cao có thể bị từ chối chỉ do người phân tích thiếu nỗ lực và thời gian trong việc

trình bày các kết quả. Người ra quyết định thường bị sức ép về thời gian và muốn đi

đến các kết quả cuối cùng càng sớm càng tốt. Họ thường không quan tâm đến tính chất

mới của sự tiếp cận hay chính sự tiếp cận. Mặt khác, người phân tích sau khi đã bỏ ra

rất nhiều thời gian cho việc phân tích, lại cố nói với người ra quyết định về tính chất

mới của việc tiếp cận lập mô hình, chứ không phải là về các kết quả cuối cùng. Sự

khác biệt về quan điểm này có thể dẫn đến một báo cáo quá dài, không gây được ảnh

hưởng. Vấn đề này lại bị làm cho trầm trọng thêm bởi việc người phân tích cũng muốn

trình bày các kết quả cho các đồng nghiệp của mình, họ cũng là những nhà phân tích

và muốn hiểu biết thêm chủ yếu về việc tiếp cận chứ không phải là các kết quả cuối

cùng. Vì vậy, một giải pháp cho vấn đề này là chuẩn bị 2 bài trình bày (hoặcbáo cáo)

riêng biệt cho 2 đối tượng người nghe. Bài trình bày cho người ra quyết định cần có

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

thật ít các thuật ngữ chuyên môn về phân tích và cần nhấn mạnh đến các kết quả cuối

cùng; trong khi đó bài trình bày cho các nhà phân tích khác cần được bổ sung thêm tất

cả các chi tiết của các kỹ thuật phân tích. Việc kết hợp 2 bài trình bày này làm một có

thể làm cho nó trở nên vô nghĩa cho cả 2 đối tượng nghe.

Người phân tích không có kinh nghiệm thường cho rằng người ra quyết định cũng

giống như họ và cùng chia sẽ những niềm tin, các giá trị, ngôn ngữ và các thuật ngữ

chuyên môn. Điều này thương là sai. Người ra quyết định có thể giỏi trong việc đánh

giá các kết quả phân tích, nhưng có thể không hiểu biết nhiều về chính việc phân tích.

Ở vị trí của người ra quyết định, họ phải cân nhắc một vài yếu tố (factor) mà người

phân tích có thể cho là không quan trọng, thí dụ như ảnh hưởng chính trị của quyết

định, sự chậm trễ trong các thủ tục của dự án hoặc là việc có sẵn người hay không để

thực thi một quyết định cụ thể nhất định. Người phân tích cố gắng hiểu được những

điều quan tâm của người ra quyết định và tích hợp chúng vào trong bài trình bày của

mình càng nhiều càng tốt sẽ có được cơ hội tốt hơn để “bán” kết quả phân tích của

mình, so với những người chỉ nhìn thấy sự vật theo quan điểm của chính mình.

22.Lờ đi các giả thiết và hạn chế đã sử dụng khi trình bày phân tích (Omitting

Assumptions and Limitations): Các giả thiết và hạn chế của sự phân tích thường bị lờ

đi trong báo cáo cuối cùng. Điều này có thể làm cho NSD áp dụng sự phân tích vào

ngữ cảnh khác, trong đó các giả thiết không có giá trị. Đôi khi người phân tích liệt kê

các giả thiết tại đầu báo cáo và sau đó quên mất các hạn chế tại cuối (báo cáo) và đưa

ra các kết luận về những môi trường mà phân tích của anh ta không áp dụng được.

1.5 Tiếp cận một cách có hệ thống để tránh mắc lỗi

Hầu hết các bài toán về đánh giá hiệu suất là duy nhất. Các độ đo, tải mạng và các kỹ

thuật đánh giá được sử dụng cho bài toán này thường không sử dụng được cho các bài

toán khác. Tuy nhiên, các bài toán đánh giá hiệu suất mạng vẫn có các bước đi chung, cần

tuân theo để tránh mắc các lỗi trình bày ở trên.

1. Phát biểu rõ mục tiêu và xác định hệ thống (State Goals and Define the System): Bước

đầu tiên trong mọi dự án đánh giá hiệu suất là phát biểu các mục đích của việc nghiên

cứu và xác định những gì cấu thành nên hệ thống bằng việc vạch ra biên giới của hệ

thống. Khi đã cho cùng một một tập hardware và software, định nghĩa của hệ thống có

thể thay đổi phụ thuộc vào các mục đích của việc nghiên cứu. Thí dụ cho biết 2 CPU,

mục đích có thể là đánh giá ảnh hưởng của chúng lên thời gian phản ứng của những

NSD tương tác. Trong trường hợp này hệ thống có thể bao gồm hệ thống chia sẻ thời

gian, các kết luận của việc nghiên cứu có thể phụ thuộc mạnh vào các thành phần bên

ngoài CPU. Mặt khác, nếu 2 CPU về căn bản là giống nhau ngoại trừ các ALU của

chúng, còn mục đích của sự nghiên cứu là quyết định nên chọn ALU nào, thì có thể coi

CPU là một hệ thống và chỉ có các thành phần bên trong CPU có thể được coi là thành

phần của hệ thống.

Việc lựa chọn biên giới của hệ thống ảnh hưởng đến các độ đo hiệu suất cũng như đến

tải được sử dụng để so sánh các hệ thống. Vì vậy, việc biết được biên giới của hệ thống

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

là quan trọng. Mặc dầu trong các đối tượng của việc nghiên cứu, việc thiết lập biên

giới hệ thống là sự xem xét chủ yếu, vẫn cần phải tính đến những sự xem xét khác nữa,

chẳng hạn như việc quản lý hành chính của những người bảo trợ cho việc nghiên cứu.

Nếu những người bảo trợ không có quyền điều khiển một số thành phần, họ có thể

muốn để các thành phần này nằm ngoài biên giới của hệ thống.

2. Lên danh sách các dịch vụ và các kết quả có thể có (List Services and Outcomes): Mỗi

hệ thống cung cấp một tập các dịch vụ. Thí dụ, một mạng máy tính cho phép NSD của

nó gửi các gói tin đến các đích được chỉ ra. Một hệ thống CSDL đáp ứng các truy vấn.

Một bộ xử lý thực hiện một số chỉ thị khác nhau. Bước tiếp theo của việc phân tích một

hệ thống là lên danh sách các dịch vụ này. Khi NSD yêu cầu bất kỳ dịch vụ nào trong

số các dịch vụ, có thể có một số kết quả. Một số trong các kết quả này là được mong

đợi còn một số là không. Thí dụ, một hệ thống CSDL có thể trả lời một truy vấn một

cách đúng đắn, không đúng (do cập nhật không nhất quán) hoặc thậm chí không trả lời

(do deadlock hay các vấn đề tương tự). Một danh sách các dịch vụ và các kết quả có

thể có là rất hữu ích sau này cho việc lựa chọn các độ đo và tải đúng.

3. Chọn lựa các độ đo hiệu suất (Select Metrics): Bước tiếp theo là chọn các tiêu chuẩn

để so sách hiệu suất. Các tiêu chuẩn này được gọi là độ đo. Nói chung, các độ đo liên

quan đến tốc độ, độ chính xác và tính sẵn sàng sử dụng của các dịch vụ. Hiệu suất của

mạng, thí dụ được đo bởi tốc độ (thông lượng và độ trễ), độ chính xác (tỉ suất lỗi) và

tính sẵn sàng để dùng (availability) của các gói tin được gửi. Hiệu suất của một bộ xử

lý được đo bằng tốc độ (thời gian thi hành) của các chỉ thị khác nhau.

4. Lên danh sách các tham số (List Parameter): Bước tiếp theo trong các dự án về hiệu

suất là tạo ra một danh sách tất cả các tham số có ảnh hưởng đến hiệu suất. Danh sách

này có thể được chia thành các tham số hệ thống và các tham số tải. Các tham số hệ

thống bao gồm cả các tham số phần cứng lẫn các tham số phần mềm, chúng thường

không thay đổi trong số các sự cài đặt khác nhau của hệ thống. Các tham số tải được

đặc trưng bởi các yêu cầu của NSD, chúng thường thay đổi từ sự cài đặt đến sự cài đặt

khác.

Danh sách các tham số có thể là không đầy đủ; nghĩa là, sau khi trải qua một lần phân

tích, bạn có thể phát hiện ra rằng, có các tham số bổ sung thêm có ảnh hưởng đến hiệu

suất. Sau đó bạn có thể bổ sung các tham số này vào danh sách; Tuy nhiên tại mọi thời

điểm cần phải giữ cho danh sách này càng bao gồm toàn diện càng tốt. Điều này cho

phép người phân tích và người ra quyết định thảo luận về ảnh hưởng của các tham số

khác nhau và định rõ dữ liệu nào cần được thu thập trước hoặc trong khi phân tích.

5. Lựa chọn các yếu tố để nghiên cứu (Select Factors to Study): Danh sách các tham số

được chia thành 2 phần: các tham số sẽ thay đổi trong quá trình đánh giá và các tham

số sẽ không thay đổi. Các tham số sẽ thay đổi được gọi là factor (yếu tố) và các giá trị

của chúng được gọi là các mức (levels). Nói chung, danh sách các factor và các mức có

thể có của chúng là lớn hơn so với giới hạn mà các tài nguyên sẵn có cho phép. Nói

cách khác, danh sách này tiếp tục lớn dần lên cho đến khi người ta thấy rõ rằng không

có đủ tài nguyên để nghiên cứu vấn đề. Tốt hơn cả là bắt đầu nghiên cứu với một danh

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

sách ngắn các factor và một số lượng nhỏ các mức cho mỗi factor và mở rộng danh

sách ở pha tiếp theo của dự án nếu các tài nguyên còn cho phép. Thí dụ, bạn có thể

quyết định chỉ có 2 factor: kích thước lượng tử và số người sử dụng. Với mỗi một

trong 2 factor này bạn chỉ có thể chọn 2 mức: nhỏ và lớn. Kích thước tập làm việc và

kiểu của tải có thể được cố định.

Các tham số được cho rằng có ảnh hưởng lớn đến hiệu suất tốt nhất là được chọn làm

factor. Giống như các độ đo, lỗi thường gặp trong việc lựa chọn các factor là: các tham

số dễ làm thay đổi và đo được sử dụng làm factor, trong khi đó các tham số có ảnh

hưởng hơn bị lờ đi đơn giản chỉ bởi vì các khó khăn có liên quan đến chúng.

Trong việc chọn factor, điều quan trọng là xem xét các ràng buộc về kinh tế, chính trị

và công nghệ đang có cũng như việc bổ sung thêm vào các giới hạn mà sự điều khiển

của người ra quyết định áp đặt lên và thời gian có hiệu lực của quyết định. Điều này

làm tăng cơ may của việc tìm một giải pháp chấp nhận được và thực hiện được.

6. Lựa chọn kỹ thuật đánh giá hiệu suất (Select Evaluation Technique): Ba kỹ thuật được

sử dụng rộng rãi cho việc đánh giá hiệu suất là: lập mô hình giải tích, mô phỏng và đo

trên hệ thống thực. Việc lựa chọn một kỹ thuật đúng phụ thuộc vào thời gian và các tài

nguyên sẵn có để giải bài toán và mức độ đòi hỏi về độ chính xác.

7. Lựa chọn tải đưa vào mạng (Select Workload): Tải bao gồm một danh sách các yêu

cầu (request) dịch vụ đối với hệ thống. Thí dụ, tải cho việc so sánh một số hệ cơ sở dữ

liệu có thể bao gồm một tập các truy vấn (queries). Tuỳ thuộc vào kỹ thuật đánh giá đã

được chọn, tải có thể được biểu diễn dưới các dạng khác nhau. Đối với kỹ thuật Lập

mô hình giải tích, tải thường được biểu diễn như là xác suất của các yêu cầu khác

nhau. Đối với mô phỏng, người ta có thể sử dụng vết (trace) của các yêu cầu được đo

trên hệ thống thực. Đối với kỹ thuật đo, tải có thể bao gồm các script của người sử

dụng sẽ được thi hành trên hệ thống. Trong mọi trường hợp, điều cốt yếu là tải phải là

mẫu đại diện của việc sử dụng hệ thống trong thực tế (real life). Để sinh ra tải có tính

chất đại diện, cần phải đo và mô tả (characterize) tải trên các hệ thống đang tồn tại.

8. Thiết kế thí nghiệm (Design Experiments): Một khi bạn đã có danh sách các factor và

các mức của chúng, bạn cần quyết định một dãy các thí nghiệm để cho ra một lượng

thông tin lớn nhất với nỗ lực nhỏ nhất. Trong thực tế, tiến hành thí nghiệm trong 2 pha

là hữu ích. Trong pha thứ nhất, số factor có thể là lớn nhưng số mức thì nhỏ. Mục đích

là để xác định ảnh hưởng liên quan của các factor khác nhau. Trong hầu hết các trường

hợp, việc này có thể thực hiện bằng thiết kế thí nghiệm thừa số phân đoạn (fractional

factorial experimental designs) (được trình bày tại Part IV của cuốn sách). Trong pha

thứ hai, số factor được giảm xuống còn số mức của các factor có ảnh hưởng đánh kể

được tăng lên.

9. Phân tích và diễn giải số liệu thu được (Analyze and Interpret Data): Một điều quan

trọng cần phải nhận thức là các kết quả của việc đo hoặc mô phỏng là các đại lượng

ngẫu nhiên theo nghĩa là kết quả có thể khác mỗi khi thí nghiệm được lặp lại. Trong

việc so sánh 2 lựa chọn (alternatives), cần phải xét đến sự thay đổi của các kết quả.

Nếu chỉ so sánh các giá trị trung bình có thể dẫn đến các kết luận không chính xác.

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

(Các kỹ thuật thống kê để so sách 2 lựa chọn được trình bày ở chương 13 của cuốn

sách).

Việc biểu diễn các kết quả của một phép phân tích là một phần cốt yếu của nghệ thuật

phân tích. Cần phải hiểu rằng, sự phân tích chỉ sinh ra các kết quả chứ không sinh ra

các kết luận. Kết quả tạo ra cơ sở, dựa trên đó người phân tích hoặc người ra quyết

định có thể rút ra các kết luận. Khi một số người phân tích được trao cùng một tập các

kết quả, mỗi người phân tích có thể rút ra một kết luận khác nhau.

10.Trình bày kết quả (Present Results): Bước cuối cùng của mọi đề án về hiệu suất là

truyền đạt các kết quả đến các thành viên khác của nhóm ra quyết định (decision-

making team). Điều quan trọng là các kết quả phải được trình bày theo cách dễ hiểu.

Việc này thường đòi hỏi trình bày kết quả dưới dạng đồ thị chứ không phải bằng các

thuật ngũ chuyên môn về thống kê. Các đồ thị cần chia tỉ lệ thích hợp. Vấn đề vẽ đồ thị

đúng được bàn luận tiếp ở chương 10).

Thông thường, đến giai đoạn này của dự án, các kiến thức thu được từ việc nghiên cứu

có thể đòi hỏi người phân tích quay trở lại và xem xét lại một số quyết định ở các bước

trước đó. Thí dụ, người phân tích có thể muốn định nghĩa lại các ranh giới của hệ

thống hay bổ sung thêm các factor và các độ đo hiệu suất khác mà trước đó chưa được

xem xét. Vì vậy ,dự án toàn bộ bao gồm một vài chu trình qua các bước chứ không

phải chỉ đi một lần qua các bước.

1.6 Tài liệu tham khảo cho Chương 1

[1.1] Rij Jain (1992), The art of Computer systems Performance Analysis: Techniques for

Experimental Design, Measurement, Simulation, and Modeling, Wiley, 1992.

[1.2] Hiashi Kobayashi (1978), Modeling and Analyis: An Introduction to System Performance

Evaluation Methodology, Addition-Wesley, Massachusetts.

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

CHƯƠNG 2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU NĂNG MẠNG

2.2 Mô hình Giải tích

Khi sử dụng lý thuyết Hàng đợi để giải bài toán đánh giá hiệu năng, người ta thường

phải đưa ra nhiều giả thuyết để đơn giản hoá mô hình. Có những giả thuyết có vẻ như phi

thực tế hoặc đơn giản hoá quá mức, tuy nhiên, kết quả thu được lại rất phù hợp với các kết

quả của phương pháp mô phỏng hoặc phương pháp thực nghiệm. Điều quan trọng đối với

nhà nghiên cứu là đưa ra được các giả thiết làm cho mô hình trở nên càng đơn giản càng

tốt mà vẫn đạt được một độ chính xác cần thiết của các kết quả dự đoán và đánh giá hiệu

năng [39].

Mạng máy tính có thể được lập mô hình như một mạng hàng đợi. Khách hàng

(customer) của các hàng đợi là các gói số liệu đến và yêu cầu được truyền đi, còn người

phục vụ (server) chính là các phương tiện truyền, bao gồm hệ chuyển mạch và đường kết

nối vật lý, hoặc nói đơn giản hơn là đường truyền. Hầu hết các vấn đề liên quan đến hiệu

năng đều liên quan tới thời gian mà các gói số liệu phải xếp hàng chờ được phục vụ. Đây

là một độ đo quan trọng để đánh giá hiệu năng, bởi vì nó là một thành phần của thời gian

trễ chuyển tiếp gói số liệu từ thực thể nguồn tới thực thể đích, được gọi tắt là thời gian trễ

đầu cuối - đầu cuối, một yếu tố của hiệu năng mạng mà người sử dụng nhận thấy được.

Tất nhiên, thời gian chờ cũng phụ thuộc vào thời gian xử lý của nút và chiều dài của gói số

liệu. Nó cũng còn phụ thuộc vào dung lượng đường truyền, tức là khả năng truyền, đo

bằng packet/s, phụ thuộc vào chiến lược phục vụ được áp dụng ở các hàng đợi. Lý thuyết

Hàng đợi có thể đưa tất cả các yếu tố này vào trong mô hình; tuy nhiên, khi nghiên cứu

định lượng về chuyển mạch gói, trong những điều kiện cụ thể, người ta có thể bỏ qua một

số tham số, làm cho bài toán đơn giản hơn mà vẫn không làm giảm nhiều độ chính xác của

kết quả thu được.

Chúng ta hãy xem xét mô hình đơn giản nhất của một hàng đợi được mô tả trên hình

2.1, với ngữ cảnh mạng chuyển mạch gói. Giả sử rằng các gói số liệu đến một cách ngẫu

nhiên với tốc độ đến trung bình là  packet/s, tốc độ phục vụ của người phục vụ là 

packet/s. Hàng đợi trên hình vẽ chứa các gói số liệu, chúng đang xếp hàng chờ được phục

vụ - được phát ra đường truyền; người phục vụ là phương tiện truyền hay đường truyền,

tốc độ truyền hay còn gọi dung lượng đường truyền thường được tính theo đơn vị bit/s,

dưới đây được ký hiệu là C. Nếu chiều dài gói số liệu trung bình tính bằng bit là 1/’ và

được cho bằng đơn vị bit/packet, thì  = ’C là tốc độ truyền tính bằng đơn vị packet/s.

Hình 2.1 Mô hình hàng đợi có một người phục vụ

Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN

Rõ ràng rằng, khi tốc độ đến của các gói số liệu  tiến tới dung lượng đường truyền 

thì hàng đợi bắt đầu hình thành. Với một hàng đợi hữu hạn, khi  vượt quá  và tiếp tục

tăng lên, bộ đệm sẽ đầy, tất cả các gói số liệu đến sau sẽ bị chặn lại, vì trong hàng đợi

không còn chỗ trống cho chúng. Nếu giả thiết bộ đệm là vô hạn cho đơn giản (đây là giả

thiết nhằm đơn giản hoá việc phân tích), hàng đợi sẽ trở nên không ổn định khi .

Người ta đã chứng minh được rằng < là điều kiện đảm bảo cho sự ổn định của một hàng

đợi có một người phục vụ [38], [41]. Đặc biệt, chúng ta sẽ tìm tham số   /, thường

được gọi là độ sử dụng đường truyền hoặc tải chuẩn hoá, đó là tỉ số của tải của hệ thống

trên năng lực của hệ thống. Tham số  đóng vai trò then chốt trong việc phân tích hàng đợi.

Đối với hàng đợi có một người phục vụ, khi  tiến tới và vượt quá một, vùng tắc nghẽn

sẽ xuất hiện, thời gian trễ bắt đầu tăng nhanh, các gói số liệu đến sẽ bị chặn lại một cách

thường xuyên hơn.

Để nghiên cứu định lượng về thời gian trễ, sự chặn (blocking), thông lượng và mối

quan hệ của chúng với cả tốc độ phục vụ  lẫn kích thước của bộ đệm, chúng ta cần một

mô hình hệ thống hàng đợi chi tiết hơn mô hình hàng đợi trên hình 2.1. Trong mô hình này

các tham số hiệu năng phụ thuộc vào các xác suất trạng thái hàng đợi, với trạng thái được

định nghĩa là số gói số liệu ở trong hàng đợi, kể cả gói số liệu đang được phục vụ nếu

hàng đợi không rỗng. Để tính các xác suất trạng thái, ta phải biết:

 Quá trình đến của các gói số liệu (thống kê các gói số liệu mới đến).

 Phân bố của chiều dài các gói số liệu (phân bố thời gian phục vụ).

 Chiến lược phục vụ (thí dụ: FCFS, FIFO - đến trước phục vụ trước, hay LCFS - đến

sau phục vụ trước v.v).

Đối với các hàng đợi có nhiều người phục vụ, xác suất trạng thái còn phụ thuộc vào số

lượng người phục vụ nữa.

Dưới đây, trong nhóm tiểu mục 2.2.1 và 2.2.2, chúng tôi trình bày tóm tắt một số kết

quả nghiên cứu về lý thuyết Hàng đợi [38], [41], trong ngữ cảnh mạng máy tính, được

chúng tôi áp dụng trong Chương 3, mục 3.2 của bản Luận án này.

2.2.1 Quá trình Poisson và các tính chất của nó

Đây là quá trình ngẫu nhiên được sử dụng thường xuyên nhất trong lý thuyết Hàng đợi

để lập mô hình cho sự đến và sự phục vụ trong một hệ thống mạng máy tính. Quá trình

Poisson mô tả một tập hợp các sự đến của các gói số liệu, trong đó khoảng thời gian giữa

hai gói đến liên tiếp là độc lập và được phân bố theo hàm mũ với giá trị trung bình

t  1/  , với  là tốc độ đến trung bình. Xác suất có k gói đến trong khoảng thời gian t là:

(t) 

(t)

t

(2-1)

Bấm Tải xuống để xem toàn bộ.

Preview text:

PGS. TS. NGUYỄN ĐÌNH VIỆT BÀI GIẢNG
ĐÁNH GIÁ HIỆU NĂNG MẠNG MÁY TÍNH HÀ NỘI - 2008
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 2 MỤC LỤC
CHƯƠNG 1 GIỚI THIỆU. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1 Khái niệm hiệu năng và các độ đo hiệu năng mạng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.1 Khái niệm hiệu năng mạng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.2 Các độ đo hiệu năng mạng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5
1.2 Tầm quan trọng của việc đánh giá hiệu năng mạng máy tính. . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Phân loại các phương pháp đánh giá hiệu năng mạng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6
1.4 Các lỗi thường gặp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8
1.5 Tiếp cận một cách có hệ thống để tránh mắc lỗi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6 Tài liệu tham khảo cho Chương 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
CHƯƠNG 2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU NĂNG MẠNG. . . . . . . . . . . . . . 19
2.2 Mô hình Giải tích. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19
2.2.1 Quá trình Poisson và các tính chất của nó. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2.2 Hàng đợi M/M/1 và một số kết quả. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.2.1 Xác suất trạng thái cân bằng của hàng đợi M/M/1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21
2.2.2.2 Đặc trưng thông lượng của hàng đợi M/M/1 hữu hạn. . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.2.3 Kích thước trung bình của hàng đợi M/M/1 hữu hạn. . . . . . . . . . . . . . . . . . . . . . . . . . . .23
2.2.2.4 Công thức Little L=W và áp dụng để tính thời gian trễ trung bình. . . . . . . . . . . . . . . . 24
2.3 Mô phỏng mạng bằng chương trình máy tính. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.1 Giới thiệu chung (under construction). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.2 Ý tưởng xây dựng bộ mô phỏng mạng vận hành theo các sự kiện rời rạc. . . . . . . . . . . . . . . . 25
2.4 Đo trên mạng thực (under construction). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.5 Tài liệu tham khảo cho Chương 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
CHƯƠNG 3 ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG MÔ HÌNH HÀNG ĐỢI. . . . . . . 28
3.1 Mô hình mạch ảo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2 Thí dụ 3.1: Đánh giá hiệu năng của các cơ chế kiểm soát lỗi. . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.1 Kiểm soát lỗi đầu cuối - đầu cuối (end-to-end). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.2 Kiểm soát lỗi theo chặng (link-by-link). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .33
3.2.3 Áp dụng: So sánh cơ chế kiểm soát lỗi đầu cuối - đầu cuối và theo chặng. . . . . . . . . . . . . . . 35
3.2.3.1 So sánh các cơ chế theo chặng và đầu cuối - đầu cuối ở mạng tốc độ thấp. . . . . . . . . . . 35
3.2.3.2 So sánh các cơ chế theo chặng và đầu cuối - đầu cuối ở mạng tốc độ cao. . . . . . . . . . . .37
3.3 Thí dụ 3.2: Đánh giá hiệu năng của cơ chế điều khiển lưu lượng bằng cửa sổ trượt. . . . . . 39
3.3.1 Mô hình cửa sổ trượt với sự biên nhận từng gói số liệu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .39
3.3.1.1 Trường hợp tải rất nặng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3.1.2 Trường hợp tải xấp xỉ bằng khả năng vận chuyển của đường truyền. . . . . . . . . . . . . . . .41
3.3.2 Mô hình cửa sổ trượt với sự biên nhận ở cuối cửa sổ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3.2.1 Trường hợp tải rất nặng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3.2.2 Trường hợp tải xấp xỉ bằng khả năng vận chuyển của đường truyền. . . . . . . . . . . . . . . .44
3.4 Tài liệu tham khảo cho Chương 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
CHƯƠNG 4 ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG BỘ MÔ PHỎNG NS-2. . . . . . . . 46
4.1 Bộ mô phỏng mạng NS-2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.1.1 Giới thiệu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 3
4.1.2 Cấu trúc phần mềm của NS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .48
4.1.3 Lập trình mô phỏng bằng NS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.1.4 Cấu trúc tệp vết (trace file) chứa kết quả mô phỏng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.1.4.1 Cấu trúc tệp vết chứa kết quả mô phỏng mạng có dây. . . . . . . . . . . . . . . . . . . . . . . . . . .50
Tài liệu tham khảo (cho 4.1.4.1):. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.1.4.2 Cấu trúc tệp vết chứa kết quả mô phỏng mạng không dây (under construction). . . . . . . 51
4.1.4.3 Cấu trúc tệp vết chứa kết quả mô phỏng mạng hỗn hợp (under construction). . . . . . . . . 51
4.2 NAM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Tài liệu tham khảo cho “4.2 NAM”:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.3 Giới thiệu một số công cụ hỗ trợ việc phân tích và hiển thị kết quả mô phỏng. . . . . . . . . . 52
4.3.1 Giới thiệu dự án GNU. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.3.2 Grep. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .52
4.3.3 Awk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .53
4.3.4 Perl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3.5 GNUPLOT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3.6 XGRAPH. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.3.7 Trace graph. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Tài liệu tham khảo cho “4.3 Giới thiệu một số công cụ hỗ trợ việc phân tích và hiển thị kết quả
mô phỏng”:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.4 Các bước chính trong việc tiến hành mô phỏng mạng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.4.1 Tạo bộ lập lịch các sự kiện (Creating Event Scheduler). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.4.2 Ghi lại vết các sự kiện của mạng mô phỏng (vào file “*.tr” và/hoặc “*.nam”). . . . . . . . . . . .55
4.4.3 Thiết lập mạng mô phỏng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4.3.1 Thiết lập tô-pô. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4.3.2 Đưa mô hình lỗi vào đường truyền:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4.3.3 Chọn thuật toán routing:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.4 Tạo ra các kết nối ở tầng giao vận (giao thức TCP, UDP. .). . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.4.1 Tạo ra các kết nối TCP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .56
4.4.4.2 Tạo ra các kết nối UDP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.5 Tạo ra các nguồn sinh lưu lượng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.5.1 Lưu lượng do TCP vận chuyển. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4.5.2 Lưu lượng do UDP vận chuyển. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4.6 Xác định thời gian mô phỏng cần thiết. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.5 Tài liệu tham khảo cho Chương 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
CHƯƠNG 5 CÁC THÍ DỤ ĐÁNH GIÁ HIỆU NĂNG MẠNG BẰNG NS-2. . . . . . . . . . .59
5.1 Thí dụ 1: Tính các tham số hiệu suất chính và sự chia sẻ đường truyền của các kết nối TCP,
UDP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.1.1 Viết simulation script theo yêu cầu của bài toán. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.1.2 Tính các tham số hiệu suất trung bình trong một khoảng thời gian. . . . . . . . . . . . . . . . . . . . .61
5.1.2.1 Tính thông lượng trung bình của từng kết nối (tcp: 3, udp: 1). . . . . . . . . . . . . . . . . . . . . 61
5.1.2.2 Tính độ trễ trung bình của các gói tin theo từng kết nối (tcp: 3, udp: 1). . . . . . . . . . . . . 64
5.1.3 Tính các tham số hiệu suất trung bình tại từng thời điểm trong quá trình mô phỏng. . . . . . . 66
5.1.3.1 Vẽ đồ thị thông lượng trung bình của 4 kết nối trong quá trình mô phỏng. . . . . . . . . . . 66
5.1.3.2 Tính thăng giáng độ trễ của từng gói tin (Jitter) trong quá trình mô phỏng. . . . . . . . . . . 67
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 4
PHỤ LỤC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .68
1. Chương trình chapter5_sample1.tcl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2. Chương trình avg_throughput_during_sim_time.pl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .70
3. Chương trình avg_delay_during_sim_time.pl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4. Chương trình throughput.pl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Thí dụ 1: RED Queue Monitor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
CÁC ĐỀ TÀI SEMINAR CHO HVCH. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78
Sách:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
1. Chapter 4: Type of Workloads. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2. Chapter 5: The Art of Workload Selection. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78
3. Chapter 6: Workload Characterization Techniques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4. Chapter 7: Monitors. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5. Chapter 8: Program Execution Monitors and Accounting Logs. . . . . . . . . . . . . . . . . . . . . . . . . .78
6. Chapter 9: Capacity Planning and Benchmarking. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
7. Chapter 10: The Art of Data Presentation. Chapter 11: Ratio Games. . . . . . . . . . . . . . . . . . . . . 78
8. Chapter 11: Ratio Games. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
9. Chapter 12: Summerizing Measured data. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78
10. Chapter 13: Comparing Systems Using Sample Data. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
Bài báo:. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
DANH MỤC TÀI LIỆU THAM KHẢO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78
BẢNG CHÚ GIẢI (Index). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 5
CHƯƠNG 1 GIỚI THIỆU
1.1 Khái niệm hiệu năng và các độ đo hiệu năng mạng
1.1.1 Khái niệm hiệu năng mạng
Theo nghĩa chung, hiệu năng là một độ đo công việc mà một hệ thống thực hiện được.
Hiệu năng chủ yếu được xác định bởi sự kết hợp của các nhân tố: tính sẵn sàng để dùng
(availability), thông lượng (throughput) và thời gian đáp ứng (response time). Đối với
mạng máy tính, hiệu năng cũng còn được xác định dựa trên các nhân tố khác nữa, thí dụ:
thời gian trễ (delay), độ tin cậy (reliability), tỉ suất lỗi (error rate), hiệu năng của ứng dụng v.v.
Tuỳ theo mục đích nghiên cứu cụ thể, hiệu năng có thể chỉ bao gồm một nhân tố nào đó
hoặc là sự kết hợp một số trong các nhân tố nêu trên.
1.1.2 Các độ đo hiệu năng mạng
Có thể phân các độ đo hiệu năng thành hai loại: các độ đo hướng tới người sử dụng và
các độ đo hướng tới hệ thống. Trong các độ đo hướng tới người sử dụng, thời gian đáp
ứng (response time) thường được sử dụng trong các hệ thời gian thực hoặc các môi trường
hệ thống tương tác. Đó là khoảng thời gian từ khi có một yêu cầu (request) đến hệ thống
cho đến khi nó được hệ thống thực hiện xong. Trong các hệ thống tương tác, đôi khi người
ta sử dụng độ đo thời gian phản ứng của hệ thống (system reaction time) thay cho thời
gian đáp ứng. Đó là khoảng thời gian tính từ khi input đến hệ thống cho đến khi yêu cầu
chứa trong input đó nhận được khe thời gian (slice time) phục vụ đầu tiên. Độ đo này đo
mức độ hiệu dụng của bộ lập lịch của hệ thống trong việc nhanh chóng cung cấp dịch vụ
cho một yêu cầu mới đến. Trong các hệ thống mạng máy tính, các đại lượng thời gian đáp
ứng, thời gian phản ứng của hệ thống đều được xem là các biến ngẫu nhiên, vì vậy người
ta thường nói về phân bố, kỳ vọng, phương sai. . của chúng [20].
Các độ đo hướng tới hệ thống điển hình là thông lượng (throughput) và thời gian trễ
(delay time, delay). Thông lượng được định nghĩa là số đơn vị thông tin tính trung bình
được vận chuyển qua mạng trong một đơn vị thời gian. Đơn vị thông tin ở đây có thể là bit,
byte hay gói số liệu. . Nếu các đơn vị thông tin đi vào mạng theo một cơ chế độc lập với
trạng thái của mạng, thì thông lượng cũng chính bằng tốc độ đến trung bình nếu mạng vẫn
còn có khả năng vận chuyển, không dẫn đến trạng thái bị tắc nghẽn. Một số trường hợp
người ta sử dụng đại lượng không thứ nguyên Hệ số sử dụng đường truyền (Line
Utilization) hay còn gọi thông lượng chuẩn hoá, đó là tỉ số của thông lượng trên năng lực
vận chuyển của đường truyền (line capacity). Thời gian trễ là thời gian trung bình để vận
chuyển một gói số liệu qua mạng, từ nguồn tới đích. Cũng có trường hợp người ta sử dụng
đại lượng thời gian trễ chuẩn hoá, đó là tỉ số của thời gian trễ trên một tham số thời gian
nào đó, thí dụ thời gian cần thiết để truyền một gói tin (packet transmition time).
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 6
1.2 Tầm quan trọng của việc đánh giá hiệu năng mạng máy tính
Trong suốt lịch sử tiến hoá của mạng máy tính, vấn đề đánh giá và dự đoán hiệu năng
mạng luôn thu hút sự quan tâm của những người nghiên cứu và thiết kế mạng; mục đích
chính là để nắm được và cải thiện đặc trưng giá - hiệu năng (cost-performance). Yêu
cầu đánh giá và dự đoán hiệu năng mạng đặt ra ngay từ khi người ta thiết kế kiến trúc của
hệ thống cho đến khi mạng đã được lắp đặt và đưa vào hoạt động. Trong giai đoạn đầu của
quá trình thiết kế, người ta thường phải dự đoán hai điều. Thứ nhất là bản chất của các ứng
dụng sẽ chạy trên mạng và các yêu cầu dịch vụ mà các ứng dụng này đòi hỏi hệ thống
mạng phải đáp ứng. Điều dự đoán thứ hai liên quan tới việc lựa chọn một trong các thiết
kế kiến trúc, dựa trên các công nghệ phần cứng và phần mềm sẽ được phát triển và đưa ra
thị trường trong tương lai, khi hệ thống mạng bước vào giai đoạn triển khai thực hiện.
Sau khi đã lựa chọn kiến trúc và bắt đầu thiết kế, triển khai hệ thống mạng, việc dự
đoán và đánh giá hiệu năng sẽ trở nên cụ thể hơn. Thí dụ sẽ chọn đường truyền vật lý như
thế nào, các đặc tính của đường truyền được chọn sẽ ảnh hưởng thế nào đến hiệu năng của
mạng. Các kỹ thuật được dùng để dự đoán và đánh giá hiệu năng mạng trong giai đoạn
thiết kế và triển khai thực hiện có khi chỉ là các tính toán bằng tay, nhưng cũng có khi là
các mô phỏng rất tinh vi. Việc so sánh hiệu năng dự đoán với hiệu năng thực tế đạt được
thường giúp cho nhà nghiên cứu thấy được các khiếm khuyết chính trong thiết kế hoặc các
lỗi trong việc lập trình hệ thống. Ngày nay, việc dự đoán và đánh giá hiệu năng thường
được người ta coi là một phần không thể thiếu được của công việc thiết kế và triển khai thực hiện hệ thống.
Định cấu hình mạng: Sau khi mạng đã được triển khai thực hiện, việc dự đoán và đánh
giá hiệu năng mạng đối với các ứng dụng cụ thể cũng có ý nghĩa quan trọng. Nhằm đạt
được sự tối ưu hoá, nhà sản xuất phải chỉ ra được các cách kết hợp và tổ chức phần cứng
và phần mềm mạng để đem lại một giải pháp tốt nhất cho các yêu cầu của khách hàng,
việc này thường được gọi là định cấu hình mạng. Mặc dù có thể vẫn sử dụng các công cụ
và phương pháp đã được sử dụng trong giai đoạn phát triển hệ thống, nhưng cần phải bổ
sung thêm một số yếu tố nữa. Đặc điểm môi trường của người sử dụng sản phẩm mạng
cần được biểu diễn bằng các tham số định lượng và đưa vào mô hình mô phỏng hiệu năng.
Tinh chỉnh hệ thống: Sau khi hệ thống sản phẩm đã được lắp đặt tại địa điểm của
khách hàng, nhà cung cấp sản phẩm cần phải làm sao cho hệ thống mà họ bán cho khách
hàng đạt được hiệu năng hoạt động như họ đã hứa hẹn khi chào hàng, việc này được gọi là
tinh chỉnh hệ thống. Đối với các hệ thống mạng, việc tìm ra được điểm làm việc tối ưu và
ổn định trên toàn mạng là rất khó.
1.3 Phân loại các phương pháp đánh giá hiệu năng mạng
Có nhiều phương pháp đánh giá hiệu năng mạng máy tính, có thể chia chúng làm ba
loại: mô hình Giải tích (Analytic Models), mô hình Mô phỏng (Simulation Models) và Đo hiệu năng (Measurement).
Mô hình Giải tích
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 7
Trong các mạng chuyển mạch gói, gói số liệu là các khối dữ liệu có chiều dài thay đổi
được, được truyền qua mạng từ nguồn tới đích theo một con đường nào đó do hệ thống
mạng quyết định. Các tài nguyên mạng sẽ được chia sẻ giữa các gói số liệu khi chúng đi
qua mạng. Số lượng và chiều dài các gói số liệu đi vào hoặc đi qua mạng tại mọi thời điểm,
thời gian kéo dài các cuộc kết nối v.v., tất cả các tham số này nói chung, thay đổi một cách
thống kê. Vì vậy, để nêu ra các tiêu chuẩn đo lường định lượng về hiệu năng, cần phải sử
dụng các khái niệm về xác suất để nghiên cứu sự tương tác của chúng với mạng. Lý thuyết
Hàng đợi đóng vai trò mấu chốt trong việc phân tích mạng, bởi vì đó là công cụ Toán học
thích hợp nhất để phát biểu và giải các bài toán về hiệu năng. Theo phương pháp này,
chúng ta viết ra các mối quan hệ hàm giữa các tiêu chuẩn hiệu năng cần quan tâm và các
tham số của hệ thống mạng bằng các phương trình có thể giải được bằng giải tích. Mô phỏng
Theo nghĩa chung nhất, mô phỏng là sự bắt chước một hay nhiều khía cạnh của sự vật
có thực, bằng một cách nào đó càng giống càng tốt. Trong các lĩnh vực nghiên cứu hiện
đại, như lĩnh vực đánh giá hiệu năng mạng, mô phỏng được hiểu là một kỹ thuật sử dụng
máy tính điện tử số để làm các thí nghiệm về mạng có liên quan đến thời gian. Mô hình
Mô phỏng mô tả hành vi động của mạng, ngay cả khi người nghiên cứu chỉ quan tâm đến
giá trị trung bình của một số độ đo trong trạng thái dừng. Cấu trúc và độ phức tạp của bộ
mô phỏng phụ thuộc vào phạm vi của thí nghiệm mô phỏng. Nó thường được xây dựng có
cấu trúc, cho phép mô-đun hoá chương trình mô phỏng thành tập các chương trình con,
sao cho việc sửa đổi, bổ sung các chương trình con được dễ dàng. Ngoài ra, chương trình
mô phỏng cũng phải được xây dựng sao cho đạt được tốc độ cao nhằm làm giảm thời gian
chạy mô phỏng càng nhiều càng tốt. Đo
Đó là phương pháp xác định hiệu năng dựa trên việc đo trên mạng thực các tham số
mạng cấu thành độ đo hiệu năng cần quan tâm. Việc đo hiệu năng nhằm thực hiện một
trong các nhiệm vụ sau. Một là, giám sát hiệu năng của mạng . Hai là, thu thập số liệu để
lập mô hình dữ liệu vào cho các phương pháp đánh giá hiệu năng bằng giải tích hoặc mô
phỏng. Nhiệm vụ thứ ba là kiểm chứng các mô hình khác dựa trên các số liệu đo được. Đo
hiệu năng không chỉ quan trọng trong các giai đoạn triển khai thực hiện và tích hợp hệ
thống mà còn cả trong các giai đoạn lắp đặt và vận hành hệ thống. Bởi vì sau khi lắp đặt
và đưa vào sử dụng, mỗi một hệ thống cụ thể sẽ có một tải hệ thống và các độ đo hiệu
năng được quan tâm riêng của nó, cho nên sau khi lắp đặt, người ta thường phải điều chỉnh
cấu hình cho phù hợp. Các tham số cấu hình sẽ được chọn sau khi các phép đo hiệu năng
cho thấy các tham số cấu hình này làm cho hệ thống đạt được hiệu năng tốt nhất. Trong
thực tế, mọi người đều thừa nhận tầm quan trọng của việc đo và đánh giá hiệu năng.
Chúng ta có thể thấy rõ điều này qua việc, hầu như tất cả các hệ thống mạng đều tích hợp
bên trong nó các công cụ đo và đánh giá hiệu năng; nhờ đó có thể đo hiệu năng bất cứ lúc
nào trong suốt vòng đời của hệ thống.
So sánh các phương pháp đánh giá hiệu năng
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 8
Mô hình Giải tích: Nếu có thể sử dụng mô hình Giải tích thì đó là điều tốt nhất, bởi vì
chúng ta có thể thay đổi các tham số hệ thống và cấu hình mạng trong một miền rộng với
chi phí thấp mà vẫn có thể đạt được các kết quả mong muốn. Tuy nhiên, các mô hình Giải
tích mà chúng ta xây dựng thường là không thể giải được nếu không được đơn giản hoá
nhờ các giả thiết, hoặc được phân rã thành các mô hình nhiều cấp. Các mô hình giải được
thường rất đơn giản hoặc khác xa thực tế, cho nên phương pháp này thường chỉ được sử
dụng ngay trong giai đoạn đầu của việc thiết kế mạng, giúp cho người thiết kế dự đoán
được các giá trị giới hạn của hiệu năng. Ngoài ra, các kết quả của phương pháp này bắt
buộc phải được kiểm nghiệm bằng kết quả của các phương pháp khác, như mô phỏng hoặc đo.
Mô phỏng: Trong những trường hợp mô hình Giải tích mà chúng ta nhận được, dù đã
được đơn giản hoá, hoặc phân rã nhưng vẫn không thể giải được bằng Toán học, khi đó,
nói chung, chúng ta sẽ chỉ còn một phương pháp là mô phỏng. Phương pháp mô phỏng có
thể được sử dụng ngay trong giai đoạn đầu của việc thiết kế hệ thống mạng, cho đến giai
đoạn triển khai thực hiện và tích hợp hệ thống. Phương pháp này nói chung, đòi hỏi một
chi phí rất cao cho việc xây dựng bộ mô phỏng cũng như kiểm chứng tính đúng đắn của
nó. Tuy nhiên, sau khi đã xây dựng xong bộ mô phỏng, người nghiên cứu có thể tiến hành
chạy chương trình mô phỏng bao nhiêu lần tuỳ ý, với độ chính xác theo yêu cầu và chi phí
cho mỗi lần chạy thường là rất thấp. Các kết quả mô phỏng nói chung vẫn cần được kiểm
chứng, bằng phương pháp giải tích hoặc đo, nhất là bằng phương pháp đo. Phương pháp
mô hình Giải tích và mô hình Mô phỏng đóng vai trò rất quan trọng trong việc thiết kế và
triển khai thực hiện hệ thống, đặc biệt là ở giai đoạn đầu.
Đo: Phương pháp đo chỉ có thể thực hiện được trên mạng thực, đang hoạt động, nó
cũng đòi hỏi chi phí cho các công cụ đo và cho việc tiến hành đo. Việc đo cần được tiến
hành tại nhiều điểm trên mạng thực, ở những thời điểm khác nhau và cần lặp đi lặp lại
trong một khoảng thời gian đủ dài, thậm chí có thể dài đến hàng tháng. Ngoài ra, người
nghiên cứu phải có kiến thức về Lý thuyết thống kê thì mới có thể rút ra được các kết luận
hữu ích từ các số liệu thu thập được. Mặc dầu vậy, bằng phương pháp đo có thể vẫn không
phát hiện ra được hoặc dự đoán được các hành vi đặc biệt của mạng.
Các phương pháp được trình bày trong giáo trình này: giáo trình này trình bày hai
phương pháp đánh giá hiệu năng mạng là mô hình Giải tích và Mô phỏng (trong tương lai,
tác giả sẽ bổ sung thêm phương pháp đo). Bằng hai phương pháp này, đặc biệt là bằng
phương pháp Mô phỏng, chúng ta có thể nghiên cứu rất sâu các phương pháp cải thiện
hiệu năng các giao thức, thí dụ các giao thức giao vận như TCP và các giao thức MAC
802.3, 802.11, chúng ta có thể “thực hiện” các cải tiến đối với các giao thức đó và đánh
giá hiệu quả của các đề xuất cải tiến với một chi phí thấp về thời gian và cơ sở vật chất.
1.4 Các lỗi thường gặp
Trong việc đánh giá hiệu suất mạng, người nghiên cứu có thể vô tình mắc phải một số
lỗi do bỏ sót một hay một số yếu tố, hiểu sai vấn đề, thiếu kiến thức về các kỹ thuật đánh giá hiệu suất. .
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 9
Dưới đây liệt kê các lỗi thường mắc phải khi đánh giá hiệu suất mạng.
1. Không có mục đích rõ ràng (No Goal). Trước khi thực hiện đánh giá hiệu suất mạng,
nhất thiết phải xác định rõ các mục tiêu cụ thể cần đạt được là gì, trên cơ sở đó lựa
chọn các độ đo hiệu suất, tải đưa vào mạng và phương pháp đánh giá v.v. phù hợp.
Nhiệm vụ này nghe qua có vẻ đơn giản và tầm thường nhưng thực sự không luôn luôn như vậy.
2. Mục đích thiên lệch (Bias goals). Khi phát biểu mục đích, có thể thiên vị một các hiển
nhiên hay thiên vị kiểu ngầm. Thí dụ, nếu như mục đích là: “Hãy chỉ ra rằng hệ thống
của chúng ta tốt hơn hệ thống của họ”, thì bài toán trở thành tìm các độ đo và tải sao
cho hệ thống của chúng ta thể hiện là tốt hơn, chứ không phải là việc tìm ra các độ đo
và tải đúng đắn để so sánh hai hệ thống. Có một quy tắc bất thành văn của giới chuyên
gia về đánh giá hiệu suất là không thiên vị, người đánh giá hiệu suất cần đóng vai trò
của người giám khảo và đưa ra các kết luận dựa trên sự phân tích chứ không dựa trên niềm tin.
3. Sự tiếp cận thiếu tính hệ thống (Unsystermatic Approach). Người phân tích thường
phỏng theo một cách tiếp cận không có tính hệ thống khi chọn một cách tuỳ tiện các
tham số hệ thống, các nhân tố (factor), các độ đo và tải. Vấn đề này sẽ được bàn thêm
kỹ hơn ở mục 1.5 sau đây.
4. Phân tích mà không hiểu bài toán (Analysis without Understanding the Problem).
Người phân tích thiếu kinh nghiệm cảm thấy thực sự không đạt được điều gì khi chưa
xây dựng xong mô hình và chưa nhận được một kết quả bằng con số nào. Đối với
người phân tích có kinh nghiệm, họ biết rõ rằng việc xác định rõ bài toán chiếm phần
lớn nỗ lực của họ, tỉ lệ này có thể lên đến 40%. Điều này củng cố cho một câu châm
ngôn cũ: “một bài toán được phát biểu tốt là đã giải được một nửa”. Trong 60% nỗ
lực còn lại, phần chủ yếu dành cho các lựa chọn thiết kế, diễn giải các kết quả và trình
bày các kết luận. Việc phát triển mô hình bản thân nó là một phần nhỏ của quá trình
giải bài toán, giống như ô tô và tàu hoả là các phương tiện để đi đến một địa điểm nào
đó chứ không phải là chính địa điểm đến. Mô hình là phương tiện để đạt được kết luận
chứ nó không phải là kết luận cuối cùng. Những người phân tích được đào tạo về việc
lập mô hình để đánh giá hiệu suất nhưng không được đào tạo về việc xác định bài toán
hay trình bày kết quả thường thấy các mô hình của họ bị những người ra quyết định lờ
đi trong khi họ chỉ tìm kiếm sự hỗ trợ của mô hình chứ không phải chính bản thân mô hình.
5. Các độ đo hiệu suất không đúng (Incorrect Performance Metrics): Nói về độ đo là nói
về các tiêu chuẩn được sử dụng để lượng hoá hiệu suất của hệ thống. Thí dụ về các độ
đo hiệu suất thường được sử dụng là: thông lượng (throughput) và thời gian đáp ứng
(response time). Việc lựa chọn độ đo hiệu suất đúng phụ thuộc vào các dịch vụ mà hệ
thống hoặc hệ thống con được mô hình hoá cung cấp. Thí dụ hiệu suất của các CPU
được so sánh trên cơ sở thông lượng của chúng, thường được đo bằng đơn vị MIPS
(Million of Íntruction Per Second). Tuy nhiên việc so sánh MIPS của 2 CPU có kiến
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 10
trúc khác nhau, thí dụ RISC và CISC là vô nghĩa, bởi vì các chỉ thị mà 2 CPU này thi
hành là không tương đương.
Lỗi thường mắc khi chọn độ đo hiệu suất là: người phân tích thường chọn các độ đo dễ
tính toán, dễ đo đạc chứ không chọn các độ đo thích đáng.
6. Tải mạng không có tính chất đại diện (Unrepresentative Workload): Tải được sử dụng
để so sánh 2 hệ thống cần phải là đại diện cho việc sử dụng thật sự của hệ thống trong
phạm vi nghiên cứu. Thí dụ, nếu các gói tin trong mạng tính chung là sự trộn lẫn của 2
loại kích thước ngắn và dài , thì tải được sử dụng để so sánh 2 mạng cần bao gồm bao
gồm các gói tin có kích thước dài và kích thước ngắn.
Việc lựa chọn tải có ảnh hưởng quan trọng đến kết quả của việc nghiên cứu về hiệu
suất. Việc lựa chọn sai tải sẽ dẫn đến các kết luận không chính xác.
7. Kỹ thuật đánh giá sai (Wrong Evaluation Technique): Có 3 kỹ thuật đánh giá: đo, mô
phỏng và lập mô hình giải tích. Người phân tích thường có sở thích sử dụng một kỹ
thuật đánh giá cho mọi bài toán đánh giá hiệu suất phải giải quyết. Thí dụ những người
thành thạo Lý thuyết hàng đợi sẽ có khuynh hướng chuyển mọi bài toán đánh giá hiệu
suất về bài toán hàng đợi, dù cho hệ thống có quá phức tạp và có thể áp dụng kỹ thuật
đo một cách dễ dàng. Những người thành thạo về lập trình lại có khuynh hướng giải
mọi bài toán bằng kỹ thuật mô phỏng. Việc người nghiên cứu gắn chặt với một kỹ
thuật duy nhất sẽ dẫn đến một mô hình mà anh ta có thể giải một cách tốt nhất chứ
không phải một mô hình giúp giải bài toán theo cách tốt nhất. Vấn đề xảy ra đối với
những sự biến đổi như vậy là chúng có thể gây ra các hiện tượng lạ trong mô hình
không có trong hệ thống nguyên bản hoặc có thể làm mất đi một số hiện tượng quan
trọng có trong hệ thống nguyên bản.
Người phân tích cần có các kiến thức cơ bản về cả 3 kỹ thuật. Có một số nhân tố cần
được xem xét khi phải lựa chọn lấy một kỹ thuật thích hợp. (sẽ được trình bày tại . .).
8. Xem nhẹ các tham số quan trọng (Overlooking Important Parameters): Có một ý tưởng
tốt là liệt kê đầy đủ các đặc tính (characteristics) của hệ thống và của tải có ảnh hưởng
đến hiệu suất của hệ thống. Các đặc tính này được gọi là các tham số (parameters). Thí
dụ, các tham số hệ thống có thể bao gồm kích thước lượng tử (quantum size) để phân
bổ CPU hay kích thước tập làm việc (working set size) để phân bổ bộ nhớ. Các tham
số về tải có thể bao gồm: số NSD, mẫu đến của các yêu cầu (request arrival patterns),
quyền ưu tiên v.v. Người phân tích có thể chọn một tập các giá trị cho mỗi một trong
các tham số này; kết quả cuối cùng của việc nghiên cứu phụ thuộc rất mạnh vào các
lựa chọn này. Việc xem nhẹ một hay một số tham số quan trọng có thể làm cho các kết quả trở thành vô dụng.
9. Bỏ qua các yếu tố quan trọng (Ignoring Significant Factors): Các tham số sẽ thay đổi
trong quá trình nghiên cứu được gọi là nhân tố (factor). Thí dụ, trong các tham số về
tải đã được liệt kê ở trên, chỉ có số NSD là có thể được chọn làm factor; các tham số
khác có thể được giữ cố định ở các giá trị điển hình của chúng. Không phải tất cả các
tham số đều có ảnh hưởng bằng nhau đến hiệu suất. Một việc quan trọng là chỉ ra các
tham số mà nếu chúng thay đổi sẽ có ảnh hưởng đáng kể đến hiệu suất. Các tham số
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 11
này cần được sử dụng làm factor khi nghiên cứu về hiệu suất. Thí dụ tốc độ đến của
các gói tin chứ không phải kích thước gói tin ảnh hưởng đến thời gian phản ứng của
một network gateway, vì vậy tốt nhất là sử dụng một vài giá trị tốc độ đến khác nhau
khi nghiên cứu hiệu suất của nó (network gateway).
Những factor mà NSD cuối (hoặc người ra quyết định) có thể điều khiển được một các
dễ dàng cần được ưu tiên hơn các factor không thay đổi được. Đừng có lãng phí thời
gian vào việc so sánh các lựa chọn (alternatives) mà NSD cuối không thể chấp nhận
hoặc là vì chúng liên quan đến những hành động không thể chấp nhận được đối với
người ra quyết định hoặc là vì chúng nằm ngoài phạm vi ảnh hưởng của chúng.
Điều quan trọng là hiểu được tính ngẫu nhiên của một hệ thống riêng lẻ và các tham số
tải có ảnh hưởng đến hiệu suất. Một số trong các tham số này là dễ biết được hơn các
tham số khác. Thí dụ một người phân tích có thể biết được phân bố của sự tham khảo
trang (page references) trong một hệ thống máy tính nhưng không có một ý niệm gì về
phân bố của sự tham khảo đĩa (distribution of disk references). Trong trường hợp này,
lỗi thường mắc phải là việc sử dụng phân bố tham khảo trang như là một factor mà lại
không sử dụng phân bố tham khảo đĩa, mặc dù đĩa có thể là cái cổ chai và có ảnh
hưởng nhiều hơn đến hiệu suất so với việc tham khảo trang. Việc chọn các factor cần
dựa trên sự liên quan của chúng chứ không nên dựa trên hiểu biết của người phân tích
về các factor. Cần phải nỗ lực để nhận được các giá trị thực tế của tất cả các tham số có
liên quan và các phân bố của chúng. Đối với các tham số còn chưa biết, cần phải thực
hiện một sự phân tích nhạy bén (sensitivity analysis) cho thấy ảnh hưởng của sự thay
đổi của các tham số này so với các giá trị được giả định của chúng, để định lượng ảnh
hưởng của các tham số chưa biết.
10.Thiết kế thí nghiệm không thích hợp (Inappropriate Experimental Design): Việc thiết
kế thí nghiệm liên quan đến số các thí nghiệm đo hoặc thí nghiệm mô phỏng sẽ được
thực hiện và các giá trị của tham số được sử dụng trong từng thí nghiệm. Việc chọn các
giá trị này một cách thích hợp sẽ làm cho với cùng một số lần làm thí nghiệm có thể
nhận được nhiều thông tin hơn. Việc chọn không thích hợp sẽ gây ra lãng phí thời gian
và tài nguyên của người phân tích.
Trong một thiết kế non nớt (naive), từng factor được lần lượt thay đổi. Thiết kế này có
thể dẫn đến các kết luận sai nếu các tham số tương tác đến mức mà ảnh hưởng của một
tham số phụ thuộc vào các giá trị của các tham số khác. Có các cách thiết kế khác tốt
hơn, sử dụng thiết kế thực nghiệm phân chia thành thừa số đầy đủ (full factorial
experimental designs) và thiết kế phân chia thành thừa số phân đoạn (fractional
factorial designs), được giải thích trong Phần IV [].
11.Mức độ chi tiết không thích hợp (Inappropriate Level of Detail): mức độ chi tiết được
sử dụng trong lập mô hình một hệ thống có ảnh hưởng lớn đến việc phát biểu bài toán.
Cần tránh các phát biểu quá rộng hoặc quá hẹp. Để so sánh các lựa chọn khác nhau là
các biến thể khác chút ít của một cách tiếp cận chung, việc xây dựng một mô hình tích
hợp các biến thể là hữu ích hơn việc xây dựng một mô hình ở mức cao. Mặt khác, để
so sánh các lựa chọn rất khác nhau, các mô hình mức cao đơn giản có thể cho phép
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 12
phân tích một vài lựa chọn một cách nhanh chóng và không tốn kém. Một lỗi thường
mắc là chọn cách tiếp cận chi tiết khi mà một mô hình mức cao có thể làm được và
ngược lại. Rõ ràng là các mục đích của việc nghiên cứu có ảnh hưởng lớn đến những
cái được lập mô hình và việc chúng sẽ được phân tích như thế nào.
12.Thiếu phân tích (No Analysis): Một trong các vấn đề chung của các kế hoạch (project)
đo là chúng thường được vận hành bởi những người phân tích hiệu suất, họ giỏi về các
kỹ thuật đo nhưng thiếu tinh thông về phân tích số liệu. Họ thu thập một lượng lớn số
liệu, nhưng không biết phải phân tích hoặc diễn dải chúng như thế nào. Kết quả là một
bộ băng từ (hoặc bộ đĩa) chứa đầy số liệu mà không có một bản tóm tắt nào. Giỏi lăm,
người phân tích có thể tạo ra một bản báo cáo dày chứa đầy các số liệu thô và các đồ
thị mà không có một giải thích về việc người ta có thể sử dụng các kết quả này như
thế nào. Vì vậy, tốt nhất là có một đội các nhà phân tích hiệu suất có các kiến thức cơ sở về đo và phân tích.
13.Phân tích sai (Erroneous Analysis): Có một số lỗi chung mà những người phân tích
thường mắc phải trong việc đo, mô phỏng và lập mô hình giải tích, thí dụ lấy trung
bình của các tỉ số và các mô phỏng quá ngắn.
14.Thiếu phân tích nhạy bén (No Sensitivity Analysis): Các nhà phân tích thường nhấn
mạnh quá mức vào các kết quả của sự phân tích của họ, bằng cách trình bày chúng như
là các sự kiện (fact) chứ không phải là các bằng chứng (evidence). Có một sự thật là
các kết quả có thể nhạy cảm đối với tải và các tham số hệ thống thường bị bỏ sót
(overlook). Nếu thiếu sự phân tích nhạy bén, người ta sẽ không thể chắc chắn rằng các
kết luận có thay đổi hay không nếu sự phân tích được thực hiện với một sự thiết lập
(setting) hơi khác một chút. Cũng như vậy, nếu thiếu sự phân tích nhạy bén, khó có thể
biết được sự quan trọng tương đối của các tham số khác nhau.
15.Bỏ qua các lỗi ở input (Ignoring Error in Input): Thông thường các tham số cần quan
tâm lại không thể đo được. Thay vào đó, lại có thể đo được một biến khác và sử dụng
nó để ước lượng (giá trị của) tham số. Thí dụ trong một thiết bị mạng, các gói tin được
chứa trong một danh sách móc nối của các bộ đệm (buffer), mỗi bộ đệm có chiều dài
512 byte. Khi biết được số bộ đệm cần có để chứa các gói tin, không thể dự đoán được
một cách chính xác số gói tin hay số byte có trong các gói tin. Những tình huống như
vậy dẫn đến các tình huống bất định bổ sung trong số liệu vào. Người phân tích cần
phải điều chỉnh mức độ tin cậy ở đầu ra của mô hình nhận được từ những số liệu như
vậy. Ngoài ra, cũng có thể là không đáng để lập mô hình một cách chính xác kích
thước gói tin khi input có thể được tắt đi nhiều đến 512 bytes. Thí dụ này còn minh hoạ
thêm một điểm nữa, đó là các lỗi ở input không luôn luôn được phân bố đều quanh giá
trị trung bình. Trong trường hợp này, không gian bộ đệm luôn lớn hơn số lượng byte
thực sự được truyền lên mạng hoặc được nhận từ mạng. Nói cách khác, input bị thiên lệch.
16.Xử lý không đúng đắn các giá trị khác thường (Improper Treatment of Outlier): Các
giá trị quá cao hoặc quá thấp so với đa số các giá trị trong một tập được gọi là các giá
trị khác thường (outliers). Các giá trị khác thường ở input hoặc output của mô hình
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 13
biểu thị một vấn đề. Nếu một giá trị khác thường không phải do một hiện tượng của hệ
thống thực gây ra, thì cần bỏ qua nó. Việc sử dụng cả giá trị này có thể tạo ra một mô
hình hỏng. Mặt khác, nếu giá trị khác thường có thể xuất hiện trong hệ thống thực, nó
cần được đưa vào mô hình một cách thích hợp. Việc bỏ qua không sử dụng giá trị này
sẽ tạo ra một mô hình hỏng. Việc xác định giá trị khác thường nào cần bỏ qua, giá trị
khác thường nào cần đưa vào là một phần của nghệ thuật đánh giá hiệu suất và đòi hỏi
sự hiểu biết kỹ càng về hệ thống được lập mô hình.
17.Giả thiết sẽ không có thay đổi gì trong tương lai (Assuming No Change in the Future):
Người ta thường giả thiết rằng tương lai là giống với quá khứ. Một mô hình dựa trên
việc sử dụng tải và hiệu suất quan sát được trong quá khứ để dự đoán hiệu suất trong
tương lai. Tải và hành vi hệ thống trong tương lai được giả thiết là tương tự với tải và
hành vi hệ thống đã được đo. Người phân tích và những người ra quyết định cần thảo
luận về giả thiết này và định giới hạn thời gian trong tương lai cho việc áp dụng các dự đoán.
18.Bỏ qua tính biến thiên (Ignoring Variability): Người ta thường chỉ phân tích hiệu suất
trung bình bởi vì việc xác định tính biến thiên thường là khó, thậm chí là không thể
thực hiện được. Nếu tính biến thiên là cao, việc chỉ sử dụng giá trị trung bình có thể
làm người ra quyết định bị sai lầm. Thí dụ, các quyết định dựa trên việc tính giá trị
trung bình hàng ngày của yêu cầu sử dụng máy tính có thể không có giá trị nếu yêu cầu
về tải có nhiều giá trị cao điểm (peak) hàng giờ, chúng ảnh hưởng bất lợi đến hiệu suất của người sử dụng.
19.Phân tích quá phức tạp (Too Complex Analysis): Khi đã biết 2 phép phân tích dẫn đến
cùng một kết luận, thì phép phân tích đơn giản hơn, dễ giải thích hơn rõ ràng nên được
sử dụng. Người phân tích hiệu suất cần truyền đạt các kết luận cuối cùng theo cách
càng đơn giản càng tốt. Một số người phân tích bắt đầu với các mô hình phức tạp và
các mục tiêu quá tham vọng, dẫn đến việc không thể giải được, hoặc không thể đo
được hoặc mô phỏng được, kết cục là không thể đạt được mục đích. Tốt nhất là hãy bắt
đầu nghiên cứu với các mô hình hay phép đo đơn giản, sau khi nhận được một số kết
quả hoặc thấu hiểu được vấn đề, sẽ tăng độ phức tạp của mô hình hoặc phép đo.
Có sự khác nhau đáng kể giữa các kiểu mô hình được công bố trong tài liệu và các mô
hình được sử dụng trong thực tế. Các mô hình trình bày trong các tài liệu và thường
được giảng dạy trong các nhà trường thường là quá phức tạp. Lý do là vì các mô hình
tầm thường, dù cho rất sáng tỏ, cũng thường không được chấp nhận cho xuất bản. Vì
một số lý do, khả năng phát triển và giải một mô hình phức tạp được giới hàn lâm đánh
giá cao hơn so với việc rút ra được các kết luận từ các mô hình đơn giản. Tuy nhiên,
trong giới công nghiệp, những người ra quyết định hiếm khi quan tâm đến kỹ thuật lập
mô hình hay tính mới của nó. Quan tâm chủ yếu của họ là sự tính dẫn dắt của mô hình
cùng với thời gian và chi phí để phát triển mô hình. Thời hạn ra quyết định thường dẫn
đến việc chọn các mô hình đơn giản. Chính vì vậy, đa số các vấn đề về hiệu suất hàng
ngày trong thế giới thực được giải quyết bằng các mô hình đơn giản; các mô hình phức
tạp hiếm khi, thậm chí là không bao giờ được sử dụng. Ngay cả khi thời gian để phát
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 14
triển mô hình không bị hạn chế, người ra quyết định cũng không dễ ràng hiểu được các
mô hình phức tạp, vì vậy kết quả của các mô hình này cũng không được tin tưởng.
Chính điều này làm những người mới tốt nghiệp, được đào tạo rất tốt về các kỹ thuật
lập mô hình phức tạp thất vọng vì họ thấy có rất ít cơ hội sử dụng chúng trong thực tế.
20.Biểu diễn kết quả không thích hợp (Improper Presentation of Results): Mục đích cuối
cùng của việc nghiên cứu hiệu suất là trợ giúp cho việc ra quyết định. Việc phân tích
không tạo ra được các kết quả hữu dụng là việc làm thất bại. Tương tự như vậy, việc
phân tích với các kết quả mà người ra quyết định không thể hiểu nổi cũng là thất bại.
Người ra quyết định có thể là nhà thiết kế hệ thống, người mua hệ thống hoặc là người
tài trợ cho dự án. Việc truyền đạt (hoặc bán) các kết quả của việc phân tích cho người
ra quyết định là trách nhiệm của người phân tích. Điều này đòi hỏi việc sử dụng không
ngoan từ ngữ, các bức ảnh và đồ thị để giải thích các kết quả và việc phân tích. Độ đo
đúng để đo hiệu suất của một người phân tích không phải là số phép phân tích đã được
thực hiện mà là số phép phân tích đã giúp ích cho người ra quyết định.
21.Bỏ qua các yếu tố xã hội (Ignoring Social Aspects): Việc trình bày thành công các kết
quả phân tích đòi hỏi phải có 2 loại kỹ năng: kỹ năng về xã hội và kỹ năng thực sự
(substantive skills). Viết và nói là các kỹ năng về xã hội, trong khi đó việc lập mô hình
và phân tích là các kỹ năng thật sự. Hầu hết các nhà phân tích đều có loại kỹ năng thực
sự là tốt; tuy nhiên chỉ có những người có kỹ năng xã hội tốt thành công trong việc bán
các kết quả của họ cho những người ra quyết định. Việc chấp nhận các kết quả phân
tích đòi hỏi việc thể hiện sự tin cậy giữa những người ra quyết định và người phân tích
và việc trình bày các kết quả trước người ra quyết định thao một cách thức mà người ra
quyết định có thể hiểu được. Nếu người ra quyết định không tin hoặc không hiểu sự
phân tích, thì người phân tích đã thất bại trong việc gây ảnh hưởng lên quyết định cuối
cùng. Các kỹ năng về mặt xã hội là đặc biệt quan trọng trong việc trình bày các kết quả
trái với những điều mà người ra quyết định vẫn tin hoặc trong việc trình bày các giá trị
đòi hỏi những sự thay đổi lớn trong thiết kế.
Những người phân tích mới vào nghề thường không hiểu được rằng, các kỹ năng về
mặt xã hội thường là quan trọng hơn so với các kỹ năng thực sự. Các phân tích có chất
lượng cao có thể bị từ chối chỉ do người phân tích thiếu nỗ lực và thời gian trong việc
trình bày các kết quả. Người ra quyết định thường bị sức ép về thời gian và muốn đi
đến các kết quả cuối cùng càng sớm càng tốt. Họ thường không quan tâm đến tính chất
mới của sự tiếp cận hay chính sự tiếp cận. Mặt khác, người phân tích sau khi đã bỏ ra
rất nhiều thời gian cho việc phân tích, lại cố nói với người ra quyết định về tính chất
mới của việc tiếp cận lập mô hình, chứ không phải là về các kết quả cuối cùng. Sự
khác biệt về quan điểm này có thể dẫn đến một báo cáo quá dài, không gây được ảnh
hưởng. Vấn đề này lại bị làm cho trầm trọng thêm bởi việc người phân tích cũng muốn
trình bày các kết quả cho các đồng nghiệp của mình, họ cũng là những nhà phân tích
và muốn hiểu biết thêm chủ yếu về việc tiếp cận chứ không phải là các kết quả cuối
cùng. Vì vậy, một giải pháp cho vấn đề này là chuẩn bị 2 bài trình bày (hoặcbáo cáo)
riêng biệt cho 2 đối tượng người nghe. Bài trình bày cho người ra quyết định cần có
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 15
thật ít các thuật ngữ chuyên môn về phân tích và cần nhấn mạnh đến các kết quả cuối
cùng; trong khi đó bài trình bày cho các nhà phân tích khác cần được bổ sung thêm tất
cả các chi tiết của các kỹ thuật phân tích. Việc kết hợp 2 bài trình bày này làm một có
thể làm cho nó trở nên vô nghĩa cho cả 2 đối tượng nghe.
Người phân tích không có kinh nghiệm thường cho rằng người ra quyết định cũng
giống như họ và cùng chia sẽ những niềm tin, các giá trị, ngôn ngữ và các thuật ngữ
chuyên môn. Điều này thương là sai. Người ra quyết định có thể giỏi trong việc đánh
giá các kết quả phân tích, nhưng có thể không hiểu biết nhiều về chính việc phân tích.
Ở vị trí của người ra quyết định, họ phải cân nhắc một vài yếu tố (factor) mà người
phân tích có thể cho là không quan trọng, thí dụ như ảnh hưởng chính trị của quyết
định, sự chậm trễ trong các thủ tục của dự án hoặc là việc có sẵn người hay không để
thực thi một quyết định cụ thể nhất định. Người phân tích cố gắng hiểu được những
điều quan tâm của người ra quyết định và tích hợp chúng vào trong bài trình bày của
mình càng nhiều càng tốt sẽ có được cơ hội tốt hơn để “bán” kết quả phân tích của
mình, so với những người chỉ nhìn thấy sự vật theo quan điểm của chính mình.
22.Lờ đi các giả thiết và hạn chế đã sử dụng khi trình bày phân tích (Omitting
Assumptions and Limitations): Các giả thiết và hạn chế của sự phân tích thường bị lờ
đi trong báo cáo cuối cùng. Điều này có thể làm cho NSD áp dụng sự phân tích vào
ngữ cảnh khác, trong đó các giả thiết không có giá trị. Đôi khi người phân tích liệt kê
các giả thiết tại đầu báo cáo và sau đó quên mất các hạn chế tại cuối (báo cáo) và đưa
ra các kết luận về những môi trường mà phân tích của anh ta không áp dụng được.
1.5 Tiếp cận một cách có hệ thống để tránh mắc lỗi
Hầu hết các bài toán về đánh giá hiệu suất là duy nhất. Các độ đo, tải mạng và các kỹ
thuật đánh giá được sử dụng cho bài toán này thường không sử dụng được cho các bài
toán khác. Tuy nhiên, các bài toán đánh giá hiệu suất mạng vẫn có các bước đi chung, cần
tuân theo để tránh mắc các lỗi trình bày ở trên.
1. Phát biểu rõ mục tiêu và xác định hệ thống (State Goals and Define the System): Bước
đầu tiên trong mọi dự án đánh giá hiệu suất là phát biểu các mục đích của việc nghiên
cứu và xác định những gì cấu thành nên hệ thống bằng việc vạch ra biên giới của hệ
thống. Khi đã cho cùng một một tập hardware và software, định nghĩa của hệ thống có
thể thay đổi phụ thuộc vào các mục đích của việc nghiên cứu. Thí dụ cho biết 2 CPU,
mục đích có thể là đánh giá ảnh hưởng của chúng lên thời gian phản ứng của những
NSD tương tác. Trong trường hợp này hệ thống có thể bao gồm hệ thống chia sẻ thời
gian, các kết luận của việc nghiên cứu có thể phụ thuộc mạnh vào các thành phần bên
ngoài CPU. Mặt khác, nếu 2 CPU về căn bản là giống nhau ngoại trừ các ALU của
chúng, còn mục đích của sự nghiên cứu là quyết định nên chọn ALU nào, thì có thể coi
CPU là một hệ thống và chỉ có các thành phần bên trong CPU có thể được coi là thành phần của hệ thống.
Việc lựa chọn biên giới của hệ thống ảnh hưởng đến các độ đo hiệu suất cũng như đến
tải được sử dụng để so sánh các hệ thống. Vì vậy, việc biết được biên giới của hệ thống
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 16
là quan trọng. Mặc dầu trong các đối tượng của việc nghiên cứu, việc thiết lập biên
giới hệ thống là sự xem xét chủ yếu, vẫn cần phải tính đến những sự xem xét khác nữa,
chẳng hạn như việc quản lý hành chính của những người bảo trợ cho việc nghiên cứu.
Nếu những người bảo trợ không có quyền điều khiển một số thành phần, họ có thể
muốn để các thành phần này nằm ngoài biên giới của hệ thống.
2. Lên danh sách các dịch vụ và các kết quả có thể có (List Services and Outcomes): Mỗi
hệ thống cung cấp một tập các dịch vụ. Thí dụ, một mạng máy tính cho phép NSD của
nó gửi các gói tin đến các đích được chỉ ra. Một hệ thống CSDL đáp ứng các truy vấn.
Một bộ xử lý thực hiện một số chỉ thị khác nhau. Bước tiếp theo của việc phân tích một
hệ thống là lên danh sách các dịch vụ này. Khi NSD yêu cầu bất kỳ dịch vụ nào trong
số các dịch vụ, có thể có một số kết quả. Một số trong các kết quả này là được mong
đợi còn một số là không. Thí dụ, một hệ thống CSDL có thể trả lời một truy vấn một
cách đúng đắn, không đúng (do cập nhật không nhất quán) hoặc thậm chí không trả lời
(do deadlock hay các vấn đề tương tự). Một danh sách các dịch vụ và các kết quả có
thể có là rất hữu ích sau này cho việc lựa chọn các độ đo và tải đúng.
3. Chọn lựa các độ đo hiệu suất (Select Metrics): Bước tiếp theo là chọn các tiêu chuẩn
để so sách hiệu suất. Các tiêu chuẩn này được gọi là độ đo. Nói chung, các độ đo liên
quan đến tốc độ, độ chính xác và tính sẵn sàng sử dụng của các dịch vụ. Hiệu suất của
mạng, thí dụ được đo bởi tốc độ (thông lượng và độ trễ), độ chính xác (tỉ suất lỗi) và
tính sẵn sàng để dùng (availability) của các gói tin được gửi. Hiệu suất của một bộ xử
lý được đo bằng tốc độ (thời gian thi hành) của các chỉ thị khác nhau.
4. Lên danh sách các tham số (List Parameter): Bước tiếp theo trong các dự án về hiệu
suất là tạo ra một danh sách tất cả các tham số có ảnh hưởng đến hiệu suất. Danh sách
này có thể được chia thành các tham số hệ thống và các tham số tải. Các tham số hệ
thống bao gồm cả các tham số phần cứng lẫn các tham số phần mềm, chúng thường
không thay đổi trong số các sự cài đặt khác nhau của hệ thống. Các tham số tải được
đặc trưng bởi các yêu cầu của NSD, chúng thường thay đổi từ sự cài đặt đến sự cài đặt khác.
Danh sách các tham số có thể là không đầy đủ; nghĩa là, sau khi trải qua một lần phân
tích, bạn có thể phát hiện ra rằng, có các tham số bổ sung thêm có ảnh hưởng đến hiệu
suất. Sau đó bạn có thể bổ sung các tham số này vào danh sách; Tuy nhiên tại mọi thời
điểm cần phải giữ cho danh sách này càng bao gồm toàn diện càng tốt. Điều này cho
phép người phân tích và người ra quyết định thảo luận về ảnh hưởng của các tham số
khác nhau và định rõ dữ liệu nào cần được thu thập trước hoặc trong khi phân tích.
5. Lựa chọn các yếu tố để nghiên cứu (Select Factors to Study): Danh sách các tham số
được chia thành 2 phần: các tham số sẽ thay đổi trong quá trình đánh giá và các tham
số sẽ không thay đổi. Các tham số sẽ thay đổi được gọi là factor (yếu tố) và các giá trị
của chúng được gọi là các mức (levels). Nói chung, danh sách các factor và các mức có
thể có của chúng là lớn hơn so với giới hạn mà các tài nguyên sẵn có cho phép. Nói
cách khác, danh sách này tiếp tục lớn dần lên cho đến khi người ta thấy rõ rằng không
có đủ tài nguyên để nghiên cứu vấn đề. Tốt hơn cả là bắt đầu nghiên cứu với một danh
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 17
sách ngắn các factor và một số lượng nhỏ các mức cho mỗi factor và mở rộng danh
sách ở pha tiếp theo của dự án nếu các tài nguyên còn cho phép. Thí dụ, bạn có thể
quyết định chỉ có 2 factor: kích thước lượng tử và số người sử dụng. Với mỗi một
trong 2 factor này bạn chỉ có thể chọn 2 mức: nhỏ và lớn. Kích thước tập làm việc và
kiểu của tải có thể được cố định.
Các tham số được cho rằng có ảnh hưởng lớn đến hiệu suất tốt nhất là được chọn làm
factor. Giống như các độ đo, lỗi thường gặp trong việc lựa chọn các factor là: các tham
số dễ làm thay đổi và đo được sử dụng làm factor, trong khi đó các tham số có ảnh
hưởng hơn bị lờ đi đơn giản chỉ bởi vì các khó khăn có liên quan đến chúng.
Trong việc chọn factor, điều quan trọng là xem xét các ràng buộc về kinh tế, chính trị
và công nghệ đang có cũng như việc bổ sung thêm vào các giới hạn mà sự điều khiển
của người ra quyết định áp đặt lên và thời gian có hiệu lực của quyết định. Điều này
làm tăng cơ may của việc tìm một giải pháp chấp nhận được và thực hiện được.
6. Lựa chọn kỹ thuật đánh giá hiệu suất (Select Evaluation Technique): Ba kỹ thuật được
sử dụng rộng rãi cho việc đánh giá hiệu suất là: lập mô hình giải tích, mô phỏng và đo
trên hệ thống thực. Việc lựa chọn một kỹ thuật đúng phụ thuộc vào thời gian và các tài
nguyên sẵn có để giải bài toán và mức độ đòi hỏi về độ chính xác.
7. Lựa chọn tải đưa vào mạng (Select Workload): Tải bao gồm một danh sách các yêu
cầu (request) dịch vụ đối với hệ thống. Thí dụ, tải cho việc so sánh một số hệ cơ sở dữ
liệu có thể bao gồm một tập các truy vấn (queries). Tuỳ thuộc vào kỹ thuật đánh giá đã
được chọn, tải có thể được biểu diễn dưới các dạng khác nhau. Đối với kỹ thuật Lập
mô hình giải tích, tải thường được biểu diễn như là xác suất của các yêu cầu khác
nhau. Đối với mô phỏng, người ta có thể sử dụng vết (trace) của các yêu cầu được đo
trên hệ thống thực. Đối với kỹ thuật đo, tải có thể bao gồm các script của người sử
dụng sẽ được thi hành trên hệ thống. Trong mọi trường hợp, điều cốt yếu là tải phải là
mẫu đại diện của việc sử dụng hệ thống trong thực tế (real life). Để sinh ra tải có tính
chất đại diện, cần phải đo và mô tả (characterize) tải trên các hệ thống đang tồn tại.
8. Thiết kế thí nghiệm (Design Experiments): Một khi bạn đã có danh sách các factor và
các mức của chúng, bạn cần quyết định một dãy các thí nghiệm để cho ra một lượng
thông tin lớn nhất với nỗ lực nhỏ nhất. Trong thực tế, tiến hành thí nghiệm trong 2 pha
là hữu ích. Trong pha thứ nhất, số factor có thể là lớn nhưng số mức thì nhỏ. Mục đích
là để xác định ảnh hưởng liên quan của các factor khác nhau. Trong hầu hết các trường
hợp, việc này có thể thực hiện bằng thiết kế thí nghiệm thừa số phân đoạn (fractional
factorial experimental designs) (được trình bày tại Part IV của cuốn sách). Trong pha
thứ hai, số factor được giảm xuống còn số mức của các factor có ảnh hưởng đánh kể được tăng lên.
9. Phân tích và diễn giải số liệu thu được (Analyze and Interpret Data): Một điều quan
trọng cần phải nhận thức là các kết quả của việc đo hoặc mô phỏng là các đại lượng
ngẫu nhiên theo nghĩa là kết quả có thể khác mỗi khi thí nghiệm được lặp lại. Trong
việc so sánh 2 lựa chọn (alternatives), cần phải xét đến sự thay đổi của các kết quả.
Nếu chỉ so sánh các giá trị trung bình có thể dẫn đến các kết luận không chính xác.
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 18
(Các kỹ thuật thống kê để so sách 2 lựa chọn được trình bày ở chương 13 của cuốn sách).
Việc biểu diễn các kết quả của một phép phân tích là một phần cốt yếu của nghệ thuật
phân tích. Cần phải hiểu rằng, sự phân tích chỉ sinh ra các kết quả chứ không sinh ra
các kết luận. Kết quả tạo ra cơ sở, dựa trên đó người phân tích hoặc người ra quyết
định có thể rút ra các kết luận. Khi một số người phân tích được trao cùng một tập các
kết quả, mỗi người phân tích có thể rút ra một kết luận khác nhau.
10.Trình bày kết quả (Present Results): Bước cuối cùng của mọi đề án về hiệu suất là
truyền đạt các kết quả đến các thành viên khác của nhóm ra quyết định (decision-
making team). Điều quan trọng là các kết quả phải được trình bày theo cách dễ hiểu.
Việc này thường đòi hỏi trình bày kết quả dưới dạng đồ thị chứ không phải bằng các
thuật ngũ chuyên môn về thống kê. Các đồ thị cần chia tỉ lệ thích hợp. Vấn đề vẽ đồ thị
đúng được bàn luận tiếp ở chương 10).
Thông thường, đến giai đoạn này của dự án, các kiến thức thu được từ việc nghiên cứu
có thể đòi hỏi người phân tích quay trở lại và xem xét lại một số quyết định ở các bước
trước đó. Thí dụ, người phân tích có thể muốn định nghĩa lại các ranh giới của hệ
thống hay bổ sung thêm các factor và các độ đo hiệu suất khác mà trước đó chưa được
xem xét. Vì vậy ,dự án toàn bộ bao gồm một vài chu trình qua các bước chứ không
phải chỉ đi một lần qua các bước.
1.6 Tài liệu tham khảo cho Chương 1
[1.1] Rij Jain (1992), The art of Computer systems Performance Analysis: Techniques for
Experimental Design, Measurement, Simulation, and Modeling, Wiley, 1992.
[1.2] Hiashi Kobayashi (1978), Modeling and Analyis: An Introduction to System Performance
Evaluation Methodology, Addition-Wesley, Massachusetts.
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 19
CHƯƠNG 2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU NĂNG MẠNG
2.2 Mô hình Giải tích
Khi sử dụng lý thuyết Hàng đợi để giải bài toán đánh giá hiệu năng, người ta thường
phải đưa ra nhiều giả thuyết để đơn giản hoá mô hình. Có những giả thuyết có vẻ như phi
thực tế hoặc đơn giản hoá quá mức, tuy nhiên, kết quả thu được lại rất phù hợp với các kết
quả của phương pháp mô phỏng hoặc phương pháp thực nghiệm. Điều quan trọng đối với
nhà nghiên cứu là đưa ra được các giả thiết làm cho mô hình trở nên càng đơn giản càng
tốt mà vẫn đạt được một độ chính xác cần thiết của các kết quả dự đoán và đánh giá hiệu năng [39].
Mạng máy tính có thể được lập mô hình như một mạng hàng đợi. Khách hàng
(customer) của các hàng đợi là các gói số liệu đến và yêu cầu được truyền đi, còn người
phục vụ (server) chính là các phương tiện truyền, bao gồm hệ chuyển mạch và đường kết
nối vật lý, hoặc nói đơn giản hơn là đường truyền. Hầu hết các vấn đề liên quan đến hiệu
năng đều liên quan tới thời gian mà các gói số liệu phải xếp hàng chờ được phục vụ. Đây
là một độ đo quan trọng để đánh giá hiệu năng, bởi vì nó là một thành phần của thời gian
trễ chuyển tiếp gói số liệu từ thực thể nguồn tới thực thể đích, được gọi tắt là thời gian trễ
đầu cuối - đầu cuối, một yếu tố của hiệu năng mạng mà người sử dụng nhận thấy được.
Tất nhiên, thời gian chờ cũng phụ thuộc vào thời gian xử lý của nút và chiều dài của gói số
liệu. Nó cũng còn phụ thuộc vào dung lượng đường truyền, tức là khả năng truyền, đo
bằng packet/s, phụ thuộc vào chiến lược phục vụ được áp dụng ở các hàng đợi. Lý thuyết
Hàng đợi có thể đưa tất cả các yếu tố này vào trong mô hình; tuy nhiên, khi nghiên cứu
định lượng về chuyển mạch gói, trong những điều kiện cụ thể, người ta có thể bỏ qua một
số tham số, làm cho bài toán đơn giản hơn mà vẫn không làm giảm nhiều độ chính xác của kết quả thu được.
Chúng ta hãy xem xét mô hình đơn giản nhất của một hàng đợi được mô tả trên hình
2.1, với ngữ cảnh mạng chuyển mạch gói. Giả sử rằng các gói số liệu đến một cách ngẫu
nhiên với tốc độ đến trung bình là  packet/s, tốc độ phục vụ của người phục vụ là 
packet/s. Hàng đợi trên hình vẽ chứa các gói số liệu, chúng đang xếp hàng chờ được phục
vụ - được phát ra đường truyền; người phục vụ là phương tiện truyền hay đường truyền,
tốc độ truyền hay còn gọi dung lượng đường truyền thường được tính theo đơn vị bit/s,
dưới đây được ký hiệu là C. Nếu chiều dài gói số liệu trung bình tính bằng bit là 1/’ và
được cho bằng đơn vị bit/packet, thì  = ’C là tốc độ truyền tính bằng đơn vị packet/s.
Hình 2.1 Mô hình hàng đợi có một người phục vụ
Bài giảng (vs1, 2008): Đánh giá hiệu năng mạng máy tính. Tác giả: PGS. TS. Nguyễn Đình Việt, trường ĐHCN, ĐHQGHN. 20
Rõ ràng rằng, khi tốc độ đến của các gói số liệu  tiến tới dung lượng đường truyền 
thì hàng đợi bắt đầu hình thành. Với một hàng đợi hữu hạn, khi  vượt quá  và tiếp tục
tăng lên, bộ đệm sẽ đầy, tất cả các gói số liệu đến sau sẽ bị chặn lại, vì trong hàng đợi
không còn chỗ trống cho chúng. Nếu giả thiết bộ đệm là vô hạn cho đơn giản (đây là giả
thiết nhằm đơn giản hoá việc phân tích), hàng đợi sẽ trở nên không ổn định khi .
Người ta đã chứng minh được rằng < là điều kiện đảm bảo cho sự ổn định của một hàng
đợi có một người phục vụ [38], [41]. Đặc biệt, chúng ta sẽ tìm tham số   /, thường
được gọi là độ sử dụng đường truyền hoặc tải chuẩn hoá, đó là tỉ số của tải của hệ thống
trên năng lực của hệ thống. Tham số  đóng vai trò then chốt trong việc phân tích hàng đợi.
Đối với hàng đợi có một người phục vụ, khi  tiến tới và vượt quá một, vùng tắc nghẽn
sẽ xuất hiện, thời gian trễ bắt đầu tăng nhanh, các gói số liệu đến sẽ bị chặn lại một cách thường xuyên hơn.
Để nghiên cứu định lượng về thời gian trễ, sự chặn (blocking), thông lượng và mối
quan hệ của chúng với cả tốc độ phục vụ  lẫn kích thước của bộ đệm, chúng ta cần một
mô hình hệ thống hàng đợi chi tiết hơn mô hình hàng đợi trên hình 2.1. Trong mô hình này
các tham số hiệu năng phụ thuộc vào các xác suất trạng thái hàng đợi, với trạng thái được
định nghĩa là số gói số liệu ở trong hàng đợi, kể cả gói số liệu đang được phục vụ nếu
hàng đợi không rỗng. Để tính các xác suất trạng thái, ta phải biết:
 Quá trình đến của các gói số liệu (thống kê các gói số liệu mới đến).
 Phân bố của chiều dài các gói số liệu (phân bố thời gian phục vụ).
 Chiến lược phục vụ (thí dụ: FCFS, FIFO - đến trước phục vụ trước, hay LCFS - đến sau phục vụ trước v.v).
Đối với các hàng đợi có nhiều người phục vụ, xác suất trạng thái còn phụ thuộc vào số
lượng người phục vụ nữa.
Dưới đây, trong nhóm tiểu mục 2.2.1 và 2.2.2, chúng tôi trình bày tóm tắt một số kết
quả nghiên cứu về lý thuyết Hàng đợi [38], [41], trong ngữ cảnh mạng máy tính, được
chúng tôi áp dụng trong Chương 3, mục 3.2 của bản Luận án này.
2.2.1 Quá trình Poisson và các tính chất của nó
Đây là quá trình ngẫu nhiên được sử dụng thường xuyên nhất trong lý thuyết Hàng đợi
để lập mô hình cho sự đến và sự phục vụ trong một hệ thống mạng máy tính. Quá trình
Poisson mô tả một tập hợp các sự đến của các gói số liệu, trong đó khoảng thời gian giữa
hai gói đến liên tiếp là độc lập và được phân bố theo hàm mũ với giá trị trung bình
t  1/  , với  là tốc độ đến trung bình. Xác suất có k gói đến trong khoảng thời gian t là: P et (2-1)
k (t)  (t)k k!

Bài Giảng Đánh Giá Hiệu Năng Mạng Máy Tính - 2008

Tài liệu liên quan:

Tổng Quan Về Công Ty TNHH Công Nghệ Dưỡng Phú và Xưởng TĐN 09

TCVN 11930:2017 Yêu Cầu Cơ Bản Về An Toàn Hệ Thống Thông Tin

Xác định Tính Khả Thi Ý Tưởng Kinh Doanh Chỉ Trong 5 Bước

NHẬT KÝ THỰC TẬP DIGITAL MARKETING - CÔNG TY HMEDIA

Phân rã Use Case Hệ Thống Đặt Món - Đặc Tả Chi Tiết