lOMoARcPSD| 58970315
72 CHAPTER 2 / PERFORMANCE ISSUES
Figure 2.7 SPEC Evaluation Flowchart
1. Tiếp theo, mỗi kết quả trong số 12 kết quả được chuẩn hóa bằng cách
tính toán tỷ lệ thời gian chạy của thời gian chạy tham chiếu với thời
gian chạy hệ thống. Tỷ lệ được tính như sau:
Trefi
r
i Tsuti (2.9)
trong đó Trefi thời gian thực hiện của chương trình điểm chuẩn
i trên hệ thống tham chiếu Tsuti thời gian thực hiện của
chương trình điểm chuẩn i trên hệ thống được thử nghiệm. Do
đó, tỷ lệ cao hơn đối với máy nhanh hơn.
2. Cuối cùng, trung bình hình học của 12 tỷ lệ thời gian chạy được tính
toán để tạo ra số liệu tổng thể:
12 rG = a q ri b
i = 1/12
lOMoARcPSD| 58970315
1
Đối với điểm chuẩn số nguyên, có thể tính toán bốn chỉ số riêng biệt:
1. SPECint2006: Giá trị trung bình hình học của 12 tỷ lệ chuẩn
hóa khi các dấu băng ghế được biên soạn với điều chỉnh đỉnh.
SPECint_base2006: Giá trị trung bình hình học của 12 tỷ lệ chuẩn
hóa khi các điểm chuẩn được biên soạn với điều chỉnh cơ sở.
1. SPECint_rate2006: Giá trị trung bình hình học của 12 tỷ lệ
thông lượng chuẩn hóa khi các điểm chuẩn được biên soạn với
điều chỉnh đỉnh.
1. SPECint_rate_base2006: Giá trị trung bình hình học của 12 thông
lượng chuẩn hóa khi các điểm chuẩn được biên soạn với điều
chỉnh cơ sở.
lOMoARcPSD| 58970315
2.6 / BENCHMARKS AND SPEC
73
Kết quả cho Sun Blade 1000 được hiển thị trong Bảng 2.7a. Một trong những điểm chuẩn
sốEXAMPLE nguyên SPEC CPU2006 là 464.h264ref. Đây là triển khai tham chiếu của H.264 / 2.9 AVC
(Mã hóa video nâng cao), êu chuẩn nén video hiện đại mới nhất. Sun Blade 1000 thực hiện chương
trình này trong thời gian trung bình là 5.259 giây. Việc triển khai tham chiếu yêu cầu 22.130 giây. Tỷ
lệ được nh như sau: 22.130/5.259 = 4.21. Chỉ số tốc độ được nh bằng cách lấy căn thứ ời hai
của ch của các tỷ lệ:
(3.18 * 2.96 * 2.98 * 3.91 * 3.17 * 3.61 * 3.51 * 2.01 *
4.21 * 2.43 * 2.75 * 3.42)
1/12
= 3.12
Các chỉ số tỷ lệ tính đến một hệ thống nhiều bộ xử lý. Để
kiểm tra một máy, một số bản sao N được chọn thường bằng số lượng
bộ xử hoặc số luồng thực thi đồng thời trên hệ thống kiểm tra. Tỷ
lệ của mỗi chương trình kiểm tra riêng lẻ được xác định bằng cách lấy
trung bình của ba lần chạy. Mỗi lần chạy bao gồm N bản sao của
chương trình chạy đồng thời trên hệ thống thử nghiệm. Thời gian thực
thi thời gian cần thiết để tất cả các bản sao hoàn thành (tức thời
gian từ khi bản sao đầu tiên bắt đầu cho đến khi bản sao cuối cùng kết
thúc). Chỉ số tỷ lệ cho chương trình đó được tính theo công thức sau:
Tref
i
rate
i
= N * Tsut
i
Điểm tỷ lệ cho hệ thống được kiểm tra được xác định từ giá trị trung
bình hình học cho mỗi chương trình trong bộ thử nghiệm.
Kết quả cho Sun Blade X6250 được hiển thị trong Bảng 2.7b. Hệ thng này hai chip xử ,
vớEXAMPLE i hai lõi trên mỗi chip, với tổng cộng bốn lõi. Để có được chỉ số tốc độ, mỗi chương
trình điểm chuẩn được thực thi đồng thời trên cả bốn lõi, với 2.10 thời gian thực thi là thời gian
từ khi bắt đầu cả bốn bản sao đến khi kết thúc quá trình chạy chậm nhất. Tlệ tốc độ được nh
như trước và giá trị tốc độ chđơn giản bốn lần tỷ ltốc độ. Chỉ số tỷ lệ cuối cùng được m
thy bằng cách lấy giá trị trung bình hình học của các giá trị tỷ lệ:
(78.63 * 62.97 * 60.87 * 77.29 * 65.87 * 83.68 * 76.70 * 134.98 * 106.65 *
40.39 * 48.41 * 65.40)
1/12
= 71.59
Bảng 2.7 Một số kết quả CINT2006 SPEC
lOMoARcPSD| 58970315
(a)Sun Blade1000
Chuẩn
Thời
gian
thực
hiện
(giây)
Thời
gian thực
hiện
(giây)
Thời
gian thực
hiện
(giây)
Thời
gian
tham
chiếu
(giây)
Tỉ lệ
400.perlbenc
h
3077
3076
3080
9770
3.18
401.bzip2
3260
3263
3260
9650
2.96
403.gcc
2711
2701
2702
8050
2.98
429.mcf
2356
2331
2301
9120
3.91
445.gobmk
3319
3310
3308
10,490
3.17
456.hmmer
2586
2587
2601
9330
3.61
(Tiếp tục)
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
PROBLEMS 74
Table 2.7 (Continued)
Chuẩn
Thời
gian
thực
hiện
(giây)
Thời
gian
thực
hiện
(giây)
Thời
gian
thực
hiện
(giây)
Thời
gian
tham
chiếu
(giây)
Tỉ lệ
Suất
400.perlbe
nch
497
497
497
9770
19.66
78.63
401.bzip2
613
614
613
9650
15.74
62.97
403.gcc
529
529
529
8050
15.22
60.87
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
(a) Sun Blade 1000
Chuẩn
Thời
gian thực
hiện
(giây)
Thời
gian thực
hiện
(giây)
Thời
gian thực
hiện
(giây)
Thời
gian
tham
chiếu
(giây)
Tỉ lệ
458.sjeng
3452
3449
3449
12,100
3.51
462.libquant
um
10,318
10,319
10,273
20,720
2.01
464.h264tha
m khảo
5246
5290
5259
22,130
4.21
471.omnetp
p
2565
2572
2582
6250
2.43
473.ngôi sao
2522
2554
2565
7020
2.75
483.xalcbmk
2014
2018
2018
6900
3.42
1. Sun Blade X6250
k
PROBLEMS
75
456.hmme
r
446
446
446
9330
20.92
83.68
458.sjeng
631
632
630
12,100
19.18
76.70
462.libqua
ntum
614
614
614
20,720
33.75
134.98
464.h264t
ham khảo
830
830
830
22,130
26.66
106.65
471.omnet
pp
619
620
619
6250
10.10
40.39
429.mcf
472
472
473
9120
19.32
77.29
445.gobm
637
637
637
10,490
16.47
65.87
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
473.ngôi
sao
580
580
580
7020
12.10
48.41
483.xalcb
mk
422
422
422
6900
16.35
65.40
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
2.7 các thu t ng chính, đánh giá Câu h i, và D ánậ ữ
Key Terms
đồng hồ
P
tick
chu kỳ mỗi lệnh (CPI)
ROBLEMSĐịnh luật Little 76
nhiều lõi tích hợp
(MIC)
thông lượng
Điểm chuẩn đo
lường cơ sở
trung bình số
học (AM) định
luật Amdahl
đồng hồ chu kỳ
đồng hồ chu kỳ
thời gian tốc độ
đồng hồ tốc độ
tính toán đa năng
trung bình chức
năng (FM) trên
GPU
(GPGPU)
Bộ xử lý đồ họa
trung bình hình học
(GM)
(GPU)
tốc độ thực hiện
lệnh trung bình hài
hòa (HM)
bộ vi xử lý
MIPS tốc
độ đa lõi
Chỉ số tỷ
lệ chỉ số
đỉnh
chỉ số tốc độ
máy tham chiếu
SPEC Hệ thống
đang được kiểm
tra
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 77
PROBLEMS
Câu hỏi ôn tập
1. Liệt xác định ngắn gọn một số kỹ thuật được sử dụng
trong các bộ xử lý hiện đại để tăng tốc độ.
2. Giải thích khái niệm cân bằng hiệu suất.
3. Giải thích sự khác biệt giữa các hệ thống đa lõi, MIC và
GPGPU.
4. Mô tả ngắn gọn định luật Amdahl.
5. Mô tả ngắn gọn định luật Little.
6. Định nghĩa MIPS và FLOPS.
7. Liệt kê và xác định ba phương pháp để tính giá trị trung bình
của một tập hợp các giá trị dữ liệu.
8. Liệt kê các đặc điểm mong muốn của một chương trình điểm
chuẩn.
9. Điểm chuẩn SPEC là gì?
10. Sự khác biệt giữa chỉ số sở, chỉ số đỉnh, chỉ số tốc độ
chỉ số tỷ lệ là gì?
Vấn đề
1. Một chương trình điểm chuẩn được chạy trên bộ xử lý 40 MHz.
Chương trình được thực hiện bao gồm 100.000 lần thực thi lệnh,
với hỗn hợp lệnh và số chu kỳ đồng hồ sau:
Loại hướng
dẫn
Số lượng
hướng dẫn
Chu kỳ mỗi
hướng dẫn
Số học số
nguyên
45,000
1
Truyền dữ liệu
32,000
2
Dấu phẩy động
15,000
2
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
Chuyển giao
PROB
điều khiển
LEMS 800078
2
Xác định CPI, tỷ lệ MIPS thời gian thực hiện hiệu quả cho
chương trình này.
2. Hãy xem xét hai máy khác nhau, với hai bộ lệnh khác nhau, c
hai đều tốc độ xung nhịp 200 MHz. Các phép đo sau đây
được ghi lại trên hai máy chạy một bộ chương trình điểm chuẩn
nhất định:
Loại hướng dẫn
Số lượng
hướng dẫn
(triệu)
Chu kỳ
mỗi
hướng
dẫn
Máy A
Số học và logic
8
1
Tải và lưu trữ
4
3
Nhánh
2
4
Khác
4
3
Máy A
Số học và logic
10
1
Tải và lưu trữ
8
2
Nhánh
2
4
Khác
4
3
1. Xác định CPI hiệu quả, tỷ lMIPS thời gian thực hiện
cho từng máy.
2. Nhận xét về kết quả.
PROBLEMS
1. Các ví dụ ban đầu về thiết kế CISC RISC lần lượt là VAX
11/780 IBM RS/6000. Sử dụng một chương trình điểm
chuẩn điển hình, các đặc tính máy móc sau đây:
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 79
Xử lý
Tần số xung
nhịp
(MHz)
Hiệu suất
(MIPS)
Thời gian
CPU
(giây
)
Máy bay VAX
11/780
5
1
12 x
Máy tính IBM
RS / 6000
25
18
x
Cột cuối cùng cho thấy VAX yêu cầu lâu hơn 12 lần so với thời
gian CPU mà IBM đo được.
1. Kích thước tương đối của số lượng lệnh của mã máy cho
chương trình điểm chuẩn này chạy trên hai máy bao
nhiêu?
2. Giá trị CPI cho hai máy là gì?
2. Bốn chương trình điểm chuẩn được thực hiện trên ba máy tính
với kết quả sau:
Máy tính
A
Máy tính
B
Máy tính
C
Chương
trình 1
1
10
20
Chương
trình 2
1000
100
20
Chương
trình 3
500
1000
50
Chương
trình 4
100
800
100
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
80
Bảng cho thấy thời gian thực hiện tính bằng giây, vớiPROBLEMS
100.000.000 lệnh được thực hiện trong mỗi chương trình trong
số bốn chương trình. Tính toán các giá trị MIPS cho mỗi máy
tính cho mỗi chương trình. Sau đó, tính toán trung bình số học
và điều hòa giả sử trọng số bằng nhau cho bốn chương trình
xếp hạng các máy tính dựa trên trung bình số học và trung bình
hài.
3. Bảng sau, dựa trên dữ liệu được báo cáo trong tài liệu
[HEAT84], cho thấy thời gian thực thi, tính bằng giây, cho năm
chương trình điểm chuẩn khác nhau trên ba máy.
Chuẩn
Xử lý
R
M
Z
E
417
244
134
F
83
70
70
H
66
153
135
Tôi
39,449
35,52
7
66,00
0
K
772
368
369
1. Tính toán chỉ số tốc độ cho mỗi bộ xử cho mỗi điểm chuẩn,
được chuẩn hóa cho máy R. Nghĩa là, các giá trị tlệ cho R
đều 1.0. Các tỷ lệ khác được tính bằng phương trình (2.5)
với R được coi là hệ tham chiếu. Sau đó tính giá trị trung bình
số học cho từng hệ thống bằng cách sử dụng Phương trình
(2.3). Đây là cách tiếp cận được thực hiện trong [HEAT84].
2. Lặp lại phần (a) sử dụng M m máy tham chiếu. Tính toán
này đã không được thử trong [HEAT84].
3. Máy nào chậm nhất dựa trên mỗi tính toán trong số hai phép
tính trước đó?
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 81
4. Lặp lại các phép tính của các phần (a) (b) bằng cách sử
dụng giá trị trung bình hình học, được xác định trong Phương
trình (2.6). Máy nào chậm nhất dựa trên
hai phép tính?PROBLEMS
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
82
PROBLEMS
1. Để làm rõ kết quả của bài toán trước, chúng ta xem xét một ví dụ
đơn giản hơn.
Chuẩn
Xử lý
X
Y
Z
1
20
10
40
2
40
80
20
1. Tính giá trị trung bình số học cho mỗi hệ thống bằng cách sử
dụng X làm máy tham chiếu sau đó sử dụng Y làm máy
tham chiếu. Lập luận rằng về mặt trực giác, ba máy hiệu
suất gần như tương đương giá trị trung bình số học cho kết
quả sai lầm.
2. Tính giá trị trung bình hình học cho mỗi hệ thống bằng cách
sử dụng X làm máy tham chiếu và sau đó sử dụng Y làm máy
tham chiếu. Lập luận rằng kết quả thực tế n so với giá trị
trung bình số học.
2. Hãy xem xét ví dụ trong Phần 2.5 để tính toán CPI trung bình và tỷ
lệ MIPS, dẫn đến kết quả CPI = 2,24 và tỷ lệ MIPS = 178. Bây
giờ giả sử rằng chương trình thể được thực thi trong tám
nhiệm vụ song song hoặc luồng với số lượng lệnh được thực
hiện trong mỗi nhiệm vụ gần bằng nhau. Thực hiện trên một hệ
thống 8 lõi với mỗi
lõi (bộ xử lý) có hiệu suất tương tự như bộ xử lý duy nhất được
sử dụng ban đầu. Sự phối hợp và đồng bộ hóa giữa các bộ phận
bổ sung thêm 25.000 lệnh thực hiện cho mỗi tác vụ. Giả sử hỗn
hợp lệnh giống như trong ví dụ cho mỗi tác vụ, nhưng tăng CPI
cho tham chiếu bộ nhớ với bỏ lỡ bộ nhớ đệm lên 12 chu kỳ do
tranh chấp bộ nhớ.
1. Xác định CPI trung bình.
2. Xác định tỷ lệ MIPS tương ứng.
3. Tính toán hệ số tăng tốc.
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 83
4. So sánh hệ số tăng tốc thực tế với hệ số tăng tốc lý
thuyết được xác định bởi định luật Amdhal.PROBLEMS
2. Bộ xử lý truy cập bộ nhớ chính với thời gian truy cập trung bình
T2. Một bộ nhớ cache nhỏ hơn được xen kẽ giữa bộ xử lý và
bộ nhớ chính. Bộ nhớ đệm có thời gian truy cập nhanh hơn đáng
kể T1 6 T2. Bộ nhớ đệm lưu trữ, bất cứ lúc nào, các bản sao
của một số từ bộ nhớ chính được thiết kế để các từ có nhiều
khả năng được truy cập trong tương lai gần nằm trong bộ nhớ
cache. Giả sử rằng xác suất từ tiếp theo được bộ xử truy
cập nằm trong bộ nhớ đệm là H, được gọi là tỷ lệ truy cập.
1. Đối với bất kỳ truy cập bộ nhớ đơn lẻ nào, tốc độ thuyết
của việc truy cập từ trong bộ nhớ cache thay vì trong bộ nhớ
chính là gì?
2. Giả sử T thời gian truy cập trung bình. Biểu thị T dưới
dạng hàm của T1, T2 H. Tăng tốc tổng thể như một hàm
của H là gì?
3. Trong thực tế, một hệ thống thể được thiết kế để bộ xử lý
trước tiên phải truy cập vào bộ nhớ đệm để xác định xem từ
trong bộ nhớ đệm hay không nếu không, sau đó truy
cập bộ nhớ chính, để khi bỏ lỡ (ngược lại với lần truy cập),
thời gian truy cập bộ nhớ T1 + T2. Biểu thị T dưới dạng
hàm của T1, T2H. Bây giờ tính toán tốc độ và so sánh với
kết quả được tạo ra trong phần (b).
3. Chủ cửa hàng quan sát thấy trung bình 18 khách hàng mỗi giờ
đến thường 8 khách hàng trong cửa hàng. Khoảng thời
gian trung bình mỗi khách hàng trong cửa hàng bao
nhiêu?
4. Chúng ta thể hiểu rõ hơn về định luật Little bằng cách xem
xét Hình 2.8a. Trong khoảng thời gian T, tổng cộng các mặt
hàng C đến một hệ thống, chờ bảo dưỡng hoàn thành dịch vụ.
Đường liền trên hiển thị trình tự thời gian đến đường liền phía
dưới hiển thị trình tự thời gian khởi hành. Khu vực bóng mờ
được giới hạn bởi hai đường thể hiện tổng số "công việc" được
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
84
hệ thống thựcPROBLEMS hiện theo đơn vị giây công việc; hãy để A
là tổng công việc. Chúng ta muốn rút ra mối quan hệ giữa L, W
λ.
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 85
PROBLEMS
1. Hình 2.8b chia tổng diện tích thành các hình chữ nhật nằm
ngang, mỗi hình chữ nhật chiều cao của một công việc.
Hình ảnh trượt tất cả các hình chữ nhật này sang trái để các
cạnh trái của chúng thẳng hàng t = 0. Phát triển một phương
trình liên quan đến A, CW.
2. Hình 2.8c chia tổng diện tích thành các hình chữ nhật dọc,
được xác định bởi đường thẳng đứng ranh giới chuyển tiếp
được biểu thị bằng các đường đứt đoạn. Hình ảnh trượt tất cả
các góc hình chữ nhật này xuống để các cạnh dưới của chúng
thẳng hàng ở N (t) = 0. Phát triển một phương trình liên quan
đến A, T L.
3. Cuối cùng, suy ra L = lW từ kết quả của (a) và (b).
2. Trong Hình 2.8a, các công việc đến vào thời điểm t = 0, 1,
1,5, 3,25, 5,25 và 7,75. Tương ứng
Thời gian hoàn thành là T = 2, 3, 3.5, 4.25, 8.25 và 8.75.
1. Xác định diện tích của mỗi trong số sáu nh chữ nhật trong
Hình 2.8b và tổng để có được
tổng diện tích A. Hiển thị tác phẩm của bạn.
2. Xác định diện tích của mỗi trong số 10 hình chữ nhật trong
Hình 2.8c và tổng để có tổng diện tích A. Hiển thị tác phẩm
của bạn.
3. Trong Phần 2.6, chúng tôi đã chđịnh rằng tlệ sở được sử
dụng để so sánh một hệ thống được thử nghiệm với một hệ tham
chiếu là:
Trefi
r
i
Tsuti
N(t)
N C(t) C
QUESTIONS, AND
0REVIEW0 PROBLEMS 86
0 T 0 T t
t 2.Được xem dưới dạng hình
1.Đến và hoàn thành công chữ nhật ngang việc
0 T t
0
1.Được xem dưới dạng hình chữ nhật dọc
Figure 2.8 Minh họa về Định luật Little
lOMoARcPSD| 58970315
2.7 / KEY TERMS, REVIEW PROBLEMS 87
1. Phương trình trước cung cấp thước đo tốc độ của hệ thống được thử
nghiệm so với hệ tham chiếu. Giả sử rằng số lượng các phép toán dấu
Tot
2.7
al
comple s
/ KEY
on
lO
TERMS,
MoARcPSD|58 970315
N
(
t
)
C
QUESTIONS, AND
phẩy động được thực hiện trong chương trình kiểm tra Ii. Bây giờ
hiển thị tốc độ như một hàm của tốc độ thực hiện lệnh FLOPSi.
2. Một kỹ thuật khác để chuẩn hóa hiệu suất là biểu thị hiệu suất của một
hệ thống dưới dạng phần trăm thay đổi so với hiệu suất của một hệ
thống khác. Thể hiện sự thay đổi tương đối này trước tiên dưới dạng
hàm của tốc độ thực hiện lệnh, sau đó hàm của thời gian thực
hiện.
1. Giả sử rằng một chương trình điểm chuẩn thực thi trong 480 giây
trên máy tham chiếu A. Chương trình tương tự thực hiện trên hệ
thống B, C và D lần lượt trong 360, 540 và 210 giây.
1. Hiển thị tốc độ của từng hệ thống trong số ba hệ thống được
thử nghiệm so với A.
2. Bây giờ hãy hiển thị tốc độ tương đối của ba hệ thống. Nhận
xét về ba cách so sánh máy (thời gian thực hiện, tăng tốc,
tăng tốc tương đối).
2. Lặp lại vấn đề trước đó bằng cách sử dụng máy D làm máy tham
chiếu. Điều này ảnh hưởng như thế nào đến thứ hạng tương đối
của bốn hệ thống?
3. Tính toán lại kết quả trong Bảng 2.2 bằng cách sử dụng dữ liệu
thời gian máy tính của Bảng 2.4 và nhận xét về kết quả.
4. Phương trình 2.5 cho thấy hai công thức khác nhau của giá trị
trung bình hình học, một sử dụng toán tử tích một sử dụng
toán tử tổng.
1. Cho thấy rằng hai công thức là tương đương.
2. Tại sao công thức tổng lại được ưu tiên để nh giá trị trung
bình hình học?
5. Dự án. Mục 2.5 liệt kê một số tài liệu tham khảo ghi lại
"điểm chuẩn có nghĩa là chiến tranh". Tất cả các bài báo
lOMoARcPSD| 58970315
QUESTIONS, AND
2.7 / KEY TERMS, REVIEW
tham khảo đều sẵn tại box.com/COA10e. Đọc các bàiPROBLEMS
88 báo này tóm tắt trường hợp ủng hộ chống lại việc sử
dụng giá trị trung bình hình học để tính toán SPEC.
2.1

Preview text:

lOMoAR cPSD| 58970315
72 CHAPTER 2 / PERFORMANCE ISSUES
Figure 2.7 SPEC Evaluation Flowchart 1.
Tiếp theo, mỗi kết quả trong số 12 kết quả được chuẩn hóa bằng cách
tính toán tỷ lệ thời gian chạy của thời gian chạy tham chiếu với thời
gian chạy hệ thống. Tỷ lệ được tính như sau: Trefi r i Tsuti (2.9)
trong đó Trefi là thời gian thực hiện của chương trình điểm chuẩn
i trên hệ thống tham chiếu và Tsuti là thời gian thực hiện của
chương trình điểm chuẩn i trên hệ thống được thử nghiệm. Do
đó, tỷ lệ cao hơn đối với máy nhanh hơn. 2.
Cuối cùng, trung bình hình học của 12 tỷ lệ thời gian chạy được tính
toán để tạo ra số liệu tổng thể: 12 rG = a q ri b i = 1/12 lOMoAR cPSD| 58970315 1
Đối với điểm chuẩn số nguyên, có thể tính toán bốn chỉ số riêng biệt: 1.
SPECint2006: Giá trị trung bình hình học của 12 tỷ lệ chuẩn
hóa khi các dấu băng ghế được biên soạn với điều chỉnh đỉnh.
SPECint_base2006: Giá trị trung bình hình học của 12 tỷ lệ chuẩn
hóa khi các điểm chuẩn được biên soạn với điều chỉnh cơ sở. 1.
SPECint_rate2006: Giá trị trung bình hình học của 12 tỷ lệ
thông lượng chuẩn hóa khi các điểm chuẩn được biên soạn với điều chỉnh đỉnh.
1. SPECint_rate_base2006: Giá trị trung bình hình học của 12 thông
lượng chuẩn hóa khi các điểm chuẩn được biên soạn với điều chỉnh cơ sở. lOMoAR cPSD| 58970315 2.6 / BENCHMARKS AND SPEC 73
Kết quả cho Sun Blade 1000 được hiển thị trong Bảng 2.7a. Một trong những điểm chuẩn
sốEXAMPLE nguyên SPEC CPU2006 là 464.h264ref. Đây là triển khai tham chiếu của H.264 / 2.9 AVC
(Mã hóa video nâng cao), tiêu chuẩn nén video hiện đại mới nhất. Sun Blade 1000 thực hiện chương
trình này trong thời gian trung bình là 5.259 giây. Việc triển khai tham chiếu yêu cầu 22.130 giây. Tỷ
lệ được tính như sau: 22.130/5.259 = 4.21. Chỉ số tốc độ được tính bằng cách lấy căn thứ mười hai
của tích của các tỷ lệ:
(3.18 * 2.96 * 2.98 * 3.91 * 3.17 * 3.61 * 3.51 * 2.01 *
4.21 * 2.43 * 2.75 * 3.42)1/12 = 3.12
Các chỉ số tỷ lệ có tính đến một hệ thống có nhiều bộ xử lý. Để
kiểm tra một máy, một số bản sao N được chọn thường bằng số lượng
bộ xử lý hoặc số luồng thực thi đồng thời trên hệ thống kiểm tra. Tỷ
lệ của mỗi chương trình kiểm tra riêng lẻ được xác định bằng cách lấy
trung bình của ba lần chạy. Mỗi lần chạy bao gồm N bản sao của
chương trình chạy đồng thời trên hệ thống thử nghiệm. Thời gian thực
thi là thời gian cần thiết để tất cả các bản sao hoàn thành (tức là thời
gian từ khi bản sao đầu tiên bắt đầu cho đến khi bản sao cuối cùng kết
thúc). Chỉ số tỷ lệ cho chương trình đó được tính theo công thức sau: Tref i
ratei = N * Tsuti
Điểm tỷ lệ cho hệ thống được kiểm tra được xác định từ giá trị trung
bình hình học cho mỗi chương trình trong bộ thử nghiệm.
Kết quả cho Sun Blade X6250 được hiển thị trong Bảng 2.7b. Hệ thống này có hai chip xử lý,
vớEXAMPLE i hai lõi trên mỗi chip, với tổng cộng bốn lõi. Để có được chỉ số tốc độ, mỗi chương
trình điểm chuẩn được thực thi đồng thời trên cả bốn lõi, với 2.10 thời gian thực thi là thời gian
từ khi bắt đầu cả bốn bản sao đến khi kết thúc quá trình chạy chậm nhất. Tỷ lệ tốc độ được tính
như trước và giá trị tốc độ chỉ đơn giản là bốn lần tỷ lệ tốc độ. Chỉ số tỷ lệ cuối cùng được tìm
thấy bằng cách lấy giá trị trung bình hình học của các giá trị tỷ lệ:
(78.63 * 62.97 * 60.87 * 77.29 * 65.87 * 83.68 * 76.70 * 134.98 * 106.65 *
40.39 * 48.41 * 65.40)1/12 = 71.59
Bảng 2.7 Một số kết quả CINT2006 SPEC lOMoAR cPSD| 58970315 (a)Sun Blade1000 Chuẩn Thời Thời Thời Thời Tỉ lệ gian
gian thực gian thực gian thực hiện hiện tham hiện (giây) (giây) chiếu (giây) (giây) 400.perlbenc 3077 3076 3080 9770 3.18 h 401.bzip2 3260 3263 3260 9650 2.96 403.gcc 2711 2701 2702 8050 2.98 429.mcf 2356 2331 2301 9120 3.91 445.gobmk 3319 3310 3308 10,490 3.17 456.hmmer 2586 2587 2601 9330 3.61 (Tiếp tục) lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND PROBLEMS 74
Table 2.7 (Continued) Chuẩn Thời Thời Thời Thời Tỉ lệ Suất gian gian gian gian thực thực thực tham hiện hiện hiện chiếu (giây) (giây) (giây) (giây) 400.perlbe 497 497 497 9770 19.66 78.63 nch 401.bzip2 613 614 613 9650 15.74 62.97 403.gcc 529 529 529 8050 15.22 60.87 lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 429.mcf 472 472 473 9120 19.32 77.29 445.gobm 637 637 637 10,490 16.47 65.87 (a) Sun Blade 1000 Chuẩn Thời Thời Thời Thời Tỉ lệ
gian thực gian thực gian thực gian hiện hiện hiện tham (giây) (giây) (giây) chiếu (giây) 458.sjeng 3452 3449 3449 12,100 3.51 462.libquant 10,318 10,319 10,273 20,720 2.01 um 464.h264tha 5246 5290 5259 22,130 4.21 m khảo 471.omnetp 2565 2572 2582 6250 2.43 p 473.ngôi sao 2522 2554 2565 7020 2.75 483.xalcbmk 2014 2018 2018 6900 3.42 1. Sun Blade X6250 k PROBLEMS 75 456.hmme 446 446 446 9330 20.92 83.68 r 458.sjeng 631 632 630 12,100 19.18 76.70 462.libqua 614 614 614 20,720 33.75 134.98 ntum 464.h264t 830 830 830 22,130 26.66 106.65 ham khảo 471.omnet 619 620 619 6250 10.10 40.39 pp lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 473.ngôi 580 580 580 7020 12.10 48.41 sao 483.xalcb 422 422 422 6900 16.35 65.40 mk lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
2.7 các thu t ng chính, đánh giá Câu h i, và D ánậ ữ ỏ ự Key Terms đồng hồ
P ROBLEMSĐịnh luật Little 76 thông lượng tick nhiều lõi tích hợp
chu kỳ mỗi lệnh (CPI) (MIC) Điểm chuẩn đo tính toán đa năng bộ vi xử lý lường cơ sở trung bình chức MIPS tốc trung bình số năng (FM) trên độ đa lõi học (AM) định GPU Chỉ số tỷ luật Amdahl (GPGPU) lệ chỉ số đồng hồ chu kỳ Bộ xử lý đồ họa đỉnh đồng hồ chu kỳ trung bình hình học chỉ số tốc độ thời gian tốc độ (GM) máy tham chiếu đồng hồ tốc độ (GPU) SPEC Hệ thống tốc độ thực hiện đang được kiểm lệnh trung bình hài tra hòa (HM) lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 77 PROBLEMS Câu hỏi ôn tập 1.
Liệt kê và xác định ngắn gọn một số kỹ thuật được sử dụng
trong các bộ xử lý hiện đại để tăng tốc độ. 2.
Giải thích khái niệm cân bằng hiệu suất. 3.
Giải thích sự khác biệt giữa các hệ thống đa lõi, MIC và GPGPU. 4.
Mô tả ngắn gọn định luật Amdahl. 5.
Mô tả ngắn gọn định luật Little. 6.
Định nghĩa MIPS và FLOPS. 7.
Liệt kê và xác định ba phương pháp để tính giá trị trung bình
của một tập hợp các giá trị dữ liệu. 8.
Liệt kê các đặc điểm mong muốn của một chương trình điểm chuẩn. 9. Điểm chuẩn SPEC là gì? 10.
Sự khác biệt giữa chỉ số cơ sở, chỉ số đỉnh, chỉ số tốc độ và chỉ số tỷ lệ là gì? Vấn đề 1.
Một chương trình điểm chuẩn được chạy trên bộ xử lý 40 MHz.
Chương trình được thực hiện bao gồm 100.000 lần thực thi lệnh,
với hỗn hợp lệnh và số chu kỳ đồng hồ sau: Loại hướng Số lượng Chu kỳ mỗi dẫn hướng dẫn hướng dẫn Số học số 45,000 1 nguyên Truyền dữ liệu 32,000 2 Dấu phẩy động 15,000 2 lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
Chuyển giao LEMS 800078 2 PROB điều khiển
Xác định CPI, tỷ lệ MIPS và thời gian thực hiện hiệu quả cho chương trình này. 2.
Hãy xem xét hai máy khác nhau, với hai bộ lệnh khác nhau, cả
hai đều có tốc độ xung nhịp là 200 MHz. Các phép đo sau đây
được ghi lại trên hai máy chạy một bộ chương trình điểm chuẩn nhất định: Loại hướng dẫn Số lượng Chu kỳ
hướng dẫn mỗi (triệu) hướng dẫn Máy A Số học và logic 8 1 Tải và lưu trữ 4 3 Nhánh 2 4 Khác 4 3 Máy A Số học và logic 10 1 Tải và lưu trữ 8 2 Nhánh 2 4 Khác 4 3
1. Xác định CPI hiệu quả, tỷ lệ MIPS và thời gian thực hiện cho từng máy.
2. Nhận xét về kết quả. PROBLEMS 1.
Các ví dụ ban đầu về thiết kế CISC và RISC lần lượt là VAX
11/780 và IBM RS/6000. Sử dụng một chương trình điểm
chuẩn điển hình, các đặc tính máy móc sau đây: lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 79 Xử lý
Tần số xung Hiệu suất Thời gian nhịp (MIPS) CPU (MHz) (giây ) Máy bay VAX 5 1 12 x 11/780 Máy tính IBM 25 18 x RS / 6000
Cột cuối cùng cho thấy VAX yêu cầu lâu hơn 12 lần so với thời
gian CPU mà IBM đo được. 1.
Kích thước tương đối của số lượng lệnh của mã máy cho
chương trình điểm chuẩn này chạy trên hai máy là bao nhiêu? 2.
Giá trị CPI cho hai máy là gì? 2.
Bốn chương trình điểm chuẩn được thực hiện trên ba máy tính với kết quả sau:
Máy tính Máy tính Máy tính A B C Chương 1 10 20 trình 1 Chương 1000 100 20 trình 2 Chương 500 1000 50 trình 3 Chương 100 800 100 trình 4 lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 80
Bảng cho thấy thời gian thực hiện tính bằng giây, vớiPROBLEMS
100.000.000 lệnh được thực hiện trong mỗi chương trình trong
số bốn chương trình. Tính toán các giá trị MIPS cho mỗi máy
tính cho mỗi chương trình. Sau đó, tính toán trung bình số học
và điều hòa giả sử trọng số bằng nhau cho bốn chương trình và
xếp hạng các máy tính dựa trên trung bình số học và trung bình hài. 3.
Bảng sau, dựa trên dữ liệu được báo cáo trong tài liệu
[HEAT84], cho thấy thời gian thực thi, tính bằng giây, cho năm
chương trình điểm chuẩn khác nhau trên ba máy. Xử lý Chuẩn R M Z E 417 244 134 F 83 70 70 H 66 153 135 Tôi 39,449 35,52 66,00 7 0 K 772 368 369 1.
Tính toán chỉ số tốc độ cho mỗi bộ xử lý cho mỗi điểm chuẩn,
được chuẩn hóa cho máy R. Nghĩa là, các giá trị tỷ lệ cho R
đều là 1.0. Các tỷ lệ khác được tính bằng phương trình (2.5)
với R được coi là hệ tham chiếu. Sau đó tính giá trị trung bình
số học cho từng hệ thống bằng cách sử dụng Phương trình
(2.3). Đây là cách tiếp cận được thực hiện trong [HEAT84]. 2.
Lặp lại phần (a) sử dụng M làm máy tham chiếu. Tính toán
này đã không được thử trong [HEAT84]. 3.
Máy nào chậm nhất dựa trên mỗi tính toán trong số hai phép tính trước đó? lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 81 4.
Lặp lại các phép tính của các phần (a) và (b) bằng cách sử
dụng giá trị trung bình hình học, được xác định trong Phương
trình (2.6). Máy nào chậm nhất dựa trên
hai phép tính?PROBLEMS lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 82 PROBLEMS
1. Để làm rõ kết quả của bài toán trước, chúng ta xem xét một ví dụ đơn giản hơn. Xử lý Chuẩn X Y Z 1 20 10 40 2 40 80 20 1.
Tính giá trị trung bình số học cho mỗi hệ thống bằng cách sử
dụng X làm máy tham chiếu và sau đó sử dụng Y làm máy
tham chiếu. Lập luận rằng về mặt trực giác, ba máy có hiệu
suất gần như tương đương và giá trị trung bình số học cho kết quả sai lầm. 2.
Tính giá trị trung bình hình học cho mỗi hệ thống bằng cách
sử dụng X làm máy tham chiếu và sau đó sử dụng Y làm máy
tham chiếu. Lập luận rằng kết quả thực tế hơn so với giá trị trung bình số học.
2. Hãy xem xét ví dụ trong Phần 2.5 để tính toán CPI trung bình và tỷ
lệ MIPS, dẫn đến kết quả CPI = 2,24 và tỷ lệ MIPS = 178. Bây
giờ giả sử rằng chương trình có thể được thực thi trong tám
nhiệm vụ song song hoặc luồng với số lượng lệnh được thực
hiện trong mỗi nhiệm vụ gần bằng nhau. Thực hiện trên một hệ thống 8 lõi với mỗi
lõi (bộ xử lý) có hiệu suất tương tự như bộ xử lý duy nhất được
sử dụng ban đầu. Sự phối hợp và đồng bộ hóa giữa các bộ phận
bổ sung thêm 25.000 lệnh thực hiện cho mỗi tác vụ. Giả sử hỗn
hợp lệnh giống như trong ví dụ cho mỗi tác vụ, nhưng tăng CPI
cho tham chiếu bộ nhớ với bỏ lỡ bộ nhớ đệm lên 12 chu kỳ do tranh chấp bộ nhớ.
1. Xác định CPI trung bình.
2. Xác định tỷ lệ MIPS tương ứng.
3. Tính toán hệ số tăng tốc. lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 83
4. So sánh hệ số tăng tốc thực tế với hệ số tăng tốc lý
thuyết được xác định bởi định luật Amdhal.PROBLEMS 2.
Bộ xử lý truy cập bộ nhớ chính với thời gian truy cập trung bình
T2. Một bộ nhớ cache nhỏ hơn được xen kẽ giữa bộ xử lý và
bộ nhớ chính. Bộ nhớ đệm có thời gian truy cập nhanh hơn đáng
kể là T1 6 T2. Bộ nhớ đệm lưu trữ, bất cứ lúc nào, các bản sao
của một số từ bộ nhớ chính và được thiết kế để các từ có nhiều
khả năng được truy cập trong tương lai gần nằm trong bộ nhớ
cache. Giả sử rằng xác suất mà từ tiếp theo được bộ xử lý truy
cập nằm trong bộ nhớ đệm là H, được gọi là tỷ lệ truy cập.
1. Đối với bất kỳ truy cập bộ nhớ đơn lẻ nào, tốc độ lý thuyết
của việc truy cập từ trong bộ nhớ cache thay vì trong bộ nhớ chính là gì?
2. Giả sử T là thời gian truy cập trung bình. Biểu thị T dưới
dạng hàm của T1, T2H. Tăng tốc tổng thể như một hàm của H là gì?
3. Trong thực tế, một hệ thống có thể được thiết kế để bộ xử lý
trước tiên phải truy cập vào bộ nhớ đệm để xác định xem từ
có trong bộ nhớ đệm hay không và nếu không, sau đó truy
cập bộ nhớ chính, để khi bỏ lỡ (ngược lại với lần truy cập),
thời gian truy cập bộ nhớ là T1 + T2. Biểu thị T dưới dạng
hàm của T1, T2H. Bây giờ tính toán tốc độ và so sánh với
kết quả được tạo ra trong phần (b). 3.
Chủ cửa hàng quan sát thấy trung bình 18 khách hàng mỗi giờ
đến và thường có 8 khách hàng trong cửa hàng. Khoảng thời
gian trung bình mà mỗi khách hàng ở trong cửa hàng là bao nhiêu? 4.
Chúng ta có thể hiểu rõ hơn về định luật Little bằng cách xem
xét Hình 2.8a. Trong khoảng thời gian T, tổng cộng các mặt
hàng C đến một hệ thống, chờ bảo dưỡng và hoàn thành dịch vụ.
Đường liền trên hiển thị trình tự thời gian đến và đường liền phía
dưới hiển thị trình tự thời gian khởi hành. Khu vực bóng mờ
được giới hạn bởi hai đường thể hiện tổng số "công việc" được lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 84
hệ thống thựcPROBLEMS hiện theo đơn vị giây công việc; hãy để A
là tổng công việc. Chúng ta muốn rút ra mối quan hệ giữa L, W và λ. lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 85 PROBLEMS
1. Hình 2.8b chia tổng diện tích thành các hình chữ nhật nằm
ngang, mỗi hình chữ nhật có chiều cao của một công việc.
Hình ảnh trượt tất cả các hình chữ nhật này sang trái để các
cạnh trái của chúng thẳng hàng ở t = 0. Phát triển một phương
trình liên quan đến A, CW.
2. Hình 2.8c chia tổng diện tích thành các hình chữ nhật dọc,
được xác định bởi đường thẳng đứng ranh giới chuyển tiếp
được biểu thị bằng các đường đứt đoạn. Hình ảnh trượt tất cả
các góc hình chữ nhật này xuống để các cạnh dưới của chúng
thẳng hàng ở N (t) = 0. Phát triển một phương trình liên quan
đến A, T L.
3. Cuối cùng, suy ra L = lW từ kết quả của (a) và (b).
2. Trong Hình 2.8a, các công việc đến vào thời điểm t = 0, 1,
1,5, 3,25, 5,25 và 7,75. Tương ứng
Thời gian hoàn thành là T = 2, 3, 3.5, 4.25, 8.25 và 8.75.
1. Xác định diện tích của mỗi trong số sáu hình chữ nhật trong
Hình 2.8b và tổng để có được
tổng diện tích A. Hiển thị tác phẩm của bạn.
2. Xác định diện tích của mỗi trong số 10 hình chữ nhật trong
Hình 2.8c và tổng để có tổng diện tích A. Hiển thị tác phẩm của bạn.
3. Trong Phần 2.6, chúng tôi đã chỉ định rằng tỷ lệ cơ sở được sử
dụng để so sánh một hệ thống được thử nghiệm với một hệ tham chiếu là: Trefi r i Tsuti
N(t)
N C(t) C MoARc PSD |58970315 al on lO completi s / KEY QUESTIONS, AND TERMS, 0REVIEW0 PROBLEMS 86 Tot 2.7 0 T 0 T t t
2.Được xem dưới dạng hình
1.Đến và hoàn thành công chữ nhật ngang việc
N ( t ) C 0 T t 0
1.Được xem dưới dạng hình chữ nhật dọc
Figure 2.8 Minh họa về Định luật Little lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW PROBLEMS 87 1.
Phương trình trước cung cấp thước đo tốc độ của hệ thống được thử
nghiệm so với hệ tham chiếu. Giả sử rằng số lượng các phép toán dấu QUESTIONS, AND
phẩy động được thực hiện trong chương trình kiểm tra là Ii. Bây giờ
hiển thị tốc độ như một hàm của tốc độ thực hiện lệnh FLOPSi. 2.
Một kỹ thuật khác để chuẩn hóa hiệu suất là biểu thị hiệu suất của một
hệ thống dưới dạng phần trăm thay đổi so với hiệu suất của một hệ
thống khác. Thể hiện sự thay đổi tương đối này trước tiên dưới dạng
hàm của tốc độ thực hiện lệnh, và sau đó là hàm của thời gian thực hiện.
1. Giả sử rằng một chương trình điểm chuẩn thực thi trong 480 giây
trên máy tham chiếu A. Chương trình tương tự thực hiện trên hệ
thống B, C và D lần lượt trong 360, 540 và 210 giây.
1. Hiển thị tốc độ của từng hệ thống trong số ba hệ thống được thử nghiệm so với A.
2. Bây giờ hãy hiển thị tốc độ tương đối của ba hệ thống. Nhận
xét về ba cách so sánh máy (thời gian thực hiện, tăng tốc, tăng tốc tương đối).
2. Lặp lại vấn đề trước đó bằng cách sử dụng máy D làm máy tham
chiếu. Điều này ảnh hưởng như thế nào đến thứ hạng tương đối của bốn hệ thống?
3. Tính toán lại kết quả trong Bảng 2.2 bằng cách sử dụng dữ liệu
thời gian máy tính của Bảng 2.4 và nhận xét về kết quả.
4. Phương trình 2.5 cho thấy hai công thức khác nhau của giá trị
trung bình hình học, một sử dụng toán tử tích và một sử dụng toán tử tổng.
1. Cho thấy rằng hai công thức là tương đương.
2. Tại sao công thức tổng lại được ưu tiên để tính giá trị trung bình hình học?
5. Dự án. Mục 2.5 liệt kê một số tài liệu tham khảo ghi lại
"điểm chuẩn có nghĩa là chiến tranh". Tất cả các bài báo lOMoAR cPSD| 58970315 QUESTIONS, AND
2.7 / KEY TERMS, REVIEW
tham khảo đều có sẵn tại box.com/COA10e. Đọc các bàiPROBLEMS
88 báo này và tóm tắt trường hợp ủng hộ và chống lại việc sử
dụng giá trị trung bình hình học để tính toán SPEC. 2.1