



















Preview text:
lOMoAR cPSD| 58970315
72 CHAPTER 2 / PERFORMANCE ISSUES
Figure 2.7 SPEC Evaluation Flowchart 1.
Tiếp theo, mỗi kết quả trong số 12 kết quả được chuẩn hóa bằng cách
tính toán tỷ lệ thời gian chạy của thời gian chạy tham chiếu với thời
gian chạy hệ thống. Tỷ lệ được tính như sau: Trefi r i Tsuti (2.9)
trong đó Trefi là thời gian thực hiện của chương trình điểm chuẩn
i trên hệ thống tham chiếu và Tsuti là thời gian thực hiện của
chương trình điểm chuẩn i trên hệ thống được thử nghiệm. Do
đó, tỷ lệ cao hơn đối với máy nhanh hơn. 2.
Cuối cùng, trung bình hình học của 12 tỷ lệ thời gian chạy được tính
toán để tạo ra số liệu tổng thể: 12 rG = a q ri b i = 1/12 lOMoAR cPSD| 58970315 1
Đối với điểm chuẩn số nguyên, có thể tính toán bốn chỉ số riêng biệt: 1.
SPECint2006: Giá trị trung bình hình học của 12 tỷ lệ chuẩn
hóa khi các dấu băng ghế được biên soạn với điều chỉnh đỉnh.
■ SPECint_base2006: Giá trị trung bình hình học của 12 tỷ lệ chuẩn
hóa khi các điểm chuẩn được biên soạn với điều chỉnh cơ sở. 1.
SPECint_rate2006: Giá trị trung bình hình học của 12 tỷ lệ
thông lượng chuẩn hóa khi các điểm chuẩn được biên soạn với điều chỉnh đỉnh.
1. SPECint_rate_base2006: Giá trị trung bình hình học của 12 thông
lượng chuẩn hóa khi các điểm chuẩn được biên soạn với điều chỉnh cơ sở. lOMoAR cPSD| 58970315 2.6 / BENCHMARKS AND SPEC 73
Kết quả cho Sun Blade 1000 được hiển thị trong Bảng 2.7a. Một trong những điểm chuẩn
sốEXAMPLE nguyên SPEC CPU2006 là 464.h264ref. Đây là triển khai tham chiếu của H.264 / 2.9 AVC
(Mã hóa video nâng cao), tiêu chuẩn nén video hiện đại mới nhất. Sun Blade 1000 thực hiện chương
trình này trong thời gian trung bình là 5.259 giây. Việc triển khai tham chiếu yêu cầu 22.130 giây. Tỷ
lệ được tính như sau: 22.130/5.259 = 4.21. Chỉ số tốc độ được tính bằng cách lấy căn thứ mười hai
của tích của các tỷ lệ:
(3.18 * 2.96 * 2.98 * 3.91 * 3.17 * 3.61 * 3.51 * 2.01 *
4.21 * 2.43 * 2.75 * 3.42)1/12 = 3.12
Các chỉ số tỷ lệ có tính đến một hệ thống có nhiều bộ xử lý. Để
kiểm tra một máy, một số bản sao N được chọn thường bằng số lượng
bộ xử lý hoặc số luồng thực thi đồng thời trên hệ thống kiểm tra. Tỷ
lệ của mỗi chương trình kiểm tra riêng lẻ được xác định bằng cách lấy
trung bình của ba lần chạy. Mỗi lần chạy bao gồm N bản sao của
chương trình chạy đồng thời trên hệ thống thử nghiệm. Thời gian thực
thi là thời gian cần thiết để tất cả các bản sao hoàn thành (tức là thời
gian từ khi bản sao đầu tiên bắt đầu cho đến khi bản sao cuối cùng kết
thúc). Chỉ số tỷ lệ cho chương trình đó được tính theo công thức sau: Tref i
ratei = N * Tsuti
Điểm tỷ lệ cho hệ thống được kiểm tra được xác định từ giá trị trung
bình hình học cho mỗi chương trình trong bộ thử nghiệm.
Kết quả cho Sun Blade X6250 được hiển thị trong Bảng 2.7b. Hệ thống này có hai chip xử lý,
vớEXAMPLE i hai lõi trên mỗi chip, với tổng cộng bốn lõi. Để có được chỉ số tốc độ, mỗi chương
trình điểm chuẩn được thực thi đồng thời trên cả bốn lõi, với 2.10 thời gian thực thi là thời gian
từ khi bắt đầu cả bốn bản sao đến khi kết thúc quá trình chạy chậm nhất. Tỷ lệ tốc độ được tính
như trước và giá trị tốc độ chỉ đơn giản là bốn lần tỷ lệ tốc độ. Chỉ số tỷ lệ cuối cùng được tìm
thấy bằng cách lấy giá trị trung bình hình học của các giá trị tỷ lệ:
(78.63 * 62.97 * 60.87 * 77.29 * 65.87 * 83.68 * 76.70 * 134.98 * 106.65 *
40.39 * 48.41 * 65.40)1/12 = 71.59
Bảng 2.7 Một số kết quả CINT2006 SPEC lOMoAR cPSD| 58970315 (a)Sun Blade1000 Chuẩn Thời Thời Thời Thời Tỉ lệ gian
gian thực gian thực gian thực hiện hiện tham hiện (giây) (giây) chiếu (giây) (giây) 400.perlbenc 3077 3076 3080 9770 3.18 h 401.bzip2 3260 3263 3260 9650 2.96 403.gcc 2711 2701 2702 8050 2.98 429.mcf 2356 2331 2301 9120 3.91 445.gobmk 3319 3310 3308 10,490 3.17 456.hmmer 2586 2587 2601 9330 3.61 (Tiếp tục) lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND PROBLEMS 74
Table 2.7 (Continued) Chuẩn Thời Thời Thời Thời Tỉ lệ Suất gian gian gian gian thực thực thực tham hiện hiện hiện chiếu (giây) (giây) (giây) (giây) 400.perlbe 497 497 497 9770 19.66 78.63 nch 401.bzip2 613 614 613 9650 15.74 62.97 403.gcc 529 529 529 8050 15.22 60.87 lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 429.mcf 472 472 473 9120 19.32 77.29 445.gobm 637 637 637 10,490 16.47 65.87 (a) Sun Blade 1000 Chuẩn Thời Thời Thời Thời Tỉ lệ
gian thực gian thực gian thực gian hiện hiện hiện tham (giây) (giây) (giây) chiếu (giây) 458.sjeng 3452 3449 3449 12,100 3.51 462.libquant 10,318 10,319 10,273 20,720 2.01 um 464.h264tha 5246 5290 5259 22,130 4.21 m khảo 471.omnetp 2565 2572 2582 6250 2.43 p 473.ngôi sao 2522 2554 2565 7020 2.75 483.xalcbmk 2014 2018 2018 6900 3.42 1. Sun Blade X6250 k PROBLEMS 75 456.hmme 446 446 446 9330 20.92 83.68 r 458.sjeng 631 632 630 12,100 19.18 76.70 462.libqua 614 614 614 20,720 33.75 134.98 ntum 464.h264t 830 830 830 22,130 26.66 106.65 ham khảo 471.omnet 619 620 619 6250 10.10 40.39 pp lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 473.ngôi 580 580 580 7020 12.10 48.41 sao 483.xalcb 422 422 422 6900 16.35 65.40 mk lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
2.7 các thu t ng chính, đánh giá Câu h i, và D ánậ ữ ỏ ự Key Terms đồng hồ
P ROBLEMSĐịnh luật Little 76 thông lượng tick nhiều lõi tích hợp
chu kỳ mỗi lệnh (CPI) (MIC) Điểm chuẩn đo tính toán đa năng bộ vi xử lý lường cơ sở trung bình chức MIPS tốc trung bình số năng (FM) trên độ đa lõi học (AM) định GPU Chỉ số tỷ luật Amdahl (GPGPU) lệ chỉ số đồng hồ chu kỳ Bộ xử lý đồ họa đỉnh đồng hồ chu kỳ trung bình hình học chỉ số tốc độ thời gian tốc độ (GM) máy tham chiếu đồng hồ tốc độ (GPU) SPEC Hệ thống tốc độ thực hiện đang được kiểm lệnh trung bình hài tra hòa (HM) lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 77 PROBLEMS Câu hỏi ôn tập 1.
Liệt kê và xác định ngắn gọn một số kỹ thuật được sử dụng
trong các bộ xử lý hiện đại để tăng tốc độ. 2.
Giải thích khái niệm cân bằng hiệu suất. 3.
Giải thích sự khác biệt giữa các hệ thống đa lõi, MIC và GPGPU. 4.
Mô tả ngắn gọn định luật Amdahl. 5.
Mô tả ngắn gọn định luật Little. 6.
Định nghĩa MIPS và FLOPS. 7.
Liệt kê và xác định ba phương pháp để tính giá trị trung bình
của một tập hợp các giá trị dữ liệu. 8.
Liệt kê các đặc điểm mong muốn của một chương trình điểm chuẩn. 9. Điểm chuẩn SPEC là gì? 10.
Sự khác biệt giữa chỉ số cơ sở, chỉ số đỉnh, chỉ số tốc độ và chỉ số tỷ lệ là gì? Vấn đề 1.
Một chương trình điểm chuẩn được chạy trên bộ xử lý 40 MHz.
Chương trình được thực hiện bao gồm 100.000 lần thực thi lệnh,
với hỗn hợp lệnh và số chu kỳ đồng hồ sau: Loại hướng Số lượng Chu kỳ mỗi dẫn hướng dẫn hướng dẫn Số học số 45,000 1 nguyên Truyền dữ liệu 32,000 2 Dấu phẩy động 15,000 2 lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND
Chuyển giao LEMS 800078 2 PROB điều khiển
Xác định CPI, tỷ lệ MIPS và thời gian thực hiện hiệu quả cho chương trình này. 2.
Hãy xem xét hai máy khác nhau, với hai bộ lệnh khác nhau, cả
hai đều có tốc độ xung nhịp là 200 MHz. Các phép đo sau đây
được ghi lại trên hai máy chạy một bộ chương trình điểm chuẩn nhất định: Loại hướng dẫn Số lượng Chu kỳ
hướng dẫn mỗi (triệu) hướng dẫn Máy A Số học và logic 8 1 Tải và lưu trữ 4 3 Nhánh 2 4 Khác 4 3 Máy A Số học và logic 10 1 Tải và lưu trữ 8 2 Nhánh 2 4 Khác 4 3
1. Xác định CPI hiệu quả, tỷ lệ MIPS và thời gian thực hiện cho từng máy.
2. Nhận xét về kết quả. PROBLEMS 1.
Các ví dụ ban đầu về thiết kế CISC và RISC lần lượt là VAX
11/780 và IBM RS/6000. Sử dụng một chương trình điểm
chuẩn điển hình, các đặc tính máy móc sau đây: lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 79 Xử lý
Tần số xung Hiệu suất Thời gian nhịp (MIPS) CPU (MHz) (giây ) Máy bay VAX 5 1 12 x 11/780 Máy tính IBM 25 18 x RS / 6000
Cột cuối cùng cho thấy VAX yêu cầu lâu hơn 12 lần so với thời
gian CPU mà IBM đo được. 1.
Kích thước tương đối của số lượng lệnh của mã máy cho
chương trình điểm chuẩn này chạy trên hai máy là bao nhiêu? 2.
Giá trị CPI cho hai máy là gì? 2.
Bốn chương trình điểm chuẩn được thực hiện trên ba máy tính với kết quả sau:
Máy tính Máy tính Máy tính A B C Chương 1 10 20 trình 1 Chương 1000 100 20 trình 2 Chương 500 1000 50 trình 3 Chương 100 800 100 trình 4 lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 80
Bảng cho thấy thời gian thực hiện tính bằng giây, vớiPROBLEMS
100.000.000 lệnh được thực hiện trong mỗi chương trình trong
số bốn chương trình. Tính toán các giá trị MIPS cho mỗi máy
tính cho mỗi chương trình. Sau đó, tính toán trung bình số học
và điều hòa giả sử trọng số bằng nhau cho bốn chương trình và
xếp hạng các máy tính dựa trên trung bình số học và trung bình hài. 3.
Bảng sau, dựa trên dữ liệu được báo cáo trong tài liệu
[HEAT84], cho thấy thời gian thực thi, tính bằng giây, cho năm
chương trình điểm chuẩn khác nhau trên ba máy. Xử lý Chuẩn R M Z E 417 244 134 F 83 70 70 H 66 153 135 Tôi 39,449 35,52 66,00 7 0 K 772 368 369 1.
Tính toán chỉ số tốc độ cho mỗi bộ xử lý cho mỗi điểm chuẩn,
được chuẩn hóa cho máy R. Nghĩa là, các giá trị tỷ lệ cho R
đều là 1.0. Các tỷ lệ khác được tính bằng phương trình (2.5)
với R được coi là hệ tham chiếu. Sau đó tính giá trị trung bình
số học cho từng hệ thống bằng cách sử dụng Phương trình
(2.3). Đây là cách tiếp cận được thực hiện trong [HEAT84]. 2.
Lặp lại phần (a) sử dụng M làm máy tham chiếu. Tính toán
này đã không được thử trong [HEAT84]. 3.
Máy nào chậm nhất dựa trên mỗi tính toán trong số hai phép tính trước đó? lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 81 4.
Lặp lại các phép tính của các phần (a) và (b) bằng cách sử
dụng giá trị trung bình hình học, được xác định trong Phương
trình (2.6). Máy nào chậm nhất dựa trên
hai phép tính?PROBLEMS lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 82 PROBLEMS
1. Để làm rõ kết quả của bài toán trước, chúng ta xem xét một ví dụ đơn giản hơn. Xử lý Chuẩn X Y Z 1 20 10 40 2 40 80 20 1.
Tính giá trị trung bình số học cho mỗi hệ thống bằng cách sử
dụng X làm máy tham chiếu và sau đó sử dụng Y làm máy
tham chiếu. Lập luận rằng về mặt trực giác, ba máy có hiệu
suất gần như tương đương và giá trị trung bình số học cho kết quả sai lầm. 2.
Tính giá trị trung bình hình học cho mỗi hệ thống bằng cách
sử dụng X làm máy tham chiếu và sau đó sử dụng Y làm máy
tham chiếu. Lập luận rằng kết quả thực tế hơn so với giá trị trung bình số học.
2. Hãy xem xét ví dụ trong Phần 2.5 để tính toán CPI trung bình và tỷ
lệ MIPS, dẫn đến kết quả CPI = 2,24 và tỷ lệ MIPS = 178. Bây
giờ giả sử rằng chương trình có thể được thực thi trong tám
nhiệm vụ song song hoặc luồng với số lượng lệnh được thực
hiện trong mỗi nhiệm vụ gần bằng nhau. Thực hiện trên một hệ thống 8 lõi với mỗi
lõi (bộ xử lý) có hiệu suất tương tự như bộ xử lý duy nhất được
sử dụng ban đầu. Sự phối hợp và đồng bộ hóa giữa các bộ phận
bổ sung thêm 25.000 lệnh thực hiện cho mỗi tác vụ. Giả sử hỗn
hợp lệnh giống như trong ví dụ cho mỗi tác vụ, nhưng tăng CPI
cho tham chiếu bộ nhớ với bỏ lỡ bộ nhớ đệm lên 12 chu kỳ do tranh chấp bộ nhớ.
1. Xác định CPI trung bình.
2. Xác định tỷ lệ MIPS tương ứng.
3. Tính toán hệ số tăng tốc. lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 83
4. So sánh hệ số tăng tốc thực tế với hệ số tăng tốc lý
thuyết được xác định bởi định luật Amdhal.PROBLEMS 2.
Bộ xử lý truy cập bộ nhớ chính với thời gian truy cập trung bình
là T2. Một bộ nhớ cache nhỏ hơn được xen kẽ giữa bộ xử lý và
bộ nhớ chính. Bộ nhớ đệm có thời gian truy cập nhanh hơn đáng
kể là T1 6 T2. Bộ nhớ đệm lưu trữ, bất cứ lúc nào, các bản sao
của một số từ bộ nhớ chính và được thiết kế để các từ có nhiều
khả năng được truy cập trong tương lai gần nằm trong bộ nhớ
cache. Giả sử rằng xác suất mà từ tiếp theo được bộ xử lý truy
cập nằm trong bộ nhớ đệm là H, được gọi là tỷ lệ truy cập.
1. Đối với bất kỳ truy cập bộ nhớ đơn lẻ nào, tốc độ lý thuyết
của việc truy cập từ trong bộ nhớ cache thay vì trong bộ nhớ chính là gì?
2. Giả sử T là thời gian truy cập trung bình. Biểu thị T dưới
dạng hàm của T1, T2 và H. Tăng tốc tổng thể như một hàm của H là gì?
3. Trong thực tế, một hệ thống có thể được thiết kế để bộ xử lý
trước tiên phải truy cập vào bộ nhớ đệm để xác định xem từ
có trong bộ nhớ đệm hay không và nếu không, sau đó truy
cập bộ nhớ chính, để khi bỏ lỡ (ngược lại với lần truy cập),
thời gian truy cập bộ nhớ là T1 + T2. Biểu thị T dưới dạng
hàm của T1, T2 và H. Bây giờ tính toán tốc độ và so sánh với
kết quả được tạo ra trong phần (b). 3.
Chủ cửa hàng quan sát thấy trung bình 18 khách hàng mỗi giờ
đến và thường có 8 khách hàng trong cửa hàng. Khoảng thời
gian trung bình mà mỗi khách hàng ở trong cửa hàng là bao nhiêu? 4.
Chúng ta có thể hiểu rõ hơn về định luật Little bằng cách xem
xét Hình 2.8a. Trong khoảng thời gian T, tổng cộng các mặt
hàng C đến một hệ thống, chờ bảo dưỡng và hoàn thành dịch vụ.
Đường liền trên hiển thị trình tự thời gian đến và đường liền phía
dưới hiển thị trình tự thời gian khởi hành. Khu vực bóng mờ
được giới hạn bởi hai đường thể hiện tổng số "công việc" được lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 84
hệ thống thựcPROBLEMS hiện theo đơn vị giây công việc; hãy để A
là tổng công việc. Chúng ta muốn rút ra mối quan hệ giữa L, W và λ. lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW QUESTIONS, AND 85 PROBLEMS
1. Hình 2.8b chia tổng diện tích thành các hình chữ nhật nằm
ngang, mỗi hình chữ nhật có chiều cao của một công việc.
Hình ảnh trượt tất cả các hình chữ nhật này sang trái để các
cạnh trái của chúng thẳng hàng ở t = 0. Phát triển một phương
trình liên quan đến A, C và W.
2. Hình 2.8c chia tổng diện tích thành các hình chữ nhật dọc,
được xác định bởi đường thẳng đứng ranh giới chuyển tiếp
được biểu thị bằng các đường đứt đoạn. Hình ảnh trượt tất cả
các góc hình chữ nhật này xuống để các cạnh dưới của chúng
thẳng hàng ở N (t) = 0. Phát triển một phương trình liên quan
đến A, T và L.
3. Cuối cùng, suy ra L = lW từ kết quả của (a) và (b).
2. Trong Hình 2.8a, các công việc đến vào thời điểm t = 0, 1,
1,5, 3,25, 5,25 và 7,75. Tương ứng
Thời gian hoàn thành là T = 2, 3, 3.5, 4.25, 8.25 và 8.75.
1. Xác định diện tích của mỗi trong số sáu hình chữ nhật trong
Hình 2.8b và tổng để có được
tổng diện tích A. Hiển thị tác phẩm của bạn.
2. Xác định diện tích của mỗi trong số 10 hình chữ nhật trong
Hình 2.8c và tổng để có tổng diện tích A. Hiển thị tác phẩm của bạn.
3. Trong Phần 2.6, chúng tôi đã chỉ định rằng tỷ lệ cơ sở được sử
dụng để so sánh một hệ thống được thử nghiệm với một hệ tham chiếu là: Trefi r i Tsuti
N(t)
N C(t) C MoARc PSD |58970315 al on lO completi s / KEY QUESTIONS, AND TERMS, 0REVIEW0 PROBLEMS 86 Tot 2.7 0 T 0 T t t
2.Được xem dưới dạng hình
1.Đến và hoàn thành công chữ nhật ngang việc
N ( t ) C 0 T t 0
1.Được xem dưới dạng hình chữ nhật dọc
Figure 2.8 Minh họa về Định luật Little lOMoAR cPSD| 58970315
2.7 / KEY TERMS, REVIEW PROBLEMS 87 1.
Phương trình trước cung cấp thước đo tốc độ của hệ thống được thử
nghiệm so với hệ tham chiếu. Giả sử rằng số lượng các phép toán dấu QUESTIONS, AND
phẩy động được thực hiện trong chương trình kiểm tra là Ii. Bây giờ
hiển thị tốc độ như một hàm của tốc độ thực hiện lệnh FLOPSi. 2.
Một kỹ thuật khác để chuẩn hóa hiệu suất là biểu thị hiệu suất của một
hệ thống dưới dạng phần trăm thay đổi so với hiệu suất của một hệ
thống khác. Thể hiện sự thay đổi tương đối này trước tiên dưới dạng
hàm của tốc độ thực hiện lệnh, và sau đó là hàm của thời gian thực hiện.
1. Giả sử rằng một chương trình điểm chuẩn thực thi trong 480 giây
trên máy tham chiếu A. Chương trình tương tự thực hiện trên hệ
thống B, C và D lần lượt trong 360, 540 và 210 giây.
1. Hiển thị tốc độ của từng hệ thống trong số ba hệ thống được thử nghiệm so với A.
2. Bây giờ hãy hiển thị tốc độ tương đối của ba hệ thống. Nhận
xét về ba cách so sánh máy (thời gian thực hiện, tăng tốc, tăng tốc tương đối).
2. Lặp lại vấn đề trước đó bằng cách sử dụng máy D làm máy tham
chiếu. Điều này ảnh hưởng như thế nào đến thứ hạng tương đối của bốn hệ thống?
3. Tính toán lại kết quả trong Bảng 2.2 bằng cách sử dụng dữ liệu
thời gian máy tính của Bảng 2.4 và nhận xét về kết quả.
4. Phương trình 2.5 cho thấy hai công thức khác nhau của giá trị
trung bình hình học, một sử dụng toán tử tích và một sử dụng toán tử tổng.
1. Cho thấy rằng hai công thức là tương đương.
2. Tại sao công thức tổng lại được ưu tiên để tính giá trị trung bình hình học?
5. Dự án. Mục 2.5 liệt kê một số tài liệu tham khảo ghi lại
"điểm chuẩn có nghĩa là chiến tranh". Tất cả các bài báo lOMoAR cPSD| 58970315 QUESTIONS, AND
2.7 / KEY TERMS, REVIEW
tham khảo đều có sẵn tại box.com/COA10e. Đọc các bàiPROBLEMS
88 báo này và tóm tắt trường hợp ủng hộ và chống lại việc sử
dụng giá trị trung bình hình học để tính toán SPEC. 2.1