



















Preview text:
lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng Chương 2
CÁC SƠ ĐỒ XỬ LÝ TÍN HIỆU ĐA PHƯƠNG TIỆN VÀ DỊCH VỤ
TRONG CÁC HỆ THÔNG THÔNG TIN DI ĐỘNG
2.1. GIỚI THIỆU CHUNG
2.1.1. Các chủ ề ược trình bầy trong chương
• Xử lý ảnh và tiếng nói, âm thanh cho các HTTTDĐ (hệ thống thông tin di ộng)
• Các CODEC tiếng ược sử dụng trong các HTTTDĐ
• Sơ ồ xử lý tín hiệu a phương tiện trong các HTTTDĐ
• Các phương pháp cung cấp dịch vụ thông tin di ộng Các phương pháp phân bố
dịch vụ IP a phương tiện, Truyền bản tin a phương tiện (MMS) .
2.1.2. Hướng dẫn
Học kỹ các tư liệu ựơc trình bầy trong chương Tham khảo thêm [5],[6].
2.1.3. Mục ích chương
• Hiểu ược các công nghệ xử lý ảnh, tiếng và âm thanh trong thông tin di ộng
• Hiểu ược các công nghệ tạo lập và phân bố nội dung trong các hệ thống thông tin di ộng
• Hiểu ược các sơ ồ cung cấp dịch vụ IP a phương tiện trong thông tin di ộng 2.2. MỞ ĐẦU
Các hệ thống thông tin di ộng thế hệ sau cho phép truyền dẫn số liệu tốc ộ cao ặt nền tảng
cho thông tin a phương tiện trong các môi trường di ộng. Để xử lý a phương tiện phù hợp
với thông tin di ộng cần xét ến các ặc tính và hạn chế của truy nhập vô tuyến.
Trong chương này trước hết ta xét công nghệ cơ sở xử lý tín hiệu ể thực hiện thông tin a
phương tiện. Phần ầu bao gồm mô tả công nghệ, các ặc tính và khuynh hướng phương pháp
mã hoá ảnh của nhóm chuyên gia hình ảnh ộng (MPEG-4: Moving Picture Experts Group-
4), mã hoá tiếng a tốc ộ thích ứng (AMR: Adaptive MultiRate) và 3G-324. MPEG-4 ược
coi như là công nghệ then chốt ối với các hệ thống thông tin di ộng thế hệ sau ược phát
triển ể sử dụng trong thông tin di ộng và ược tiêu chuẩn hoá trên cơ sở các phương pháp
mã hoá hiện có khác nhau. AMR có chất lượng cao ược thiết kế ể sử dụng cho các iều kiện
khác nhau như trong nhà và di ộng. 3G-324M ược 3GPP tiếp nhận như là một công nghệ
của hệ thống ầu cuối ể thực hiện các dịch vụ nghe nhìn. lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng 2.3. XỬ LÝ ẢNH
Phương pháp mã hoá ảnh MPEG-4 ược sử dụng trong các dịch vụ 3G khác nhau như iện
thoại có hình và phân phối truyền hình. MPEG-4 ược xây dựng trên quan iểm kết hợp các
công nghệ mã hoá ảnh hiện có. Phần này sẽ giải thích các công nghệ phần tử và các ặc
trưng khác nhau cuả các phương pháp mã hoá ảnh ược phát triển trước MPEG-4.
2.3.1. Các công nghệ thành phần của mã hoá ảnh
Thông thường tín hiệu ảnh chứa khoảng 100Mbps thông tin. Để xử lý các tín hiệu ảnh, các
phương pháp mã hoá ảnh hiệu suất khác nhau ã ược nghiên cứu trên cơ sở sử dụng các ặc
tính có lợi của hình ảnh. Các công nghệ thành phần của các phương pháp này bao gồm dự
oán chuyển ộng giữa các khung, biến ổi Cosin rời rạc (DCT: Discrete Cosin Transform) và
mã hoá ộ dài khả biến.
Dự oán nén chuyển ộng giữa các khung
Dự oán nén chuyển ộng giữa các khung là một kỹ thuật sử dụng ể xác ịnh tần suất
và phương mà một bộ phận ặc thù của ảnh có thể di chuyển trên cơ sở tham khảo các ảnh
trước và sau ó thay cho việc phải mã hoá từng ảnh (hình 2.1). Phương và ại lượng chuyển
ộng (vectơ chuyển ộng) thay ổi phụ thuộc vào khối của từng khung. Vì thế một khung ược
chia thành khối có kích thước 16x16 pixel ( ược gọi là khối vĩ mô) ể nhận ược vectơ chuyển
ộng cho từng khối. Sự khác nhau giữa các khối vĩ mô của khung xét và khung trước ược
gọi là sai số dự dáo. DCT ược xét dứơi ây áp dụng cho sai số này.
Hình 2.1. Ý tưởng cơ bản của dự oán nén chuyển ộng giữa các khung DCT
Mỗi khung trong video ược biểu diễn bằng tổng các trọng lượng của tập hợp các
phần tử ảnh từ ơn giản (các phần tử tần số thấp) ến các phức tạp (các phần tử tần số cao) (hình 2.2). lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng a a a a a a
Hình 2.2. Khái niệm phân chia màn hình thành các phần tử tần số
Ta biết rằng thông tin chủ yếu tập trung ở miền tần số thấp và miền này óng vai trò rất
quan trọng. Mục ích của DCT là chỉ lấy ra các phần tử tần số quan trọng ể thực hiện nén
hình. Phương pháp này ược tiếp nhận rộng rãi vì chuyển ổi vào miền tần số không gian
cho phép truyền dẫn hiệu quả hơn.
Trong thực tế DCT ược áp dụng cho từng khối của khung với kích thước của mỗi khối là
8x8 pixel. Trên hình 2.2. "ai" ký hiệu cho hệ số DCT. Hệ số này lại ược lượng tử hoá tiếp
và làm tròn ến mức lượng tử và sau ó áp dụng mã hoá ộ dài khả biến.
Mã hoá ộ dài khả biến
Mã hoá ộ dài khả biến ược sử dụng ể nén thông tin dựa trên cơ sở tính chất không
giống nhau cuả các tín hiệu ầu vào. Phương pháp này gán các mã ngắn cho các giá trị tín
hiệu thường xẩy ra và mã dài cho các giá trị tín hiệu ít xẩy ra.
Như ã nói ở phần trước, nhiều hệ số của các thành phần tần số cao bằng không trong quá
trình làm tròn ến mức lượng tử thể hiện nó. Vì thế có rất nhiều trường hợp trong ó "tất cả
các giá trị tiếp theo bằng không (EOB: End of Block= kết thúc khối)" hay " giá trị L i sau
một số các giá trị không". Cũng có thể nén thông tin bằng cách gán mã ngắn cho các tổ
hợp thường xẩy ra của các số không ( oạn chạy không) và giá trị L (mức). Các phương
pháp ược giải thích ở trên là các sơ ồ gán một mã cho một tổ hợp hai giá trị. Phương pháp
này ược gọi là mã hoá ộ dài khả biến hai kích thứơc.
2.3.2. Các lĩnh vực áp dụng cho các phương pháp mã hoá video khác nhau
Các phương pháp mã hoá video ược tiêu chuẩn hoá quốc tế bao gồm H.261, lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
MPEG-1, MPEG-2, H263 và MPEG-4. Hình 2.3 cho thấy các lĩnh vực có thể áp dụng ược
của từng sơ ồ. Các phần tiếp theo sẽ trình bầy cách thức mà các phương pháp này sử dụng
các công nghệ thành phần nói trên ể cải thiện hiệu suất nén và sự khác biệt về mặt chức
năng cuả các phương pháp này.
Hình 2.3. Quan hệ giữa mã hoá video MPEG-4 và các tiêu chuẩn khác. Mã hoá video H.261
Phương pháp này là một tiêu chuẩn toàn cầu ầu tiên cho mã hoá video, ược thiết kế ể sử
dụng trong iện thoại có hình và hội nghị video ISDN, ược ITU-T tiêu chuẩn hoá vào năm
1990. Nội dung cuả phương pháp này như sau:
1. Dự oán vectơ chuyển ộng của khối vĩ mô gồm 16x16 pixel theo ơn vị pixel ể thực
hiện dự oán nén chuyển ộng giữa các khung.
2. Áp dụng DCT cho sai lỗi dự oán so với khung trước với kích thứơc 8x8pixel. Đối với
các vùng chuyển ộng nhanh vượi quá một ại lượng sai lỗi dự oán nhất ịnh, không thực
hiện dự oán nén chuyển ộng giữa các khung. Thay vào ó 8x8 pixel DCT ược áp dụng
trong khung ể tăng hiệu suất mã hoá.
3. Thực hiện mã hoá ộ dài khả biến cho vectơ chuyển ộng nhận ược từ nén chuyển ộng
giưã các khung và kết quả xử lý DCT. Mã hoá ộ dài khả biến hai kích thước ược sử
dụng cho kết quả xử lý DCT.
H.261 giả thiết rằng sử dụng camera TV và monitor thông thường. Khuôn dạng tín
hiệu TV (số các khung và số các dòng quét) tuy nhiên thay ổi phụ thuộc vào các vùng khác lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
nhau trên thế giới. Để phù hợp với thông tin quốc tế, các khuôn dạng này phải biến ổi vào
một khuôn dạng chung trung gian. Khuôn dạng này ược gọi là khuôn dạng trung gian chung
(CIF: Common Intermediate Format) ược xác ịnh như sau: 352 (ngang) nhân 288 ( ứng)
pixel, cực ại 30 khung trong một giây và không an xen. CIF một phần tư (QCIF: Quater
CIF) có kích thước bằng 1/4 kích thước CIF cũng ã ược ịnh nghĩa tại cùng thời iểm và ược
sử dụng cho các ứng dụng mã hoá video.
Mã hoá video MPEG-1/MPEG-2
MPEG-1 ược tiêu chuẩn hoá bởi ISO/IEC (International Organization for
Standardization/ International Electrotechnical Commission) vào năm 1993 ể sử dụng cho
các phương tiện lưu giữ như CD-ROM. Phương pháp mã hoá này ược thiết kế ể xử lý số
liệu hình ảnh vào khỏang 1,5Mbps. Vì ây là sơ ồ mã hoá cho các phương tiện lưu giữ, nên
các yêu cầu xử lý thời gian thực không ược coi trọng như H.261, nên nó tăng thêm khả
năng tiếp nhận các công nghệ mới òi hỏi các khả năng như tìm kiếm ngẫu nhiên. Trong
khi căn bản vẫn sử dụng cùng các công nghệ thành phần tử như H.261, MPEG-1 ược bổ
sung thêm các khả năng sau:
1. Định kỳ chèn thêm ảnh trong cùng một khung ể phát lại bằng truy nhập ngẫu nhiên 2.
Nếu H.261 chỉ dự oán vectơ chuyển ộng từ ảnh quá khứ ể dự oán nén chuyển ộng giữa các
khung ( ược gọi là dự oán thuận), thì MPEG-1 còn cho phép dự oán từ hình ảnh tương
lai ( ược gọi là dự oán ngược) trên cơ sở các ặc tính cuả phương tiện lưu giữ. Ngoài ra
MPEG-1 ước tính dự oán thuận, dự oán ngược và lấy trung bình dự oán ngược và dự oán
thuận và sau ó chọn một dự oán có sai số dự oán nhỏ nhất trong số ba giá trị này ể cải thiện tỷ lệ nén.
3. Trong khi H.261 dự oán vectơ chuyển ộng theo ơn vị 1 pixel, thì MPEG-1 ưa ra dự oán
theo dơn vị 0,5 pixel. Để ạt ược iều này nó tạo ra một ảnh nội suy bằng cách lấy trung
bình các pixel lân cận ể tăng cường tỷ lệ nén.
Với ba khả năng bổ sung, MPEG-1 ược sử dụng rộng rãi như một bộ mã hoá video và
phát lại cho các máy tính cá nhân.
MPEG-2 là một phương pháp mã hoá video ược phát triển có xét ến các yêu cầu cho viễn
thông, quảng bá và lưu giữ. MPEG-2 ược ISO/IEC tiêu chuẩn hoá vào năm 1996 và có
cùng văn bản với ITUT H.262. MPEG-2 là sơ ồ mã hoá cho video từ 3 ến 20Mbps ược sử
dụng rộng rãi cho TV quảng bá, truyền hình ộ phân giải cao (HDTV) và ĩa số a năng số
(DVD: Digital Versatile Disk). MPEG-2 thừa hưởng các công nghệ thành phần của MPEG-
1 và có các tính năng sau:
1. Khả năng mã hoá hiệu qủa các ảnh an xen trong các tín hiệu TV thông thường.
2. Chức năng iều chỉnh kích thước màn hình và chất lượng ( ược gọi là khả năng ịnh cỡ
không gian và ịnh cỡ SNR) khi yêu cầu bằng cách chỉ thu nhận phần số liệu ược mã hoá. lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
Vì các khả năng ược bổ sung cho các sử dụng khác nhau, nên cần ặc biệt lưu ý ể ảm
bảo tính tương thích của số liệu ược mã hoá. Để ảm bảo vấn ề này, MPEG-2 ã ưa ra các
khái niệm mới như "hồ sơ" và "mức" ể phân loại sự khác nhau cuả các khả năng và ộ phức
tạp xử lý. Các khái niệm này cũng ược sử dụng trong MPEG-4. Mã hoá video H.263
Đây là phương pháp mã hoá video tốc ộ cực thấp cho iện thoại có hình trên các mạng
tương tự do ITU-T tiêu chuẩn váo năm 1992. Phương pháp này sử dụng modem 28,8 kbps
và tiếp nhận một phần các công nghệ mới ược phát triển cho MPEG-1. Dự oán nén chuyển
ộng giữa các khung theo ơn vị 0,5pixel là chức năng cơ sở bắt buộc. Một chức năng cơ sở
khác là mã hoá ba kích thước gồm cả EOB cho phép mở rộng mã hoá ộ dài khả biến hai
kích thước thông thường ( oạn chạy và mức).Ngoài ra, dự oán nén chuyển ộng giưã các
khung theo ơn vị các khối 8x8 pixel và xử lý giảm méo khối trong các ảnh ược bổ sung
thêm như là các tuỳ chọn.
Với các chức năng bổ sung này, H.263 hiện nay ược sử dụng trong một số thiết bị cho iện
thoại có hình và hội nghị truyền hình ISDN.
2.3.3. Mã hoá video MPEG-4
Mã hoá video MPEG-4 ược phát triển trên cở sở rất nhiều cải thiện cho mã hoá H.263 bao
gồm cả tăng cường chống lỗi. Phương pháp mã hoá này tương thích ngược với chức năng cơ sở của H263.
Nếu MPEG-2 ược thiết kế chủ yếu ể xử lý ảnh trên máy tính, phát quảng bá số và
thông tin tốc ộ cao, thì ngoài các dịch vụ này, MPEG-4 ược tiêu chuẩn với tập trung chủ
yếu lên các ứng dụng viễn thông, nhất là thông tin di ộng. Năm 1999, MPEG-4 thiết lập
một phương pháp mã hoá video rất tổng quát như là tiêu chuẩn ISO/IEC. Vì thế MPEG-4
ược công nhận như là một công nghệ then chốt cho các dịch vụ a phương tiện trên cơ sở
hình ảnh bao gồm thư video, phân phối video và iện thoại có hình trong 3G (hình 2.4). lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng Th«ng tin * TV di fiØng
* Ph'n phŁi th«ng tin di fiØng MPEG-4 * Th› video
Hình 2.4. Phạm vi ứng dụng của MPEG-4. Hồ sơ và mức
Để ảm báo tính trao ổi và tương tác của số liệu sau mã hoá, các chức năng cuả MPEG-4
ược phân loại theo hồ sơ, còn mức ộ phức tạp ược phân lọai theo mức giống như ở MPEG-
2. Các hồ sơ ược ịnh nghĩa gồm: ơn giản, lõi, chính và khả ịnh cỡ ơn giản, trong ó hồ sơ
ơn giản ịnh nghĩa các chức năng chung. Dự oán nén di ộng giữa các khung bằng 8x8pixel
( ược ịnh nghĩa như là tuỳ chọn trong H.263) ược coi như là hồ sơ ơn giản.
Với hồ sơ ơn giản, các ảnh QCIF ược xử lý theo mức 0 và 1 và CIF ược xử lý theo mức 2.
Các hồ sơ lõi và chính ịnh nghĩa một vùng bất kỳ trong video như là một ' ối tượng" ể cải
thiện chất lượng ảnh hoặc kết hợp ối tượng này và số liệu ược mã hoá khác. MPEG-4 cũng
cung cấp các hồ sơ khác, chẳng hạn các hồ sơ ược soạn thảo bằng các ảnh do máy tính tạo ra ( CG: Computer Generated).
2.3.4. Các tiêu chuẩn cho 3G
Tiêu chuẩn iện thoại có hình 3GPP 3G-324M òi hỏi chức năng cơ sở H.263 như là sơ ồ mã
hoá video bắt buộc và ặc biệt coi trọng việc sử dụng hồ sơ ơn giản của MPEG-4 mức 0.
Hồ sơ ơn giản chứa công cụ chống lỗi sau:
1. Đồng bộ lại: ịnh vị các lỗi truyền dẫn bằng cách chèn mã ồng bộ lại vào số liệu ược
mã hoá ộ dài khả biến và ặt nó vào vị trí tương ứng trong khung. Vì thông tin tiêu ề
i sau mã ồng bộ lại ể ặc tả các thông số mã hoá, nên nó cho phép khôi phục nhanh
trạng thái lỗi giải mã. Đoạn chèn mã ồng bộ lại có thể ược tối lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
ưu khi xét ến phần bổ sung của thông tin tiêu ề, cảnh hình ảnh trong kiểu ầu vào và
các ặc tính truyền dẫn.
2. Phân cách số liệu: cho phép che ậy lỗi bằng cách chèn mã ồng bộ (SC) tại biên giới
các kiểu số liệu ược mã hoá khác nhau. Chẳng hạn bằng cách chèn SC giữa vectơ
chuyển ộng và hệ số DCT, có thể truyền vectơ chuyển ộng úng ngay cả khi xẩy ra lỗi
bit trong hệ số DCT, nhờ vậy che dấu lỗi một cách tự nhiên hơn.
3. Mã hoá ộ dài khả biến ngược (RVLC: Reversible Variable Length Code): như thấy ở
hình 2.5, ây là một mã ộ dài khả biến có thể ược giải mã theo chiều ngược lại. Điều
này ược thực hiện cho hệ số DCT. Với công cụ này, tất cả các khối vĩ mô có thể ược
giải mã ngoại trừ khối chứa các lỗi bit.
4. Làm tươi lại bên trong thích ứng: công cụ này ngăn cản sự truyền lan lỗi bằng cách
thực hiện mã hoá trong khung ở các vùng chuyển ộng nhanh. Giải mã
Không ược giải mã ® Loại bỏ x Lỗi
(a) Giải mã ơn hướng với mã ộ dài khả biến thông thường Giải mã
Không ược giải mã ® Loại bỏ x x Lỗi Lỗi Giải mã ngược
(b) Giải mã hai hướng với RVLC
Hình 2.5. Thí dụ mã ộ dài khả biến ngược (RVLC).
Từ trình bầy ở trên ta thấy, hồ sơ ơn giản MPEG-4 mức 0 tạo nên một CODEC ơn giản
phù hợp cho thông tin di ộng.
2.4. XỬ LÝ TIẾNG VÀ ÂM THANH
Có ba phương pháp mã hoá tiếng là: mã hoá dạng sóng, mã hoá phát âm và mã hoá lai
ghép. Giống như iều chế PCM hoặc iều chế PCM vi sai thích ứng (APCM), mã hoá dạng
sóng thực hiện mã hoá dạng sóng cho các tín hiệu ở mức ộ chính xác nhất mà không phụ
thuộc và bản chất của tín hiệu. Vì thế nếu tốc ộ bit ủ cao, có thể ạt ược chất lượng cao. Tuy
nhiên nếu tốc ộ bit thấp, chất lượng giảm ột ngột. Trái lại bộ mã hoá theo cơ quan phát âm
giả ịnh một mô hình tạo tiếng, rồi phân tích và mã hoá các thông số cuả mô hình này. Mặc
dù phương pháp này có thể duy trì tốc ộ bit thấp, nhưng khó cải thiện chất lượng ngay cả
khi tăng tốc ộ bit vì chất lượng tiếng chủ yếu phụ thuộc vào mô hình tạo tiếng ược giả ịnh.
Mã hoá lai ghép là phương pháp kết hợp mã hoá dạng sóng và mã hoá theo cơ quan phát lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
âm. Phương pháp này giả ịnh một mô hình tạo tiếng, phân tích và mã hoá các thông số của
nó sau ó thực hiện mã hoá dạng sóng cho thông tin còn lại (các tín hiệu dư) không ược
biểu diễn bằng các thông số. Một số phương pháp lai ghép iển hình là CELP và RPE-LTP.
Các phương pháp này ược sử dụng rộng rãi cho mã hoá tiếng của thông tin di ộng như là
các giải thuật chung ể thực hiện mã hoá tiếng chất lượng cao và hiệu suất cao.
2.4.1. Nguyên lý công nghệ mã hóa tiếng
1. Mô hình tạo tiếng nói
Hình 2.6 cho ta thấy mô hình cơ sở tạo tiếng nói. Trong mô hình này, âm thanh ược tạo ra
từ một dẫy xung ều tượng trưng cho sự rung ộng của thanh quản và một nguồn nhiễu ngẫu
nhiên tượng trưng cho phụ âm không kêu ược tạo ra bởi môi và lưỡi. Các âm này ựơc iều
chế bởi bộ lọc tổng hợp thực hiện các chỉnh lý mịn cho âm sắc tùy theo tình trạng cuả cơ
quan phát âm (hàm, lưỡi, mồm...).
Các nguồn âm thanh và bộ lọc tổng hợp cả hai ều biến ổi theo thời gian nhưng có thể coi
như hằng số trong các chu kỳ 20-30ms. Th«ng tin
Hình 2.6. Mô hình tạo tiếng ược sử dụng khi mã hoá CELP.
2.Phân tích dự oán tuyến tính
Vì các tín hiệu tiếng thường ít thay ổi theo thời gian nên có thể sự dụng các tín hiệu hiện
thời và quá khứ ể dự oán các tín hiệu trong tương lai với ộ chính xác khá cao. Hệ số sử
dụng ể dự oán tín hiệu trong tương lai ược gọi là "hệ số dự oán" và mạch tạo ra các hệ số
này ược gọi là "bộ lọc dự oán". Sự khác nhau giữa giá trị dự oán và tín hiệu tiếng nói ược
gọi là "số dư dự oán". lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
Như thấy ở hình 2.7, phân tích dự oán tuyến tính sử dụng tương quan thời gian của các tín
hiệu tiếng nói và dự oán tín hiệu hiện thời (tại thời iểm t) từ các ầu vào quá khứ. Sự khác
nhau giữa tín hiệu gốc và tín hiệu dự oán ược gọi là ộ dư dự oán ( t ). H m truy n fi„t
BØ l c tuy n t nh: F(z) Pi.z i t i 1 BØ l c fi¶o: t
X Xt ˆ t BØ l c .Xt t ng h p: Số dư dự oán .Xt .Xt 1 1 .Xt p các hệ số dự oán Giá trị dự oán (X ) A(z) 1 i.z i p .Xtp ˆ i 1 t
Hình 2.7. Phân tích dự oán tuyến tính
2.4.2. Thuật toán dự oán dài hạn kích thích xung ều (RPE-LTP)
Sơ ồ khối của bộ mã hoá dựa trên thuật toán dự oán dài hạn kích thích xung ều (RPE-LTP:
Regular Pulse Excitation- Long Term Prediction) ược cho ở hình 2.8. Tín hiệu mã hoá
PCM ồng ều 13bit/8000mẫu/s ược nhấn mạnh trước (Pre-emphsis) rồi ược phân oạn thành
các oạn 20ms/160mẫu/13bit ưa vào ầu vào của bộ mã hoá. Nguyên lý chung của bộ mã hoá
dựa trên cơ sở là ể tiết kiệm băng thông, người ta sẽ chỉ gửi i các thông số cần thiết nhất ể
có thể khôi phục lại ược tiếng nói ở ầu thu: thông số về cơ quan phát âm và xung kích thích bộ phận này. lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng Các thông số LPC LTP RPE xung kích thích Phân Bộ lọc phân Bộ lọc Chọn oạn tích LPC thông thấp lưới RPE Phần dư Ba mẫu chọn một 13 kbps Ghép Bộ lọc phân kênh Thông số LTP tích LTP Phân Thông số LPC tích LPC
Hình 2.8. Bộ mã hóa dựa trên giải thuật RPE-LTP
Để vậy người ta sử dụng hai kiểu mã hoá kết hợp: mã hoá kiểu phát âm (Vocoder) và mã
hoá dạng sóng (PCM ồng ều). Để thực hiện mã hoá kiểu phát âm các oạn tiếng 20 ms nói
trên ược ưa qua bộ lọc LPC (Linear Prediction Coding: bộ lọc mã hoá dự oán tuyến tính)
có ặc tính ảo so với cơ quan phát âm của con người ể nhận ược các xung kích thích . Trong
quá trình này các thông số của bộ lọc LPC cũng ược phân tích và ược giửi i. Bộ lọc phân
tích LPC là bộ lọc tuyến tính bậc n thực hiện tổ hợp tín hiệu hiện thời với tín hiệu ược trễ
1,2,3...n mẫu ở tần số 8kHz ể mô phỏng cơ quan phát âm. Các thông số của bộ lọc này thay
ổi từ khối này ến khối khác và ược gửi i ở khung tiếng. Do các oạn liên tiếp của tiếng nói
khá giống nhau, nên trong thực tế ta chỉ cần gửi i sự khác nhau (tín hiệu dư) giữa các oạn
liên tiếp này mà thôi. Quá trình lấy ra tín hiệu dư như sau. Sau LPC chuỗi kích thích ược
chia thành các khối 5ms/40mẫu ưa qua bộ lọc LTP (Long Term Prediction: bộ lọc dự oán
dài hạn). Bộ lọc này thực hiện trừ oạn tín hiệu hiện thời với oạn ược trễ Nr mẫu và ược
nhân với hệ số br. Các giá trị của Nr và br ược truyền trong khung tiếng cứ 5 ms một lần.
Trễ Nr phải vào khoảng 40 ến 120 mẫu (5 ến 15 ms) ể có thể tương ứng với tần số cơ bản
của tiếng nói (tuỳ thuộc vào người nói). Sau LTP ta ược tín hiệu dư giống với xung kích
thích hơn. Để lấy ra chuỗi kích thích, tín hiệu dư sau LTP ược ưa qua bộ lọc thông thấp và
ược lấy mẫu ều (RPE: Regular Pulse Excitation) với tần số lấy mẫu là 8/3KHz. Quá trình
này giống như mã hoá dạng sóng. Theo lý thuyết xử lý tín hiệu thì chỉ có thông tin của
chuỗi kích thích có tần số thấp hơn 1,3 kHz là ược gửi i. Tương ứng ta có 13 mẫu trong các
khoảng 5ms. Pha của các mẫu 8/3kHz ược gửi i trong khung tiếng 5ms một lần. Các mẫu
ược mã hoá iều xung mã thích ứng APCM. Ở mã hoá này biên ộ cực ại và tỷ số giữa mẫu
với biên ộ cực ại ược mã hoá riêng biệt. Đầu ra của bộ ma hóa ta ược luồng số có tốc ộ 13
kbps, trong ó: Các thông số LPC+ LTP= 3,6kbps Các thông số RPE: 9,4 kbps.
Giải mã tiếng trong kỹ thuật RPE-LTP bao gồm các giai oạn sau (xem hình 2.9):
• Tạo lại các mẫu 8kHz bằng cách bổ xung 27 mẫu không vào 13 mẫu tiếng trong các khối 5ms.
• Lọc LTP ( ảo so với phía phát) bao gồm các mẫu của khối 5ms hiện thời và ba khối trước ó.
• Lọc LPC ( ảo so với phía phát) theo các thông số ược truyền. lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng • Khử nhấn mạnh. PCM mã hóa ồng ều Chuỗi kích thích 13bit/8000 Lọc LTP Lọc LPC Khử nhấn mẫu/s mạnh
Đến bộ biến ổi số vào tương tự
Hình 2.9. Sơ ồ khối mô tả quá trình giải mã tiếng theo RPE-LTP.
2.4.3. Thuật toán dự oán tuyến tính kích thích theo mã (CELP)
Bộ mã hoá CELP (Code Excited linear Prediction) tính toán tự tương quan của các tín
hiệu tiếng nói và nhận ược các hệ số dự oán tuyến tính i bằng cách sử dụng phương pháp
Levinson-Dervin-Itakura. Nhóm hệ số dự oán tuyến tính trong mã hoá băng tần iện thoại
thường là mười hệ số. Vì rất khó xác ịnh ược ộ ổn ịnh cuả bộ lọc, nên các hệ số dự oán
tuyến tính ược chuyển ổi vào các hệ số tương ương và ổn ịnh ược như: các hệ số phản xạ
hay các hệ số cặp phổ vạch (LSP: Line Spectrum Pair) và sau ó ược lượng tử hoá. Bộ giải
mã gồm bộ lọc tổng hợp có các i thu ược và bộ lọc này ược kích thích bởi số dư dự oán
( t ) ể nhận ược tiếng sau giải mã. Đặc tính tần số cuả bộ lọc tổng hợp tương ứng với hình bao phổ tiếng nói. 1. Mô hình
Hình 2.10 cho thấy mô hình tạo tiếng ược sử dụng trong mã hoá CELP. Bộ mã hoá CELP
có cùng cấu trúc bên trong như bộ giải mã. Bộ giải mã CELP gồm bộ lọc tổng hợp dự oán
tuyến tính và hai bảng mã (Bảng mã thích ứng và bảng mã ngẫu nhiên) ể tạo ra tín hiệu
kích thích cho bộ lọc. Bộ lọc tổng hợp dự oán thể hiện ặc tính ường bao phổ của tín hiệu
tiếng và các tín hiệu kích thích ược tạo ra từ các bảng mã tương ứng với sự rung của thanh
quản (âm hữu thanh) và và luồng khí ào qua phần co lại cuả cơ quan phát âm (âm vô thanh). lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng Bảng mã thích ứng Tiếng ầu vào ( Thàng phần cao ộ ) Khuyếch ại Bảng mã ngẫu nhiên Bộ lọc tổng hợp #1 Chuyển mạch Khuyếch ại #2 bảng mã
Bộ lọc ánh trong số theo #N ộ thụ cảm
Hình 2.10. Mô hình bộ mã hóa CELP
Các phần dưới ây sẽ giải thích các công nghệ cơ sở ược sử dụng ể mã hoá CELP.
2. Bộ lọc ánh trọng lượng theo ộ thụ cảm
Bộ mã hoá CELP có cùng cấu trúc như bộ giải mã. Nó mã hoá tín hiệu bằng cách: tìm
các mẫu trong bảng mã và khuyếch ại chúng ể ạt ược sai lỗi giữa tín hiệu tiếng sau tổ hợp
và tín hiệu tiếng ầu vào nhỏ nhất. Các kỹ thuât nàỳ ược gọi là phân tích bằng cách tổng
hợp (A-b-S: Analysis by Synthesis), ây là một trong các ặc tính cuả CELP.
A-b-S tính toán sai số bằng cách sử dụng sai lỗi ược ánh trọng số trên cơ sở ặc tính thụ
cảm của con người. Bộ lọc ánh trọng số thụ cảm ược biểu diễn như là một bộ lọc kiểu
ARMA (Auto Regressive Moving Average: lấy trung bình dịch lùi tự ộng) sử dụng hệ số
nhận ược từ phân tích dự oán tuyến tính. Bộ lọc này giảm thiểu sai số lượng tử của các
vùng phổ trũng dễ bị nghe thấy bằng cách sử dụng ặc tính tần số có với ường bao phổ
tiếng nói ảo theo chiều ứng.
Mặc dù sử dụng hệ số dự oán tuyến tính không lượng tử cho phép cải thiện các ặc tính,
nhưng mức ộ phức tạp tính toán tăng. Vì lý do này trong một số trường hợp trước ây ể giảm
ộ phức tạp tính toán người ta dịch hệ số dự oán tuyến tính sau lượng tử so với bộ lọc
tổng hợp với trả giá bằng chất lượng. Hiện nay, việc tính toán chủ yếu ược thực hiện bằng
cách sử dụng áp ứng xung kim cuả bộ lọc tổng hợp và bộ lọc tổng hợp ánh trọng số thụ cảm.
3. Bảng mã thích ứng lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
Bảng mã thích ứng lưu giữ các tín hiệu kích thích quá khứ và thay ổi ộng. Nếu tín hiêụ
kích thích có chu trình, giống như âm thanh, thì có thể biểu diễn nó một cách hiệu quả bằng
cách sử dụng bảng mã thích ứng, vì tín hiệu kích thích lặp lại tại chu kỳ cao ộ tương ứng
với cao dộ của tiếng nói. Chu kỳ cao ộ ược chọn là một chu kỳ mà trong ó sự khác nhau
giữa giọng nói nguồn và ầu ra của vectơ bảng mã nhận ược từ bộ lọc tổng hợp là nhỏ nhất
trong vùng ánh trọng số thụ cảm. Đối với ầu vào lấy mẫu 8kHz chu kỳ cao ộ tiếng nói
khoảng từ 16 ến 144 mẫu.
Vì ộ phức tạp tính toán sai số khá lớn, nên thông thường tự tương quan tiếng ược tính
toán trước ể nhận ược chu kỳ cao ộ tương ối, sau ó mới tính toán sai số.
4. Bảng mã ngẫu nhiên
Bảng mã ngẫu nhiên biểu diễn các tín hiệu dư còn lại không thể biểu diễn ược bằng bảng
mã thích ứng và vì thê nó có các mẫu không tuần hoàn. Thông thường bảng mã này chứa
các tín hiệu tạp âm và tạp âm Gauss. Nhưng hiện nay người ta thường sử dụng bảng mã ại
số biểu diễn các tín hiệu dư này bằng các xung phân tán, vì thế có thể giảm áng kể: bộ nhớ
cần thiết ể lưu giữ các vectơ tạp âm, thuật toán trực giao với bảng mã thích ứng và khối
lượng tính toán sai số.
5. Bộ lọc sau
Bộ lọc sau dược sử dụng ở tầng cuối cùng của bộ giải mã ể cải thiện chất lượng chủ quan
của tiếng sau giải mã bằng cách tạo lại dạng tiếng. Bộ lọc này thường là bộ lọc nhấn mạnh
Formant có dạng ARMA và có ặc tính ảo so với bộ lọc ánh trọng lượng theo thụ cảm. Bộ
lọc này có khả năng triệt các vùng phổ thấp ể giảm bớt ảnh hưởng của sai số lượng tử.
Thông thường bộ lọc này ược bổ sung thêm một bộ lọc ể hiệu chỉnh ộ nghiêng phổ của tín hiệu ra.
2.4.4. Các công nghệ ngoại vi cho mã hóa tiếng trong thông tin di ộng
Để ảm bảo các iều kiện ặc thù của thông tin di ộng ở các ường truyền vô tuyến, các công
nghệ ngoại vi cho mã hóa tiếng khác nhau ược sử dụng cho môi trường ngoài nhà và di
ộng. Phần này sẽ tổng quan các công nghệ ngoại vi này.
Công nghệ hiệu chỉnh lỗi
Mã hiệu chỉnh lỗi ược sử dụng ể hiệu chỉnh lỗi truyền dẫn xẩy ra trong các kênh vô tuyến.
Hiểu chỉnh lỗi trước chọn lựa bit (BS-FEC) hay bảo vệ chống lỗi không cân bằng (UEP)
ược sử dụng ể hiệu chỉnh lỗi hiệu quả vì chúng sử dụng các mã hiệu chỉnh với các khả năng
khác nhau phụ thuộc vào mức ộ nhạy cảm lỗi của thông tin mã hoá tiếng (kích cỡ méo
gây ra ối với tiếng sau giải mã khi bit bị lỗi). lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
Công nghệ che dấu lỗi
Nếu không sửa ược lỗi bằng mã hiệu chỉnh lỗi nói trên hay thông tin bị mất, giải mã thông
tin thu sẽ bị sai. Trong trường hợp này các tín hiệu tiếng của phần mắc lỗi sẽ ược tạo ra
bằng cách nội suy thông số trên cơ sở sử dụng thông tin tiếng nói quá khứ ể giảm thiểu sự
giảm cấp chất lượng tiếng. Quá trình này ược gọi là công nghệ che dấu lỗi. Các thông số
ược nội suy bao gồm hệ số dự oán tuyến tính, chu kỳ cao ộ và khuyếch ại vì chúng có tương quan thời gian cao.
Phát không liên tục
Phát không liên tục (DTX: Discontinous Transmission) là quá trình trong ó MS không
phát hoặc phát rất ít khi không có tiếng. Quá trình này cho phép tiết kiệm dung lượng acqui
của MS và giảm nhiễu. Bộ phát hiện tích cực tiếng (VAD: Voice Activity Detector) sử
dụng các thông số tiếng ể xác ịnh xem có tiếng hay không. Trong các khoảng thời gian im
lặng, tạp âm nền ược tạo ra trên cơ sở thông tin tạp âm nền chứa một lượng tin tin nhỏ hơn
nhiều so với tiếng ể giảm sự khó chịu ối với người nghe do DTX gây ra. Triệt tiếng ồn
Như ã nói trong phần 2.3.1, vì giải thuật CELP sử dụng mô hình phát âm của con người,
các ặc trưng của các âm thanh khác như tiếng ồn ngòai phố sẽ gây ra giảm chất lượng. Vì
thế việc triệt bỏ tiếng ồn khác với tiếng nói con người trong khi hội thoại sẽ cải thiện chất lượng tiếng.
2.5. CÁC CODEC TIẾNG
2.4.1. Quá trình mã hóa và giải mã tiếng trong thông tin di ộng
Quá trình mã hóa và giải mã tiếng trong thông tin di ộng ược cho trên hình 2.11. Tín hiệu
tiếng ở MS ược ưa qua bộ lọc thông thấp, qua bộ biến ổi ADC ể ược mã hoá PCM ồng ều
sau ó tín hiệu này ược ưa lên bộ mã hóa. Ở ầu ra của bộ ADC ta ược luồng số phân oạn
thành các khối 20ms. Nếu tín hiệu ầu vào mạng thông tin di ộng lấy từ mạng PSTN thì
trước hết tín hiệu 8 bit PCM luật A ựơc biến ổi thành luồng bit ược mã hóa ồng ều như trên
sau ó ưa các oạn 20 ms lên bộ mã hoá. Ở phía thu quá trình ược thực hiện theo hướng ngược lại . lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng Bộ giải 1 LPF ADC Bộ mã hóa mã DAC LPF 3 bit luật A và Bộ mã Bộ giải 2 8 12 8 bit luật A và 12 bit ồng ều hóa mã bit ồng ều LPF 4 Ký hiệu:
1: Micro; 2: Mã PCM luật A, 8000 mẫu /bit (từ mạng PSTN); 3: Loa; 4: Mã PCM luật A (vào mạng PSTN)
LPF: Bộ lọc thông thấp, ADC: Bộ biến ổi tương /tự số; DAC bộ biến ổ số/tương tự
Hình 2.11. Quá trình mã hóa và giải mã tiếng trong thông tin di ộng
2.5. 1. CODEC tiếng trong GSM
1. Bộ mã hóa toán tốc (FRC)
Mã hoá tiếng ở GSM có thể thực hiện ở tốc ộ 13kbit/s (toàn tốc) hoặc ở 6,5kbit/s (bán tốc).
Trong phần này ta xét mã hoá toàn tốc (FRC: Full Rate Codec). Sơ ồ mã hoá tiếng GSM
FRC ở tốc ộ 13kbit/s dựa trên giải thuật RPE-LTP (Regular Pulse Excitation-Long Term
Prediction: kích thích xung ều - dự oán dài hạn) (hình 2.8). Mã hoá này cho phép nhận ược
chất lượng như mạng cố ịnh nhưng òi hỏi ộ rộng phổ tần vô tuyến hẹp hơn. Tín hiệu tiếng
ở MS ược ưa qua bộ lọc thông thấp, qua bộ biến ổi ADC ể ược mã hoá PCM ồng ều với
tần số lấy mẫu 8kHz và 13bit mã hoá cho một mẫu sau ó tín hiệu này ược ưa lên bộ mã
hóa. Ở ầu ra của bộ phân oạn ta ược các khối 20ms mã hoá 260 bit tương ứng với tốc ộ
của luồng ra là 13kbps. Nếu tín hiệu ấu vào mạng GSM lấy từ mạng PSTN thì trước hết tín
hiệu 8 bit PCM luật A ựơc biến ổi thành 13 bit PCM ồng ều và ược phân oạn 260bit/20ms
ể biến ổi thành 13kbps sau ó ưa lên bộ mã hoá.
Ở phía thu quá trình ược thực hiện theo hướng ngược lại .
Các thông số ược phát i trong khung tiếng 20 ms ược cho ở bảng 2.1 dưới ây.
Bảng 2.1. Các thông số ược phát i ở khung tiếng Số bit Số bit trong trong 5ms 20ms Bộ lọc LPC 8 thông số 36 Bộ lọc LTP
Nr (thông số trễ) 7 28
br (thông số khuyếch ại) 2 8
Tín hiệu kích thích pha lấy mẫu (8/3kHz) 2 8 Biên ộ cực ại 6 24 13 mẫu 39 156 Tổng 260 lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
2. CODEC toàn tốc tăng cường (EFRC)
Codec GSM EFRC (Enhanced Full Rate Codec) ược xây dựng trên cơ sở thuật toán
ACELP (Algebraic Code Excited Linear Prediction: Dự oán tuyến tính kích thích theo mã
ại số). Vì tốc ộ mã hoá của codec này là 12,2kbps nên có thể dành thêm 0,8 kbps ể mã
hoá chống lỗi so với codec 13 kbps trước ây. EFR codec hoạt ộng với các khung 20 ms
ược chia thành bốn khung con 5 ms. Ở bộ mã hoá tín hiệu tiếng ược phân tích và các thông
số của mô hình tổng hợp tiếng CELP ược rút ra. Hai tập các hệ số của các bộ lọc dự oán
tuyến tính ược tính toán cho từng khung. Các chỉ số bảng mã thích ứng (ACB: Adaptive
Code Book) và cố ịnh (FCB: Fixed Code Book) ược tìm cho từng khung con. Các thông
số phát trong khung tiếng ược cho ở bảng 2.2.
Bảng 2.2. Các thông số ược phát i ở khung tiếng của codec EFR Thông số Khung 1 và 3 Khung 2 và 4 Số bit trong khung 20 ms 2 bộ LSP 38 Chỉ số ACB 9 6 30 Khuyếch ại ACB 4 4 16 Các xung FCB 35 35 140 Khuyếch ại FCB 5 5 20 Tổng 244 Tốc ộ, kbps 12,2
2.5.2. CODEC tiếng cuả cdma 2000
1. CODEC tốc ộ bit khả biến (VRC)
cdma 2000 sử dụng bộ mã hóa tiếng VRC (Variable Bit Rate) tiếng dựa trên dự oán
tuyến tính kích thích theo mã (CELP: Code Excited Linear Prediction). Trong kỹ thụât này
bộ giải mã CELP sử dụng bảng ể tạo ra ầu vào cho bộ tổng hợp tần số. Bảng mã ược ặc
trưng bởi chỉ số bảng mã I và khuyếch ại G. Bộ lọc phổ ược ặc trưng bởi tập ba thông số:
các vạch phổ cao ộ cao (pitch) i, trễ ộ cao L và khuyếch ại ộ cao b. Đầu ra của bộ lọc ược
xử lý bởi bộ lọc sau và iều chỉnh khuyếch ại.
Bộ mã hóa CELP òi hỏi ba bước thực hiện (hình 2.12). Trước hết cần xác ịnh mã LSP: giá
trị i của các cặp phổ vạch (LSP: Line Spectral Pair). Sau ó giá trị i của LSP ược sử dụng ể
phân tích bởi tổng hợp (AbS) ể xác ịnh các giá trị trễ cao ộ (L) và khuyếch ại cao ộ (b).
Cuối cùng các giá trị i, b và L ược sử dụng ở bước AbS thứ hai ể xác ịnh chỉ số bảng mã lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
(I) và khuyếch ại bảng mã (G). Sau ó các thông số này ược ưa lên các hàm tính toán lỗi ể
thực hiện dự oán tuyến tính. Kết quả ầu ra ược các thông số: L (trễ cao ộ), b (khuyếch ại
cao ộ), chỉ số bảng mã (I), khuyếch ại bảng mã (G) Tính toán Chọn L và b ể Đầu ra hàm lỗi giảm thiểu lỗi Trễ ( L ) Khuyếch ại i (mã LSP) ( b ) PCM ồngều Tính toán Chọn G và I ể Đầu ra hàm lỗi giảm thiểu lỗi Bảng mã ( I ) Khuyếch ại ( G ) Các giá trị L và b Các giá trị I và G
Hình 2.12. Bộ mã hóa tiếng CELP
cdma 2000 sử dụng bộ mã tốc ộ khả biến cho phép thay ổi tốc ộ tùy theo tần suất nói (nói
nhiều thì tốc ộ mã hóa cao còn nói ít thì tốc ộ mã hóa thấp). Bộ mã hóa này hỗ trợ bốn tốc
ộ sau: 8,55 kbps (tỷ lệ 1 ), 4,2 kbps (tỷ lệ 1/2), 2,4 kbps (tỷ lệ 1/4) và 0,8kbps (tỷ lệ 1/8).
Mỗi tỷ lệ sử dụng ít bit hơn ể mã hoá I,G,L,b.
Khung cơ sở của cdma 2000 là 20 ms. Ở tỷ lệ 1, 160 bit ược phát ể mã hoá số liệu cộng
với trường chẵn lẻ 11 bit. Ở các tốc ộ bit thấp hơn số bit ược sử dụng ít hơn (xem bảng 2.3).
Bảng 2.3. Các thông số CELP ối với các tỷ lệ mã hoá khác nhau Các thông số CELP
Tỷ lệ 1 Tỷ
lệ Tỷ lệ1/4 Tỷ lệ 1/2 1/8
Các bit i của cặp phổ vạch 40 20 10 10
Sô lần cập nhật bit i trên một khung 1 1 1 1 Tổng số bit i trên khung 40 20 10 10 Các bit trễ ộ cao L 7 7 7 0
Số lần cập nhật L trên một khung Tổng 4 2 1 0 số bit L trên khung 28 14 7 0
Các bit khuyếch ại ộ cao b 3 3 3 0
Số lần cập nhật b trên một khung Tổng 4 2 1 0 số bit b trên khung 12 6 3 0
Các bit chỉ số bảng mã I 7 7 7 0
Số lần cập nhật I trên một khung Tổng 8 4 2 _ số các bit I trên khung 56 28 14 0 lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
Các bit khuyếch ại bảng mã G Số 3 3 3 2
lần cập nhật G trên một khung 8 4 2 1
Tổng số các bit G trên một khung 24 12 6 2
Các bit hạt giống bảng mã CBSEED 0 0 0 4
Số lần cập nhật CBSEED trên khung _ _ _ 1 Tổng số các bit CBSEED _ _ _ 4
Các bit chẵn lẻ trên khung Tổng 11 0 0 0 số các bit trên khung 171+1* 80 40 16 Tốc ộ bit (kbps) 8,6 4 2 0,8 * bit dự trữ
Sơ ồ giải mã CELP trong cdma 2000 ược cho trên hình 2.13. Ở tỷ lệ 1/8 các bit chỉ số I
không có và một bộ tạo mã giả ngẫu nhiên ược sử dụng ể ưa vào các bit CBSEED
(Codebook Seed: hạt giống của bảng mã). Bộ lọc sau và iều Bảng mã Bộ lọc tổng hợp cao ộ khiển khuyếch ại Chỉ số
Khuyếch ại Trễ cao ộ (L) bảng
mã (I) bảng mã (G) Khuyếch ại cao ộ (b) Các vạch phổ cao ộ
Các ầu vào bộ giải mã CELP
Hinh 2.13. Bộ giải mã CELP.
2. CODEC tốc ộ khả biến chất lượng tuyệt hảo (EVRC)
EVRC (Excellent Voice Quality Variable Bit Rate) cho phép giảm số bit cần thiết cho các
hệ số dự oán tuyến tính và tổng hợp ộ cao cho phép bảng mã ại số tạo ra kích thích. Nhờ
vậy EVRC cho chất lượng tiếng cao hơn. Khác với các codec CELP, EVRC không có ý ịnh
thích ứng tín hiệu tiếng một cách chính xác. Nó sử dụng thuật toán dự oán tuyến tính kích
thích theo mã nới lỏng (RCELP). Phương pháp này cho phép giảm tốc ộ số bit trên khung
cần ể thể hiện ộ cao và cho phép bổ sung các bit cho kích thích ngẫu nhiên và bảo vệ kênh.
Thuật toán EVRC phân loại tiếng thành các khung 20 ms: toàn tốc (8,6 kbps), tốc ộ 1/2 (4 lOMoAR cPSD| 58977565 TS. Nguyễn Phạm Anh Dũng
kbps) và tốc ộ 1/8 (0,8 kbps). Thuật toán EVRC cho phép cải thiện áng kể chất lượng tiếng.
Bảng 2.4 cho thấy phân bổ vị trí các bit theo gói ở EVRC.
Bảng 2.4. Phân bổ vị trí bit theo kiểu gói ở EVRC Trường Kiểu gói Tốc ộ 1 Tốc ộ 1/2 Tốc ộ1/8 Để trống
Chỉ thị chuyển ổi phổ 1 LSP 28 22 8 Trễ ộ cao 7 7 Trễ Delta 5 Khuyếch ại ACB 9 9 Dạng FCB 105 30 Khuyếch ại FCB 15 12 Năng lượng khung 8
Tổng số các bit ược mã hoá 171+1 80 16 Tốc ộ (kbps) 8,6 4 1,2
2.5.3. CODEC tiếng của W-CDMA UMTS
Vì có rất nhiều sơ ồ mã hoá tiếng ược ề xuất, các tổ chức quốc tế như TIA, TTC, ETSI ,
ARIB... ã tiến hành lựa chọn công nghệ mã hoá tiêng phù hợp nhất cho TTDĐ 3G. Mã hoá
tiếng a tốc ộ thích ứng (AMR: Adaptive Multirate) ược coi là công nghệ vượt trội các công
nghệ mã hoá tiếng khác. Vì thế nó ược chọn là sơ ồ mã hoá tiếng cho 3GW-CDMA UMTS.
1. CODEC a tốc ộ khả biến (AMR)
AMR là phương pháp mã hoá tiếng ược phát triển trên cơ sở CELP ại số (ACELP:
Algebrraic CELP) ã ược tiếp nhận cho phương pháp mã hoá tiếng của GSM vào năm 1998.
Nó cung cấp 8 chế ộ mã hoá từ 12,2 bps ến 4,75kbps. Trong số các chế ộ này, 12,2kbps,
7,4 kbps và 6,7 kbps có chung một giải thuật với các sơ ồ mã hoá tiếng ược tiêu chuẩn hoá
ở các tiêu chuẩn của các vùng khác trên thế giới.
Giải thuật mã hoá tiếng này cơ bản giống như G.729 với một số cải tiến cho a tốc ộ. Độ
dài khung cố ịnh bằng 20 ms trong tất cả các chế ộ. Khả năng a tốc ộ ạt ược bằng cách thay
ổi số số bit lượng tử cho các thông số trong các khung con (xem bảng 2.5).