Giáo trình Lý thuyết thông tin_Lê Quyết Thắng| Môn Lý thuyết thông tin| Trường Đại học Bách Khoa Hà Nội

Giáo trình này sẽ cung cấp cho người đọc những khối kiến thức cơ bản của lý thuyết thông tin như: Độ do lượng tin (Measure of Information), Sinh mã tách được (Decypherable Coding), Kênh truyền tin rời rạc không nhớ (Discrete Memoryless Channel) và Sửa lỗi trên kênh truyền (Error Correcting Codings).

Giáo trình: Lý thuyết thông tin.
MC LC
GII THIU TNG QUAN.............................................................................................................6
1. MC ĐÍCH...........................................................................................................................6
2. YÊU CU .............................................................................................................................6
3. NI DUNG CT LÕI...........................................................................................................7
4. KT THC TIÊN QUYT ..................................................................................................7
5. TÀI LIU THAM KHO.....................................................................................................8
6. PHƯƠNG PHÁP HC TP.................................................................................................8
CHƯƠNG 1: GII THIU ...............................................................................................................9
1. Mc tiêu.................................................................................................................................9
2. Đối tượng nghiên cu............................................................................................................9
3. Mô hình lý thuyết thông tin theo quan đim Shannon ........................................................10
4. Lượng tin biết và chưa biết .................................................................................................10
5. Ví d v lượng tin biết và chưa biết....................................................................................10
6. Định lý cơ s ca k thut truyn tin ..................................................................................11
7. Mô t trng thái truyn tin có nhiu ....................................................................................11
8. Minh ha k thut gim nhiu.............................................................................................12
9. Chi phí phi tr cho k thut gim nhiu ............................................................................13
10. Khái nim v dung lượng kênh truyn............................................................................13
11. Vn đề sinh mã................................................................................................................13
12. Vn đề gii mã.................................................................................................................13
CHƯƠNG 2: ĐỘ ĐO LƯỢNG TIN...............................................................................................15
BÀI 2.1: ENTROPY .......................................................................................................................15
1. Mc tiêu...............................................................................................................................15
2. Ví d v entropy..................................................................................................................15
3. Nhn xét v độ đo lượng tin................................................................................................15
4. Khái nim entropy...............................................................................................................16
5. Entropy ca mt s kin......................................................................................................16
6. Entropy ca mt phân phi .................................................................................................16
7. Định lý dng gii tích ca Entropy......................................................................................16
8. Ví d minh ha....................................................................................................................17
9. Bài toán v cây tìm kiếm nh phân-Đặt vn đề ...................................................................17
10. Bài toán v cây tìm kiếm nh phân - Din gii................................................................17
11. Bài tp .............................................................................................................................18
BÀI 2.2: CÁC TÍNH CHT CA ENTROPY .............................................................................19
1. Mc tiêu: .............................................................................................................................19
2. Các tính cht cơ bn ca Entropy........................................................................................19
3. Minh ha tính cht 1 và 2....................................................................................................19
4. Minh ha tính cht 3 và 4....................................................................................................19
5. Định lý cc đại ca entropy ................................................................................................20
6. Chng minh định lý cc đại ca Entropy............................................................................20
7. Bài tp .................................................................................................................................21
BÀI 2.3: ENTROPY CA NHIU BIN .....................................................................................22
1. Mc tiêu...............................................................................................................................22
2. Định nghĩa Entropy ca nhiu biến.....................................................................................22
3. Ví d Entropy ca nhiu biến..............................................................................................22
4. Định nghĩa Entropy có điu kin.........................................................................................22
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
1
Giáo trình: Lý thuyết thông tin.
5. Ví d Entropy có điu kin .................................................................................................23
6. Quan h gia H(X,Y) vi H(X) và H(Y) khi X, Y độc lp.................................................23
7. Quan h gia H(X,Y) vi H(X) và H(Y) khi X, Y tương quan ..........................................24
8. Bài tp .................................................................................................................................25
BÀI 2.4: MINH HA CÁC ENTROPY........................................................................................26
1. Mc tiêu...............................................................................................................................26
2. Yêu cu ca bài toán ...........................................................................................................26
3. Xác định các phân phi ngu nhiên ca bài toán ................................................................26
4. Minh ha Entropy H(X), H(Y) và H(X,Y)..........................................................................27
5. Minh ha Entropy H(X/Y) và H(Y/X)................................................................................27
6. Minh ha quan h gia các Entropy....................................................................................27
BAI 2.5: ĐO LƯỢNG TIN (MESURE OF INFORMATION) ......................................................28
1. Mc tiêu...............................................................................................................................28
2. Đặt vn đề bài toán..............................................................................................................28
3. Xác định các phân phi ca bài toán...................................................................................28
4. Nhn xét da theo entropy ..................................................................................................28
5. Định nghĩa lượng tin ...........................................................................................................29
6. Bài tp .................................................................................................................................29
CHƯƠNG 3: SINH MÃ TÁCH ĐƯC (Decypherable Coding)...................................................31
BÀI 3.1: KHÁI NIM V MÃ TÁCH ĐƯỢC..............................................................................31
1. Mc tiêu...............................................................................................................................31
2. Đặt vn đề bài toán sinh mã ................................................................................................31
3. Khái nim v bng mã không tách được.............................................................................32
4. Bng mã tách được..............................................................................................................32
5. Khái nim bng mã tc thi ................................................................................................33
6. Gii thut kim tra tính tách được ca bng mã..................................................................33
7. Bài toán 1- yêu cu..............................................................................................................33
8. Bài toán 1 - Áp dng gii thut ...........................................................................................34
9. Bài toán 2 ............................................................................................................................34
10. Bài tp .............................................................................................................................35
BÀI 3.2: QUAN H GIA MÃ TÁCH ĐƯỢC VÀ ĐỘ DÀI MÃ................................................36
1. Mc tiêu...............................................................................................................................36
2. Định lý Kraftn(1949)...........................................................................................................36
3. Định nghĩa cây bc D c k. .................................................................................................36
4. Vn đề sinh mã cho cây bc D c k ....................................................................................37
5. Chng minh định lý Kraft (Điu kin cn) .........................................................................37
6. Chng minh định lý Kraft (Điu kin đủ)...........................................................................38
7. Ví d minh ha định lý Kraft ..............................................................................................38
8. Bài tp .................................................................................................................................39
BÀI 3.3: TÍNH TI ƯU CA ĐỘ DÀI MÃ..................................................................................40
1. Mc tiêu...............................................................................................................................40
2. Định lý Shannon (1948) ......................................................................................................40
3. Bng mã ti ưu tuyt đối.....................................................................................................40
4. Bng mã ti ưu tương đối....................................................................................................41
5. Điu kin nhn biết mt bng mã ti ưu .............................................................................41
6. Định lý Huffman .................................................................................................................41
7. Phương pháp sinh mã Huffman...........................................................................................42
8. Minh ha phương pháp sinh mã Huffman ..........................................................................42
9. Nhn xét tính ti ưu ca bng mã Huffman........................................................................43
10. Bài tp .............................................................................................................................43
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
2
Giáo trình: Lý thuyết thông tin.
CHƯƠNG 4: KÊNH TRUYN ......................................................................................................45
BÀI 4.1: KÊNH TRUYN RI RC KHÔNG NH ...................................................................45
1. Mc tiêu...............................................................................................................................45
2. Gii thiu.............................................................................................................................45
3. Mô hình vt lý .....................................................................................................................45
4. Mô hình toán hc.................................................................................................................46
5. Ví d xác định phân phi đầu nhn.....................................................................................47
6. Lượng tin trên kênh truyn..................................................................................................47
7. Định nghĩa dung lượng kênh truyn....................................................................................48
BAI 4.2: CÁC DNG KÊNH TRUYN........................................................................................49
1. Mc tiêu...............................................................................................................................49
2. Hiu định lý v dung lượng kênh truyn,Kênh truyn không mt tin.................................49
3. Kênh truyn xác định ..........................................................................................................49
4. Kênh truyn không nhiu ....................................................................................................50
5. Kênh truyn không s dng được. ......................................................................................50
6. Kênh truyn đối xng..........................................................................................................50
7. Xây dng công thc tính dung lượng kênh truyn đối xng ..............................................51
8. Định lý v dung lượng kênh truyn.....................................................................................52
9. Bài tp .................................................................................................................................52
BÀI 4.3: LƯỢC ĐỒ GII MÃ .......................................................................................................53
1. Mc tiêu...............................................................................................................................53
2. Đặt vn đề bài toán gii mã.................................................................................................53
3. Ví d bài toán gii mã .........................................................................................................53
4. Các khái nim cơ bn ca k thut truyn tin .....................................................................54
5. Ví d minh ha các khái nim cơ bn .................................................................................54
6. Các dng sai s cơ bn ........................................................................................................55
7. Phương pháp xây dng lượt đồ gii mã ti ưu....................................................................55
8. Minh ha xây dng lược đồ gii mã ti ưu.........................................................................56
9. Minh ha cách tính các sai s..............................................................................................57
10. Bài tp 1 ..........................................................................................................................58
11. Bài Tp 2 .........................................................................................................................58
CHƯƠNG 5: SA LI...................................................................................................................59
BÀI 5.1: NGUYÊN LÝ KHONG CÁCH NH NHT HAMMING .........................................59
1. Mc tiêu: .............................................................................................................................59
2. Khong cách Hamming.......................................................................................................59
3. Kênh truyn đối xng nh phân và lược đồ gii mã ti ưu..................................................59
4. Ví d kênh truyn đối xng nh phân..................................................................................60
5. Quan h gia xác sut gii mã và khong cách Hamming..................................................60
6. Nguyên lý Hamming ...........................................................................................................60
7. Bài tp .................................................................................................................................61
BÀI 5.2: B ĐỀ V T SA LI VÀ CN HAMMING ...........................................................62
1. Mc tiêu...............................................................................................................................62
2. B đề v t sa li...............................................................................................................62
3. Chng minh và minh ha b đề ..........................................................................................62
4. Cn Hamming. ....................................................................................................................63
5. Phân các dng li.................................................................................................................64
6. Bài tp .................................................................................................................................64
BÀI 5.3: MÃ KIM TRA CHN L .............................................................................................64
1. Mc tiêu: .............................................................................................................................64
2. B mã kim tra chn l........................................................................................................65
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
3
Giáo trình: Lý thuyết thông tin.
3. Phương pháp kim tra chn l.............................................................................................65
4. Phương pháp sinh mã kim tra chn l ...............................................................................66
5. Ví d sinh mã kim tra chn l............................................................................................66
6. Định lý quan h gia độ dài mã n, s bit kim tra m và s li t sa e ..............................67
7. Ví d tìm m nh nht t n và e...........................................................................................68
8. Ví d tìm e ln nht t m và n.............................................................................................68
9. Bài tp .................................................................................................................................68
BÀI 5.4: NHÓM CNG TÍNH VÀ B T MÃ CHN L .........................................................69
1. Mc tiêu...............................................................................................................................69
2. Khái nim nhóm cng tính..................................................................................................69
3. Tính cht ca b mã chn l................................................................................................69
4. Ví d minh ha....................................................................................................................70
5. Phương pháp sinh mã kim tra chn l nhanh.....................................................................71
6. Ví d sinh mã kim tra chn l nhanh.................................................................................71
7. Bài tp .................................................................................................................................72
BÀI 5.5: LƯỢC ĐỒ SA LI TI ƯU.........................................................................................73
1. Mc tiêu...............................................................................................................................73
2. Đặt vn đề............................................................................................................................73
3. Định nghĩa Hip hp ...........................................................................................................73
4. Lược đồ sa li theo các hip hp ......................................................................................74
5. Lược đồ sa li thong qua b li.........................................................................................74
6. Ví d minh ha lược đồ sa li 1 bit...................................................................................74
7. Ví d minh ha lược đồ sa li 2 bit...................................................................................75
8. Ví d minh ha lược đồ sa li 3 bit...................................................................................76
9. Xác sut truyn đúng...........................................................................................................76
10. Bài tp .............................................................................................................................76
BÀI 5.6: MÃ HAMMING ..............................................................................................................76
1. Mc tiêu...............................................................................................................................76
2. Mã Hammin.........................................................................................................................77
3. Tính cht..............................................................................................................................77
4. Ví d minh ha....................................................................................................................77
5. Bài tp .................................................................................................................................78
BÀI 5.7: THANH GHI LÙI TNG BƯỚC ...................................................................................79
1. Mc tiêu...............................................................................................................................79
2. Đặt vn đề............................................................................................................................79
3. Biu din vt lý ca thanh ghi.............................................................................................79
4. Biu din toán hc ca thanh ghi ........................................................................................80
5. Ví d thanh ghi lui tng bước .............................................................................................80
6. Chu k ca thanh ghi...........................................................................................................81
7. Ví d tìm chu k ca thanh ghi ...........................................................................................81
8. Bài tp .................................................................................................................................82
BÀI 5.8: MÃ XOAY VÒNG ..........................................................................................................82
1. Mc tiêu...............................................................................................................................82
2. Ma trn kim tra chn l mã xoay vòng..............................................................................83
3. Định nghĩa mã xoay vòng ...................................................................................................83
4. Phương pháp sinh nhanh b mã xoay vòng.........................................................................83
5. Ví d sinh nhanh b mã xoay vòng.....................................................................................84
6. Bài tp .................................................................................................................................85
BÀI 5.9: ĐA THC ĐẶC TRƯNG CA THANH GHI ...............................................................86
1. Mc tiêu...............................................................................................................................86
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
4
Giáo trình: Lý thuyết thông tin.
2. Định nghĩa đa thc đặc trưng ca thanh ghi .......................................................................86
3. Quan h gia chu k n, đa thc đăc trưng và đa thc (x
n
+ 1)............................................86
4. Th tc sinh thanh ghi lùi tng bước ..................................................................................87
5. Ví d minh ha....................................................................................................................87
6. Bài tp .................................................................................................................................87
Bài 5.10: PHƯƠNG PHÁP SINH MÃ XOAY VÒNG ..................................................................88
1. Mc tiêu...............................................................................................................................88
2. Đặt vn đề............................................................................................................................88
3. Phương pháp sinh bng mã xoay vòng................................................................................88
4. Ví d minh ha 1.................................................................................................................89
5. Ví d minh ha 2.................................................................................................................89
6. Ví d minh ha 3.................................................................................................................90
7. Bng lit kê mt s đa thc đặc trưng.................................................................................90
8. Bài tp .................................................................................................................................90
BÀI TP TNG HP ....................................................................................................................91
1. Mc tiêu...............................................................................................................................91
2. Bài 1 ....................................................................................................................................91
3. Bài 2 ....................................................................................................................................91
4. Bài 3 ....................................................................................................................................92
5. Bài 4 ....................................................................................................................................93
TÀI LIU THAM KHO...............................................................................................................95
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
5
Giáo trình: Lý thuyết thông tin.
GII THIU TNG QUAN
GIÁO TRÌNH LÝ THUYT THÔNG TIN
MC ĐÍCH
Giáo trình này s cung cp cho người đọc nhng khi kiến thc cơ bn ca lý thuyết thông tin
như: Độ do lượng tin (Measure of Information), Sinh mã tách được (Decypherable Coding),
Kênh truyn tin ri rc không nh (Discrete Memoryless Channel) và Sa li trên kênh truyn
(Error Correcting Codings).
Liên quan đến Độ đo lượng tin, giáo trình s trình bày các khái nim cơ bn v thông tin,
entropy, mt s công thc, tính cht, các định lý quan trng ca entropy và cách tính
lượng tin.
V Sinh mã tách được
, giáo trình s gii thiu đến người hc các vn đề v yêu cu ca
bài toán sinh mã, gii mã duy nht, cũng như mã tc thi và gii thut kim tra mã tách
được. Các định lý quan trng được đề cp trong ni dung này là: Định lý Kraft (1949),
Định lý Shannon (1948) và Định lý sinh mã Huffman.
V kênh truyn tin ri rc không nh, giáo trình s gii thiu mô hình kênh truyn theo
2 khía cnh vt lý và toán hc. Các khái nim v dung lượng kênh truyn, phân lp kênh
truyn, định lý v dung lượng kênh truyn, cũng như các khái nim trong k thut truyn
tin và phương pháp xây dng lược đồ gii mã ti ưu cũng được trình bày trong môn hc
này.
Vn đề Sa li (hay x lý mã sai) trên kênh truyn là mt vn đề rt quan trng và
được quan tâm nhiu trong môn hc này. Các ni dung được gii thiu đến các bn s
Nguyên lý Khong cách Hamming, các định lý v C
n Hamming, phương pháp kim tra
chn l, các lược đồ sa li, Bng mã Hamming và Bng mã xoay vòng.
Hơn na, hu hết các vn đề nêu trên đều được đưa vào ni dung ging dy các bc Đại hc
ca mt s ngành trong đó có ngành Công ngh thông tin. Do đó, để có mt tài liu phc v
công tác ging dy ca giáo viên cũng như vic hc tp và nghiên cu c
a sinh viên, chúng tôi
mnh dn biên son giáo trình này nhm giúp cho sinh viên có mt tài liu t hc và nghiên
cu mt cách hiu qu.
YÊU CU
Sau khi hc xong môn này, sinh viên phi có được nhng kh năng sau:
Hiu các khái nim v v thông tin, Entropy, Entropy ca mt phân phi, Entropy ca
nhiu phân phi, Entropy có điu kin, Độ đo lượng tin. Vn dng gii quyết các bài toán
v xác định lượng tin.
Biết khái nim v mã tách được, mã không tách được, bng mã ti ưu. Hiu Định lý Kraft
(1949), Định lý Shannon (1948), Định lý sinh mã Huffman và phương pháp sinh mã
Huffman. Vn dng
để sinh bng mã tách được ti ưu, nhn biết được bng mã như thế
nào là bng mã ti ưu và có th vn dng để viết các chương trình sinh mã, gii mã (hay
viết chương trình nén và gii nén). T đây, các sinh viên có th t nghiên cu các loi
bng mã khác để vn dng cho vic mã hóa và bo mt thông tin mt cách hiu qu.
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
6
Giáo trình: Lý thuyết thông tin.
Biết các khái nim v kênh truyn tin ri rc không nh, dung lượng kênh truyn và phân
lp kênh truyn. Hiu định lý v dung lượng kênh truyn, phương pháp xây dng lược đồ
gii mã ti ưu và cách tính xác sut truyn sai trên kênh truyn.
Biết các khái nim v khong cách Hamming, nguyên lý khong cách Hamming, các định
lý v Cn Hamming, phương pháp kim tra chn l, các lược đồ sa li, Bng mã
Hamming và Bng mã xoay vòng.
Vn dng các kiến thc hc được để thiết kế mt h thng truyn nhn d liu vi quy
trình cơ bn: mã hóa, gii mã và bo mt thông tin.
Lý thuyết thông tin cũng là mt trong các môn hc khó ca ngành Công ngh thông tin vì nó
đòi hi người hc phi có kiến thc cơ bn v toán và xác sut thng kê. Do đó, đòi hi người
hc phi t b
sung các kiến thc cơ bn v toán và xác sut thng kê cho mình (nếu thiếu),
tham gia lp hc đầy đủ và làm các bài tp theo yêu cu ca môn hc thì mi tiếp thu kiến
thc môn hc mt cách hiu qu.
NI DUNG CT LÕI
Giáo trình gm 5 chương được trình bày trong 45 tiết ging cho sinh viên chuyên ngành Công
ngh thông tin, trong đó có khong 30 tiết lý thuyết và 15 tiết bài tp mà giáo viên s hướng dn
cho sinh viên trên lp.
Chương 1: Gii thiu. Chương này trình bày các ni dung có tính tng quan v môn hc bao
gm: các đối tượng nghiên cu, mô hình lý thuyết thông tin theo quan đim ca nhà toán hc
Shannon, khái nim v lượng tin biết và chưa biết, định lý cơ bn ca k thut truyn tin.
Ch
ương 2: Độ đo lượng tin. Chương này trình bày các vn đề cơ bn v entropy, các tính cht
ca entropy, entropy ca nhiu biến, entropy có điu kin, các định lý v quan h gia các
entropy và lượng tin ca mt s kin.
Chương 3: Sinh mã tách được. Ni dung chính ca chương này bao gm các khái nim v
tách được, quan h gia mã tách được và độ dài mã, tính ti ưu ca độ dài mã.
Chương 4: Kênh truyn.
Các ni dung được trình bày trong chương này bao gm khái nim v
kênh truyn tin ri rc không nh, các mô hình truyn tin khía cnh vt lý và toán hc, dung
lượng trên kênh truyn, phân lp các kênh truyn. Phương pháp xây dng lược đồ gii mã ti ưu
và cách tính xác sut truyn sai cũng được gii thiu trong chương này.
Chương 5: Sa li. Chương này trình bày các ni dung ct lõi sau: khái nim v khong cách
Hamming, nguyên lý khong cách nh nht Hamming, b
đề v t sa li và định lý Cn
Hamming. Chương này cũng gii thiu v b mã kim tra chn l, phương pháp kim tra chn l,
lược đồ sa li ti ưu, mã Hamming và mã xoay vòng.
KT THC TIÊN QUYT
Để hc tt môn hc này, đòi hi sinh viên phi nm vng các môn hc có liên quan như: xác sut
thng kê, đại s boole (phép toán Modulo 2 và đa thc nh phân). Các môn hc có liên quan và có
th tham kháo thêm như k thut s, h điu hành, mng máy tính.
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
7
Giáo trình: Lý thuyết thông tin.
TÀI LIU THAM KHO
1. David J.C. Mackey, Information Theory, Infernce, and Learning Algorithms, CamBridge
University Express-2003.
2. G.J.ChaiTin, Algorithmic Information Theory, CamBridge University Express-1992.
3. Sanford Goldman, Information Theory.
4.
http://www.inference.phy.cam.ac.uk/mackay/info-theory/course.html.
5.
http://en.wikipedia.org/wiki/Information_theory.
6.
http://www-2.cs.cmu.edu/~dst/Tutorials/Info-Theory/.
7.
http://cscs.umich.edu/~crshalizi/notebooks/information-theory.html.
8.
http://www.lecb.ncifcrf.gov/~toms/paper/primer/primer.pdf.
9.
http://www.cs.ucl.ac.uk/staff/S.Bhatti/D51-notes/node27.html.
10.
http://guest.engelschall.com/~sb/hamming/.
11.
http://www2.rad.com/networks/1994/err_con/hamming.htm
PHƯƠNG PHÁP HC TP
Để phc v cho mc tiêu nâng cao kh năng t hc tp và t nghiên cu ca sinh viên, giáo trình
này được biên son cùng vi các giáo trình khác thuc chuyên ngành Công ngh thông tin ca
Khoa Công ngh thông tin và Truyn thông – Đại Hc Cn Thơ theo d án ASVIET002CNTT
“Tăng cường hiu qu đào to và năng lc đào to ca sinh viên khoa Công ngh Thông tin-
Đại hc Cn Thơ. Chúng tôi đã c gng trình bày giáo trình này mt cách có h thng các ni
dung theo b cc các chương ng vi các khi kiến thc nêu trên, mi chương được được trình
bày theo b cc ca các bài hc và mi bài hc gii thiu đến người hc mt vn đề nào đó trong
s các vn đề ca mt khi kiến thc tương ng vi mt chương. Khi hc xong các bài hc ca
mt chương, người hc s có m
t khi kiến thc cn thiết tương ng cho môn hc. Ni dung ca
các bài hc đều được đưa vào các ví d để người hc d hiu, tùy theo tng vn đề mà người hc
cn phi hc và nghiên cu trong thi lượng t 1 đến 2 tiết t hc cho mt bài hc trong mt
chương. Như vy, để hc tt môn hc này, trước hết sinh viên c
n phi:
Hc đầy đủ các môn hc tiên quyết, b sung nhng kiến thc cơ bn v toán và xác sut
thng kê (nếu thiếu).
Hc và nghiên cu k tng chương theo trình t các chương được trình bày trong giáo
trình này. Trong tng chương, hc các bài theo th t được trình bày, sau mi bài phi làm
bài tp đầy đủ (nếu có).
Tham gia lp đầy đủ, tho lun các vn
đề tn ti chưa hiu trong quá trình t hc.
Sau mi chương hc, phi nm vng các khái nim, các định nghĩa, các công thc tính
toán và vn dng gii các bài toán có tính cht tng hp được gii thiu cui chương.
Vn dng kiến thc có được sau khi hc xong các chương để gii mt s bài tp tng hp
cui giáo trình, t
đó giúp cho người hc hiu sâu hơn v môn hc và có th gii quyết
các vn đề tương t trong thc tế.
Vic cho ra đời mt giáo trình vi nhng mc đích như trên là không đơn gin khi kh năng và
kinh nghim ca người son còn có hn, nhiu khái nim, thut ng dùng trong giáo trình chưa
được định nghĩa mt cách chính thng. Vì vy giáo trình này chc không tránh khi nhng khiếm
khuy
ết, rt mong nhn được s góp ý ca các đồng nghip và người đọc.
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
8
Giáo trình: Lý thuyết thông tin.
CHƯƠNG 1: GII THIU
1: Mc tiêu
Sau khi hoàn tt bài hc này bn có th biết:
- Đối tượng nghiên cu,
- Mô hình lý thuyết thông tin theo quan đim Shannon,
- Các khái nim v Lượng tin biết và lượng tin chưa biết,
- Định lý cơ s ca k thut truyn tin,
- Khái nim chung v dung lượng kênh truyn,
- Vn đề sinh mã và gii mã.
Đối tượng nghiên cu
Lý thuyết thng kê v thông tin được xây dng trên hai hướng khác nhau bi hai nhà toán hc
Shannon (1948) và Wiener (1949). Lý thuyết thông tin nghiên cu quá trình x lý tín hiu như
sau:
Đầu vào (input): nhn tín hiu t mt lĩnh vc c th, tc là tín hiu xut hin theo các ký hiu
(symbol) t mt tp hp cho trước và theo phân phi xác sut đã biết.
Tín hiu được truyn đi trên kênh truyn (channel) và có th b nhiu cũng theo mt phân phi
xác sut nào
đó. Kênh truyn có th được hiu dưới hai nghĩa:
Dưới nghĩa vt lý: kênh truyn là mt h thng truyn tín hiu (dây dn, mch, sóng, ...) và gây
nhiu tùy thao cht lượng ca h thng.
Dưới nghĩa toán hc: kênh truyn là các phân phi xác sut xác định trên lp các tín hiu đang xét
đầu nhn tín hiu (output).
đầu ra (output): dng li tín hiu chân tht nht có th có so vi tín hiu
đầu vào.
Shannon xây dng mô hình lý thuyết thông tin trên cơ s gii quyết bài toán: sinh mã độ dài ti
ưu khi nhn tín hiu đầu vào. Tín ti ưu được xét trên 3 yếu t sau:
Phân phi xác sut ca s xut hin ca các tín hiu.
Tính duy nht ca mã và cho phép t điu chnh mã sai nếu có vi độ chính xác cao nht. Gii mã
đồng thi t động điu chnh mã hoc xác định đon mã truyn sai.
Trong khí đó, Wiener li nghiên cu phương pháp x lý tín hiu đầu ra: ước lượng ti ưu chui
tín hiu so vi chính nó khi nhn đầu vào không qua quá trình sinh mã. Như vy phương pháp
Wiener được áp dng trong nhng trường hp con người không kim soát được quá trình truyn
tín hiu. Môn “x lý tín hiu” đã đề cp đến vn đề này.
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
9
Giáo trình: Lý thuyết thông tin.
Mô hình lý thuyết thông tin theo quan đim Shannon
Lý thuyết thông tin được xét đây theo quan đim ca Shannon. Đối tượng nghiên cu là mt h
thng liên lc truyn tin (communication system) như sơ đồ dưới đây:
Gii mã
Kênh Mã hóa
Nhiu
B ch cái
B ch cái
Nhn
Ngun
Din gii:
- Ngun (source) thông tin còn gi là thông báo cn được truyn đầu vào (Input).
- Mã hóa (encode) là b sinh mã. ng vi mt thông báo, b sinh mã s gán cho mt đối
tượng (object) phù hp vi k thut truyn tin. Đối tượng có th là:
o Dãy s ngh phân (Digital) dng: 01010101, cũng ging như mã máy tính.
o Sóng liên tc (Analog) cũng ging như truyn radio.
- Kênh (channel) là phương tin truyn mã ca thông tin.
- Nhiu (noise) được sinh ra do kênh truy
n tin. Tùy vào cht lượng ca kênh truyn mà
nhiu nhiu hay ít.
- Gii mã (decode) đầu ra (output) đưa dãy mã tr v dng thông báo ban đầu vi xác sut
cao nht. Sau đó thông báo s được chuyn cho ni nhn. Trong sơ đồ trên, chúng ta quan
tâm đến 2 khi mã hóa và gii mã trong toàn b môn hc.
Lượng tin biết và chưa biết
Mt biến ngu nhiên (BNN) X luôn mang mt lượng tin nào đó. Nếu X chưa xy ra (hay ta chưa
biết c th thông tin v X) thì lượng tin ca nó là chưa biết, trong trường hp này X có mt lượng
tin chưa biết. Ngược li nếu X đã xy ra (hay ta biết c th thông tin v X) thì lượng tin v biến
ngu nhiên X coi như đã biết hoàn toàn, trong trường hp này X có mt lượng tin đã biết.
Nếu biết thông tin c
a mt BNN X thông qua BNN Y đã xy ra thì ta có th nói: chúng ta ch biết
mt phn lượng thông tin ca X đó trên cơ s biết Y.
Ví d v lượng tin biết và chưa biết
Ta xét ví d v mt người t chc trò chơi may ri khách quan vi vic tung mt đồng tin “có
đầu hình – không có đầu hình”. Nếu người chơi chn mt không có đầu hình thì thng khi kết
qu tung đồng tin là không có đầu hình, nguc li thì thua. Tuy nhiên người t chc chơi có th
ăn gian” bng cách s dng 2 đồng tin “Tht- Gi” khác nhau sau:
+ Đồng tin loi 1 (hay đồng tin tht): đồ
ng cht có 1 mt có đầu hình.
+ Đồng tin loi 2 (hay đồng tin gi ): đồng cht, mi mt đều có 1 đầu hình.
Mc dù người t chc chơi có thăn gian” nhưng quá trình trao đổi 2 đồng tin cho nhau là ngu
nhiêu, vy liu người t chc chơi có thăn gian” hoàn toàn được không? Hay lượng tin biết và
chưa biết ca s kin ly mt đồng tin t 2
đồng tin nói trên được hiu như thế nào?
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
10
Giáo trình: Lý thuyết thông tin.
Ta th xét mt trường hp sau: nếu người chơi ly ngu nhiên 1 đồng tin và sau đó thc hin
vic tung đồng tin ly được 2 ln. Qua 2 ln tung đồng tin, ta đếm được s đầu hình xut hin.
Da vào s đầu hình xut hin, ta có th phán đoán được người t chc chơi đã ly được đồng
tin nào.
Chng h
n: Nếu s đầu hình đếm được sau 2 ln tưng là 1 thì đồng tin đã ly được là đồng tin
tht. Ngược li nếu s đầu hình đếm được là 2 thì đồng tin đã ly được có th là tht hay cũng có
th là gi. Như vy, ta đã nhn được mt phn thông tin v loi đồng tin qua s đầu hình đếm
được sau 2 ln tung. Ta có th tính
được lượng tin đó bng bao nhiêu? (Vic tính lượng tin này s
được tho lun sau). Dưới đây là mt s bng phân phi ca bài toán trên:
Gi BNN X v loi đồng tin (X=1 nếu ly được đồng tin loi 1 và X=1 nếu ly được đồng tin
loi 2 được ly).
Khi đó phân phi ca X có dng:
X 1 2
P 0.5 0.5
Đặt BNN Y là BNN v s đầu hình đếm được sau 2 ln tung. Khi đó ta có th xác định được phân
phi ca Y vi điu kin xy ra ca X trong 2 trường hp sau.
Phân phi ca Y khi biết X=1 có dng:
Y/X=1 0 1 2
P 0.25 0.5 0.25
Phân phi ca Y khi biết X=2 có dng:
Y/X=2 0 1 2
P 0 0 1
Định lý cơ s ca k thut truyn tin
Trong “ A New Basic of Information Theory (1954)”, Feinstein đã đưa ra định lý sau: “Trên mt
kênh truyn có nhiu, người ta luôn có th thc hin mt phương pháp truyn sao cho đạt được sai
s nh hơn sai s cho phép (nh bt k) cho trước đối vi kênh truyn.”
Chúng ta s không chng minh định lý, thay vào đó, chúng ta s tham kho đến các minh ha
gim nhiu trong các ni dung tiếp theo ca bài hc.
Mô t trng thái truyn tin có nhiu
Gi s, mt thông báo được truyn đi trên mt kênh truyn nh phân ri rc. Thông báo cn
truyn được mã hóa thành dãy s nh phân (0,1) và có độ dài được tính theo đơn v bit. Gi s 1
bit truyn trên kênh nhiu vi xác sut 1/4 (hay tính trung bình c truyn 4 bit thì có th nhiu 1
bit).
Ta có sơ đồ trng thái truyn tin sau:
n: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
11
¾ đúng
¾ đúng
Mã hóa Truyn tng bit
0
1
¼
¼
Ngun
0
1
Biên so
Giáo trình: Lý thuyết thông tin.
Minh ha k thut gim nhiu
Trong k thut truyn tin, người ta có th làm gim sai lm khi nhn tin bng cách truyn lp li 1
bit vi s l ln.
Ví d: truyn lp li 3 cho 1 bit cn truyn (xác sut nhiu 1 bit bng 1/4). Khi nhn 3 bit lin
nhau cui kếnh được xem như là 1 bit. Giá tr ca bit này được hiu là 0 (hay 1) nếu bit 0 (bit 1)
có s ln xut hin nhiu hơn trong dãy 3 bit nhn được lin nhau (hay gii mã theo nguyên t
c đa
s). Ta cn chng minh vi phương pháp truyn này thì xác sut truyn sai tht s < 1/4 (xác sut
nhiu cho trước ca kênh truyn).
Sơ đồ truyn tin:
Bit truyn Tuyn lp 3 ln Nhn 3 bit Gii mã
0 000 000 0
000 001 0
000 010 0
000 100 0
000 101 1
000 011 1
000 110 1
000 111 1
1 111 000 0
111 001 0
111 010 0
111 100 0
111 011 1
111 110 1
111 111 1
111 111 1
Tht vy:
Gi s X
i
xác định giá tr đúng hay sai ca bit th i nhn được cui kênh truyn vi X
i
=1 nếu
bit th i nhn được là sai và X
i
=0 nếu bit th i nhn được là đúng. Theo gi thiết ban đầu ca
kênh truyn thì phân phi xác sut ca X
i
có dng Bernoulli b(1/4):
X
i
1 0
P 3/4 1/4
Gi Y ={X
1
+ X
2
+ X
3
} là tng s bit nhn sai sau 3 ln truyn lp cho 1 bit. Trong trường hp
này Y tuân theo phân phi Nh thc B(p,n), vi p=1/4 (xác sut truyn sai mt bit) và q =3/4 (xác
sut truyn đúng 1 bit):
Y ~ B(i,n) hay
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
12
Giáo trình: Lý thuyết thông tin.
inii
n
qpCiYp
== .)(
Trong đó:
)!(!
!
ini
n
i
n
C
=
Vy truyn sai khi Y {2, 3} có xác xut là:
P
sai
= P(y2) = P(Y=2) + P(Y=3) = B(2,3) + B(2,3)
Hay
4
1
64
10
))
4
3
()
4
1
(())
4
3
.()
4
1
(( Psai
033
3
122
3
<=+= CC
(đpcm).
Chi phí phi tr cho k thut gim nhiu
Theo cách thc lp li như trên, ta có th gim sai lm bao nhiêu cũng được (lp càng nhiu thì
sai càng ít), nhưng thi gian truyn cũng tăng lên và chi phí truyn cũng s tăng theo.
Hay ta có th hiu như sau:
Lp càng nhiu ln 1 bit => thi gian truyn càng nhiu => chi phí càng tăng.
Khái nim v dung lượng kênh truyn
Ví d trên cho chúng ta thy cn phi xác định mt thông s cho truyn tin để đảm bo sai s
chp nhn được và đồng thi tc độ truyn cũng không quá chm.
Khái nim “dung lượng” kênh truyn là khái nim rt cơ bn ca lý thuyết truyn tin và là mt đại
lượng vt lý đồng thi cũng là đại lượng toán hc (có đơn v là bit). Nó cho phép xác định tc độ
truyn t
i đa ca mi kênh truyn. Do đó, da vào dung lượng kênh truyn, người ta có th ch ra
tc độ truyn tin đồng thi vi mt phương pháp truyn có sai s cho phép.
Vn đề sinh mã
T k thut truyn tin trên cho ta thy quá trình sinh mã và gii mã được mô t như sau: mt đơn
v thông tin nhn được đầu vào s được gán cho mt ký hiu trong b ký hiu sinh mã. Mt ký
hiu mã được gán n ln lp li (da vào dung lượng ca kênh truyn, ta có th xác định được n).
Thiết b sinh mã (Coding device/ Encoder) s thc hin quá trình sinh mã.
Như vy, mt đơn v thông tin t ngun phát tin s
được thiết b sinh mã gán cho mt dãy n ký
hiu mã. Dãy ký hiu mã ca 1 đơn v thông tin được gi là mt t mã (Code word). Trong trường
hp tng quát, người ta có th gán mt khi ký t mã cho mt khi thông tin nào đó và được gi
là mt t mã.
Vn đề gii mã
cui kênh truyn, mt thiết b gii mã (Decoding device/ Decoder) s thc hin quá trình ngược
li như sau: kim tra dãy ký hiu mã để quyết định gii mã v mt t mã và đưa nó v dng khi
tin ban đầu.
Ví d:
Khi tin ban đầu : 01010101
Khi ký hiu mã đầu truyn (lp 3 ln): 000111000111000111000111.
Khi ký hiu mã đầu nhn : 001110100111011001000111
Khi tin nhn được cui cùng : 01011001 (sai 2 bit so vi kh
i tin ban đầu)
Do đó làm sao để đua khi tin nhn được v khi tin ban đầu 01010101, đây chính là công vic
ca b gii mã (Decoder).
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
13
Giáo trình: Lý thuyết thông tin.
Mt vn đề quan trng cn lưu ý là phi đồng b gia tc độ np thông tin (phát tín hiu) vi tc
độ truyn tin. Nếu tc độ np thông tin bng hoc ln hơn so vi tc độ truyn tin ca kênh, thì
cn phi gim tc độ np thông tin sao cho nh hơn tc độ truyn tin.
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
14
Giáo trình: Lý thuyết thông tin.
CHƯƠNG 2: ĐỘ ĐO LƯỢNG TIN
Mc tiêu: trình bày các khái nim v độ đo lượng tin chưa biết và đã biết v mt biến ngu nhiên
X. Tính toán các lượng tin này thông qua định nghĩa và các tính cht ca Entropy t mt hay
nhiu biến ngu nhiên.
BÀI 2.1: ENTROPY
Mc tiêu
Sau khi hoàn tt bài hc này bn có th:
- Hiu được các khái nim Entropy,
- Biết Entropy ca mt s kin và Entropy ca mt phân phi,
- Hiu Định lý dng gii tích ca Entropy,
- Biết Bài toán v cây tìm kiếm nh phân và
- Làm kiến thc cơ s để hiu và hc tt các bài hc tiếp theo.
Ví d v entropy
Trước hết, ta cn tìm hiu mt ví d v khái nim độ do ca mt lượng tin da vào các s kin
hay các phân phi xác sut ngu nhiên như sau:
Xét 2 BNN X và Y có phân phi sau:
X={1, 2, 3, 4, 5} có phân phi đều hay p(X=i) = 1/5.
Y={1, 2} cũng có phân phi đều hay p(Y=i) = 1/2.
Bn thân X và Y đều mang mt lượng tin và thông tin v X và Y chưa biết do chúng là ngu
nhiên. Do đó, X hay Y đều có mt lượng tin không chc chn và lượng tin chc chn, tng ca 2
lượng tin này là không đổi và th
c tế nó bng bao nhiêu thì ta chưa th biết. Lượng tin không chc
chn ca X (hay Y) được gi là Entropy.
Tuy nhiên, nếu X và Y có tương quan nhau thì X cũng có mt phn lượng tin không chc chn
thông qua lượng tin đã biết ca Y (hay thông tin v Y đã được biết). Trong trường hp này, mt
phn lượng tin không chc chn ca thông qua lượng tin đã biết ca Y được gi là Entropy có
điu kin.
Nhn xét v độ đo lượng tin
Rõ ràng, ta cn phi xây dng mt đại lượng toán hc rt c th để có th đo được lượng tin chưa
biết t mt biến ngu nhiên. Mt cách trc quan, lượng tin đó phi th hin được các vn đề sau:
Mt s kin có xác sut càng nh thì s kin đó ít xy ra, cũng có nghĩa là tính không chc chn
càng ln. Nếu đo lượng tin c
a nó thì nó cho mt lượng tin không biết càng ln.
Mt tp hp các s kin ngu nhiên (hay Biến ngu nhiên) càng nhiu s kin có phân phi càng
đều thì tính không chc chn càng ln. Nếu đo lượng tin ca nó thì s được lượng tin không biết
càng ln. Hay lượng tin chc chn càng nh.
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
15
Giáo trình: Lý thuyết thông tin.
Mt phân phi xác sut càng lch nhiu (có xác xut rt nh và rt ln) thì tính không chc chn
càng ít và do đó s có mt lượng tin chưa biết càng nh so vi phân phi xác sut đều hay lượng
tin chc chn ca nó càng cao.
Khái nim entropy
Trong tiếng vit ta chưa có t tương đương vi t Entropy, tuy nhiên chúng ta có th tm hiu
hiu thoáng qua trước khi đi vào định nghĩa chc ch v mt toán hc ca Entropy như sau:
Entropy là mt đại lượng toán hc dùng để đo lượng tin không chc (hay lượng ngu nhiên) ca
mt s kin hay ca phân phi ngu nhiên cho trước. Hay mt s tài liu tiếng anh gi là
Uncertainty Measure.
Entropy ca mt s kin
Gi s có mt s kin A có xác sut xut hin là p. Khi đó, ta nói A có mt lượng không chc
chn được đo bi hàm s h(p) vi p [0,1]. Hàm h(p) được gi là Entropy nếu nó tho 2 tiêu đề
toán hc sau:
Tiên đề 01: h(p) là hàm liên tc không âm và đơn điu gim.
Tiên đề 02: nếu A và B là hai s kin độc lp nhau, có xác sut xut hin ln lượt là p
A
và p
B
. Khi
đó, p(A,B) = p
A
.p
B
nhưng h(A,B) = h(p
A
) + h(p
B
).
Entropy ca mt phân phi
Xét biến ngu nhiên X có phân phi:
X x
1
x
2
x
3
… x
M
P p
1
p
2
p
3
… p
M
Nếu gi A
i
là s kin X=x
i
, (i=1,2,3,..) thì Entropy ca A
i
là: h(A
i
)= h(p
i
)
Gi Y=h(X) là hàm ngu nhiên ca X và nhn các giá tr là dãy các Entropy ca các s kin X=x
i
,
tc là Y=h(X)={h(p
1
), h(p
2
), …, h(p
n
)}.
Vy, Entropy ca X chính là k vng toán hc ca Y=h(X) có dng:
H(X)=H(p
1
, p
2
, p
3
, …,p
n
) = p
1
h(p
1
)+ p
2
h(p
2
)+…+p
n
h(p
n
).
Tng quát:
)()(
1
i
n
i
i
phpXH
=
=
Định lý dng gii tích ca Entropy
Định lý: Hàm H(X) = H(p
1
, p
2
,...,p
M
)
)log(
1
i
M
i
i
ppC
=
=
C = const >0
Cơ s logarithm là bt k.
B đề: h(p)=-Clog(p).
Trường hp C=1 và cơ s logarithm = 2 thì đơn v tính là bit.
Khi đó: h(p)=-log
2
(p) (đvt: bit) và
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
16
Giáo trình: Lý thuyết thông tin.
)(log )p,...,p ,H(p H(X)
2
1
M21 i
M
i
i
pp
=
==
Qui ước trong cách viết: log(p
i
)= log
2
(p
i
)
Ví d minh ha
Nếu s kin A có xác sut xut hin là 1/2 thì h(A)=h(1/2)= -log(1/2) = 1 (bit)
Xét BNN X có phân phi sau:
X x
1
x
2
x
3
P 1/2 1/4 1/4
H(X) = H(1/2, 1/4, 1/4) = -(1/2log(1/2)+1/4log(1/4)+1/4log(1/4)) =3/2 (bit)
Bài toán v cây tìm kiếm nh phân-Đặt vn đề
Gi s, tìm 1 trong 5 người có tên biết trước s xut hin theo phân phi sau:
X x
1
x
2
x
3
x
4
x
5
P 0,2 0,3 0,2 0,15 0,15
Trong đó: x
1
, …x
5
ln lượt là tên ca 5 người mà ta cn nhn ra vi cách xác định tên bng câu
hi đúng sai (yes/no).
Sơ đồ dưới đây minh ha cách xác định tên ca mt người:
x
1
X=x
1
/x
2
?
Yes
X=x
3
?
No
No
Yes
X=x
1
?
Yes
x
2
x
3
x
4
X=x
4
?
No
Yes
No
x
5
Bài toán v cây tìm kiếm nh phân - Din gii
Theo sơ đồ trên:
Để tìm x
1
, x
2
, x
3
vi
xác sut tương ng là 0.2, 0.3, 0.2 ta ch cn tn 2 câu hi.
Để tìm x
4
, x
5
vi xác sut tương ng 0.15, 0.15 thì ta cn 3 câu hi.
Vy:
S câu hi trung bình là: 2 x (0,2+0,3+0,2) + 3 x (0,15+0,15) = 2.3
Mt khác: Entropy ca X: H(X)= H(0.2, 0.3, 0.2, 0.15, 0.15)=2.27.
Ta luôn có s câu hi trung bình luôn H(X) (theo định lý Shannon s trình bày sau). Vì s câu
hi trung bình trong trường hp này xp s H(X) nên đây là s câu hi trung bình ti ưu để tìm ra
tên chính xác ca mt người. Do đó, sơ đồ tìm kiếm trên là sơ đồ ti ưu.
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
17
Giáo trình: Lý thuyết thông tin.
Sinh viên t cho thêm 1 hay 2 sơ đồ tìm kiếm khác và t din gii tương t - xem như bài tp.
Bài tp
Tính H(X) vi phân phi sau:
X x
1
x
2
x
3
P 1/3 1/3 1/3
Tính H(Y) vi phân phi sau:
Y x
1
x
2
x
3
x
4
P 1/6 2/6 1/6 2/6
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
18
Giáo trình: Lý thuyết thông tin.
BÀI 2.2: CÁC TÍNH CHT CA ENTROPY
Mc tiêu:
Sau khi hoàn tt bài hc này bn có th:
- Hiu các tính cht cơ bn ca Entropy,
- Hiu định lý cc đại ca Entropy,
- Vn dng gii mt s bài toán v Entropy,
- Làm cơ s để vn dng gii quyết các bài toán tính dung lượng kênh truyn.
Các tính cht cơ bn ca Entropy
Xét biến ngu nhiên X = {x
1
, x
2
, …, x
M
}. Entropy ca biến ngu nhiên X có các tính cht:
1. Hàm s f(M) = H(
M
1
,…,
M
1
) đơn điu tăng.
2. Hàm s f(ML) = f(M)+f(L).
3. H(p
1
, p
2
, …, p
M
) = H(p
1
+ p
2
+…+p
r
, p
r+1
+ p
r+2
+…+ p
M
)
),...,()Hp p (p
11
1
r21
==
++++
r
i
i
r
r
i
i
p
p
p
p
),...,()Hp p (p
11
1
M2r1r
+=+=
+
++
++++
M
ri
i
M
M
ri
i
r
p
p
p
p
4. H(p, 1-p) là hàm liên tc theo P.
Minh ha tính cht 1 và 2
Minh ha tính cht 1:
Trong trường hp biến ngu nhiên X có phân phi đều
Entropy ca X như sau :
MM
M
MMMMMmMMM
HXH
1
log
11
log
1
,...,
1
log
11
log
11
,,
1
,
1
)( ==
= L
=> H(X)
M
M
log
1
log ==
là hàm đơn điu tăng
Minh ha tính cht 2:
Trong trường hp 2 biến ngu nhiên X, Y độc lp có phân phi đều vi BNN X có M s
kin và BNN Y có L s kin.
Gi f(M), f(L) ln lượt là Entropy ca X, ca Y. Theo tính cht 2 ca Entropy ta có
f(ML)=f(M)+f(L)
Minh ha tính cht 3 và 4
Minh ha tính cht 3:
Xét con xúc sc có 6 mt vi xác sut xut hin các mt được cho trong bng sau:
X x
1
x
2
x
3
x
4
x
5
x
6
P 10% 20% 25% 25% 15% 5%
Ta có th gom các s kin x
1
, x
2
, x
3
li thành mt s kin mi là x
123
có xác sut xut hin
là 55%, gom s kin x
5
và x
6
li thành s kin x
56
có xác sut 20%.
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
19
Giáo trình: Lý thuyết thông tin.
Ta được mt nhiến ngu nhiên mi X
*
có phân phi sau:
X
*
x
123
x
4
X
56
P 55% 25% 20%
Đến đây các bn có th áp dng công thc để tính, so sánh các Entropy và nhn xét tính
cht 3. Phn này xem như bài tp cho sinh viên.
Minh ha tính cht 4:
Để hiu tính cht th 4, ta xét dng đồ th ca hàm s H(p, 1-p ):
Rõ ràng H(p, 1-p) là mt hàm liên tc theo p.
Định lý cc đại ca entropy
Định lý: H(p
1
, p
2
, …,p
M
) log(M)
Trong đó: đẳng thc xy ra khi và ch khi p
1
=…= p
M
= 1/M
B đề: cho 2 b {p
1
, p
2
, …,p
M
} và {q
1
, q
2
,…,q
M
} là các b s dương bt k
==
=
M
i
i
M
i
i
qp
11
Khi đó, ta có H(p
1
, p
2
, …,p
M
)= (*)
i
M
i
i
M
i
ii
qppp
==
1
2
1
2
loglog
Đẳng thc xy ra khi p
i
=q
i
vi i=1,..,M.
Chng minh định lý cc đại ca Entropy
Chng minh b đề:
Theo toán hc ta luôn có th chng minh được ln(x) x-1 vi x>0 và đẳng thc đúng khi x=1.
Đặt x= q
i
/p
i
Suy ra ln(q
i
/p
i
) q
i
/p
i
–1 (và đẳng thc đúng khi q
i
=p
i
vi mi i).
011)(ln
11
==
==
ii
M
i
M
i
i
i
i
pq
p
q
p
(đẳng thc xy ra khi q
i
M
i
i
M
i
ii
qppp
==
11
lnln
i
=p
i
). (1)
Theo toán hc ta có lnx = log
2
x / log
2
e (2)
T (1) và (2), ta có
(đẳng thc xy ra khi q
i
M
i
i
M
i
ii
qppp
==
11
loglog
i
=p
i
.)
Chng minh định lý:
Đặt q
i
i
M
,
1
T b đề, ta có:
===
==
M
i
i
M
i
i
M
i
ii
MpM
M
ppp
1
22
1
2
1
2
loglog
1
loglog
Biên son: TS. L ê Quy ết Thng, ThS. Phan Tn Tài & Ks. Dương Văn Hiếu.
20
| 1/95

Preview text:

Giáo trình: Lý thuyết thông tin. MỤC LỤC
GIỚI THIỆU TỔNG QUAN.............................................................................................................6
1. MỤC ĐÍCH ...........................................................................................................................6
2. YÊU CẦU .............................................................................................................................6
3. NỘI DUNG CỐT LÕI...........................................................................................................7
4. KẾT THỨC TIÊN QUYẾT ..................................................................................................7
5. TÀI LIỆU THAM KHẢO.....................................................................................................8
6. PHƯƠNG PHÁP HỌC TẬP.................................................................................................8
CHƯƠNG 1: GIỚI THIỆU ...............................................................................................................9
1. Mục tiêu.................................................................................................................................9
2. Đối tượng nghiên cứu............................................................................................................9
3. Mô hình lý thuyết thông tin theo quan điểm Shannon ........................................................10
4. Lượng tin biết và chưa biết .................................................................................................10
5. Ví dụ về lượng tin biết và chưa biết ....................................................................................10
6. Định lý cơ sở của kỹ thuật truyền tin ..................................................................................11
7. Mô tả trạng thái truyền tin có nhiễu ....................................................................................11
8. Minh họa kỹ thuật giảm nhiễu.............................................................................................12
9. Chi phí phải trả cho kỹ thuật giảm nhiễu ............................................................................13 10.
Khái niệm về dung lượng kênh truyền ............................................................................13 11.
Vấn đề sinh mã ................................................................................................................13 12.
Vấn đề giải mã.................................................................................................................13
CHƯƠNG 2: ĐỘ ĐO LƯỢNG TIN ...............................................................................................15
BÀI 2.1: ENTROPY .......................................................................................................................15
1. Mục tiêu...............................................................................................................................15
2. Ví dụ về entropy..................................................................................................................15
3. Nhận xét về độ đo lượng tin................................................................................................15
4. Khái niệm entropy...............................................................................................................16
5. Entropy của một sự kiện......................................................................................................16
6. Entropy của một phân phối .................................................................................................16
7. Định lý dạng giải tích của Entropy......................................................................................16
8. Ví dụ minh họa....................................................................................................................17
9. Bài toán về cây tìm kiếm nhị phân-Đặt vấn đề ...................................................................17 10.
Bài toán về cây tìm kiếm nhị phân - Diễn giải................................................................17 11.
Bài tập .............................................................................................................................18
BÀI 2.2: CÁC TÍNH CHẤT CỦA ENTROPY .............................................................................19
1. Mục tiêu: .............................................................................................................................19
2. Các tính chất cơ bản của Entropy........................................................................................19
3. Minh họa tính chất 1 và 2....................................................................................................19
4. Minh họa tính chất 3 và 4....................................................................................................19
5. Định lý cực đại của entropy ................................................................................................20
6. Chứng minh định lý cực đại của Entropy............................................................................20
7. Bài tập .................................................................................................................................21
BÀI 2.3: ENTROPY CỦA NHIỀU BIẾN .....................................................................................22
1. Mục tiêu...............................................................................................................................22
2. Định nghĩa Entropy của nhiều biến.....................................................................................22
3. Ví dụ Entropy của nhiều biến..............................................................................................22
4. Định nghĩa Entropy có điều kiện.........................................................................................22
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 1
Giáo trình: Lý thuyết thông tin.
5. Ví dụ Entropy có điều kiện .................................................................................................23
6. Quan hệ giữa H(X,Y) với H(X) và H(Y) khi X, Y độc lập.................................................23
7. Quan hệ giữa H(X,Y) với H(X) và H(Y) khi X, Y tương quan ..........................................24
8. Bài tập .................................................................................................................................25
BÀI 2.4: MINH HỌA CÁC ENTROPY........................................................................................26
1. Mục tiêu...............................................................................................................................26
2. Yêu cầu của bài toán ...........................................................................................................26
3. Xác định các phân phối ngẫu nhiên của bài toán ................................................................26
4. Minh họa Entropy H(X), H(Y) và H(X,Y)..........................................................................27
5. Minh họa Entropy H(X/Y) và H(Y/X)................................................................................27
6. Minh họa quan hệ giữa các Entropy....................................................................................27
BAI 2.5: ĐO LƯỢNG TIN (MESURE OF INFORMATION) ......................................................28
1. Mục tiêu...............................................................................................................................28
2. Đặt vấn đề bài toán..............................................................................................................28
3. Xác định các phân phối của bài toán...................................................................................28
4. Nhận xét dựa theo entropy ..................................................................................................28
5. Định nghĩa lượng tin ...........................................................................................................29
6. Bài tập .................................................................................................................................29
CHƯƠNG 3: SINH MÃ TÁCH ĐƯỢC (Decypherable Coding)...................................................31
BÀI 3.1: KHÁI NIỆM VỀ MÃ TÁCH ĐƯỢC..............................................................................31
1. Mục tiêu...............................................................................................................................31
2. Đặt vấn đề bài toán sinh mã ................................................................................................31
3. Khái niệm về bảng mã không tách được .............................................................................32
4. Bảng mã tách được..............................................................................................................32
5. Khái niệm bảng mã tức thời ................................................................................................33
6. Giải thuật kiểm tra tính tách được của bảng mã..................................................................33
7. Bài toán 1- yêu cầu..............................................................................................................33
8. Bài toán 1 - Áp dụng giải thuật ...........................................................................................34
9. Bài toán 2 ............................................................................................................................34 10.
Bài tập .............................................................................................................................35
BÀI 3.2: QUAN HỆ GIỮA MÃ TÁCH ĐƯỢC VÀ ĐỘ DÀI MÃ................................................36
1. Mục tiêu...............................................................................................................................36
2. Định lý Kraftn(1949)...........................................................................................................36
3. Định nghĩa cây bậc D cỡ k. .................................................................................................36
4. Vấn đề sinh mã cho cây bậc D cỡ k ....................................................................................37
5. Chứng minh định lý Kraft (Điều kiện cần) .........................................................................37
6. Chứng minh định lý Kraft (Điều kiện đủ)...........................................................................38
7. Ví dụ minh họa định lý Kraft ..............................................................................................38
8. Bài tập .................................................................................................................................39
BÀI 3.3: TÍNH TỐI ƯU CỦA ĐỘ DÀI MÃ..................................................................................40
1. Mục tiêu...............................................................................................................................40
2. Định lý Shannon (1948) ......................................................................................................40
3. Bảng mã tối ưu tuyệt đối .....................................................................................................40
4. Bảng mã tối ưu tương đối....................................................................................................41
5. Điều kiện nhận biết một bảng mã tối ưu .............................................................................41
6. Định lý Huffman .................................................................................................................41
7. Phương pháp sinh mã Huffman...........................................................................................42
8. Minh họa phương pháp sinh mã Huffman ..........................................................................42
9. Nhận xét tính tối ưu của bảng mã Huffman ........................................................................43 10.
Bài tập .............................................................................................................................43
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 2
Giáo trình: Lý thuyết thông tin.
CHƯƠNG 4: KÊNH TRUYỀN ......................................................................................................45
BÀI 4.1: KÊNH TRUYỀN RỜI RẠC KHÔNG NHỚ ...................................................................45
1. Mục tiêu...............................................................................................................................45
2. Giới thiệu.............................................................................................................................45
3. Mô hình vật lý .....................................................................................................................45
4. Mô hình toán học.................................................................................................................46
5. Ví dụ xác định phân phối đầu nhận.....................................................................................47
6. Lượng tin trên kênh truyền..................................................................................................47
7. Định nghĩa dung lượng kênh truyền....................................................................................48
BAI 4.2: CÁC DẠNG KÊNH TRUYỀN........................................................................................49
1. Mục tiêu...............................................................................................................................49
2. Hiểu định lý về dung lượng kênh truyền,Kênh truyền không mất tin.................................49
3. Kênh truyền xác định ..........................................................................................................49
4. Kênh truyền không nhiễu ....................................................................................................50
5. Kênh truyền không sử dụng được. ......................................................................................50
6. Kênh truyền đối xứng..........................................................................................................50
7. Xây dựng công thức tính dung lượng kênh truyền đối xứng ..............................................51
8. Định lý về dung lượng kênh truyền.....................................................................................52
9. Bài tập .................................................................................................................................52
BÀI 4.3: LƯỢC ĐỒ GIẢI MÃ .......................................................................................................53
1. Mục tiêu...............................................................................................................................53
2. Đặt vấn đề bài toán giải mã.................................................................................................53
3. Ví dụ bài toán giải mã .........................................................................................................53
4. Các khái niệm cơ bản của kỹ thuật truyền tin .....................................................................54
5. Ví dụ minh họa các khái niệm cơ bản .................................................................................54
6. Các dạng sai số cơ bản ........................................................................................................55
7. Phương pháp xây dựng lượt đồ giải mã tối ưu....................................................................55
8. Minh họa xây dựng lược đồ giải mã tối ưu .........................................................................56
9. Minh họa cách tính các sai số..............................................................................................57 10.
Bài tập 1 ..........................................................................................................................58 11.
Bài Tập 2 .........................................................................................................................58
CHƯƠNG 5: SỬA LỖI...................................................................................................................59
BÀI 5.1: NGUYÊN LÝ KHOẢNG CÁCH NHỎ NHẤT HAMMING .........................................59
1. Mục tiêu: .............................................................................................................................59
2. Khoảng cách Hamming .......................................................................................................59
3. Kênh truyền đối xứng nhị phân và lược đồ giải mã tối ưu..................................................59
4. Ví dụ kênh truyền đối xứng nhị phân..................................................................................60
5. Quan hệ giữa xác suất giải mã và khoảng cách Hamming..................................................60
6. Nguyên lý Hamming ...........................................................................................................60
7. Bài tập .................................................................................................................................61
BÀI 5.2: BỔ ĐỀ VỀ TỰ SỬA LỖI VÀ CẬN HAMMING ...........................................................62
1. Mục tiêu...............................................................................................................................62
2. Bổ đề về tự sửa lỗi...............................................................................................................62
3. Chứng minh và minh họa bổ đề ..........................................................................................62
4. Cận Hamming. ....................................................................................................................63
5. Phân các dạng lỗi.................................................................................................................64
6. Bài tập .................................................................................................................................64
BÀI 5.3: MÃ KIỂM TRA CHẴN LẺ .............................................................................................64
1. Mục tiêu: .............................................................................................................................64
2. Bộ mã kiểm tra chẵn lẻ........................................................................................................65
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 3
Giáo trình: Lý thuyết thông tin.
3. Phương pháp kiểm tra chẵn lẻ .............................................................................................65
4. Phương pháp sinh mã kiểm tra chẵn lẻ ...............................................................................66
5. Ví dụ sinh mã kiểm tra chẵn lẻ............................................................................................66
6. Định lý quan hệ giữa độ dài mã n, số bit kiểm tra m và số lỗi tự sửa e ..............................67
7. Ví dụ tìm m nhỏ nhất từ n và e...........................................................................................68
8. Ví dụ tìm e lớn nhất từ m và n.............................................................................................68
9. Bài tập .................................................................................................................................68
BÀI 5.4: NHÓM CỘNG TÍNH VÀ BỘ TỪ MÃ CHẴN LẺ .........................................................69
1. Mục tiêu...............................................................................................................................69
2. Khái niệm nhóm cộng tính. .................................................................................................69
3. Tính chất của bộ mã chẵn lẻ................................................................................................69
4. Ví dụ minh họa....................................................................................................................70
5. Phương pháp sinh mã kiểm tra chẵn lẻ nhanh.....................................................................71
6. Ví dụ sinh mã kiểm tra chẵn lẻ nhanh.................................................................................71
7. Bài tập .................................................................................................................................72
BÀI 5.5: LƯỢC ĐỒ SỬA LỖI TỐI ƯU.........................................................................................73
1. Mục tiêu...............................................................................................................................73
2. Đặt vấn đề............................................................................................................................73
3. Định nghĩa Hiệp hợp ...........................................................................................................73
4. Lược đồ sửa lỗi theo các hiệp hợp ......................................................................................74
5. Lược đồ sửa lỗi thong qua bộ lỗi.........................................................................................74
6. Ví dụ minh họa lược đồ sửa lỗi 1 bit...................................................................................74
7. Ví dụ minh họa lược đồ sửa lỗi 2 bit...................................................................................75
8. Ví dụ minh họa lược đồ sửa lỗi 3 bit...................................................................................76
9. Xác suất truyền đúng...........................................................................................................76 10.
Bài tập .............................................................................................................................76
BÀI 5.6: MÃ HAMMING ..............................................................................................................76
1. Mục tiêu...............................................................................................................................76
2. Mã Hammin.........................................................................................................................77
3. Tính chất..............................................................................................................................77
4. Ví dụ minh họa....................................................................................................................77
5. Bài tập .................................................................................................................................78
BÀI 5.7: THANH GHI LÙI TỪNG BƯỚC ...................................................................................79
1. Mục tiêu...............................................................................................................................79
2. Đặt vấn đề............................................................................................................................79
3. Biểu diễn vật lý của thanh ghi.............................................................................................79
4. Biểu diễn toán học của thanh ghi ........................................................................................80
5. Ví dụ thanh ghi lui từng bước .............................................................................................80
6. Chu kỳ của thanh ghi...........................................................................................................81
7. Ví dụ tìm chu kỳ của thanh ghi ...........................................................................................81
8. Bài tập .................................................................................................................................82
BÀI 5.8: MÃ XOAY VÒNG ..........................................................................................................82
1. Mục tiêu...............................................................................................................................82
2. Ma trận kiểm tra chẵn lẻ mã xoay vòng ..............................................................................83
3. Định nghĩa mã xoay vòng ...................................................................................................83
4. Phương pháp sinh nhanh bộ mã xoay vòng.........................................................................83
5. Ví dụ sinh nhanh bộ mã xoay vòng.....................................................................................84
6. Bài tập .................................................................................................................................85
BÀI 5.9: ĐA THỨC ĐẶC TRƯNG CỦA THANH GHI ...............................................................86
1. Mục tiêu...............................................................................................................................86
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 4
Giáo trình: Lý thuyết thông tin.
2. Định nghĩa đa thức đặc trưng của thanh ghi .......................................................................86
3. Quan hệ giữa chu kỳ n, đa thức đăc trưng và đa thức (xn + 1)............................................86
4. Thủ tục sinh thanh ghi lùi từng bước ..................................................................................87
5. Ví dụ minh họa....................................................................................................................87
6. Bài tập .................................................................................................................................87
Bài 5.10: PHƯƠNG PHÁP SINH MÃ XOAY VÒNG ..................................................................88
1. Mục tiêu...............................................................................................................................88
2. Đặt vấn đề............................................................................................................................88
3. Phương pháp sinh bảng mã xoay vòng................................................................................88
4. Ví dụ minh họa 1.................................................................................................................89
5. Ví dụ minh họa 2.................................................................................................................89
6. Ví dụ minh họa 3.................................................................................................................90
7. Bảng liệt kê một số đa thức đặc trưng.................................................................................90
8. Bài tập .................................................................................................................................90
BÀI TẬP TỔNG HỢP ....................................................................................................................91
1. Mục tiêu...............................................................................................................................91
2. Bài 1 ....................................................................................................................................91
3. Bài 2 ....................................................................................................................................91
4. Bài 3 ....................................................................................................................................92
5. Bài 4 ....................................................................................................................................93
TÀI LIỆU THAM KHẢO...............................................................................................................95
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 5
Giáo trình: Lý thuyết thông tin.
GIỚI THIỆU TỔNG QUAN
GIÁO TRÌNH LÝ THUYẾT THÔNG TIN MỤC ĐÍCH
Giáo trình này sẽ cung cấp cho người đọc những khối kiến thức cơ bản của lý thuyết thông tin
như: Độ do lượng tin (Measure of Information), Sinh mã tách được (Decypherable Coding),
Kênh truyền tin rời rạc không nhớ (Discrete Memoryless Channel) và Sửa lỗi trên kênh truyền (Error Correcting Codings).
Liên quan đến Độ đo lượng tin, giáo trình sẽ trình bày các khái niệm cơ bản về thông tin,
entropy, một số công thức, tính chất, các định lý quan trọng của entropy và cách tính lượng tin.
Về Sinh mã tách được, giáo trình sẽ giới thiệu đến người học các vấn đề về yêu cầu của
bài toán sinh mã, giải mã duy nhất, cũng như mã tức thời và giải thuật kiểm tra mã tách
được. Các định lý quan trọng được đề cập trong nội dung này là: Định lý Kraft (1949),
Định lý Shannon (1948) và Định lý sinh mã Huffman.
Về kênh truyền tin rời rạc không nhớ, giáo trình sẽ giới thiệu mô hình kênh truyền theo
2 khía cạnh vật lý và toán học. Các khái niệm về dung lượng kênh truyền, phân lớp kênh
truyền, định lý về dung lượng kênh truyền, cũng như các khái niệm trong kỹ thuật truyền
tin và phương pháp xây dựng lược đồ giải mã tối ưu cũng được trình bày trong môn học này.
Vấn đề Sửa lỗi (hay xử lý mã sai) trên kênh truyền là một vấn đề rất quan trọng và
được quan tâm nhiều trong môn học này. Các nội dung được giới thiệu đến các bạn sẽ là
Nguyên lý Khoảng cách Hamming, các định lý về Cận Hamming, phương pháp kiểm tra
chẵn lẻ, các lược đồ sửa lỗi, Bảng mã Hamming và Bảng mã xoay vòng.
Hơn nữa, hầu hết các vấn đề nêu trên đều được đưa vào nội dung giảng dạy ở các bậc Đại học
của một số ngành trong đó có ngành Công nghệ thông tin. Do đó, để có một tài liệu phục vụ
công tác giảng dạy của giáo viên cũng như việc học tập và nghiên cứu của sinh viên, chúng tôi
mạnh dạn biên soạn giáo trình này nhằm giúp cho sinh viên có một tài liệu tự học và nghiên
cứu một cách hiệu quả. YÊU CẦU
Sau khi học xong môn này, sinh viên phải có được những khả năng sau:
• Hiểu các khái niệm về về thông tin, Entropy, Entropy của một phân phối, Entropy của
nhiều phân phối, Entropy có điều kiện, Độ đo lượng tin. Vận dụng giải quyết các bài toán
về xác định lượng tin.
• Biết khái niệm về mã tách được, mã không tách được, bảng mã tối ưu. Hiểu Định lý Kraft
(1949), Định lý Shannon (1948), Định lý sinh mã Huffman và phương pháp sinh mã
Huffman. Vận dụng để sinh bảng mã tách được tối ưu, nhận biết được bảng mã như thế
nào là bảng mã tối ưu và có thể vận dụng để viết các chương trình sinh mã, giải mã (hay
viết chương trình nén và giải nén). Từ đây, các sinh viên có thể tự nghiên cứu các loại
bảng mã khác để vận dụng cho việc mã hóa và bảo mật thông tin một cách hiệu quả.
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 6
Giáo trình: Lý thuyết thông tin.
• Biết các khái niệm về kênh truyền tin rời rạc không nhớ, dung lượng kênh truyền và phân
lớp kênh truyền. Hiểu định lý về dung lượng kênh truyền, phương pháp xây dựng lược đồ
giải mã tối ưu và cách tính xác suất truyền sai trên kênh truyền.
• Biết các khái niệm về khoảng cách Hamming, nguyên lý khoảng cách Hamming, các định
lý về Cận Hamming, phương pháp kiểm tra chẵn lẻ, các lược đồ sửa lỗi, Bảng mã
Hamming và Bảng mã xoay vòng.
• Vận dụng các kiến thức học được để thiết kế một hệ thống truyền nhận dữ liệu với quy
trình cơ bản: mã hóa, giải mã và bảo mật thông tin.
Lý thuyết thông tin cũng là một trong các môn học khó của ngành Công nghệ thông tin vì nó
đòi hỏi người học phải có kiến thức cơ bản về toán và xác suất thống kê. Do đó, đòi hỏi người
học phải tự bổ sung các kiến thức cơ bản về toán và xác suất thống kê cho mình (nếu thiếu),
tham gia lớp học đầy đủ và làm các bài tập theo yêu cầu của môn học thì mới tiếp thu kiến
thức môn học một cách hiệu quả. NỘI DUNG CỐT LÕI
Giáo trình gồm 5 chương được trình bày trong 45 tiết giảng cho sinh viên chuyên ngành Công
nghệ thông tin, trong đó có khoảng 30 tiết lý thuyết và 15 tiết bài tập mà giáo viên sẽ hướng dẫn cho sinh viên trên lớp.
Chương 1: Giới thiệu. Chương này trình bày các nội dung có tính tổng quan về môn học bao
gồm: các đối tượng nghiên cứu, mô hình lý thuyết thông tin theo quan điểm của nhà toán học
Shannon, khái niệm về lượng tin biết và chưa biết, định lý cơ bản của kỹ thuật truyền tin.

Chương 2: Độ đo lượng tin. Chương này trình bày các vấn đề cơ bản về entropy, các tính chất
của entropy, entropy của nhiều biến, entropy có điều kiện, các định lý về quan hệ giữa các
entropy và lượng tin của một sự kiện.

Chương 3: Sinh mã tách được. Nội dung chính của chương này bao gồm các khái niệm về mã
tách được, quan hệ giữa mã tách được và độ dài mã, tính tối ưu của độ dài mã.

Chương 4: Kênh truyền. Các nội dung được trình bày trong chương này bao gồm khái niệm về
kênh truyền tin rời rạc không nhớ, các mô hình truyền tin ở khía cạnh vật lý và toán học, dung
lượng trên kênh truyền, phân lớp các kênh truyền. Phương pháp xây dựng lược đồ giải mã tối ưu
và cách tính xác suất truyền sai cũng được giới thiệu trong chương này.

Chương 5: Sửa lỗi. Chương này trình bày các nội dung cốt lõi sau: khái niệm về khoảng cách
Hamming, nguyên lý khoảng cách nhỏ nhất Hamming, bổ đề về tự sửa lỗi và định lý Cận
Hamming. Chương này cũng giới thiệu về bộ mã kiểm tra chẵn lẻ, phương pháp kiểm tra chẵn lẻ,
lược đồ sửa lỗi tối ưu, mã Hamming và mã xoay vòng.

KẾT THỨC TIÊN QUYẾT
Để học tốt môn học này, đòi hỏi sinh viên phải nắm vững các môn học có liên quan như: xác suất
thống kê, đại số boole (phép toán Modulo 2 và đa thức nhị phân). Các môn học có liên quan và có
thể tham kháo thêm như kỷ thuật số, hệ điều hành, mạng máy tính.
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 7
Giáo trình: Lý thuyết thông tin.
TÀI LIỆU THAM KHẢO
1. David J.C. Mackey, Information Theory, Infernce, and Learning Algorithms, CamBridge University Express-2003.
2. G.J.ChaiTin, Algorithmic Information Theory, CamBridge University Express-1992.
3. Sanford Goldman, Information Theory.
4. http://www.inference.phy.cam.ac.uk/mackay/info-theory/course.html.
5. http://en.wikipedia.org/wiki/Information_theory.
6. http://www-2.cs.cmu.edu/~dst/Tutorials/Info-Theory/.
7. http://cscs.umich.edu/~crshalizi/notebooks/information-theory.html.
8. http://www.lecb.ncifcrf.gov/~toms/paper/primer/primer.pdf.
9. http://www.cs.ucl.ac.uk/staff/S.Bhatti/D51-notes/node27.html.
10. http://guest.engelschall.com/~sb/hamming/.
11. http://www2.rad.com/networks/1994/err_con/hamming.htm
PHƯƠNG PHÁP HỌC TẬP
Để phục vụ cho mục tiêu nâng cao khả năng tự học tập và tự nghiên cứu của sinh viên, giáo trình
này được biên soạn cùng với các giáo trình khác thuộc chuyên ngành Công nghệ thông tin của
Khoa Công nghệ thông tin và Truyền thông – Đại Học Cần Thơ theo dự án ASVIET002CNTT
“Tăng cường hiệu quả đào tạo và năng lực đào tạo của sinh viên khoa Công nghệ Thông tin-
Đại học Cần Thơ”
. Chúng tôi đã cố gắng trình bày giáo trình này một cách có hệ thống các nội
dung theo bố cục các chương ứng với các khối kiến thức nêu trên, mỗi chương được được trình
bày theo bố cục của các bài học và mỗi bài học giới thiệu đến người học một vấn đề nào đó trong
số các vấn đề của một khối kiến thức tương ứng với một chương. Khi học xong các bài học của
một chương, người học sẽ có một khối kiến thức cần thiết tương ứng cho môn học. Nội dung của
các bài học đều được đưa vào các ví dụ để người học dễ hiểu, tùy theo từng vấn đề mà người học
cần phải học và nghiên cứu trong thời lượng từ 1 đến 2 tiết tự học cho một bài học trong một
chương. Như vậy, để học tốt môn học này, trước hết sinh viên cần phải:
• Học đầy đủ các môn học tiên quyết, bổ sung những kiến thức cơ bản về toán và xác suất thống kê (nếu thiếu).
• Học và nghiên cứu kỹ từng chương theo trình tự các chương được trình bày trong giáo
trình này. Trong từng chương, học các bài theo thứ tự được trình bày, sau mỗi bài phải làm
bài tập đầy đủ (nếu có).
• Tham gia lớp đầy đủ, thảo luận các vấn đề tồn tại chưa hiểu trong quá trình tự học.
• Sau mỗi chương học, phải nắm vững các khái niệm, các định nghĩa, các công thức tính
toán và vận dụng giải các bài toán có tính chất tổng hợp được giới thiệu ở cuối chương.
• Vận dụng kiến thức có được sau khi học xong các chương để giải một số bài tập tổng hợp
ở cuối giáo trình, từ đó giúp cho người học hiểu sâu hơn về môn học và có thể giải quyết
các vấn đề tương tự trong thực tế.
Việc cho ra đời một giáo trình với những mục đích như trên là không đơn giản khi khả năng và
kinh nghiệm của người soạn còn có hạn, nhiều khái niệm, thuật ngữ dùng trong giáo trình chưa
được định nghĩa một cách chính thống. Vì vậy giáo trình này chắc không tránh khỏi những khiếm
khuyết, rất mong nhận được sự góp ý của các đồng nghiệp và người đọc.
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 8
Giáo trình: Lý thuyết thông tin.
CHƯƠNG 1: GIỚI THIỆU 1: Mục tiêu
Sau khi hoàn tất bài học này bạn có thể biết:
- Đối tượng nghiên cứu,
- Mô hình lý thuyết thông tin theo quan điểm Shannon,
- Các khái niệm về Lượng tin biết và lượng tin chưa biết,
- Định lý cơ sở của kỹ thuật truyền tin,
- Khái niệm chung về dung lượng kênh truyền,
- Vấn đề sinh mã và giải mã.
Đối tượng nghiên cứu
Lý thuyết thống kê về thông tin được xây dựng trên hai hướng khác nhau bởi hai nhà toán học
Shannon (1948) và Wiener (1949). Lý thuyết thông tin nghiên cứu quá trình xử lý tín hiệu như sau:
Đầu vào (input): nhận tín hiệu từ một lĩnh vực cụ thể, tức là tín hiệu xuất hiện theo các ký hiệu
(symbol) từ một tập hợp cho trước và theo phân phối xác suất đã biết.
Tín hiệu được truyền đi trên kênh truyền (channel) và có thể bị nhiễu cũng theo một phân phối
xác suất nào đó. Kênh truyền có thể được hiểu dưới hai nghĩa:
Dưới nghĩa vật lý: kênh truyền là một hệ thống truyền tín hiệu (dây dẫn, mạch, sóng, ...) và gây
nhiễu tùy thao chất lượng của hệ thống.
Dưới nghĩa toán học: kênh truyền là các phân phối xác suất xác định trên lớp các tín hiệu đang xét
ở đầu nhận tín hiệu (output).
Ở đầu ra (output): dựng lại tín hiệu chân thật nhất có thể có so với tín hiệu ở đầu vào.
Shannon xây dựng mô hình lý thuyết thông tin trên cơ sở giải quyết bài toán: sinh mã độ dài tối
ưu khi nhận tín hiệu đầu vào. Tín tối ưu được xét trên 3 yếu tố sau:
Phân phối xác suất của sự xuất hiện của các tín hiệu.
Tính duy nhất của mã và cho phép tự điều chỉnh mã sai nếu có với độ chính xác cao nhất. Giải mã
đồng thời tự động điều chỉnh mã hoặc xác định đoạn mã truyền sai.
Trong khí đó, Wiener lại nghiên cứu phương pháp xử lý tín hiệu ở đầu ra: ước lượng tối ưu chuỗi
tín hiệu so với chính nó khi nhận ở đầu vào không qua quá trình sinh mã. Như vậy phương pháp
Wiener được áp dụng trong những trường hợp con người không kiểm soát được quá trình truyền
tín hiệu. Môn “xử lý tín hiệu” đã đề cập đến vấn đề này.
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 9
Giáo trình: Lý thuyết thông tin.
Mô hình lý thuyết thông tin theo quan điểm Shannon
Lý thuyết thông tin được xét ở đây theo quan điểm của Shannon. Đối tượng nghiên cứu là một hệ
thống liên lạc truyền tin (communication system) như sơ đồ dưới đây: Nguồn Mã hóa Kênh Giải mã Nhận Nhiễu Bộ chữ cái Bộ chữ cái Diễn giải:
- Nguồn (source) thông tin còn gọi là thông báo cần được truyền ở đầu vào (Input).
- Mã hóa (encode) là bộ sinh mã. Ứng với một thông báo, bộ sinh mã sẽ gán cho một đối
tượng (object) phù hợp với kỹ thuật truyền tin. Đối tượng có thể là:
o Dãy số nghị phân (Digital) dạng: 01010101, cũng giống như mã máy tính.
o Sóng liên tục (Analog) cũng giống như truyền radio.
- Kênh (channel) là phương tiện truyền mã của thông tin.
- Nhiễu (noise) được sinh ra do kênh truyền tin. Tùy vào chất lượng của kênh truyền mà nhiễu nhiều hay ít.
- Giải mã (decode) ở đầu ra (output) đưa dãy mã trở về dạng thông báo ban đầu với xác suất
cao nhất. Sau đó thông báo sẽ được chuyển cho nới nhận. Trong sơ đồ trên, chúng ta quan
tâm đến 2 khối mã hóa và giải mã trong toàn bộ môn học.
Lượng tin biết và chưa biết
Một biến ngẫu nhiên (BNN) X luôn mang một lượng tin nào đó. Nếu X chưa xảy ra (hay ta chưa
biết cụ thể thông tin về X) thì lượng tin của nó là chưa biết, trong trường hợp này X có một lượng
tin chưa biết. Ngược lại nếu X đã xảy ra (hay ta biết cụ thể thông tin về X) thì lượng tin về biến
ngẫu nhiên X coi như đã biết hoàn toàn, trong trường hợp này X có một lượng tin đã biết.
Nếu biết thông tin của một BNN X thông qua BNN Y đã xảy ra thì ta có thể nói: chúng ta chỉ biết
một phần lượng thông tin của X đó trên cơ sở biết Y.
Ví dụ về lượng tin biết và chưa biết
Ta xét ví dụ về một người tổ chức trò chơi may rủi khách quan với việc tung một đồng tiền “có
đầu hình – không có đầu hình”. Nếu người chơi chọn mặt không có đầu hình thì thắng khi kết
quả tung đồng tiền là không có đầu hình, nguợc lại thì thua. Tuy nhiên người tổ chức chơi có thể
“ăn gian” bằng cách sử dụng 2 đồng tiền “Thật- Giả” khác nhau sau: +
Đồng tiền loại 1 (hay đồng tiền thật): đồng chất có 1 mặt có đầu hình. +
Đồng tiền loại 2 (hay đồng tiền giả ): đồng chất, mỗi mặt đều có 1 đầu hình.
Mặc dù người tổ chức chơi có thể “ăn gian” nhưng quá trình trao đổi 2 đồng tiền cho nhau là ngẫu
nhiêu, vậy liệu người tổ chức chơi có thể “ăn gian” hoàn toàn được không? Hay lượng tin biết và
chưa biết của sự kiện lấy một đồng tiền từ 2 đồng tiền nói trên được hiểu như thế nào?
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 10
Giáo trình: Lý thuyết thông tin.
Ta thử xét một trường hợp sau: nếu người chơi lấy ngẫu nhiên 1 đồng tiền và sau đó thực hiện
việc tung đồng tiền lấy được 2 lần. Qua 2 lần tung đồng tiền, ta đếm được số đầu hình xuất hiện.
Dựa vào số đầu hình xuất hiện, ta có thể phán đoán được người tổ chức chơi đã lấy được đồng tiền nào.
Chẳng hạn: Nếu số đầu hình đếm được sau 2 lần tưng là 1 thì đồng tiền đã lấy được là đồng tiền
thật. Ngược lại nếu số đầu hình đếm được là 2 thì đồng tiền đã lấy được có thể là thật hay cũng có
thể là giả. Như vậy, ta đã nhận được một phần thông tin về loại đồng tiền qua số đầu hình đếm
được sau 2 lần tung. Ta có thể tính được lượng tin đó bằng bao nhiêu? (Việc tính lượng tin này sẽ
được thảo luận sau).
Dưới đây là một số bảng phân phối của bài toán trên:
Gọi BNN X về loại đồng tiền (X=1 nếu lấy được đồng tiền loại 1 và X=1 nếu lấy được đồng tiền loại 2 được lấy).
Khi đó phân phối của X có dạng: X 1 2 P 0.5 0.5
Đặt BNN Y là BNN về số đầu hình đếm được sau 2 lần tung. Khi đó ta có thể xác định được phân
phối của Y với điều kiện xảy ra của X trong 2 trường hợp sau.
Phân phối của Y khi biết X=1 có dạng: Y/X=1 0 1 2 P 0.25 0.5 0.25
Phân phối của Y khi biết X=2 có dạng: Y/X=2 0 1 2 P 0 0 1
Định lý cơ sở của kỹ thuật truyền tin
Trong “ A New Basic of Information Theory (1954)”, Feinstein đã đưa ra định lý sau: “Trên một
kênh truyền có nhiễu, người ta luôn có thể thực hiện một phương pháp truyền sao cho đạt được sai
số nhỏ hơn sai số cho phép (nhỏ bất kỳ) cho trước đối với kênh truyền.”
Chúng ta sẽ không chứng minh định lý, thay vào đó, chúng ta sẽ tham khảo đến các minh họa
giảm nhiễu trong các nội dung tiếp theo của bài học.
Mô tả trạng thái truyền tin có nhiễu
Giả sử, một thông báo được truyền đi trên một kênh truyền nhị phân rời rạc. Thông báo cần
truyền được mã hóa thành dãy số nhị phân (0,1) và có độ dài được tính theo đơn vị bit. Giả sử 1
bit truyền trên kênh nhiễu với xác suất 1/4 (hay tính trung bình cứ truyền 4 bit thì có thể nhiễu 1 bit). ¾ đúng
Ta có sơ đồ trạng thái truyền tin sau: 0 0 ¼ Nguồn Mã hóa Truyền từng bit ¼ 1 1 ¾ đúng Biên so n: T
S. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 11
Giáo trình: Lý thuyết thông tin.
Minh họa kỹ thuật giảm nhiễu
Trong kỹ thuật truyền tin, người ta có thể làm giảm sai lầm khi nhận tin bằng cách truyền lặp lại 1 bit với số lẻ lần.
Ví dụ:
truyền lặp lại 3 cho 1 bit cần truyền (xác suất nhiễu 1 bit bằng 1/4). Khi nhận 3 bit liền
nhau ở cuối kếnh được xem như là 1 bit. Giá trị của bit này được hiểu là 0 (hay 1) nếu bit 0 (bit 1)
có số lần xuất hiện nhiều hơn trong dãy 3 bit nhận được liền nhau (hay giải mã theo nguyên tắc đa
số). Ta cần chứng minh với phương pháp truyền này thì xác suất truyền sai thật sự < 1/4 (xác suất
nhiễu cho trước của kênh truyền).
Sơ đồ truyền tin: Bit truyền
Tuyền lặp 3 lần Nhận 3 bit Giải mã 0 000 000 0 000 001 0 000 010 0 000 100 0 000 101 1 000 011 1 000 110 1 000 111 1 1 111 000 0 111 001 0 111 010 0 111 100 0 111 011 1 111 110 1 111 111 1 111 111 1 Thật vậy:
Giả sử Xi xác định giá trị đúng hay sai của bit thứ i nhận được ở cuối kênh truyền với Xi =1 nếu
bit thứ i nhận được là sai và Xi =0 nếu bit thứ i nhận được là đúng. Theo giả thiết ban đầu của
kênh truyền thì phân phối xác suất của Xi có dạng Bernoulli b(1/4): Xi 1 0 P 3/4 1/4
Gọi Y ={X1 + X2 + X3 } là tổng số bit nhận sai sau 3 lần truyền lặp cho 1 bit. Trong trường hợp
này Y tuân theo phân phối Nhị thức B(p,n), với p=1/4 (xác suất truyền sai một bit) và q =3/4 (xác
suất truyền đúng 1 bit): Y ~ B(i,n) hay
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 12
Giáo trình: Lý thuyết thông tin. i i ni p Y
( = i) = C .p q n Trong đó: i n! C = n i ( ! ni)!
Vậy truyền sai khi Y ∈ {2, 3} có xác xuất là:
Psai= P(y≥2) = P(Y=2) + P(Y=3) = B(2,3) + B(2,3) 2 1 2 3 1 3 1 3 3 0 10 1 Hay
Psai = (C ( ) .( ) ) + (C ( ) ( ) ) = < (đpcm). 3 4 4 3 4 4 64 4
Chi phí phải trả cho kỹ thuật giảm nhiễu
Theo cách thức lặp lại như trên, ta có thể giảm sai lầm bao nhiêu cũng được (lặp càng nhiều thì
sai càng ít), nhưng thời gian truyền cũng tăng lên và chi phí truyền cũng sẽ tăng theo.
Hay ta có thể hiểu như sau:
Lặp càng nhiều lần 1 bit => thời gian truyền càng nhiều => chi phí càng tăng.
Khái niệm về dung lượng kênh truyền
Ví dụ trên cho chúng ta thấy cần phải xác định một thông số cho truyền tin để đảm bảo sai số
chấp nhận được và đồng thời tốc độ truyền cũng không quá chậm.
Khái niệm “dung lượng” kênh truyền là khái niệm rất cơ bản của lý thuyết truyền tin và là một đại
lượng vật lý đồng thời cũng là đại lượng toán học (có đơn vị là bit). Nó cho phép xác định tốc độ
truyền tối đa của mỗi kênh truyền. Do đó, dựa vào dung lượng kênh truyền, người ta có thể chỉ ra
tốc độ truyền tin đồng thời với một phương pháp truyền có sai số cho phép. Vấn đề sinh mã
Từ kỹ thuật truyền tin trên cho ta thấy quá trình sinh mã và giải mã được mô tả như sau: một đơn
vị thông tin nhận được ở đầu vào sẽ được gán cho một ký hiệu trong bộ ký hiệu sinh mã. Một ký
hiệu mã được gán n lần lặp lại (dựa vào dung lượng của kênh truyền, ta có thể xác định được n).
Thiết bị sinh mã (Coding device/ Encoder) sẽ thực hiện quá trình sinh mã.
Như vậy, một đơn vị thông tin từ nguồn phát tin sẽ được thiết bị sinh mã gán cho một dãy n ký
hiệu mã. Dãy ký hiệu mã của 1 đơn vị thông tin được gọi là một từ mã (Code word). Trong trường
hợp tổng quát, người ta có thể gán một khối ký tự mã cho một khối thông tin nào đó và được gọi là một từ mã. Vấn đề giải mã
Ở cuối kênh truyền, một thiết bị giải mã (Decoding device/ Decoder) sẽ thực hiện quá trình ngược
lại như sau: kiểm tra dãy ký hiệu mã để quyết định giải mã về một từ mã và đưa nó về dạng khối tin ban đầu. Ví dụ: Khối tin ban đầu : 01010101
Khối ký hiệu mã ở đầu truyền (lặp 3 lần): 000111000111000111000111.
Khối ký hiệu mã ở đầu nhận : 001110100111011001000111
Khối tin nhận được cuối cùng
: 01011001 (sai 2 bit so với khối tin ban đầu)
Do đó làm sao để đua khối tin nhận được về khối tin ban đầu 01010101, đây chính là công việc
của bộ giải mã (Decoder).
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 13
Giáo trình: Lý thuyết thông tin.
Một vấn đề quan trọng cần lưu ý là phải đồng bộ giữa tốc độ nạp thông tin (phát tín hiệu) với tốc
độ truyền tin. Nếu tốc độ nạp thông tin bằng hoặc lớn hơn so với tốc độ truyền tin của kênh, thì
cần phải giảm tốc độ nạp thông tin sao cho nhỏ hơn tốc độ truyền tin.
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 14
Giáo trình: Lý thuyết thông tin.
CHƯƠNG 2: ĐỘ ĐO LƯỢNG TIN
Mục tiêu: trình bày các khái niệm về độ đo lượng tin chưa biết và đã biết về một biến ngẫu nhiên
X. Tính toán các lượng tin này thông qua định nghĩa và các tính chất của Entropy từ một hay nhiều biến ngẫu nhiên. BÀI 2.1: ENTROPY Mục tiêu
Sau khi hoàn tất bài học này bạn có thể:
- Hiểu được các khái niệm Entropy,
- Biết Entropy của một sự kiện và Entropy của một phân phối,
- Hiểu Định lý dạng giải tích của Entropy,
- Biết Bài toán về cây tìm kiếm nhị phân và
- Làm kiến thức cơ sở để hiểu và học tốt các bài học tiếp theo. Ví dụ về entropy
Trước hết, ta cần tìm hiểu một ví dụ về khái niệm độ do của một lượng tin dựa vào các sự kiện
hay các phân phối xác suất ngẫu nhiên như sau:
Xét 2 BNN X và Y có phân phối sau:
X={1, 2, 3, 4, 5} có phân phối đều hay p(X=i) = 1/5.
Y={1, 2} cũng có phân phối đều hay p(Y=i) = 1/2.
Bản thân X và Y đều mang một lượng tin và thông tin về X và Y chưa biết do chúng là ngẫu
nhiên. Do đó, X hay Y đều có một lượng tin không chắc chắn và lượng tin chắc chắn, tổng của 2
lượng tin này là không đổi và thực tế nó bằng bao nhiêu thì ta chưa thể biết. Lượng tin không chắc
chắn của X (hay Y) được gọi là Entropy.
Tuy nhiên, nếu X và Y có tương quan nhau thì X cũng có một phần lượng tin không chắc chắn
thông qua lượng tin đã biết của Y (hay thông tin về Y đã được biết). Trong trường hợp này, một
phần lượng tin không chắc chắn của thông qua lượng tin đã biết của Y được gọi là Entropy có điều kiện.
Nhận xét về độ đo lượng tin
Rõ ràng, ta cần phải xây dựng một đại lượng toán học rất cụ thể để có thể đo được lượng tin chưa
biết từ một biến ngẫu nhiên. Một cách trực quan, lượng tin đó phải thể hiện được các vấn đề sau:
Một sự kiện có xác suất càng nhỏ thì sự kiện đó ít xảy ra, cũng có nghĩa là tính không chắc chắn
càng lớn. Nếu đo lượng tin của nó thì nó cho một lượng tin không biết càng lớn.
Một tập hợp các sự kiện ngẫu nhiên (hay Biến ngẫu nhiên) càng nhiều sự kiện có phân phối càng
đều thì tính không chắc chắn càng lớn. Nếu đo lượng tin của nó thì sẽ được lượng tin không biết
càng lớn. Hay lượng tin chắc chắn càng nhỏ.
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 15
Giáo trình: Lý thuyết thông tin.
Một phân phối xác suất càng lệch nhiều (có xác xuất rất nhỏ và rất lớn) thì tính không chắc chắn
càng ít và do đó sẽ có một lượng tin chưa biết càng nhỏ so với phân phối xác suất đều hay lượng
tin chắc chắn của nó càng cao. Khái niệm entropy
Trong tiếng việt ta chưa có từ tương đương với từ Entropy, tuy nhiên chúng ta có thể tạm hiểu
hiểu thoáng qua trước khi đi vào định nghĩa chặc chẽ về mặt toán học của Entropy như sau:
Entropy là một đại lượng toán học dùng để đo lượng tin không chắc (hay lượng ngẫu nhiên) của
một sự kiện hay của phân phối ngẫu nhiên cho trước. Hay một số tài liệu tiếng anh gọi là Uncertainty Measure.
Entropy của một sự kiện
Giả sử có một sự kiện A có xác suất xuất hiện là p. Khi đó, ta nói A có một lượng không chắc
chắn được đo bởi hàm số h(p) với p ⊆ [0,1]. Hàm h(p) được gọi là Entropy nếu nó thoả 2 tiêu đề toán học sau:
Tiên đề 01: h(p) là hàm liên tục không âm và đơn điệu giảm.
Tiên đề 02: nếu A và B là hai sự kiện độc lập nhau, có xác suất xuất hiện lần lượt là pA và pB. Khi
đó, p(A,B) = pA.pB nhưng h(A,B) = h(pA) + h(pB).
Entropy của một phân phối
Xét biến ngẫu nhiên X có phân phối: X x1 x2 x3 … xM P p1 p2 p3 … pM
Nếu gọi Ai là sự kiện X=xi, (i=1,2,3,..) thì Entropy của Ai là: h(Ai)= h(pi)
Gọi Y=h(X) là hàm ngẫu nhiên của X và nhận các giá trị là dãy các Entropy của các sự kiện X=xi,
tức là Y=h(X)={h(p1), h(p2), …, h(pn)}.
Vậy, Entropy của X chính là kỳ vọng toán học của Y=h(X) có dạng:
H(X)=H(p1, p2, p3, …,pn) = p1h(p1)+ p2h(p2)+…+pnh(pn). Tổng quát: n
H (X ) = ∑ p h( p ) i i i 1 =
Định lý dạng giải tích của Entropy M
Định lý: Hàm H(X) = H(p1, p2,...,pM) = Cp log(p ) i i i =1 C = const >0
Cơ số logarithm là bất kỳ. Bổ đề: h(p)=-Clog(p).
Trường hợp C=1 và cơ số logarithm = 2 thì đơn vị tính là bit.
Khi đó: h(p)=-log2(p) (đvt: bit) và
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 16
Giáo trình: Lý thuyết thông tin. M H(X) = H(p p
, ,..., p )= −∑ p log ( p ) 1 2 M i 2 i i 1 =
Qui ước trong cách viết: log(pi)= log2(pi) Ví dụ minh họa
Nếu sự kiện A có xác suất xuất hiện là 1/2 thì h(A)=h(1/2)= -log(1/2) = 1 (bit)
Xét BNN X có phân phối sau: X x1 x2 x3 P 1/2 1/4 1/4
H(X) = H(1/2, 1/4, 1/4) = -(1/2log(1/2)+1/4log(1/4)+1/4log(1/4)) =3/2 (bit)
Bài toán về cây tìm kiếm nhị phân-Đặt vấn đề
Giả sử, tìm 1 trong 5 người có tên biết trước sẽ xuất hiện theo phân phối sau: X x1 x2 x3 x4 x5 P 0,2 0,3 0,2 0,15 0,15
Trong đó: x1, …x5 lần lượt là tên của 5 người mà ta cần nhận ra với cách xác định tên bằng câu hỏi đúng sai (yes/no).
Sơ đồ dưới đây minh họa cách xác định tên của một người: x1 Yes X=x 1? X=x1/x2? Yes No x2 x No Yes 3 X=x3? x Yes 4 X=x4? No No x5
Bài toán về cây tìm kiếm nhị phân - Diễn giải Theo sơ đồ trên:
Để tìm x1, x2, x3 với xác suất tương ứng là 0.2, 0.3, 0.2 ta chỉ cần tốn 2 câu hỏi.
Để tìm x4, x5 với xác suất tương ứng 0.15, 0.15 thì ta cần 3 câu hỏi. Vậy:
Số câu hỏi trung bình là: 2 x (0,2+0,3+0,2) + 3 x (0,15+0,15) = 2.3
Mặt khác: Entropy của X: H(X)= H(0.2, 0.3, 0.2, 0.15, 0.15)=2.27.
Ta luôn có số câu hỏi trung bình luôn ≥ H(X) (theo định lý Shannon sẽ trình bày sau). Vì số câu
hỏi trung bình trong trường hợp này xấp sỉ H(X) nên đây là số câu hỏi trung bình tối ưu để tìm ra
tên chính xác của một người. Do đó, sơ đồ tìm kiếm trên là sơ đồ tối ưu.
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 17
Giáo trình: Lý thuyết thông tin.
Sinh viên tự cho thêm 1 hay 2 sơ đồ tìm kiếm khác và tự diễn giải tương tự - xem như bài tập. Bài tập
Tính H(X) với phân phối sau: X x1 x2 x3 P 1/3 1/3 1/3
Tính H(Y) với phân phối sau: Y x1 x2 x3 x4 P 1/6 2/6 1/6 2/6
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 18
Giáo trình: Lý thuyết thông tin.
BÀI 2.2: CÁC TÍNH CHẤT CỦA ENTROPY Mục tiêu:
Sau khi hoàn tất bài học này bạn có thể:
- Hiểu các tính chất cơ bản của Entropy,
- Hiểu định lý cực đại của Entropy,
- Vận dụng giải một số bài toán về Entropy,
- Làm cơ sở để vận dụng giải quyết các bài toán tính dung lượng kênh truyền.
Các tính chất cơ bản của Entropy
Xét biến ngẫu nhiên X = {x1, x2, …, xM}. Entropy của biến ngẫu nhiên X có các tính chất: 1 1 1. Hàm số f(M) = H( ,…, ) đơn điệu tăng. M M
2. Hàm số f(ML) = f(M)+f(L).
3. H(p1, p2, …, pM) = H(p1 + p2 +…+pr, pr+1+ pr+2+…+ pM) p p + (p + p + …+ p )H( 1 ,..., r ) 1 2 r ∑r r p p i= i ∑ 1 i 1 = i p p + (p + p +…+ p )H( r 1 + ,..., M ) r 1 + r+2 M ∑M M p p i=r+ i ∑ 1 i=r 1 + i
4. H(p, 1-p) là hàm liên tục theo P.
Minh họa tính chất 1 và 2 Minh họa tính chất 1:
Trong trường hợp biến ngẫu nhiên X có phân phối đều Entropy của X như sau : ⎛ 1 1 1 ⎞ 1 1 1 1 1 1 1 1
H ( X ) = H ⎜ , , L , ⎟ = − log − log ,..., − log = − M log ⎝ M M M m M M M M M M M 1 => H(X) = − log
= log M là hàm đơn điệu tăng M Minh họa tính chất 2:
Trong trường hợp 2 biến ngẫu nhiên X, Y độc lập có phân phối đều với BNN X có M sự
kiện và BNN Y có L sự kiện.
Gọi f(M), f(L) lần lượt là Entropy của X, của Y. Theo tính chất 2 của Entropy ta có f(ML)=f(M)+f(L)
Minh họa tính chất 3 và 4 Minh họa tính chất 3:
Xét con xúc sắc có 6 mặt với xác suất xuất hiện các mặt được cho trong bảng sau: X x1 x2 x3 x4 x5 x6 P 10% 20% 25% 25% 15% 5%
Ta có thể gom các sự kiện x1, x2, x3 lại thành một sự kiện mới là x123 có xác suất xuất hiện
là 55%, gom sự kiện x5 và x6 lại thành sự kiện x56 có xác suất 20%.
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 19
Giáo trình: Lý thuyết thông tin.
Ta được một nhiến ngẫu nhiên mới X* có phân phối sau: X* x123 x4 X56 P 55% 25% 20%
Đến đây các bạn có thể áp dụng công thức để tính, so sánh các Entropy và nhận xét tính
chất 3. Phần này xem như bài tập cho sinh viên.
Minh họa tính chất 4:
Để hiểu tính chất thứ 4, ta xét dạng đồ thị của hàm số H(p, 1-p ):
Rõ ràng H(p, 1-p) là một hàm liên tục theo p.
Định lý cực đại của entropy
Định lý: H(p1, p2, …,pM)≤ log(M)
Trong đó: đẳng thức xảy ra khi và chỉ khi p1=…= pM= 1/M
Bổ đề: cho 2 bộ {p1, p2, …,pM} và {q1, q2,…,qM} là các bộ số dương bất kỳ và ∑M M p = q ii i=1 i=1 M M
Khi đó, ta có H(p1, p2, …,pM)= − ∑ p log p ≤ − log 2 ∑ p q (*) i i i 2 i i=1 i=1
Đẳng thức xảy ra khi pi=qi với ∀i=1,..,M.
Chứng minh định lý cực đại của Entropy Chứng minh bổ đề:
Theo toán học ta luôn có thể chứng minh được ln(x)≤ x-1 với x>0 và đẳng thức đúng khi x=1.
Đặt x= qi/pi Suy ra ln(qi/pi)≤ qi/pi –1 (và đẳng thức đúng khi qi=pi với mọi i). M Mqp ln i q p i ∑( − ) =1−1= 0 i i i 1 = pi i 1 = M M
⇔ − ∑ p ln p ≤ −∑ p q
ln (đẳng thức xảy ra khi q i i i i i=pi). (1) i=1 i=1
Theo toán học ta có lnx = log2x / log2e (2) M M
Từ (1) và (2), ta có − ∑ p log p ≤ −∑ p q
log (đẳng thức xảy ra khi q i i i i i=pi.) i=1 i=1 Chứng minh định lý: Đặt q 1 i , iM Từ bổ đề, ta có: M M M − ∑ 1 p log p ≤ − p log log M p log M i 2 i ∑ = i 2 2 ∑ = i 2 i=1 i=1 M i=1
Biên soạn: TS. L ê Quy ết Thắng, ThS. Phan Tấn Tài & Ks. Dương Văn Hiếu. 20