Nền tảng đại số choTopology ứng dụng và phân tích dữ liệu | Đại học Sư Phạm Hà Nội

Nền tảng đại số choTopology ứng dụng và phân tích dữ liệu | Đại học Sư Phạm Hà Nội với những kiến thức và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả cao cũng như có thể vận dụng tốt những kiến thức mình đã học vào thực tiễn cuộc sống

Nền tảng đại số cho
Topology ứng dụng và phân tích dữ liệu
Hal Schenck
KHOA T T , Đ AOÁN HỌC HỐNG ẠI HỌC UBURN
Địa chỉ email: hks0015@auburn.edu
Q
c
2021 Hal Schenck
Lời nói đầu
Cuốn sách này là một gương phản chiếu của topology ứng dụng và phân tích dữ
liệu: bao gồm một loạt các chủ đề, các mức độ phức tạp khác nhau từ
bản (đại số ma trận) đến hóc búa (dãy phổ Grothendieck). Hy vọng rằng có điều
gì đó phù hợp với mọi người, từ sinh viên đang học lớp đại số tuyến tính đầu tiên
đến những người tinh thông nghiên cứu về các đồng dạng chiều cao hơn của mã
vạch. Độc giả được khuyến khích khám phá; mục tiêu cung cấp một sự giới
thiệu trực quan thực tế về các chủ đề, thay một bài thuyết trình chính xác
đến từng chi tiết.
Ghi chú này phát triển từ một lớp dạy cho sinh viên sau đại học chuyên
ngành thốngtại Đại học Auburn trong mùaCOVID năm 2020. Cuốn sách
phản ánh điều đó: nó được viết cho một độc giả có kiến thức toán học quan tâm
đến việc hiểu những cơ sở lý thuyết của phân tích dữ liệu topology.lĩnh vực
này thu hút các chuyên gia một loạt kinh nghiệm, cuốn sách giả định ít kiến
thức bản ban đầu. Tuy nhiên, các chủ đề nâng cao trong phần sau của cuốn
sách yêu cầu sự sẵn lòng đối mặt với tài liệu kỹ thuật khó khăn.
Để xử các nền tảng đại số của phân tích dữ liệu topology, chúng ta cần
giới thiệu một số khái niệm kỹ thuật, vậy để tránh rối không, các bằng
chứng đôi khi được phác thảo hoặc bỏ qua. Có nhiều sách tuyệt vời về đại số
topology cấp cao khác nơi có thể tìm thấy thêm chi tiết, ví dụ:
Tài liệu tham khảo về đại số Tài liệu tham khảo về topology
Aluffi [2]Fulton [76]
Artin [3] Greenberg–Harper [83]
Eisenbud [70]Hatcher [91]
Hungerford [93]Munkres [119]
Lang [102]Spanier [137]
Rotman [132] Weibel [149]
iii
iv Preface
L
L
»
»
Các kỹ thuật từ đại số tuyến tính đã công cụ cần thiết trong phân tích dữ liệu
từ khi lĩnh vực này ra đời, vì vậy cuốn sách bắt đầu với những kiến thức cơ bản:
Xấp xỉ bình phương tối thiểu
Ma trận hiệp phương sai và phân tán dữ liệu
Phân giá trị đơn
Các công cụ từ topology gần đây đã tác động đến phân tích dữ liệu. Văn bản này
cung cấp nền tảng để hiểu các phát triển như persistent homology. Giả sử chúng
ta có dữ liệu điểm đám mây, tức là một tập hợp các điểm X:
Nếu X được lấy mẫu từ một đối tượng Y, chúng ta muốn sử dụng X để suy
ra các thuộc tính của Y. Persistent Homology áp dụng các công cụ của topology
đại số để làm điều này. Chúng ta bắt đầu bằng cách sử dụng X như một hạt giống
để phát triển một họ không gian
XE = NE(p), trong đó NE(p) bi u th m t E qu bóng xung quanh
p.
p X
Khi XE XE
/
nếu E ≤ El, chúng ta có một họ không gian topology và các ánh xạ chứa.
.
Như t loại lý
thuyết Morse: có một số hữu hạn giá trị của E mà topology của XE thay đổi. Lưu
ý rằng khi E 0, XE là một khối lớn; vì vậy E thường bị giới hạn trong khoảng [0,
x]. Các đặc điểm topology "tồn tại" đến giá trị tham số x được gọi đặc điểm
persistent; trong ví dụ trên, đường tròn S1 là một đặc điểm persistent.
Ba chương đầu tiên của cuốn sách một trại huấn luyện đại s-topology.
Chương 1 cung cấp một bài tóm tắt nhanh về các công cụ từ đại số tuyến tính
phù hợp nhất cho các ứng dụng, như xếp hạng trang web. Chương 2 3 bao
gồm các kết quả chúng ta cần từ các lớp cấp cao về (tương ứng) đại số
topology. Topology ứng dụng xuất hiện trong §3.4, liên kết giữa các
phương trình nhiệt, truyền thông hội. Một số độc giả thể muốn bỏ qua
ba chương đầu tiên và nhảy vào Chương 4.
1515
2
Các kỹ thuật chính xuất hiện trong Chương 4, xác định các tập đa giác, đa
giác đại số và các tập đa giác C ech & Rips. Các khái niệm này được minh họa
ˇ
bằng cách mô tả công việc của de Silva–Ghrist sử dụng tập đa giác Rips để phân
tích mạng cảm biến. Chương 5 phát triển thêm bộ công cụ topology đại số, giới
thiệu một số thuyết đồ thị nhấn mạnh công việc của Jiang–Lim–Yao–Ye
trong việc áp dụng lý thuyết Hodge vào xếp hạng cử tri (vấn đề Netflix).
Chúng ta quay trở lại đại số trong Chương 6, nơi được dành cho các mô-đun
trên miền thuyết của một thuyết tưởng chính - định cấu trúc cho các
mô-đun trên một lý thuyết lý tưởng chính đóng vai trò trung tâm trong homology
liên tục. Chương 7 8 tương ứng bao gồm homology liên tụchomology đa
tham số liên tục. Chương 9 một phần quan trọng (hoặc thể phần cuối
cùng) - một hướng dẫn nhanh bẩn thỉu về các hàm đạo hàmdãy phổ. Phụ
lục A minh họa một số gói phần mềm thể được sử dụng để thực hiện tính
toán.
Có một số văn bản giải quyết phân tích dữ liệu từ quan điểm toán học thuần
túy. Elementary Applied Topology [79] của Rob Ghristgần nhất về tinh thần
so với những ghi chú này; nó có hương vị địa hình học hơn (và minh họa tuyệt
vời!). Các văn bản khác có cùng quan điểm bao gồm Topological Data Analysis
with Applications [30] của Carlsson–Vejdemo-Johanssen, Computational
Topology for Data Analysis [60] của Dey–Wang Computational Topology
[67] của Edelsbrunner–Harer. phía đối diện, Persistence theory: from quiver
representations to data analysis [124] của Steve Oudot dành cho độc giả nâng
cao hơn; các cuốn sách của Polterovich–Rosen–Samvelyan–Zhang [126],
Rabadan–Blumberg [127] Robinson [131] tập trung vào ứng dụng. Phương
pháp thống kê không được xử lý ở đây; chúng xứng đáng có một tập riêng.
Nhiều người xứng đáng được công nhậnđóng góp của họ vào những ghi
chú này, bắt đầu với các đồng nghiệp của tôi trong lĩnh vực này: Heather
Harrington, Nina Otter Ulrike Tillmann. Một phiên bản trước của lớp TDA
mùa một khóa học nhỏ tôi đã giảng dạy tại CIMAT, do Abraham Mart´ın
del Campo, Antonio Rieser Carlos Vargas Obieta tổ chức. Lớp TDA mùa
đã được thực hiện nhờ quỹ Rosemary Kopel Brown viết bởi NSF grant
2048906. Cảm ơn Hannah Alpert, Ulrich Bauer, Michael Catanzaro, David Cox,
Ketai Chen, Carl de Boor, Vin de Silva, Robert Dixon, Jordan Eckert, Ziqin
Feng, Oliver Ga¨fvert, Rob Ghrist, Sean Grate, Anil Hirani, Yang Hui He,
Michael Lesnick, Lek-Heng Lim, Dmitriy Morozov, Steve Oudot, Alex Suciu
Matthew Wright đã đóng góp ý kiến hữu ích.
Khoa học dữ liệu là một mục tiêu di động: một trong những công cụ tiên tiến
của ngày hôm nay có thể bị đẩy vào thùng rác của lịch sử vào ngày mai. Vì lý do
này, văn bản nhằm nhấn mạnh các khái niệm toán học quan trọng đã được chứng
minh hoặc tiềm năng trong ứng dụng định hình và phân tích dữ liệu. Nhưng toán
học một nỗ lực của con người, vậy hãy nhớ câu của Seneca: "Omnia
humana brevia et caduca sunt."
Hal Schenck
Nội dung
Lời tựa. iii
Chương 1. Công cụ Đại số Tuyến tính cho Phân tích Dữ liệu. 1
§1.1. Phương trình tuyến tính, phương pháp loại bỏ Gauss, đại số ma
trận.
1
§1.2. Không gian vector, phép biến đổi tuyến tính, cơ sở và thay đổi cơ
sở.
5
§1.3. Diagonalization, Xếp hạng trang web, Dữ liệu và Hiệp phương sai. 8
§1.4. Orthogonality, Least Squares Fitting, Singular Value Decomposition 14
Chương 2. Cơ bản về Đại số: Nhóm, Vòng, Mô đun. 21
§2.1. Nhóm, Vòng và Ánh xạ 21
§2.2. Các mô-đun và các phép toán trên mô-đun. 24
§2.3. Địa phương hóa của những vòng và mô-đun. 31
§2.4. Những vòng Noetherian, định lý cơ sở Hilbert, các biến thể. 33
Chương 3. Cơ bản về Topology: Không gian và Sheaves. 37
§3.1. Không gian Topological 38
§3.2. Vector Bundles 42
§3.3. Lý thuyết bó. 44
§3.4. Từ Đồ thị đến Mạng xã hội đến Sheaves. 48
Chương 4. Đồng dạng I: Từ phức hợp đơn giản đến mạng cảm biến.
55
§4.1. Simplicial Complexes, Nerve của một Bìa. 56
§4.2. Homology Đơn giản và Đồng dạng 58
§4.3. Định lý Rắn và Dãy Dài Liên tục trong Đồng dạng 62
§4.4.
Mayer-Vietoris, Rips và C Đồ thị đơn, Mạng cảm biến
ˇ
65
vii
viii Contents
Chương 5. Đồng dạng II: Đồng cấu học đến các vấn đề xếp hạng
73
§5.1.
Đồng cấu học: Đơn giản, C Đồng cấu, lý thuyết de Rham
ˇ
74
§5.2. Xếp hạng, vấn đề Netflix và Lý thuyết Hodge 80
§5.3. CW Complexes và Đồng dạng Tế bào 82
§5.4. Poincare´ và Alexander Duality: Mạng cảm biến được xem xét
lại
85
Chương 6. Đại số Kéo dài: Các mô-đun trên một PID 95
§6.1. Miền Ideals Chính và Miền Euclidean 96
§6.2. Dạng Canon của ma trận 98
§6.3. Phép biến đổi tuyến tính, Các mô-đun K[t], Dạng Jordan 99
§6.4. Cấu trúc của các nhóm Abel và Đồng dạng Kéo dài 100
Chương 7. Đồng dạng Kéo dài
105
§7.1. Barcodes, Persistence Diagrams, Khoảng cách Bottleneck 106
§7.2. Lý thuyết Morse 114
§7.3. Định lý Ổn định 117
§7.4. Sự xen kẽ và các hạng mục 121
Chương 8. Đồng dạng Kéo dài Đa tham số 131
§8.1. Định nghĩa và Ví dụ 132
§8.2. Đại số cấp, Hàm Hilbert, chuỗi, đa thức 135
§8.3. Nguyên tắc liên quan và các mô-đun Zn-graded 140
§8.4. Sự lọc và Ext 146
Chương 9. Đạo hàm và Dãy phổ
151
§9.1. Đối tượng chính và đối tượng dự án, Giải pháp 152
§9.2. Đạo hàm 153
§9.3. Dãy phổ 159
§9.4. Pas de Deux: Dãy phổ và Đạo hàm 165
Phụ lục A. Ví dụ về Gói phần mềm 173
§A.1.
Tương quan và phân tán dữ liệu qua R
173
§A.2. Đồng dạng kéo dài qua scikit-tda 175
§A.3. Đại số tính toán thông qua Macaulay2 179
§A.4. Độ bền đa tham số thông qua RIVET 181
Tài liệu tham khảo 187
Chương 1
Công cụ Đại số tuyến tính
cho Phân tích Dữ liệu
Chúng ta bắt đầu với một bài tóm tắt ngắn sâu sắc về đại số tuyến tính.
nhiều do cho phương pháp này; trước hết quan trọng nhất đại số tuyến
tính là động cơ tính toán mà thúc đẩy hầu hết các lĩnh vực toán học, từ phân tích
số (phương pháp phần tử hữu hạn) đến hình học đại số (phân Hodge) đến
thống (ma trận hiệp phương sai hình dạng dữ liệu). do thứ hai các
chuyên gia về khoa học dữ liệu đến từ nhiều nguồn gốc khác nhau - một nhà
thống kêthể không từng thấy giá trị riêng kể từ thời đại đại học của họ. Mục
tiêu của chương này là phát triển khả năng xử lý cơ bản khi làm việc với
Phương trình tuyến tính, Loại bỏ Gauss, Đại số ma trận.
Không gian vector, Phép biến đổi tuyến tính, Cơ sở và Thay đổi cơ sở.
Đường chéo hóa, Xếp hạng trang web, Dữ liệu và Hiệp phương sai.
Đồng vuông góc, Phù hợp dữ liệu bình phương tối thiểu, Phân rã giá trị đơn.
Có rất nhiều sách viết về đại số tuyến tính, vì vậy chúng ta sẽ tập trung vào các
ví dụ và tính toán, với các bằng chứng được phác thảo hoặc để lại như bài tập.
1.1. Phương trình tuyến tính, Loại bỏ Gauss, Đại số ma trận
Trong phần này, mục tiêu của chúng ta là tìm cách thiết lập một hệ thống phương
trình để nghiên cứu câu hỏi sau:
Ví dụ 1.1.1. Giả sử mỗi năm tại Smallville, 30% người không hút thuốc bắt
đầu hút thuốc, trong khi 20% người hút thuốc bỏ hút. Nếu 8000 người
hút thuốc và 2000 người không hút thuốc vào thời điểm t = 0, sau 100 năm,
số lượng là bao nhiêu? Sau n năm? Có một trạng thái cân bằng mà số lượng
ổn định không?
1
2 1. Linear Algebra Tools for Data Analysis
7
7
a
11
5
Lĩnh vực đại số tuyến tính được dành riêng để phân tích các câu hỏi của loại này.
Bây giờ chúng ta bắt đầu một bài tóm tắt nhanh về bản. dụ, xem xét hệ
phương trình tuyến tính
x − 2y
= 2
2x + 3y
= 6
Loại bỏ Gauss cung cấp một cách thức hệ thống để biến đổi các phương trình
để giảm xuống ít phương trình trong ít biến số hơn. Một phương trình tuyến
tính (không có biến số xuất hiện với một lũy thừa lớn hơn một) trong một biến
số có dạng x = hằng số, vì vậy là trùng hợp. Đối với hệ trên, chúng ta có thể
loại bỏ biến số x bằng cách nhân hàng đầu tiên với 2 (lưu ý rằng điều này
không thay đổi các giải pháp cho hệ), và cộng nó vào hàng thứ hai, thu được
phương trình mới 7y = 2. Do đó y = 2, và thay thế giá trị này cho y trong bất
kỳ một trong hai phương trình ban đầu, chúng ta giải phương trình cho x, tìm
thấy x = 18. Loại bỏ Gauss là một hình thức hóa của ví d đơn giản này: cho
một hệ thống các phương trình tuyến tính
a11x1 + a12x2 + · · · a1nxn =
b1 a21x1 + a22x2 + · · · a2nxn
= b2
. . .
(a)
hoán đổi thứ tự c phương trình để a11 /= 0.
(b) nhân hàng đầu tiên với 1 , vì vậy hệ số của x1 trong hàng đầu tiên là 1.
(c) trừ ai1 lần hàng đầu tiên từ hàng i, cho tất cả i ≥ 2.
Cuối quá trình này, chỉhàng đầu tiên có một phương trình với hệ số x1 khác
không. Do đó, chúng ta đã giảm xuống để giải một hệ thống ít phương trình
trong ít biến số hơn. Lặp lại quá trình này. Quan trọng các phép toán trên
không thay đổi các giải pháp cho hệ phương trình; chúng được gọi các phép
toán hàng đơn giản: hình thức, các phép toán này là
(a) Hoán đổi hai hàng.
(b) Nhân một hàng với một hằng số khác không.
(c) Cộng một bội số của một hàng vào hàng khác.
Bài tập 1.1.2. Giải hệ phương trình
x + y +
z
=
3
2x + y
=
7
3x + 2z
=
5
Bạn nên kết thúc với z = 7, sau đó giải ngược. Đáng để suy nghĩ về hình học
của tập hợp các giải pháp. Mỗi phương trình trong ba phương trình xác định
một mặt phẳng trong R3. Có những giải pháp nào cho hệ thống này? Nếu hai
mặt phẳng khác nhau song song, chúng ta có các phương trình ax + by + cz =
d ax + by + cz = e, với d = e, thì không giải pháp, không điểm
nào thể nằm trên cả hai mặt phẳng. Trong khi đó, ba mặt phẳng thể
giao nhau tại một điểm duy nhất - điều này xảy ra cho hệ thống x = y = z = 0,
cho.
`
×
×
L
Cănbchai
×
·
·
×
K
h
ô
n
K
h
ô
n
3939
3
Trong đó gốc (0, 0, 0) là giải pháp duy nhất. Các khả năng hình học khác cho tập
hợp các giải pháp chung là một đường thẳng hoặc mặt phẳng; mô tả đại số tương
ứng.
đến hai khả năng cuối cùng.
Có một cách viết tắt đơn giản cho việc viết một hệ phương trình tuyến tính như
trên bằng cách sử dụng ký hiệu ma trận. Để làm điều này, chúng ta cần định
nghĩa phép nhân ma trận.
Một ma trận là một.m n mảng các phần tử, trong đó m là số hàng
và n là số cột.
Vector được định nghĩa một cách hình thức trong §1.2; một cách không
chính thức, chúng ta nghĩ về một vector thực với v là một ma trận n 1 hoặc 1 n
với các phần tử thuộc R, và hình dung nó như một mũi tên chỉ hướng với đuôi tại
gốc tọa độ (0, . . . , 0) và đầu tại điểm tương ứng với v trong Rn.
Định nghĩa 1.1.4. Tích vô hướng của các vector v = [v1, . . . , vn] và w = [w1, . . . , wn].
n
v · w = viwi, và đ dài c a v là |v| = v · v.
i=1
The translation of the original text to Vietnamese is: Theo định luật cô-sin, v, w
là vuông góc nếu v w = 0, điều này sẽ được chứng minh trong Bài tập 1.4.1. Một
ma trận m n A và ma trận p q B có thể nhân với nhau khi n = p. Nếu (AB)ij biểu
thị phần tử (i, j) trong ma trận tích, thì.
(AB)ij = hàngi(A) · cộtj(B).
Định nghĩa này có thể có vẻ mờ nhạt. Nó được thiết lập chính xác để khi ma trận
B đại diện cho một chuyển tiếp từ Trạng thái 1 đến Trạng thái 2 và ma trận A đại
diện cho một chuyển tiếp từ Trạng thái 2 đến Trạng thái 3, thì ma trận AB đại
diện cho chuyển tiếp tổng hợp từ Trạng thái 1 đến Trạng thái 3. Điều này làm
do tại sao số cột của A phải bằng số hàng của B để kết hợp các hoạt động:
mục tiêu của ánh xạ B là nguồn của ánh xạ A.
Bài tập 1.1.5.
2
7
1 1
1 2 3 4
37 46 55 64
Không thể dịch được.
3 3
Không
thể dịch được.
·
5 6 7 8
Bằng
Điền vào phần còn lại của các mục nhập.
Định nghĩa 1.1.6. Chuyển vị AT của ma trận A được định nghĩa thông
qua (AT)ij = Aji. A là đối xứng nếu AT = A và đường chéo nếu Aij ≠ 0
i = j. Nếu A và B là các ma trận đường chéo n × n, thì
AB = BA và (AB)ii = aii · bii
Ma trận đơn vị In là một ma trận đường chéo với các phần tử 1 trên đường chéo;
nếu A là một ma trận n × m, thì
In · A = A = A · Im.
Một ma trận n n A có th ngh ch đ o n u có ế
m t ma tr n n n B sao cho BA =
AB = In. Chúng ta vi t A−1 cho ma tr n B; ma tr n A−1 là ma tr n ngh ch ế
đ o c a A.
1 5
1 1
1
1
×
×
s(1) .3 .8 s(0)
s(2) .3 .8 s(1) .3 .8 .3 .8 s(0)
1/5 1/5 3 8 0 10
−1 3
4 1. Linear Algebra Tools for Data Analysis
Bài tập 1.1.7. Tìm một cặp ma trận 2 × 2 (A, B) sao cho AB ≠ BA. Chứng
minh rằng (AB)T = BT AT , và sử dụng điều này để chứng minh rằng ma
trận AT A là đối xứng. ◊
Trong ký hiệu ma trận, một hệ thức tuyến tính gồm n phương trình tuyến tính với m ẩn
được viết dưới dạng
A · x = b, trong đó A là m t ma tr n n × m và x = [x1, . . . , xm]T .
Chúng ta kết thúc phần này bằng việc quay trở lại ví dụ của chúng ta.
Ví dụ 1.1.8. Để bắt đầu phân tích về hút thuốc ở Smallville, chúng ta viết
phương trình ma trận biểu diễn sự thay đổi trong năm đầu tiên, từ t = 0
đến t = 1. Hãy để [n(t), s(t)]T vector biểu diễn số lượng người không
hút thuốc và người hút thuốc (tương ứng) vào thời điểm t. Vì 70% người
không hút thuốc tiếp tục không hút thuốc, 20% người hút thuốc bỏ
thuốc, chúng ta n(1) = .7n(0) + .2s(0). Đồng thời, 30% người không
hút thuốc bắt đầu hút thuốc, trong khi 80% người hút thuốc tiếp tục hút
thuốc, do đó s(1) = .3n(0) + .8s(0). Chúng ta hóa điều này một cách
ngắn gọn như phương trình ma trận:
1
n(1)
1
=
1
.7 .2
1
·
1
n(0)
1
Bây giờ chú ý rằng để tính trạng thái hút thuốc tại t = 2, chúng ta có
1
n(2)
1
=
1
.7 .2
1
·
1
n(1)
1
=
1
.7 .2
1
·
1
.7 .2
1
·
1
n(0)
1
Và cứ như vậy, không giới hạn. Do đó, để hiểu hành vi của hệ thống khi t rất lớn
(viết t » 0), chúng ta cần tính toán
giới hạn
t
.7 .2
t
.3 .8
·
n(0)
s(0)
Phép nhân ma trận là phức tạp tính toán, vì vậy chúng ta muốn tìm một mẹo
để tiết kiệm thời gian, năng lượng và công sức. Giải pháp là sau đây, tạm thời sẽ
một Deus ex Machina (nhưng vẫn tuyệt vời!) Gọi A là ma trận 2x2 trên
(nhân với 10 cho đơn giản). Sau đó
1 1
3/5 −2/5
·
1 1
7 2
·
1
12
1
=
1
50
1
Viết phương trình này dưới dạng BAB−1 = D, với D biểu thị ma trận
đường chéo phía bên phải của phương trình. Kiểm tra dễ dàng cho thấy
BB−1 là ma trận đơn vị I2. Do đó
(BAB−1)n = (BAB−1)(BAB−1)(BAB−1) · · · BAB−1 = BAnB−1 = Dn,
1.2. 5
Â
m
L
L
L
L
điều này được suy ra từ việc gộp các thuật ngữ B−1B liên tiếp trong biểu thức. Vì vậy
BAnB−1 = Dn, và do đó An = B−1DnB.
Như chúng ta đã thấy trước đó, việc nhân một ma trận đường chéo với chính
không tốn gì, vậy chúng ta đã giảm bớt một phép tính tưởng chừng tốn kém
thành gần như không có gì; làm thế nào chúng ta tìm ma trận B bí ẩn? Hai phần
tiếp theo của chương này được dành để trả lời câu hỏi này.
1.2. Không gian vector, biến đổi tuyến tính, cơ sở và thay đổi cơ
sở
Trong phần này, chúng tôi trình bày các nền tảng của đại số tuyến tính, bắt đầu
bằng định nghĩa của một không gian vector trên một trường K. Một trường
một loại vòng, được định nghĩa chi tiết trong chương tiếp theo. Đối với mục
đích của chúng tôi, trường K thường sẽ là một trong những
{Q, R, C, Z/p}, trong đó p là một số nguyên tố.
Định nghĩa 1.2.1. (Không chính thức) Một không gian vector V một tập
hợp các đối tượng (vector), được trang bị hai phép toán: vector có thể được
cộng để tạo ra một vector khác, hoặc nhân với một phần tử của trường. Do
đó, tập hợp các vector V được đóng dưới các phép toán. Định nghĩa chính
thức của không gian vector xuất hiện trong Định nghĩa 2.2.1.
Ví dụ 1.2.2. Các ví dụ về không gian vector.
(a) V = Kn, v i [a1, . . . , an] + [b1, . . . , bn] = [a1 + b1, . . . , an + bn] và
c[a1, . . . , an] = [ca1, . . . , can].
(b) Tập hợp các đa thức có bậc không quá n1, với các hệ số thuộc K. Chứng
minh rằng nó có cấu trúc giống như phần (a).
(c) Tập hợp các hàm liên tục trên đoạn [0,1].
Nếu chúng ta nghĩ về vector như các mũi tên, thì chúng ta thể hình
dung phép cộng vector như việc đặt đuôi của một vector tại đầu của vector khác:
vẽ một bức tranh để thuyết phục bản thân rằng.
[1, 2] + [2, 4] = [3, 6].
1.2.1. Cơ sở của một không gian vector.
Định nghĩa 1.2.3. Đối với không gian vector V, một tập hợp các vector {v1, . . . , vk}
V là.
tuyến tính độc lập (hoặc đơn giản là độc lập) nếu
k
aivi = 0 t t c các ai = 0.
i=1
một tập hợp bao phủ cho V (hoặc đơn giản là bao phủ V) nếu đối với mọi v V
tồn tại
ai thu c K sao cho
k
aivi = v.
i=1
· {
}
· ·
{ } · ·
Âm dương
{
}
i
6 1. Linear Algebra Tools for Data Analysis
Ví dụ 1.2.4. Tập hợp [1, 0], [0, 1], [2, 3] là phụ thuộc, vì 2 [1, 0]+3 [0, 1].
1 [2, 3] = [0, 0]. Đó là một tập hợp bao phủ, vì một vector tùy ý [a, b] = a [1, 0] +.
b [0, 1]. Tuy nhiên, đ i v i V = K3, t p h p các vector [1, 0, 0], [0, 1, 0] là
đ c l p, nh ng không t o thành không gian con. ư
Định nghĩa 1.2.5. Một tập con.
S = {v1, . . . , vk} V
là một cơ sở cho V nếu nó tạo thành và độc lập. Nếu S có hữu hạn phần tử,
chúng ta định nghĩa chiều của V là số phần tử trong S.
Một sở tương đối tương tự như một bộ chữ cái cho một ngôn ngữ trong
đó các từ là các vector. Điều kiện bao phủ nói rằng chúng ta có đủ chữ cái để viết
mọi từ, trong khi điều kiện độc lập nói rằng biểu diễn của một từ dưới dạng tập
hợp các chữ cái là duy nhất. Các không gian vector chúng ta gặp trong cuốn sách
này sẽ số chiều hữu hạn. Một lời cảnh báo: những điểm tinh tế phát
sinh khi làm việc với các không gian vector vô hạn chiều.
Chứng minh rằng chiều của một không gian vector là được xác định tốt.
1.2.2. Phép biến đổi tuyến tính. Một trong những khái niệm quan trọng nhất
trong toán học khái niệm về ánh xạ giữa các đối tượng. Thông thường,
người ta muốn các đối tượng có cùng loại và ánh xạ giữ nguyên cấu trúc của
chúng. Trong trường hợp không gian vector, khái niệm phù hợp là phép biến
đổi tuyến tính.
Định nghĩa 1.2.7. Hãy cho V và W là không gian vector. Một ánh xạ T:V
Wlà m t
phép bi n đ i tuy n tính n u.ế ế ế
T (cv1 + v2) = cT (v1) + T (v2)
Đối với tất cả vi thuộc V, c thuộc K. Nói một cách ngắn gọn hơn, tổng được chia nhỏ và
các hệ số được rút ra.
Trong khi phép biến đổi tuyến tính thể vẻ như một khái niệm trừu
tượng, khái niệm cơ sở sẽ cho phép chúng ta biểu diễn một phép biến đổi tuyến
tính thông qua phép nhân ma trận. Tuy nhiên, câu chuyện về những người hút
thuốc ở Smallville trong phần trước đã cho thấy không phải tất cả các biểu diễn
đều bằng nhau. Điều này đưa chúng ta đến việc thay đổi cơ sở.
Ví dụ 1.2.8. Các tập hợp B1 = {[1, 0], [1, 1]} và B2 = {[1, 1], [1, −1]} dễ dàng.
Kiểm tra xem có phải là cơ sở cho K2 không. Viết vB để biểu diễn một vector v
dưới dạng cơ sở Bi. Ví dụ
[0, 1]B = 0 · [1, 0] + 1 · [1, 1] = 1 · [1, 1] + 0 · [1, −1] = [1, 0]B
1 2
Thuật toán để viết một vector b dưới dạng một cơ sở B = v1, . . . , vn là như
sau: xây dựng ma trận A có các cột là các vector vi, sau đó sử dụng phép loại
Gauss để giải hệ thống Ax = b.
Bài tập 1.2.9. Viết vector [2, 1] dưới dạng các cơ sở B1 và B2 ở trên. ◊
| 1/53

Preview text:

Nền tảng đại số cho
Topology ứng dụng và phân tích dữ liệu Hal Schenck
KHOA TOÁN HỌC VÀ THỐNG KÊ, ĐẠI HỌC AUBURN
Địa chỉ email: hks0015@auburn.edu Qc 2021 Hal Schenck Lời nói đầu
Cuốn sách này là một gương phản chiếu của topology ứng dụng và phân tích dữ
liệu: nó bao gồm một loạt các chủ đề, ở các mức độ phức tạp khác nhau từ cơ
bản (đại số ma trận) đến hóc búa (dãy phổ Grothendieck). Hy vọng rằng có điều
gì đó phù hợp với mọi người, từ sinh viên đang học lớp đại số tuyến tính đầu tiên
đến những người tinh thông nghiên cứu về các đồng dạng chiều cao hơn của mã
vạch. Độc giả được khuyến khích khám phá; mục tiêu là cung cấp một sự giới
thiệu trực quan và thực tế về các chủ đề, thay vì một bài thuyết trình chính xác đến từng chi tiết.
Ghi chú này phát triển từ một lớp dạy cho sinh viên sau đại học chuyên
ngành thống kê tại Đại học Auburn trong mùa hè COVID năm 2020. Cuốn sách
phản ánh điều đó: nó được viết cho một độc giả có kiến thức toán học quan tâm
đến việc hiểu những cơ sở lý thuyết của phân tích dữ liệu topology. Vì lĩnh vực
này thu hút các chuyên gia có một loạt kinh nghiệm, cuốn sách giả định ít kiến
thức cơ bản ban đầu. Tuy nhiên, các chủ đề nâng cao trong phần sau của cuốn
sách yêu cầu sự sẵn lòng đối mặt với tài liệu kỹ thuật khó khăn.
Để xử lý các nền tảng đại số của phân tích dữ liệu topology, chúng ta cần
giới thiệu một số khái niệm và kỹ thuật, vì vậy để tránh rối không, các bằng
chứng đôi khi được phác thảo hoặc bỏ qua. Có nhiều sách tuyệt vời về đại số và
topology cấp cao khác nơi có thể tìm thấy thêm chi tiết, ví dụ:
Tài liệu tham khảo về đại số Tài liệu tham khảo về topology Aluffi [2]Fulton [76] Artin [3] Greenberg–Harper [83] Eisenbud [70]Hatcher [91] Hungerford [93]Munkres [119] Lang [102]Spanier [137] Rotman [132] Weibel [149] iii iv Preface
Các kỹ thuật từ đại số tuyến tính đã là công cụ cần thiết trong phân tích dữ liệu
từ khi lĩnh vực này ra đời, vì vậy cuốn sách bắt đầu với những kiến thức cơ bản:
Xấp xỉ bình phương tối thiểu
Ma trận hiệp phương sai và phân tán dữ liệu
Phân rã giá trị đơn
Các công cụ từ topology gần đây đã tác động đến phân tích dữ liệu. Văn bản này
cung cấp nền tảng để hiểu các phát triển như persistent homology. Giả sử chúng
ta có dữ liệu điểm đám mây, tức là một tập hợp các điểm X:
Nếu X được lấy mẫu từ một đối tượng Y, chúng ta muốn sử dụng X để suy
ra các thuộc tính của Y. Persistent Homology áp dụng các công cụ của topology
đại số để làm điều này. Chúng ta bắt đầu bằng cách sử dụng X như một hạt giống L
để phát triển một họ không gian L
XE = NE(p), trong đó NE(p) bi u ể th m t E qu bóng xung quanh p. p X
Khi XE ⊆ XE/ nếu E ≤ El, chúng ta có một họ không gian topology và các ánh xạ chứa. . Như t loại lý
thuyết Morse: có một số hữu hạn giá trị của E mà topology của XE thay đổi. Lưu ý rằng khi E 0, »
XE là một khối lớn; vì vậy E thường bị giới hạn trong khoảng [0, x]. Các đặc »
điểm topology "tồn tại" đến giá trị tham số x được gọi là đặc điểm
persistent; trong ví dụ trên, đường tròn S1 là một đặc điểm persistent.
Ba chương đầu tiên của cuốn sách là một trại huấn luyện đại số-topology.
Chương 1 cung cấp một bài tóm tắt nhanh về các công cụ từ đại số tuyến tính
phù hợp nhất cho các ứng dụng, như xếp hạng trang web. Chương 2 và 3 bao
gồm các kết quả chúng ta cần từ các lớp cấp cao về (tương ứng) đại số và
topology. Topology ứng dụng xuất hiện trong §3.4, liên kết giữa các bó và
phương trình nhiệt, và truyền thông xã hội. Một số độc giả có thể muốn bỏ qua
ba chương đầu tiên và nhảy vào Chương 4. 1515 2
Các kỹ thuật chính xuất hiện trong Chương 4, xác định các tập đa giác, đa
giác đại số và các tập đa giác Cˇ ech & Rips. Các khái niệm này được minh họa
bằng cách mô tả công việc của de Silva–Ghrist sử dụng tập đa giác Rips để phân
tích mạng cảm biến. Chương 5 phát triển thêm bộ công cụ topology đại số, giới
thiệu một số lý thuyết đồ thị và nhấn mạnh công việc của Jiang–Lim–Yao–Ye
trong việc áp dụng lý thuyết Hodge vào xếp hạng cử tri (vấn đề Netflix).
Chúng ta quay trở lại đại số trong Chương 6, nơi được dành cho các mô-đun
trên miền lý thuyết của một lý thuyết lý tưởng chính - định lý cấu trúc cho các
mô-đun trên một lý thuyết lý tưởng chính đóng vai trò trung tâm trong homology
liên tục. Chương 7 và 8 tương ứng bao gồm homology liên tục và homology đa
tham số liên tục. Chương 9 là một phần quan trọng (hoặc có thể là phần cuối
cùng) - một hướng dẫn nhanh và bẩn thỉu về các hàm đạo hàm và dãy phổ. Phụ
lục A minh họa một số gói phần mềm có thể được sử dụng để thực hiện tính toán.
Có một số văn bản giải quyết phân tích dữ liệu từ quan điểm toán học thuần
túy. Elementary Applied Topology [79] của Rob Ghrist là gần nhất về tinh thần
so với những ghi chú này; nó có hương vị địa hình học hơn (và minh họa tuyệt
vời!). Các văn bản khác có cùng quan điểm bao gồm Topological Data Analysis
with Applications [30] của Carlsson–Vejdemo-Johanssen, Computational
Topology for Data Analysis [60] của Dey–Wang và Computational Topology
[67] của Edelsbrunner–Harer. Ở phía đối diện, Persistence theory: from quiver
representations to data analysis [124] của Steve Oudot dành cho độc giả nâng
cao hơn; các cuốn sách của Polterovich–Rosen–Samvelyan–Zhang [126],
Rabadan–Blumberg [127] và Robinson [131] tập trung vào ứng dụng. Phương
pháp thống kê không được xử lý ở đây; chúng xứng đáng có một tập riêng.
Nhiều người xứng đáng được công nhận vì đóng góp của họ vào những ghi
chú này, bắt đầu với các đồng nghiệp của tôi trong lĩnh vực này: Heather
Harrington, Nina Otter và Ulrike Tillmann. Một phiên bản trước của lớp TDA
mùa hè là một khóa học nhỏ tôi đã giảng dạy tại CIMAT, do Abraham Mart´ın
del Campo, Antonio Rieser và Carlos Vargas Obieta tổ chức. Lớp TDA mùa hè
đã được thực hiện nhờ quỹ Rosemary Kopel Brown và viết bởi NSF grant
2048906. Cảm ơn Hannah Alpert, Ulrich Bauer, Michael Catanzaro, David Cox,
Ketai Chen, Carl de Boor, Vin de Silva, Robert Dixon, Jordan Eckert, Ziqin
Feng, Oliver Ga¨fvert, Rob Ghrist, Sean Grate, Anil Hirani, Yang Hui He,
Michael Lesnick, Lek-Heng Lim, Dmitriy Morozov, Steve Oudot, Alex Suciu và
Matthew Wright đã đóng góp ý kiến hữu ích.
Khoa học dữ liệu là một mục tiêu di động: một trong những công cụ tiên tiến
của ngày hôm nay có thể bị đẩy vào thùng rác của lịch sử vào ngày mai. Vì lý do
này, văn bản nhằm nhấn mạnh các khái niệm toán học quan trọng đã được chứng
minh hoặc tiềm năng trong ứng dụng định hình và phân tích dữ liệu. Nhưng toán
học là một nỗ lực của con người, vì vậy hãy nhớ câu của Seneca: "Omnia humana brevia et caduca sunt." Hal Schenck Nội dung Lời tựa. iii
Chương 1. Công cụ Đại số Tuyến tính cho Phân tích Dữ liệu. 1
§1.1. Phương trình tuyến tính, phương pháp loại bỏ Gauss, đại số ma 1 trận.
§1.2. Không gian vector, phép biến đổi tuyến tính, cơ sở và thay đổi cơ 5 sở.
§1.3. Diagonalization, Xếp hạng trang web, Dữ liệu và Hiệp phương sai. 8
§1.4. Orthogonality, Least Squares Fitting, Singular Value Decomposition 14
Chương 2. Cơ bản về Đại số: Nhóm, Vòng, Mô đun. 21
§2.1. Nhóm, Vòng và Ánh xạ 21
§2.2. Các mô-đun và các phép toán trên mô-đun. 24
§2.3. Địa phương hóa của những vòng và mô-đun. 31
§2.4. Những vòng Noetherian, định lý cơ sở Hilbert, các biến thể. 33
Chương 3. Cơ bản về Topology: Không gian và Sheaves. 37 §3.1. Không gian Topological 38 §3.2. Vector Bundles 42 §3.3. Lý thuyết bó. 44
§3.4. Từ Đồ thị đến Mạng xã hội đến Sheaves. 48
Chương 4. Đồng dạng I: Từ phức hợp đơn giản đến mạng cảm biến. 55
§4.1. Simplicial Complexes, Nerve của một Bìa. 56
§4.2. Homology Đơn giản và Đồng dạng 58
§4.3. Định lý Rắn và Dãy Dài Liên tục trong Đồng dạng 62
§4.4. Mayer-Vietoris, Rips và Cˇ Đồ thị đơn, Mạng cảm biến 65 vii viii Contents
Chương 5. Đồng dạng II: Đồng cấu học đến các vấn đề xếp hạng 73
§5.1. Đồng cấu học: Đơn giản, Cˇ Đồng cấu, lý thuyết de Rham 74
§5.2. Xếp hạng, vấn đề Netflix và Lý thuyết Hodge 80
§5.3. CW Complexes và Đồng dạng Tế bào 82
§5.4. Poincare´ và Alexander Duality: Mạng cảm biến được xem xét 85 lại
Chương 6. Đại số Kéo dài: Các mô-đun trên một PID 95
§6.1. Miền Ideals Chính và Miền Euclidean 96
§6.2. Dạng Canon của ma trận 98
§6.3. Phép biến đổi tuyến tính, Các mô-đun K[t], Dạng Jordan 99
§6.4. Cấu trúc của các nhóm Abel và Đồng dạng Kéo dài 100
Chương 7. Đồng dạng Kéo dài 105
§7.1. Barcodes, Persistence Diagrams, Khoảng cách Bottleneck 106 §7.2. Lý thuyết Morse 114
§7.3. Định lý Ổn định 117
§7.4. Sự xen kẽ và các hạng mục 121
Chương 8. Đồng dạng Kéo dài Đa tham số 131
§8.1. Định nghĩa và Ví dụ 132
§8.2. Đại số cấp, Hàm Hilbert, chuỗi, đa thức 135
§8.3. Nguyên tắc liên quan và các mô-đun Zn-graded 140 §8.4. Sự lọc và Ext 146
Chương 9. Đạo hàm và Dãy phổ 151
§9.1. Đối tượng chính và đối tượng dự án, Giải pháp 152 §9.2. Đạo hàm 153 §9.3. Dãy phổ 159
§9.4. Pas de Deux: Dãy phổ và Đạo hàm 165
Phụ lục A. Ví dụ về Gói phần mềm 173
§A.1. Tương quan và phân tán dữ liệu qua R 173
§A.2. Đồng dạng kéo dài qua scikit-tda 175
§A.3. Đại số tính toán thông qua Macaulay2 179
§A.4. Độ bền đa tham số thông qua RIVET 181 Tài liệu tham khảo 187 Chương 1
Công cụ Đại số tuyến tính
cho Phân tích Dữ liệu

Chúng ta bắt đầu với một bài tóm tắt ngắn và sâu sắc về đại số tuyến tính. Có
nhiều lý do cho phương pháp này; trước hết và quan trọng nhất là đại số tuyến
tính là động cơ tính toán mà thúc đẩy hầu hết các lĩnh vực toán học, từ phân tích
số (phương pháp phần tử hữu hạn) đến hình học đại số (phân rã Hodge) đến
thống kê (ma trận hiệp phương sai và hình dạng dữ liệu). Lý do thứ hai là các
chuyên gia về khoa học dữ liệu đến từ nhiều nguồn gốc khác nhau - một nhà
thống kê có thể không từng thấy giá trị riêng kể từ thời đại đại học của họ. Mục
tiêu của chương này là phát triển khả năng xử lý cơ bản khi làm việc với
Phương trình tuyến tính, Loại bỏ Gauss, Đại số ma trận.
Không gian vector, Phép biến đổi tuyến tính, Cơ sở và Thay đổi cơ sở.
Đường chéo hóa, Xếp hạng trang web, Dữ liệu và Hiệp phương sai.
Đồng vuông góc, Phù hợp dữ liệu bình phương tối thiểu, Phân rã giá trị đơn.
Có rất nhiều sách viết về đại số tuyến tính, vì vậy chúng ta sẽ tập trung vào các
ví dụ và tính toán, với các bằng chứng được phác thảo hoặc để lại như bài tập.
1.1. Phương trình tuyến tính, Loại bỏ Gauss, Đại số ma trận
Trong phần này, mục tiêu của chúng ta là tìm cách thiết lập một hệ thống phương
trình để nghiên cứu câu hỏi sau:
Ví dụ 1.1.1. Giả sử mỗi năm tại Smallville, 30% người không hút thuốc bắt
đầu hút thuốc, trong khi 20% người hút thuốc bỏ hút. Nếu có 8000 người
hút thuốc và 2000 người không hút thuốc vào thời điểm t = 0, sau 100 năm,
số lượng là bao nhiêu? Sau n năm? Có một trạng thái cân bằng mà số lượng ổn định không?
1 2
1. Linear Algebra Tools for Data Analysis
Lĩnh vực đại số tuyến tính được dành riêng để phân tích các câu hỏi của loại này.
Bây giờ chúng ta bắt đầu một bài tóm tắt nhanh về cơ bản. Ví dụ, xem xét hệ phương trình tuyến tính x − 2y = 2 2x + 3y = 6
Loại bỏ Gauss cung cấp một cách thức hệ thống để biến đổi các phương trình
để giảm xuống ít phương trình trong ít biến số hơn. Một phương trình tuyến
tính (không có biến số xuất hiện với một lũy thừa lớn hơn một) trong một biến
số có dạng x = hằng số, vì vậy là trùng hợp. Đối với hệ trên, chúng ta có thể

loại bỏ biến số x bằng cách nhân hàng đầu tiên với 2 (lưu ý rằng điều này
không thay đổi các giải pháp cho hệ), và cộng nó vào hàng thứ hai, thu được
7
phương trình mới 7y = 2. Do đó y = 2, và thay thế giá trị này cho y trong bất 7
kỳ một trong hai phương trình ban đầu, chúng ta giải phương trình cho x, tìm
thấy x = 18. Loại bỏ Gauss là một hình thức hóa của ví dụ đơn giản này: cho
một hệ thống các phương trình tuyến tính

a11x1 + a12x2 + · · · a1nxn =
b1 a21x1 + a22x2 + · · · a2nxn = b2 . . .
(a) hoán đổi thứ tự các phương trình để a11 /= 0.
(b) nhân hàng đầu tiên với 1 , vì vậy hệ số của x1 trong hàng đầu tiên là 1. a11
(c) trừ ai1 lần hàng đầu tiên từ hàng i, cho tất cả i ≥ 2.
Cuối quá trình này, chỉ có hàng đầu tiên có một phương trình với hệ số x1 khác
không. Do đó, chúng ta đã giảm xuống để giải một hệ thống ít phương trình
trong ít biến số hơn. Lặp lại quá trình này. Quan trọng là các phép toán trên
không thay đổi các giải pháp cho hệ phương trình; chúng được gọi là các phép
toán hàng đơn giản: hình thức, các phép toán này là (a) Hoán đổi hai hàng.
(b) Nhân một hàng với một hằng số khác không.
(c) Cộng một bội số của một hàng vào hàng khác.
Bài tập 1.1.2. Giải hệ phương trình x + y + = 3 z 2x + y = 7 3x + 2z = 5
Bạn nên kết thúc với z = 7,
sau đó giải ngược. Đáng để suy nghĩ về hình học 5
của tập hợp các giải pháp. Mỗi phương trình trong ba phương trình xác định
một mặt phẳng trong R3. Có những giải pháp nào cho hệ thống này? Nếu hai
mặt phẳng khác nhau song song, chúng ta có các / phương trình ax + by + cz =
d và ax + by + cz = e, với d = e, thì không có giải pháp, vì / không có điểm
nào có thể nằm trên cả hai mặt phẳng. Trong khi đó, ba mặt phẳng có thể
giao nhau tại một điểm duy nhất - điều này xảy ra cho hệ thống x = y = z = 0, cho. 3939 3
Trong đó gốc (0, 0, 0) là giải pháp duy nhất. Các khả năng hình học khác cho tập
hợp các giải pháp chung là một đường thẳng hoặc mặt phẳng; mô tả đại số tương ứng.
đến hai khả năng cuối cùng.
Có một cách viết tắt đơn giản cho việc viết một hệ phương trình tuyến tính như
trên bằng cách sử dụng ký hiệu ma trận. Để làm điều này, chúng ta cần định nghĩa phép nhân ma trận.
Một ma trận là một.m
` n mảng các phần tử, trong đó m là số hàng và n là số cột. ×
Vector được định nghĩa một cách hình thức trong §1.2; một cách không ×
chính thức, chúng ta nghĩ về một vector thực với v là một ma trận n 1 hoặc 1 n
với các phần tử thuộc R, và hình dung nó như một mũi tên chỉ hướng với đuôi tại
gốc tọa độ (0, . . . , 0) và đầu tại điểm tương ứng với v trong Rn.
Định nghĩa 1.1.4. Tích vô hướng của các vector v = [v1, . . . , vn] và w = [w1, . . . , wn].n L v · w =
viwi, và độ dài của v là |v| = v · v. i=1
The translation of the Căn b original ậc text ha to i ·
Vietnamese is: Theo định luật cô-sin, v, w là vuông góc nếu v × w = 0, điều này sẽ ·
được chứng minh trong Bài tập 1.4.1. Một
ma trận m n A và ma trận p q B có thể nhân với nhau khi n = p. Nếu (AB)ij biểu
thị phần tử (i, j) trong ma trận tích, thì.
(AB)ij = hàngi(A) · cộtj(B).
Định nghĩa này có thể có vẻ mờ nhạt. Nó được thiết lập chính xác để khi ma trận
B đại diện cho một chuyển tiếp từ Trạng thái 1 đến Trạng thái 2 và ma trận A đại
diện cho một chuyển tiếp từ Trạng thái 2 đến Trạng thái 3, thì ma trận AB đại
diện cho chuyển tiếp tổng hợp từ Trạng thái 1 đến Trạng thái 3. Điều này làm rõ
lý do tại sao số cột của A phải bằng số hàng của B để kết hợp các hoạt động:
mục tiêu của ánh xạ B là nguồn của ánh xạ A. Bài tập 1.1.5. 1 1 37 46 55 64 2 1 2 3 4 7
Không thể dịch được. 3 3Không Bằng ∗ ∗ ∗ 5 6 7 8 K K
thể dịch được. · h h 1 5 ô ∗ ∗ ∗ ô n n
Điền vào phần còn lại của các mục nhập.
Định nghĩa 1.1.6. Chuyển vị AT của ma trận A được định nghĩa thông
qua (AT)ij = Aji. A là đối xứng nếu AT = A và đường chéo nếu Aij ≠ 0
i = j. Nếu A và B là các ma trận đường chéo n × n, thì
AB = BA và (AB)ii = aii · bii
Ma trận đơn vị In là một ma trận đường chéo với các phần tử 1 trên đường chéo;
nếu A là một ma trận n × m, thì In · A = A = A · Im. × Một ma trận n n A có thể ngh ch đ o n u có ế một ma tr n n n B sao cho BA =
AB = In. Chúng ta vi t A−1 cho ma tr ế n B; ma tr n A−1 là ma tr n ngh ch đ o c ủa A. 4
1. Linear Algebra Tools for Data Analysis
Bài tập 1.1.7. Tìm một cặp ma trận 2 × 2 (A, B) sao cho AB ≠ BA. Chứng
minh rằng (AB)T = BT AT , và sử dụng điều này để chứng minh rằng ma
trận AT A là đối xứng. ◊
Trong ký hiệu ma trận, một hệ thức tuyến tính gồm n phương trình tuyến tính với m ẩn được viết dưới dạng
A · x = b, trong đó A là m t ma tr
n n × m và x = [x1, . . . , xm]T .
Chúng ta kết thúc phần này bằng việc quay trở lại ví dụ của chúng ta.
Ví dụ 1.1.8. Để bắt đầu phân tích về hút thuốc ở Smallville, chúng ta viết
phương trình ma trận biểu diễn sự thay đổi trong năm đầu tiên, từ t = 0
đến t = 1. Hãy để [n(t), s(t)]T là vector biểu diễn số lượng người không
hút thuốc và người hút thuốc (tương ứng) vào thời điểm t. Vì 70% người
không hút thuốc tiếp tục không hút thuốc, và 20% người hút thuốc bỏ
thuốc, chúng ta có n(1) = .7n(0) + .2s(0). Đồng thời, 30% người không
hút thuốc bắt đầu hút thuốc, trong khi 80% người hút thuốc tiếp tục hút
thuốc, do đó s(1) = .3n(0) + .8s(0). Chúng ta mã hóa điều này một cách
ngắn gọn như phương trình ma trận:
1 1 1 1 1 1 n(1) .7 .2 n(0) = · s(1) .3 .8 s(0)
Bây giờ chú ý rằng để tính trạng thái hút thuốc tại t = 2, chúng ta có 1 1 1 1 1 1 1 1 1 1 1 1 n(2) .7 .2 n(1) .7 .2 .7 .2 n(0) = · = · · s(2) .3 .8 s(1) .3 .8 .3 .8 s(0)
Và cứ như vậy, không giới hạn. Do đó, để hiểu hành vi của hệ thống khi t rất lớn
(viết t » 0), chúng ta cần tính toán 1 1 t .7 .2 1 giới hạn n(0) t .3 .8 1 s(0) ·
Phép nhân ma trận là phức tạp tính toán, vì vậy chúng ta muốn tìm một mẹo
để tiết kiệm thời gian, năng lượng và công sức. Giải pháp là sau đây, tạm thời sẽ
là một Deus ex Machina (nhưng vẫn tuyệt vời!) Gọi A là ma trận 2x2 ở × trên
(nhân với 10 cho đơn giản). Sau đó × 1 1 1 1 1 1 1 1 3/5 −2/5 7 2 12 50 1/5 1/5 · 3 8 · −1 3 = 0 10
Viết phương trình này dưới dạng BAB−1 = D, với D biểu thị ma trận
đường chéo ở phía bên phải của phương trình. Kiểm tra dễ dàng cho thấy
BB−1 là ma trận đơn vị I2. Do đó
(BAB−1)n = (BAB−1)(BAB−1)(BAB−1) · · · BAB−1 = BAnB−1 = Dn, 1.2. 5
điều này được suy ra từ việc gộp các thuật ngữ B−1B liên tiếp trong biểu thức. Vì vậy
BAnB−1 = Dn, và do đó An = B−1DnB.
Như chúng ta đã thấy trước đó, việc nhân một ma trận đường chéo với chính nó
không tốn gì, vì vậy chúng ta đã giảm bớt một phép tính tưởng chừng tốn kém
thành gần như không có gì; làm thế nào chúng ta tìm ma trận B bí ẩn? Hai phần
tiếp theo của chương này được dành để trả lời câu hỏi này.
1.2. Không gian vector, biến đổi tuyến tính, cơ sở và thay đổi cơ sở
Trong phần này, chúng tôi trình bày các nền tảng của đại số tuyến tính, bắt đầu
bằng định nghĩa của một không gian vector trên một trường K. Một trường là
một loại vòng, và được định nghĩa chi tiết trong chương tiếp theo. Đối với mục
đích của chúng tôi, trường K thường sẽ là một trong những
{Q, R, C, Z/p}, trong đó p là một số nguyên tố.
Định nghĩa 1.2.1. (Không chính thức) Một không gian vector V là một tập
hợp các đối tượng (vector), được trang bị hai phép toán: vector có thể được
cộng để tạo ra một vector khác, hoặc nhân với một phần tử của trường. Do
đó, tập hợp các vector V được đóng dưới các phép toán. Định nghĩa chính
thức của không gian vector xuất hiện trong Định nghĩa 2.2.1.
Ví dụ 1.2.2. Các ví dụ về không gian vector.

(a) V = Kn, v i [a1, . . . , an] + [b1, . . . , bn] = [a1 + b1, . . . , an + bn] và
c[a1, . . . , an] = [ca1, . . . , can]. (b) Â
Tập hợp các đa thức có bậc không quá n1, với các hệ số thuộc K. Chứng m
minh rằng nó có cấu trúc giống như phần (a).
(c) Tập hợp các hàm liên tục trên đoạn [0,1].
Nếu chúng ta nghĩ về vector như là các mũi tên, thì chúng ta có thể hình
dung phép cộng vector như việc đặt đuôi của một vector tại đầu của vector khác:
vẽ một bức tranh để thuyết phục bản thân rằng. [1, 2] + [2, 4] = [3, 6].
1.2.1. Cơ sở của một không gian vector.
Định nghĩa 1.2.3. Đối với không gian vector V, một tập hợp các vector {v1, . . . , vk}
V là.
tuyến tính độc lập (hoặc đơn giản là độc lập) nếu L k Laivi = 0 t t ấ c các ai = 0. i=1
một tập hợp bao phủ cho V (hoặc đơn giản là bao phủ V) nếu đối với mọi v V ∈ tồn tại ai thu c K sao cho L k Laivi = v. i=1 6
1. Linear Algebra Tools for Data Analysis { } ·
Ví dụ 1.2.4. Tập hợp [1, 0], [0, 1], [2, 3] là phụ thuộc, vì 2 [1, 0 · ]+3 [0, 1]. · Âm dương ·
1 [2, 3] = [0, 0]. Đó là một tập hợp bao phủ, vì một vector tùy ý [a, b] = a [1, 0] +. ·
b [0, 1]. Tuy nhiên, đ i ố v i V = K3, t p h p {
các vector [1, 0, 0], [0, 1, 0] là đ c l p, ậ nh ng không t ư
o thành không gian con. }
Định nghĩa 1.2.5. Một tập con. S = {v1, . . . , vk} V
là một cơ sở cho V nếu nó tạo thành và độc lập. Nếu S có hữu hạn phần tử,
chúng ta định nghĩa chiều của V là số phần tử trong S.
Một cơ sở tương đối tương tự như một bộ chữ cái cho một ngôn ngữ trong
đó các từ là các vector. Điều kiện bao phủ nói rằng chúng ta có đủ chữ cái để viết
mọi từ, trong khi điều kiện độc lập nói rằng biểu diễn của một từ dưới dạng tập
hợp các chữ cái là duy nhất. Các không gian vector chúng ta gặp trong cuốn sách
này sẽ có số chiều hữu hạn. Một lời cảnh báo: có những điểm tinh tế mà phát
sinh khi làm việc với các không gian vector vô hạn chiều.
Chứng minh rằng chiều của một không gian vector là được xác định tốt.
1.2.2. Phép biến đổi tuyến tính. Một trong những khái niệm quan trọng nhất
trong toán học là khái niệm về ánh xạ giữa các đối tượng. Thông thường,
người ta muốn các đối tượng có cùng loại và ánh xạ giữ nguyên cấu trúc của
chúng. Trong trường hợp không gian vector, khái niệm phù hợp là phép biến đổi tuyến tính.

Định nghĩa 1.2.7. Hãy cho V và W là không gian vector. Một ánh xạ T:V → Wlà một
phé p b iến đ ổi tu yến tí nh n ếu.
T (cv1 + v2) = cT (v1) + T (v2)
Đối với tất cả vi thuộc V, c thuộc K. Nói một cách ngắn gọn hơn, tổng được chia nhỏ và
các hệ số được rút ra.
Trong khi phép biến đổi tuyến tính có thể có vẻ như một khái niệm trừu
tượng, khái niệm cơ sở sẽ cho phép chúng ta biểu diễn một phép biến đổi tuyến
tính thông qua phép nhân ma trận. Tuy nhiên, câu chuyện về những người hút
thuốc ở Smallville trong phần trước đã cho thấy không phải tất cả các biểu diễn
đều bằng nhau. Điều này đưa chúng ta đến việc thay đổi cơ sở.
Ví dụ 1.2.8. Các tập hợp B1 = {[1, 0], [1, 1]} và B2 = {[1, 1], [1, −1]} dễ dàng.
Kiểm tra xem có phải là cơ sở cho K2 không. Viết vB để biểu diễn một vector v i
dưới dạng cơ sở Bi. Ví dụ
[0, 1]B = 0 · [1, 0] + 1 · [1, 1] = 1 · [1, 1] + 0 · [1, −1] = [1, 0]B 1 2
Thuật toán để viết một vector b dưới dạng một cơ sở B = { v1, . . . , vn là như
sau: xây dựng ma trận A có các cột là các vector vi, }
sau đó sử dụng phép loại
Gauss để giải hệ thống Ax = b.
Bài tập 1.2.9. Viết vector [2, 1] dưới dạng các cơ sở B1 và B2 ở trên. ◊