Lý thuyết trò chơi | Kiến trúc máy tính | Trường Đại học Thủy Lợi

Lý thuyết trò chơi của Trường Đại học Thủy Lợi. Hi vọng tài liệu này sẽ giúp các bạn học tốt, ôn tập hiệu quả, đạt kết quả cao trong các bài thi, bài kiểm tra sắp tới. Mời các bạn cùng tham khảo chi tiết bài viết dưới đây nhé.

lOMoARcPSD|40651217
Lý thuyết trò chơi
Trng Thái
Không gian trng thái
th có hưng trong ó:
− Mỗi nút là 1 trng thái
− Mỗi cnh ng vi 1 phép chuyn i trng thái
lOMoARcPSD|40651217
Các chiến lược tìm kiếm
lOMoARcPSD|40651217
Tìm kiếm mù
Tìm kiếm theo chiu rng
Thut toán
lOMoARcPSD|40651217
Tìm kiếm theo chiu sâu
Thut toán
lOMoARcPSD|40651217
Tìm kiếm sâu lp
Tìm kiếm vi tri thc b sung
- Tìm kiếm da trên các thông tin ánh giá ca các trng thái -
Hiu qu
lOMoARcPSD|40651217
Tìm kiếm vi hàm ánh giá -TQ
TK Tt nht u tiên(TK kinh nghim)
lOMoARcPSD|40651217
Thut toán
Tìm kiếm beam
lOMoARcPSD|40651217
Tìm kiếm leo i
Thut toán
lOMoARcPSD|40651217
A*
lOMoARcPSD|40651217
Nhánh cn
lOMoARcPSD|40651217
Tìm kiếm có i th
Thut toán min max
lOMoARcPSD|40651217
Thut toán
lOMoARcPSD|40651217
Th tc ct nhánh alpha -beta
Ct b bt các nhánh không cn thiết cho vic ánh giá giá tr heuristic ti mt nh
lOMoARcPSD|40651217
TRI THC - SUY DIN
Biu din tri thc
lOMoARcPSD|40651217
Logic mnh
lOMoARcPSD|40651217
(Lut)Chun hoá v dng chun hi
Phương pháp Robinson
lOMoARcPSD|40651217
Tng quát
lOMoARcPSD|40651217
Chng minh bng các lut suy din
Suy din tiến, lùi
lOMoARcPSD|40651217
Suy din tiến
Cơ chế max: Nếu có nhiu lut tha mãn ta luôn chn lp lun ln nht
lOMoARcPSD|40651217
Logic V t
Hn chế logic mnh
Logic V t
lOMoARcPSD|40651217
Thành phn cú pháp
lOMoARcPSD|40651217
Đặc im
1. Tính hoán v:
(x y) ≡ (y x)
2. Đưa các phép lượng t vào tng v t
3. Loi b
x G(x) ≡ G(x)
4. Đặt li tên biến
x G(x) ≡ y G(y)
5. Loi b ¬
¬(x G(x)) ≡ x (¬G(x))
¬(x G(x)) ≡ x (¬G(x))
6. H qu: mỗi lượng t (,) u có th biu din bởi lưng t
kia
[x friend(An,x)] ≡ [¬x ¬friend(An,x)]
An là bn ca mọi người tương ương với không có ai An
không là bn
lOMoARcPSD|40651217
Chng minh trong logic v t
lOMoARcPSD|40651217
So Sánh - Định nghĩa
Hàm ánh giá
DPT gii thut tìm kiếm mù
lOMoARcPSD|40651217
Chiu sâu vs Chiu rng
lOMoARcPSD|40651217
TK kinh nghim vs TK tối ưu
A* vs BFS
Nhánh cn vs A*
lOMoARcPSD|40651217
Nhánh cn vs leo i
Tìm kiếm tối ưu và Tìm kiếm Kinh nghim
lOMoARcPSD|40651217
Tìm kiếm chiu rng và tìm kiếm chiu sâu
lOMoARcPSD|40651217
Mạng nơ ron
Kĩ thuật tính toán mm da trên mô phng hot ng ca não b (mng
nơron thần kinh)
Nơ ron thần kinh
Nơron nhân tạo
Tng thông tin vào của 1 nơron
- Net = ∑wi xi
Đầu ra
- y = f(Net) = f(∑wi xi ) f ược gi là hàm truyn
(transfer function) hay kích hot (activation function)
Bn thân mỗi nơron như 1 hàm tính và tính mạnh hơn cổng logic
cơ bản
lOMoARcPSD|40651217
Cu trúc mạng nơ ron
Mô hình mạng nơ ron
lOMoARcPSD|40651217
lOMoARcPSD|40651217
Thiết kế mạng nơ ron
Các phương pháp học
lOMoARcPSD|40651217
Gii thut hc lan truyn ngưc sai s
lOMoARcPSD|40651217
lOMoARcPSD|40651217
lOMoARcPSD|40651217
lOMoARcPSD|40651217
ng dng
| 1/37

Preview text:

lOMoARcPSD| 40651217 Lý thuyết trò chơi Trạng Thái
Không gian trạng thái
Là ồ thị có hướng trong ó:
− Mỗi nút là 1 trạng thái
− Mỗi cạnh ứng với 1 phép chuyển ổi trạng thái lOMoARcPSD| 40651217
Các chiến lược tìm kiếm lOMoARcPSD| 40651217 Tìm kiếm mù
Tìm kiếm theo chiều rộng Thuật toán lOMoARcPSD| 40651217 Tìm kiếm theo chiều sâu Thuật toán lOMoARcPSD| 40651217 Tìm kiếm sâu lặp
Tìm kiếm với tri thức bổ sung
- Tìm kiếm dựa trên các thông tin ánh giá của các trạng thái - Hiệu quả lOMoARcPSD| 40651217
Tìm kiếm với hàm ánh giá -TQ
TK Tốt nhất ầu tiên(TK kinh nghiệm) lOMoARcPSD| 40651217 Thuật toán Tìm kiếm beam lOMoARcPSD| 40651217 Tìm kiếm leo ồi Thuật toán lOMoARcPSD| 40651217 A* lOMoARcPSD| 40651217 Nhánh cận lOMoARcPSD| 40651217 Tìm kiếm có ối thủ Thuật toán min max lOMoARcPSD| 40651217 Thuật toán lOMoARcPSD| 40651217
Thủ tục cắt nhánh alpha -beta
Cắt bỏ bớt các nhánh không cần thiết cho việc ánh giá giá trị heuristic tại một ỉnh lOMoARcPSD| 40651217
TRI THỨC - SUY DIỄN Biểu diễn tri thức lOMoARcPSD| 40651217 Logic mệnh ề lOMoARcPSD| 40651217
(Luật)Chuẩn hoá về dạng chuẩn hội
Phương pháp Robinson lOMoARcPSD| 40651217 Tổng quát lOMoARcPSD| 40651217
Chứng minh bằng các luật suy diễn
Suy diễn tiến, lùi lOMoARcPSD| 40651217 Suy diễn tiến
Cơ chế max: Nếu có nhiều luật thỏa mãn ta luôn chọn lập luận lớn nhất lOMoARcPSD| 40651217 Logic Vị từ Hạn chế logic mệnh ề Logic Vị từ lOMoARcPSD| 40651217 Thành phần cú pháp lOMoARcPSD| 40651217 Đặc iểm 1. Tính hoán vị: (∀x ∀y) ≡ (∀y ∀x)
2. Đưa các phép lượng tử vào từng vị từ 3. Loại bỏ ∀ ∀x G(x) ≡ G(x) 4. Đặt lại tên biến ∀x G(x) ≡ ∀y G(y) 5. Loại bỏ ¬
¬(∀x G(x)) ≡ ∃x (¬G(x))
¬(∃x G(x)) ≡ ∀x (¬G(x))
6. Hệ quả: mỗi lượng tử (∀,∃) ều có thể biểu diễn bởi lượng tử kia
[∀x friend(An,x)] ≡ [¬∃x ¬friend(An,x)]
An là bạn của mọi người tương ương với không có ai An không là bạn lOMoARcPSD| 40651217
Chứng minh trong logic vị từ lOMoARcPSD| 40651217
So Sánh - Định nghĩa Hàm ánh giá
DPT giải thuật tìm kiếm mù lOMoARcPSD| 40651217
Chiều sâu vs Chiều rộng lOMoARcPSD| 40651217
TK kinh nghiệm vs TK tối ưu A* vs BFS Nhánh cận vs A* lOMoARcPSD| 40651217 Nhánh cận vs leo ồi
Tìm kiếm tối ưu và Tìm kiếm Kinh nghiệm lOMoARcPSD| 40651217
Tìm kiếm chiều rộng và tìm kiếm chiều sâu lOMoARcPSD| 40651217 Mạng nơ ron
Kĩ thuật tính toán mềm dựa trên mô phỏng hoạt ộng của não bộ (mạng nơron thần kinh) Nơ ron thần kinh Nơron nhân tạo
Tổng thông tin vào của 1 nơron - Net = ∑wi xi Đầu ra -
y = f(Net) = f(∑wi xi ) f ược gọi là hàm truyền
(transfer function) hay kích hoạt (activation function)
Bản thân mỗi nơron như 1 hàm tính và tính mạnh hơn cổng logic cơ bản lOMoARcPSD| 40651217 Cấu trúc mạng nơ ron Mô hình mạng nơ ron lOMoARcPSD| 40651217 lOMoARcPSD| 40651217 Thiết kế mạng nơ ron Các phương pháp học lOMoARcPSD| 40651217
Giải thuật học lan truyền ngược sai số lOMoARcPSD| 40651217 lOMoARcPSD| 40651217 lOMoARcPSD| 40651217 lOMoARcPSD| 40651217 Ứng dụng