Chương 1: Mở đầu
1.1. Tổng quan về Trí tuệ nhân tạo
Mục tiêu
Nội dung này nhằm cung cấp cho sinh viên một cái nhìn toàn cảnh, bối cảnh
lịch sử các định nghĩa nền tảng của lĩnh vực Trí tuệ nhân tạo (tiếng Anh: Artificial
intelligence, viết tắt là: AI). Việc nắm vững các khái niệm này sẽ tạo ra một nền
móng vững chắc trước khi đi sâu vào các chủ đề kỹ thuật cụ thể của học phần, giúp
sinh viên hiểu "tại sao" chúng ta nghiên cứu các phương pháp này, chứ không chỉ
là "làm thế nào" để áp dụng chúng.
Nội dung chi tiết
Các định nghĩa và cách tiếp cận AI
Định nghĩa:
Trí tuệ nhân tạo (TTNT) một lĩnh vực rộng lớn đa dạng của khoa học máy
tính, với mục tiêu cốt lõi là nghiên cứu xây dựng các thực thể thông minh như con
người như học tập, suy luận, giải quyết vấn đề, nhận thức và đưa ra quyết định.
Tuy nhiên, bản thân khái niệm "trí tuệ" lại rất khó định nghĩa một cách chính xác,
dẫn đến việc nhiều cách tiếp cận khác nhau đđịnh nghĩa xây dựng các hệ
thống TTNT. Các định nghĩa này có thể được phân thành bốn nhóm chính, dựa trên
hai trục so sánh: một so sánh với con người (humanly) so với một tiêu chuẩn
tưởng về sự hợp (rationally), và hai là tập trung vào quá trình tư duy (thinking) so
với hành vi bên ngoài (acting).
Hành động như người (Phép thử Turing):
Cách tiếp cận này định nghĩa ttuệ thông qua hành vi. Năm 1950, nhà toán
học tiên phong Alan Turing đã đề xuất một bài kiểm tra, sau này được gọi "Phép
thử Turing" (Turing Test), để xác định xem một cmáy thể thể hiện hành vi
thông minh tương đương hoặc không thể phân biệt được với con người hay không.
Trong phép thnày, một người thẩm vấn sẽ giao tiếp bằng văn bản với hai đối
tượng ẩn danh: một là người thật và một là máy tính. Nếu người thẩm vấn không
thể phân biệt được đâu là máy, thì cỗ máy đó được coi đã vượt qua i kiểm tra
và thể hiện được trí tuệ. Để thành công, một hệ thống cần có các khả năng cốt lõi
sau:
Xử ngôn ngữ tự nhiên (Natural Language Processing): Để giao tiếp
hiệu quả bằng ngôn ngữ của con người.
Biểu diễn tri thức (Knowledge Representation): Đlưu trữ những
biết hoặc nghe được.
Suy diễn tự động (Automated Reasoning): Để sdụng thông tin đã lưu
trữ để trả lời câu hỏi và rút ra kết luận mới.
Học máy (Machine Learning): Để thích nghi với hoàn cảnh mới và phát
hiện các mẫu. Gần đây, vào năm 2014, một chương trình chatbot tên là
Eugene Goostman đã thuyết phục được 33% giám khảo rằng một
cậu 13 tuổi người Ukraine, làm dấy lên cuộc tranh luận về việc liệu
phép thử Turing có thực sự bị vượt qua hay không.
Một số câu hỏi ví dụ về kiểm tra Turing:
Sự kiện thời thơ ấu đáng nhớ nhất của bạn là gì và nó đã tác động đến bạn như
thế nào cho đến ngày nay?
Hãy mô tả bản thân bạn chỉ bằng màu sắc và hình dạng.
Giải thích tại sao thời gian trôi nhanh như n bắn nhưng trái cây lại bay nhanh
như quả chuối?
Sự kiện lịch sử nào đã thay đổi bạn nhiều nhất và bạn đang ở đâu khi sự kiện đó
xảy ra?
Trong các câu hỏi trước, câu hỏi nào khó trả lời nhất và tại sao?
Suy nghĩ như người (Mô hình nhận thức):
Một số định nghĩa:
"The exciting new effort to make computers think ... machines with minds, in
the full and literal sense." (Haugeland, 1985). Tạm dịch: “Nỗ lực mới thú vị để
làm cho máy tính biết suy nghĩ ... máy móc trí óc, theo nghĩa đen đầy đ
"[The automation of] activities that we associate with human thinking,
activities such as decision-making, problem solving, learning ..." (Bellman
1978). Tạm dịch, [Việc tự động hóa] các hoạt động mà chúng ta liên kết với
suy nghĩ của con người, các hoạt động như ra quyết định, giải quyết vấn đề,
học tập ...”
Theo nhóm định nghĩa này, hành động thông minh chỉ đạt được nếu được dẫn
dắt bởi quá trình suy nghĩ tương tự quá trình suy nghĩ của con người.
Những nghiên cứu theo hướng này dựa trên việc nghiên cứu quá trình nhận
thức duy của con người, từ đây hình hóa tạo ra những hệ thống
nh nhận thức, duy tương tự. Việc tìm hiểu quá trình nhận thức, tư duy
của người thể thực hiện theo một số phương pháp như: 1) thực nghiệm vhành
vi con người khi suy nghĩ hoặc giải quyết vấn đề; 2) chụp ảnh sóng não, đo tín
hiệu điện thoặc các tín hiệu khác của não trong quá trình thực hiện các công
việc khác nhau; 3) sử dụng các phương pháp nơ ron sinh học khác như kích thích
não, giải phẫu não v.v.
Cách tiếp cận này đi sâu hơn, không chỉ quan tâm đến hành vi mà còn đến quá
trình duy bên trong. Để một chương trình thể "suy nghĩ như người", chúng
ta phải hiểu được cách bộ não con người hoạt động. Lĩnh vực khoa học nhận thức
(cognitive science) sự giao thoa giữa các hình tính toán của AI và c kỹ
thuật thực nghiệm từ tâm học để xây dựng c lý thuyết chính xác thể
kiểm chứng vhoạt động của trí não con người. Một dụ kinh điển hthống
"General Problem Solver" (GPS) do Newell Simon phát triển vào năm 1961,
được thiết kế để giải quyết vấn đề bằng ch phỏng các bước duy con
người thực hiện.
Suy nghĩ hợp lý (Các quy tắc tư duy):
Một số định nghĩa:
"The study of mental faculties through the use of computational
models." (Charniak and McDermott, 1985). Tạm dịch Nghiên cứu về các năng
lực trí tuệ thông qua việc sử dụng các mô hình tính toán
"The study of the computations that make it possible to perceive, reason,
and act." (Winston, 1992). Tạm dịch: Nghiên cứu về các tính toán giúp nhận
thức, suy luận và hành động.”
Thay phỏng con người, cách tiếp cận này hướng tới việc y dựng các
hệ thống dựa trên các quy tắc duy đúng đắn chặt chẽ. Triết gia Hy Lạp
Aristotle là người đầu tiên cố gắng hệ thống hóa "tư duy đúng đn" thông qua các
phép tam đoạn luận (syllogisms), cho phép rút ra c kết luận chắc chắn từ các
tiền đề đúng. Sự phát triển của logic hình thức vào cuối thế kỷ 19 và đầu thế kỷ
20 đã cung cấp một bộ công cụ mạnh mẽ để biểu diễn các tri thức và thực hiện các
quá trình suy diễn một cách chính xác. Đây là nền tảng cho việc xây dựng các h
thống khả năng chứng minh định toán học hoặc đưa ra các kết luận logic một
cách tự động.
Hành động hợp lý (Tác tử thông minh - Intelligent Agents):
Một số định nghĩa:
"Computational Intelligence is the study of the design of intelligent
agents." (Poole et al., 1998). Tạm dịch Trí tuệ tính toán là nghiên cứu vthiết
kế của các tác nhân thông minh”
"AI . . .is concerned with intelligent behavior in artifacts." (Nilsson, 1998).
Tạm dịch “AI . . .là quan tâm đến hành vi thông minh trong hiện vật
Đây được coi cách tiếp cận tổng quát phổ biến nhất trong AI hiện đại.
Một "tác tử thông minh" (intelligent agent) là một thực thể khả năng nhận thức
môi trường xung quanh thông qua các bộ cảm biến (sensors) và hành động lên môi
trường đó thông qua các cơ cấu chấp hành (effectors). "Hành động hợp lý" có nghĩa
là hành động sao cho đạt được kết quả tốt nhất, hoặc khi có sự không chắc chắn, đạt
được kết quả kvọng tốt nhất. Cách tiếp cận này bao m các cách tiếp cận khác:
một tác tử thể nh động hợp bằng cách sử dụng các quy tắc suy diễn logic,
nhưng đôi khi hành động theo phản xạ (không cần suy diễn sâu) lại hợp hơn trong
các tình huống khẩn cấp. Do đó, tập trung vào kết quả cuối cùng thay vì chỉ mô
phỏng quá trình của con người.
Sự phân biệt giữa các cách tiếp cận này không chỉ mang tính học thuật.
phản ánh một sự căng thẳng cơ bản trong lĩnh vực AI: giữa mục tiêu mô phỏng con
người (mimesis) mục tiêu đạt được hiệu suất tối ưu (rationality). Khóa học này,
bằng cách bắt đầu với logic (một công cụ của sự hợp ) sau đó chuyển sang logic
mờ và mạng nơron (những công cụ có thể hình hóa duy giống con người
học hỏi từ kinh nghiệm), sẽ ngầm khám phá sự căng thẳng này. Mục tiêu cuối cùng
của một tác tử AI hiện đại hành động hợp lý, điều này thể đạt được bằng
nhiều phương tiện khác nhau.
Bảng 1.1: So sánh các cách tiếp cận định nghĩa Trí tuệ nhân tạo
Tiêu chí so
sánh
Hành động
như người
Suy nghĩ như
người
Suy nghĩ hợp
Hành động
hợp lý
Mục tiêu Thực hiện các
hành vi không
thể phân biệt
được với con
ngư
ời.
Mô phỏng quá
trình tư duy của
con người.
Suy diễn một
cách logic và
chính xác.
Đạt được mục
tiêu một cách
tối ưu hoặc kỳ
vọng tối ưu.
Thước đo thành
công
Vượt qua Phép
thử Turing.
So khớp mô
hình v
ới dữ liệu
tâm lý học và
thần kinh học.
Chứng minh
được các kết
luận là hệ quả
logic của tiền
đ
ề.
Tối đa hóa một
thước đo hiệu
suất
(performance
measure).
N
ền tảng khoa
học
Khoa học xã
hội, Ngôn ngữ
học.
Khoa học nhận
thức, Tâm lý
học, Khoa học
th
ần kinh.
Logic, Toán
học, Triết học.
Kinh tế học, Lý
thuyết quyết
định, Thống kê,
V
ận tr
ù h
ọc.
Ví dụ điển hình
Chatbot
(Eugene
Goostman,
GPT-4
1
), các
nhân vật trong
game.
General
Problem Solver
(GPS).
Các hệ chứng
minh định lý tự
động.
Xe t
ự lái, các hệ
thống giao dịch
tự động, robot
công nghiệp.
Tổng kết:
Các phân tích trên cho thấy một số ch tiếp cận chính trong định nghĩa trí tuệ nhân
tạo:
- Lấy con người làm tiêu chuẩn, nghiên cứu tâm thần kinh học để
phỏng nhận thức con người, dựa trên đó xây dựng hệ thống trí tuệ nhân tạo. - Lấy kết quả
làm tiêu chuẩn, không nhất thiết phải xây dựng hệ thống mô phỏng người.
- Lấy hành vi và hành động m mục đích, có thể có quá trình lập luận để hướng dẫn
hành động hoặc không.
1
Các chatbot Eugene Goostman và GPT-4 đã vượt qua Bài kiểm tra Turing lần lượt vào năm 2014 và 2024.
TTNT môn khoa học nghiên cứu và mô phỏng các quá trình sáng tạo của
con người trên máy tính điện tử, nhằm tạo ra các sản phẩm thông minh có khả năng
suy nghĩ, ra quyết định, hoặc hỗ trợ ra quyết định như con người.
1.2. Vai trò của trí tuệ nhân tạo
Vai trò của AI cùng quan trọng đối với cuộc sống của chúng ta. AI thể
tiếp cận với con người thông qua nhiều lĩnh vực, ngành nghề khác nhau. Ưu điểm của
trí tuệ nhân tạo khnăng xử dữ liệu khoa học hơn, nhanh hơn, hệ thống hơn so
với con người. Việc phát triển đưa các sản phẩm AI tới tay người dùng đúng cách
sẽ thúc đẩy mạnh mẽ sự phát triển của toàn nhân loại. Mở ra một thế giới hoàn toàn
mới cùng các giải pháp bù đắp cho những vấn đề mà con người không thể giải quyết.
- Theo 1 nghĩa nào đó TTNT tạo nên 1 cách đơn giản để xây dựng n cấu trúc
các chương trình ra quyết định phức tạp đòi hỏi phải dựa trên những tri thức nhất định.
- Các chương trình TTNT hoạt động giống như bộ não của con người tức nó thể
tích hợp những tri thức mới không cần thay đổi lại cách làm việc. vậy những
chương trình TTNT có thể dễ dàng cải tiến hơn so với các chương trình truyền thống.
- Khi máy tính được trang bị những phần mềm TTNT kết hợp với môi trường
làm việc thì có thể cho phép giải quyết được các bài toán cỡ lớn và phân tán.
- Một số phần mềm TTNT thể hiện tính thích nghi mềm dẻo đối với các lớp
bài toán thuộc nhiều lĩnh vực khác nhau.
1.3. Các ứng dụng của trí tuệ nhân tạo
1.3.1 Các lĩnh vực nghiên cứu
Trí tuệ nhân tạo được chia thành một số nh vực nghiên cứu nh hơn
chuyên sâu nhằm giải quyết những vấn đề khác nhau khi xây dựng một hệ thống trí tuệ
nhân tạo. Một số lĩnh vực chuyên sâu được hình thành đgiải quyết một lớp bài toán.
Một số lĩnh vực chuyên sâu khác tập trung o các hướng tiếp cận hay các kỹ thuật.
Một số lĩnh vực nghiên cứu lại xoay quanh các ứng dụng cụ thể. Trong khi nhiều lĩnh
vực nghiên cứu nhỏ liên quan mật thiết đến nhau tnhiều lĩnh vực khác rất xa
nhau, cả về mục tiêu, phương pháp và cộng đồng nghiên cứu. Các lĩnh vực phổ biến có
thể kể đến như sau:
Thông thường, một hệ thống trí tuệ nhân tạo hoàn chỉnh, làm việc trong việc
một môi trường nào đó cần có khả năng: cảm nhận (perception), lập luận (reasoning),
và hành động (action). Dưới đây là một số lĩnh vực nghiên cứu của trí tuệ nhân tạo
được phân chia theo ba thành phần này.
a) Cảm nhận (perception)
Hệ thống cần chế thu nhận thông tin liên quan tới hoạt động từ môi
trường n ngoài. Đó thể camera, cảm biến âm thanh (microphone), cảm biến siêu
âm, radar, cảm biến gia tốc, các cảm biến khác. Đó cũng có thể đơn giản hơnthông
tin do người dùng nhập vào chương trình bằng tay. Để biến đổi thông tin nhận được về
dạng có thể hiểu được, thông tin cần được xử nhờ những kỹ thuật được nghiên cứu
và trong khuôn khổ các lĩnh vực sau:
o Thị giác máy (computer vision)
o Nhận dạng mẫu
o Xử lý ngôn ngữ tự nhiên (natural language processing)
b) Lập luận và suy diễn
Sau khi cảm nhận được thông tin về môi trường xung quanh, hệ thống cần có
chế để đưa ra được quyết định phù hợp. Quá trình ra quyết định thường dựa trên
việc kết hợp thông tin cảm nhận được với tri thức có sẵn về thế giới xung quanh. Việc
ra quyết định dựa trên tri thức được thực hiện nhờ lập luận hay suy diễn. Cũng có
những trường hợp hệ thống không thực hiện suy diễn mà dựa trên những kỹ thuật khác
như tìm kiếm hay tập hợp các phản xạ hoặc hành vi đơn giản.
Thành phần lập luận và ra quyết định được xây dựng dựa trên kỹ thuật từ
những lĩnh vực nghiên cứu sau:
o Biểu diễn tri thức (knowledge representation)
o Tìm kiếm (search)
o Lập luận, suy diễn (reasoning hay inference)
o Học máy (machine learning)
o Deep Learning (Học Sâu)
o Lập kế hoạch (planning)
c) Hành động
Cho phép hệ thống c động vào môi trường xung quanh hoặc đơn giản đưa
ra thông tin về kết luận của mình. Thành phần y được xây dựng dựa trên những kỹ
thuật sau. Tổng hợp ngôn ngữ tự nhiên và tiếng nói và Kỹ thuật rô bốt (robotics).
kỹ thuật xây dựng các quan chấp hành như cánh tay người y, tổng
hợp tiếng nói, tổng hợp ngôn ngữ tự nhiên. Đây là lĩnh vực nghiên cứu giao thoa giữa
khí, điện tử, trí tunhân tạo. Bên cạnh kthuật khí để tạo ra các chế vật
lý, chuyển động, cần có thuật toán chương trình điểu khiển hoạt động chuyển
động cho các chế đó. Chẳng hạn, với cánh tay máy, cần tính toán quỹ đạo điều
khiển cụ thể các khớp nối cơ khí khi muốn di chuyển tay tới vị trí c định và thực hiện
hành động nào đó. Đây là những thành phần của kỹ thuật rô bốt mà trí tuệ nhân tạo
đóng góp chính. Ngoài ra, việc xây dựng những bốt thông minh chính xây dựng
các hệ thống trí tuệ nhân tạo hoàn chỉnh.
1.3.2 Một số ứng dụng và thành tựu
a. Các chương trình trò chơi
Xây dựng chương trình khả năng chơi những trò chơi trí tu lĩnh vực
có nhiều thành tựu của trí tuệ nhân tạo. Với những trò chơi tương đối đơn giản như cờ
carô hay cờ thỏ cáo, máy tính đã thắng người từ cách đây vài thập kỷ.
Đối với những trò chơi phức tạp hơn, các hệ thống trí tuệ nhân tạo cũng dần
đuổi kịp và vượt qua con người. Sự kiện quan trọng thường được nhắc tới là vào tháng
5 năm 1997 chương trình cờ vua Deep Blue của IBM đã thắng địch cờ vua thế giới
lúc đó là Gary Kasparov. Đây là lần đầu tiên máy tính thắng đương kim vô địch cờ vua
thế giới. Năm 2015 y chơi cờ vây AlphaGo của Google DeepMind đạt tới đẳng cấp
con người nhsử dụng học u kết hợp với lấy mẫu cây Monte Carlo. Thách thức
trong Poker không gian của trạng thái lớn không được quan sát đầy đủ (ta
không biết các quân bài của đối thủ). Libratus ợt chất ợng con người trong môn
Poker sử dụng các chiến thuật cấu trúc một cách hiệu quả [Brown & Sandholm,
2017]. Những điều y thể hiện một sự tiến triển n tượng trong các trò chơi tầm
quan trọng của các thuật toán nâng cao trong đó.
Một trường hợp tiêu biểu khác hệ thống trả lời tự động Watson cũng của
IBM đã chiến thắng hai quán quân của Jeopardy trong trò chơi này vào m 2011.
Jeopardy là trò chơi hỏi đáp trên truyền hình Mỹ, tương tự “Ai là triệu phú” trên truyền
hình Việt Nam nhưng trong đó ba người chơi phải thi với nhau không những trả lời
đúng còn phải nhanh. Watson hệ thống hỏi đáp do IBM xây dựng dựa trên việc
thu thập phân tích thông tin từ khoảng 200 triệu trang Web, trong đó toàn bộ
Wikipedia. Trong một cuộc đấu với hai cựu quán quân Jeopardy, Watson đã giành
thắng lợi và phần thưởng 1 triệu USD. Các kỹ thuật sử dụng trong Watson như thu thập
thông tin, phát hiện tri thức, hiểu ngôn ngữ tnhiên, tìm kiếm, đã được IBM thương
mại hóa và có thể sử dụng trong nhiều ứng dụng.
b. Nhận dạng tiếng nói
Nhận dạng tiếng nói biến đổi từ âm thanh tiếng nói thành các văn bản.
Hiện người dùng công cụ tìm kiếm Google có thể đọc vào câu truy vấn thay cho việc
gõ từ khóa như trước. Các điện thoại di động thông minh cũng có khả năng nhận dạng
giọng nói và trả lời các câu hỏi. Ví dụ điển hình là chương trình trợ giúp Siri trên điện
thoại thông minh của Apple (sử dụng công nghệ nhận dạng tiếng i của ng Nuance)
hay hệ thống Google Now.
Chất lượng nhận dạng giọng nói đang được cải thiện tiến bộ rất nhanh
trong vài năm gần đây. Các hệ thống nhận dạng tiếng nói hiện tại cho phép nhận dạng
tới vài chục ngôn ngữ khác nhau không phụ thuộc vào người i (ở một mức độ
nhất định).
c. Thị giác máy tính
Mặc nhiều ng dụng của thị giác máy nh vẫn chưa đạt tới đchính xác
như người, nhưng trong một số bài toán, thị giác máy tính cho đchính xác ơng
đương hoặc gần với khả năng của người. Tiêu biểu phải kể đến các hệ thống nhận dạng
chữ in với độ chính xác gần như tuyệt đối, hệ thống nhận dạng tròng mắt, vân tay, mặt
người. Những hệ thống dạng này được sử dụng rộng rãi trong sản xuất để kiểm tra sản
phẩm, trong hệ thống camera an ninh. Ứng dụng nhận dạng mặt người trên Facebook
được dùng để xác định những người quen xuất hiện trong ảnh gán nhãn tên cho
người đó.
Các ứng dụng nhận dạng hiện nay đang được cải thiện nhiều nh sử dụng
kỹ thuật học sâu (deep learning), trong đó các mạng ron nhiều lớp được kết nối
với nhau được sử dụng để phát hiện các đặc trưng của đối tượng ở mức từ đơn giản tới
phức tạp.
Nhận dạng đối tượng cũng đã tiến một ớc dài. Nhận dạng đối ợng trong
ảnh một tác vụ khó trong năm 2010. Trong bảng xếp hạng ImageNet, Lin và các
cộng sự năm 2010 đạt được tỷ lệ lỗi top-5 28%. Tới 2017. Hu các cộng sự giảm
tỉ lệ lỗi này xuống n 2,25%. Học sâu đã giúp phân loại cngàn vật thể khác nhau
trong các bức ảnh, tự tạo chú thích cho ảnh, tự sinh ảnh.
d. Các thiết bị tự lái
Các thiết bị tự lái bao gồm máy bay, ô tô, tầu thủy, thiết bị thám hiểm trụ
thể tự di chuyển không sự điều khiển của người (cả điều khiển trực tiếp
điều khiển từ xa). Hiện ô tự lái đang được một số hãng công nghcác tchức
khác nghiên cứu và phát triển, trong đó có những dự án nổi tiếng như xe tự lái của
Google Tesla. Mặc tại thời điểm viết ch này mới chỉ một mẫu xe duy nhất
được thương mại hóa dùng cho các khu đi bộchỉ thể chạy với tốc độ khoảng 20
km/giờ nhưng các dự báo cho thấy xe tự lái sẽ được thương mại hóa thành công trong
vòng vài năm tới. Các thiết bị tự lái khác bao gồm cả các xem thám hiểm trụ hành
tinh khác như xe thám hiểm sao Hỏa của NASA.
e. Hệ chuyên gia
các hệ thống làm việc dựa trên kinh nghiệm tri thức của chuyên gia
trong một lĩnh vực ơng đối hẹp nào đó để đưa ra khuyến cáo, kết luận, chuẩn đoán
một cách tự động. Các ví dụ gồm:
o MYCIN (1984, Stanford): hệ chuyên gian đầu tiên chẩn đoán bệnh về
nhiễm trùng máu và cách điều trị với khả năng tương đương một bác sĩ giỏi
trong lĩnh vực này.
o XCON của DEC: hỗ trợ chọn cấu hình máy tính tự động.
f. Xử lý, hiểu ngôn ngữ tự nhiên
Tiêu biểu c hệ thống dịch tự động như hệ thống dịch của Google, các hệ
thống tóm tắt nội dung văn bản tự động. Hệ thống dịch tự động của Google sử dụng
các hình thống xây dựng từ các văn bản song ngữ c văn bản đơn ngữ. Hệ
thống này có khả năng dịch qua lại giữa vài chục ngôn ngữ.
Các hệ thống hỏi đáp được đề cập tới trong phần về trò chơi nhận dạng
tiếng nói cũng thuộc loại ứng dụng xử ngôn ngữ tự nhiên. Những hệ thống này sử
dụng những thành phần đơn giản hơn như các phân hệ phân tích hình thái, pháp, ngữ
nghĩa. Các ứng dụng khác như trợ o, hệ thống gợi ý sản phẩm của Amazon, hệ
thống gợi ý phim của Netflix.
Các trợ thông minh như Apple Siri, Amazon Alexa, hay Google Assistant
có khả năng trả lời các câu hỏi thoại với độ chính xác chấp nhận được. Việcy cũng
bao gồm các tác vụ đơn giản như bật đèn (hữu ích đối với người tàn tật) tới đặt lịch hẹn
cắt tóc và đưa ra các đoạn hội thoại để hỗ trợ các tổng đài chăm sóc khách hàng.
Nhiều kthuật xử ngôn ngữ tự nhiên đã được ứng dụng trong các ng dụng rất
thiết thực như các bộ lọc thư rác. Dịch vụ thư điện tử của Google, Microsoft, Yahoo đều
có các bộ lọc thư rác với cơ chế học tự động và thích nghi với thay đổi của người phát
tán. Khả năng phát hiện thư rác của các hệ thống này là rất cao, gần như tuyệt đối trong
một số trường hợp.
ChatGPT một chatbot do công ty OpenAI của Mỹ phát triển ra mắt
vào tháng 11 m 2022. ChatGPT được xây dựng dựa trên GPT-3.5 một dòng mô
hình ngôn ngữ lớn của OpenAI đồng thời được tinh chỉnh bằng cả hai kỹ thuật học tăng
cường lẫn học có giám sát. ChatGPT nhanh chóng thu hút sự chú ý nhờ việc nó có thể
hồi đáp chi tiết và trả lời lưu loát trên nhiều lĩnh vực kiến thức khác nhau.
g. Lập kế hoạch, lập thời khóa biểu
Kỹ thuật trí tuệ nhân tạo được sử dụng nhiều trong bài toán lập thời khóa
biểu cho trường học, xí nghiệp, các bài toán lập kế hoạch khác. Một ví dụ lập kế hoạch
thành công với quy lớn là kế hoạch đảm bảo hậu cần cho quân đội Mỹ trong chiến
dịch Cơn bão sa mạc tại Iraq đã được thực hiện gần như hoàn toàn dựa trên kỹ thuật trí
tuệ nhân tạo. Đây một kế hoạch lớn, liên quan tới khoảng 50000 thiết bị vận tải
người tại cùng một thời điểm. Kế hoạch bao gồm điểm xuất phát, điểm tới, thời gian,
phương tiện và người tham gia sao cho không mâu thuẫn và tối ưu theo các tiêu chí.
Chương trình lập lịch và điều khiển thông minh trên xe tự hành và Robot tự
hành của NASA.
h. Rô bốt
Một số bốt được xây dựng sao cho có hình dạng tương tự con người và
khả ng toàn diện n thị giác y, giao tiếp bằng ngôn ngữ tự nhiên, khả năng lập
luận nhất định, khả năng di chuyểnthực hiện các hành động như nhẩy múa. Các rô
bốt này chủ yếu được tạo ra để chứng minh khả năng của kỹ thuật rô bốt thay vì hướng
vào ứng dụng cụ thể. Trong số này có thể kể tới rô bốt Asimo, rô bốt Nao.
Bên cạnh đó, một số bốt không phỏng người nhưng được sử dụng
trong đời sống ng ngày hoặc các ứng dụng thực tế. dụ, bốt Roomba của hãng
iRobot khả năng tự động di chuyển trong phòng, tránh vật cản, chui vào các ngóc
ngách để lau sạch toàn bộ sàn. Số lượng rô bốt Roomba đã bán lên tới vài triệu bản.
1.3.3. Những vấn đề chưa được giải quyết
Mặc đạt được nhiều thành tựu nhiều ng dụng đáng kể, các hệ thống
trí tuệ nhân tạo hiện nay chưa đạt được mức đtrí tuệ nhân tạo mạnh (strong AI) hay
trí tuệ nhân tạo tổng quát (Artificial General Intelligence). Đây cũng được coi vấn
đề khó nhất chưa được giải quyết. Trí tuệ nhân tạo mạnh khái niệm để chỉ khả
năng của y tính thực hiện bất cứ công việc trí tuệ nào mà con người có thể thực hiện.
Khái niệm trí tuệ mạnh được sử dụng để phân biệt với trí tuệ nhân tạo yếu (weak AI)
hay trí tuệ nhân tạo ng dụng (applied AI), tức là dùng máy tính để giải quyết từng bài
toán ra quyết định hay lập luận đơn lẻ. Nvậy, trí tuệ nhân tạo mạnh đòi hỏi giải quyết
đầy đủ các công việc trí tuệ như người trong khi trí tuệ nhân tạo yếu giải quyết bài toán
cụ thể.
Các khó khăn để đạt được trí tuệ nhân tạo tổng quát bao gồm khả năng thị
giác y, xử ngôn ngữ tự nhiên, khả ng xử các tình hướng mới, tình huống
không ngờ tới khi giải quyết các bài toán thực tế. Đây những lĩnh vực máy tính
còn thua kém con người. Các hệ thống trí tunhân tạo hiện nay thể giải quyết tốt
bài toán đặt ra trong một phạm vi hẹp.
Tuy nhiên, khi gặp vấn đề thực tế phạm vi rộng hơn, hệ thống trí tunhân
tạo thường không thể xử được các tình huống mới, vượt ra ngoài ngữ cảnh ban đầu
của bài toán. Ngược lại, con người có khả năng xử tốt hơn nhiều những trường hợp
như vậy do có hiểu biết rộng về thế giới xung quanh. Việc trang bị cho máy tính lượng
tri thức như con người hiện vẫn là vấn đề chưa được giải quyết.
1.4. Lịch sử hình thành và phát triển của AI
Lịch sử của Trí tuệ nhân tạo là một câu chuyện về những kỳ vọng lớn lao, những
thành tựu đột phá, những giai đoạn thất vọng và stái sinh mạnh mẽ, dẫn đến lĩnh
vực sôi động mà chúng ta thấy ngày nay.
Giai đoạn manh nha (1943-1955): Trước khi thuật ngữ "Trí tuệ nhân tạo" ra
đời, những nền móng quan trọng đã được đặt. Năm 1943, Warren McCulloch
và Walter Pitts đề xut mô hình toán học đầu tiên của một nơron nhân tạo, cho
thấy về mặt lý thuyết, một mạng lưới các nơron như vậy có thtính toán bất kỳ
hàm logic nào. Công trình của Alan Turing vào năm 1950 đã tiên đoán về các
cỗ máy thông minh, học máy và các thuật toán di truyền.
Sự ra đời kỳ vọng lớn (1956-1974): Thuật ngữ "Artificial Intelligence"
được chính thức khai sinh tại một hi thảo mùa kéo dài hai tháng tại Đại học
Dartmouth vào năm 1956, quy tụ những người sau này trở thành những người
cha đẻ của lĩnh vực này như John McCarthy, Marvin Minsky, Allen Newell
Herbert Simon. Giai đoạn này chứng kiến một sự lạc quan to lớn nhiều thành
tựu ban đầu ấn tượng: chương trình Logic Theorist của Newell Simon
thể chứng minh c định toán học; chương trình chơi cờ đam của Arthur
Samuel khả năng tự học để chơi giỏi hơn cả người tạo ra nó; John
McCarthy phát minh ra ngôn ngữ Lisp, trở thành ngôn ngữ thống trị trong AI
trong nhiều thập kỷ.
"Mùa đông AI" (1974-1980): Sự lạc quan ban đầu đã vấp phải thực tế khắc
nghiệt. Các hệ thống AI thời kỳ đầu, dựa trên các thao tác cú pháp đơn giản và
các phương pháp m kiếm tổng quát, đã thất bại khi đối mặt với các bài toán
phức tạp trong thế giới thực. Các dự án dịch máy đầy tham vọng đã không
thành công vì chúng thiếu hiểu biết vngữ cảnh ngữ nghĩa. Quan trọng hơn,
các nhà nghiên cứu đã đối mặt với vấn đề "bùng nổ tổ hợp" (combinatorial
explosion), khi số lượng các khả năng cần xem xét trong các bài toán tìm kiếm
tăng lên theo cấp số nhân, vượt xa khả năng tính toán của các máy tính thời đó.
Những thất bại này dẫn đến việc cắt giảm mạnh mẽ nguồn i trợ cho nghiên
cứu AI, đặc biệt là ở Mỹ và Anh, tạo ra một giai đoạn trì trệ được gọi là "Mùa
đông AI" đầu tiên. Giai đoạn này không đơn thuần là một vấn đề về tài chính;
là một cuộc khủng hoảng về phương pháp luận, cho thấy sự hạn chế của các
phương pháp AI biểu tượng thuần túy thiếu tri thức chuyên ngành.
Hệ chuyên gia sự trỗi dậy của hệ dựa trên tri thức (1969-1980s): Lối
thoát khỏi "Mùa đông AI" đến từ một sự thay đổi trong hình: thay c
gắng tạo ra các bộ giải quyết vấn đề tổng quát, c nhà nghiên cứu tập trung
vào việc xây dựng các hệ thống kiến thức chuyên sâu trong một lĩnh vực
hẹp. Điều này đã khai sinh ra các hchuyên gia (expert systems). Hệ thống
DENDRAL (1969) thể suy ra cấu trúc phân tử từ dliệu quang phổ với hiệu
suất vượt trội so với các chuyên gia con người. Hệ thống MYCIN (1974)
thể chẩn đoán các bệnh nhiễm trùng máu với độ chính xác tương đương các
bác giỏi. Thành công của các hệ chuyên gia đã chứng minh rằng sức mạnh
của một hệ thống thông minh đến từ tri thức sở hữu, khởi động lại
ngành công nghiệp AI.
AI trthành ngành khoa học công nghiệp (1980-nay): Giai đoạn y
chứng kiến sự trở lại của mạng nơron nhân tạo, vốn bị lãng quên trong một thời
gian dài. Các thuật toán mới nlan truyền ngược (backpropagation) cho phép
huấn luyện các mạng nơron nhiều lớp, khắc phục những hạn chế của các
hình Perceptron ban đầu. AI cũng bắt đầu áp dụng các phương pháp luận khoa
học chặt chẽ hơn, với các thuyết dựa trên c suất thống, yêu cầu
cao hơn về việc kiểm chứng thực nghiệm. Các công ty bt đầu thương mại hóa
công nghệ AI, đặc biệt các hệ chuyên gia, tạo ra một ngành công nghiệp trị
giá hàng tỷ đô la vào cuối những năm 1980.
Kỷ nguyên Dữ liệu lớn và Học sâu (2001-nay): Sự phát triển của Internet và
khả năng lưu trữ, xử dữ liệu khổng lồ đã tạo ra một cuộc cách mạng khác.
Mô hình phát triển AI chuyển dịch từ việc mã hóa tri thức thủ công (như trong
các hệ chuyên gia) sang việc cho phép các hthống tự "học" tri thức từ dữ liệu.
Các hệ thống dịch tđộng của Google đã đạt được những bước tiến vượt bậc
bằng cách phân tích hàng tỷ tài liệu song ngữ, thay vì dựa vào các quy tắc ngữ
pháp do con người lập trình. Gần đây, sự trỗi dậy của Học sâu (Deep Learning),
một dạng của mạng nơron với nhiều lớp ẩn, đã tạo ra những đột phá ngoạn mục
trong c lĩnh vực như nhận dạng hình ảnh, xử giọng nói ngôn ngữ tự
nhiên, đưa hiệu suất của y tính trong nhiều tác vụ đến gần, hoặc thậm chí
vượt qua con người.
Lịch sử này cho thấy một vòng lặp tiến hóa: từ logic biểu tượng tổng quát, đến
các hthống dựa trên tri thức chuyên gia, cuối cùng các hệ thống học từ dữ
liệu. Chính sự thất bại của các phương pháp ban đầu đã thúc đẩy sự ra đời của các
phương pháp tiếp theo, giải thích tại sao khóa học này tập trung vào Logic mờ (một
cách xtri thức không chắc chắn của chuyên gia) Mạng nơron (một công cụ
mạnh mẽ để học từ dữ liệu).
1.5. Biểu diễn tri thức bằng Logic mệnh đề
Để xây dựng các hệ thống có khả năng suy nghĩ hoặc hành động một cách hợp
lý, chúng ta cần một ngôn ngữ hình thức để biểu diễn tri thức và các quy tắc để suy
diễn từ tri thức đó. Logic mệnh đdạng logic đơn giản nhất, cung cấp nền tảng
cho các khái niệm vpháp, ngữ nghĩa suy diễn sđược sử dụng so sánh
trong suốt học phần. Đây điểm khởi đầu của "logic rõ" (crisp logic), nơi mọi mệnh
đề đều hoàn toàn đúng hoặc hoàn toàn sai, trước khi chúng ta chuyển sang "logic
mờ" (fuzzy logic) với các giá trị chân lý linh hoạt hơn.
Tri thức là sự hiểu biết về một miền chủ đề (lĩnh vực) nào đó.
Ví dụ:
- Hiểu biết về y học, văn học,.... là tri thức
- Thu thập thông tin ta được dữ liệu và căn cứ vào tri thức ta có được những
quyết dịnh phán đoán.
- Đối với quả cam ta xét các dữ liệu như vỏ, cuống, màu sắc,...của nó như thế
nào? và dựa vào hiểu biết của ta mà xác định xem quả cam đó là ngon hay
không ngon, ngon vừa,...
Như vậy, tri thức là dạng dữ liệu bậc cao. Khó phân biệt giữa tri thức và dữ liệu
(không có ranh giới ràng giữa chúng). Tuy nhiên ta thể phân biệt theo bảng
sau:
Dữ liệu Tri thức
- Định lượng
- Có cấu trúc đơn giản
- Ở dạng đơn giản
- Định tính
- Không cấu trúc hoặc
cấu trúc phức hợp
-
d
ng ph
c h
p
Người ta thể biểu diễn tri thức bằng logic mệnh đ cung cấp một nền
tảng đơn giản, chặt chẽ hệ thống để tả suy luận về thế giới. Đây
phương pháp nền tảng trong trí tuệ nhân tạo (AI) và khoa học máy tính. Dưới đây là
lý do chính:
Tính đơn giản và rõ ràng
Logic mệnh đề chia nhỏ tri thức phức tạp thành những "mệnh đề" bản nhất.
Mỗi mệnh đề một phát biểu đơn giản chỉ có thể nhận một trong hai giá trị: Đúng
(True) hoặc Sai (False).
Ví dụ:
o Mệnh đề P: "Trời đang mưa." (P có thể đúng hoặc sai)
o Mệnh đề Q: "Đường bị ướt." (Q có thể đúng hoặc sai)
Sự đơn giản này giúp máy tính dễ dàng xử lý thông tin, vì nó tương ứng trực
tiếp với hệ nhị phân (1 và 0) trong máy tính.
Tính chính xác và đơn nghĩa
Không giống ngôn ngữ tự nhiên thể hồ, logic mệnh đề yêu cầu mọi
phát biểu phải tuyệt đối rõ ràng.
Ngôn ngữ tự nhiên (mơ hồ): "Cái áo này khá đẹp." (Thế nào là "khá đẹp"?)
Logic mệnh đề (chính xác):
o IS_RED(shirt) (Áo có màu đỏ không?) Đúng/Sai.
o PRICE_UNDER_500K(shirt) (Giá áo dưới 500k không?)
Đúng/Sai.
Điều này loại bỏ sự nhầm lẫn và đảm bảo rằng mọi suy luận đều dựa trên các
sự thật không thể diễn giải theo cách khác.
Khả năng suy luận logic
Đây là lý do quan trọng nhất. Logic mệnh đề cung cấp các quy tắc và toán tử
(như VÀ , HOẶC , KHÔNG ¬, SUY RA ) để kết hợp các mệnh đề đơn lẻ
tạo ra tri thức mới một cách tự động.
Xây dựng luật: Chúng ta có thể biểu diễn một quy luật thực tế như: "Nếu trời
mưa thì đường ướt."
o Công thức logic: PQ
Suy luận: Nếu hệ thống biết thêm một sự thật là "Trời đang mưa" (tức là P là
Đúng), thể tự động suy ra rằng ường bị ướt" (tức Q cũng phải
Đúng). Đây là một ví dụ về quy tắc suy luận Modus Ponens.
Khả năng này cốti của các hệ thống chuyên gia, hệ thống chẩn đoán lỗi
và nhiều ứng dụng AI khác, giúp máy móc "suy nghĩ" một cách có logic.
Nền tảng cho các logic phức tạp hơn
Logic mệnh đề bước khởi đầu. Mặc những hạn chế (sẽ nói dưới),
nó xây dựng nền tảng vững chắc cho các hệ thống logic mạnh mẽ hơn như Logic vị
từ (Predicate Logic), vốn thể biểu diễn các mối quan hphức tạp hơn về đối tượng
và thuộc tính của chúng.
Hạn chế của logic mệnh đề
Mặc dù hữu ích, logic mệnh đề cũng có giới hạn:
Không biểu diễn đưc mối quan hệ giữa các đối tượng: Nó không thể diễn
tả các câu như "Tất cả mọi người đều phải thở." vì nó không có khái niệm về
"tất cả" hay "đối tượng". Mỗi sự thật, ví dụ "An phải thở", "Bình phải thở",
phải được biểu diễn như một mệnh đề riêng lẻ, rất cồng kềnh.
Khả năng biểu đạt hạn chế: chỉ làm việc với các phát biểu giá trị
Đúng/Sai, không phù hợp với các tri thức không chắc chắn hoặc mang tính
xác suất.
Phân biệt Cú pháp và ngữ nghĩa:
Cú pháp (Syntax)
Là bộ quy tắc về cấu trúc và cách sắp xếp các từ để tạo thành một câu hợp lệ. Nó
chỉ quan tâm đến hình thức, không quan tâm đến ý nghĩa. Các thành phần bản
bao gồm :
Các ký hiệu mệnh đề (Propositional Symbols): Các chữ cái in hoa như P, Q,
R,... đại diện cho các khẳng định về thế giới mà có thể đúng hoặc sai. Ví dụ: P
có thể đại diện cho "Trời đang mưa".

Preview text:

Chương 1: Mở đầu
1.1. Tổng quan về Trí tuệ nhân tạo Mục tiêu
Nội dung này nhằm cung cấp cho sinh viên một cái nhìn toàn cảnh, bối cảnh
lịch sử và các định nghĩa nền tảng của lĩnh vực Trí tuệ nhân tạo (tiếng Anh: Artificial
intelligence, viết tắt là: AI). Việc nắm vững các khái niệm này sẽ tạo ra một nền
móng vững chắc trước khi đi sâu vào các chủ đề kỹ thuật cụ thể của học phần, giúp
sinh viên hiểu rõ "tại sao" chúng ta nghiên cứu các phương pháp này, chứ không chỉ
là "làm thế nào" để áp dụng chúng. Nội dung chi tiết
Các định nghĩa và cách tiếp cận AI Định nghĩa:
Trí tuệ nhân tạo (TTNT) là một lĩnh vực rộng lớn và đa dạng của khoa học máy
tính, với mục tiêu cốt lõi là nghiên cứu và xây dựng các thực thể thông minh như con
người như học tập, suy luận, giải quyết vấn đề, nhận thức và đưa ra quyết định.
Tuy nhiên, bản thân khái niệm "trí tuệ" lại rất khó định nghĩa một cách chính xác,
dẫn đến việc có nhiều cách tiếp cận khác nhau để định nghĩa và xây dựng các hệ
thống TTNT. Các định nghĩa này có thể được phân thành bốn nhóm chính, dựa trên
hai trục so sánh: một là so sánh với con người (humanly) so với một tiêu chuẩn lý
tưởng về sự hợp lý (rationally), và hai là tập trung vào quá trình tư duy (thinking) so
với hành vi bên ngoài (acting).
● Hành động như người (Phép thử Turing):
Cách tiếp cận này định nghĩa trí tuệ thông qua hành vi. Năm 1950, nhà toán
học tiên phong Alan Turing đã đề xuất một bài kiểm tra, sau này được gọi là "Phép
thử Turing" (Turing Test), để xác định xem một cỗ máy có thể thể hiện hành vi
thông minh tương đương hoặc không thể phân biệt được với con người hay không.
Trong phép thử này, một người thẩm vấn sẽ giao tiếp bằng văn bản với hai đối
tượng ẩn danh: một là người thật và một là máy tính. Nếu người thẩm vấn không
thể phân biệt được đâu là máy, thì cỗ máy đó được coi là đã vượt qua bài kiểm tra
và thể hiện được trí tuệ. Để thành công, một hệ thống cần có các khả năng cốt lõi sau:
○ Xử lý ngôn ngữ tự nhiên (Natural Language Processing): Để giao tiếp
hiệu quả bằng ngôn ngữ của con người.
○ Biểu diễn tri thức (Knowledge Representation): Để lưu trữ những gì nó biết hoặc nghe được.
○ Suy diễn tự động (Automated Reasoning): Để sử dụng thông tin đã lưu
trữ để trả lời câu hỏi và rút ra kết luận mới.
○ Học máy (Machine Learning): Để thích nghi với hoàn cảnh mới và phát
hiện các mẫu. Gần đây, vào năm 2014, một chương trình chatbot tên là
Eugene Goostman đã thuyết phục được 33% giám khảo rằng nó là một
cậu bé 13 tuổi người Ukraine, làm dấy lên cuộc tranh luận về việc liệu
phép thử Turing có thực sự bị vượt qua hay không.
Một số câu hỏi ví dụ về kiểm tra Turing:
 Sự kiện thời thơ ấu đáng nhớ nhất của bạn là gì và nó đã tác động đến bạn như
thế nào cho đến ngày nay?
 Hãy mô tả bản thân bạn chỉ bằng màu sắc và hình dạng.
 Giải thích tại sao thời gian trôi nhanh như tên bắn nhưng trái cây lại bay nhanh như quả chuối?
 Sự kiện lịch sử nào đã thay đổi bạn nhiều nhất và bạn đang ở đâu khi sự kiện đó xảy ra?
 Trong các câu hỏi trước, câu hỏi nào khó trả lời nhất và tại sao?
● Suy nghĩ như người (Mô hình nhận thức): Một số định nghĩa:
"The exciting new effort to make computers think ... machines with minds, in
the full and literal sense." (Haugeland, 1985). Tạm dịch: “Nỗ lực mới thú vị để
làm cho máy tính biết suy nghĩ ... máy móc có trí óc, theo nghĩa đen và đầy đủ”
"[The automation of] activities that we associate with human thinking,
activities such as decision-making, problem solving, learning ..." (Bellman
1978). Tạm dịch, “[Việc tự động hóa] các hoạt động mà chúng ta liên kết với
suy nghĩ của con người, các hoạt động như ra quyết định, giải quyết vấn đề, học tập ...”
Theo nhóm định nghĩa này, hành động thông minh chỉ đạt được nếu được dẫn
dắt bởi quá trình suy nghĩ tương tự quá trình suy nghĩ của con người.
Những nghiên cứu theo hướng này dựa trên việc nghiên cứu quá trình nhận
thức và tư duy của con người, từ đây mô hình hóa và tạo ra những hệ thống có
mô hình nhận thức, tư duy tương tự. Việc tìm hiểu quá trình nhận thức, tư duy
của người có thể thực hiện theo một số phương pháp như: 1) thực nghiệm về hành
vi con người khi suy nghĩ hoặc giải quyết vấn đề; 2) chụp ảnh sóng não, đo tín
hiệu điện từ hoặc các tín hiệu khác của não trong quá trình thực hiện các công
việc khác nhau; 3) sử dụng các phương pháp nơ ron sinh học khác như kích thích não, giải phẫu não v.v.
Cách tiếp cận này đi sâu hơn, không chỉ quan tâm đến hành vi mà còn đến quá
trình tư duy bên trong. Để một chương trình có thể "suy nghĩ như người", chúng
ta phải hiểu được cách bộ não con người hoạt động. Lĩnh vực khoa học nhận thức
(cognitive science) là sự giao thoa giữa các mô hình tính toán của AI và các kỹ
thuật thực nghiệm từ tâm lý học để xây dựng các lý thuyết chính xác và có thể
kiểm chứng về hoạt động của trí não con người. Một ví dụ kinh điển là hệ thống
"General Problem Solver" (GPS) do Newell và Simon phát triển vào năm 1961,
được thiết kế để giải quyết vấn đề bằng cách mô phỏng các bước tư duy mà con người thực hiện.
● Suy nghĩ hợp lý (Các quy tắc tư duy): Một số định nghĩa:
"The study of mental faculties through the use of computational
models." (Charniak and McDermott, 1985). Tạm dịch “Nghiên cứu về các năng
lực trí tuệ thông qua việc sử dụng các mô hình tính toán”
"The study of the computations that make it possible to perceive, reason,
and act." (Winston, 1992). Tạm dịch: “Nghiên cứu về các tính toán giúp nhận
thức, suy luận và hành động.”
Thay vì mô phỏng con người, cách tiếp cận này hướng tới việc xây dựng các
hệ thống dựa trên các quy tắc tư duy đúng đắn và chặt chẽ. Triết gia Hy Lạp
Aristotle là người đầu tiên cố gắng hệ thống hóa "tư duy đúng đắn" thông qua các
phép tam đoạn luận (syllogisms), cho phép rút ra các kết luận chắc chắn từ các
tiền đề đúng. Sự phát triển của logic hình thức vào cuối thế kỷ 19 và đầu thế kỷ
20 đã cung cấp một bộ công cụ mạnh mẽ để biểu diễn các tri thức và thực hiện các
quá trình suy diễn một cách chính xác. Đây là nền tảng cho việc xây dựng các hệ
thống có khả năng chứng minh định lý toán học hoặc đưa ra các kết luận logic một cách tự động.
● Hành động hợp lý (Tác tử thông minh - Intelligent Agents): Một số định nghĩa:
"Computational Intelligence is the study of the design of intelligent
agents." (Poole et al., 1998). Tạm dịch “Trí tuệ tính toán là nghiên cứu về thiết
kế của các tác nhân thông minh”
"AI . . .is concerned with intelligent behavior in artifacts." (Nilsson, 1998).
Tạm dịch “AI . . .là quan tâm đến hành vi thông minh trong hiện vật”
Đây được coi là cách tiếp cận tổng quát và phổ biến nhất trong AI hiện đại.
Một "tác tử thông minh" (intelligent agent) là một thực thể có khả năng nhận thức
môi trường xung quanh thông qua các bộ cảm biến (sensors) và hành động lên môi
trường đó thông qua các cơ cấu chấp hành (effectors). "Hành động hợp lý" có nghĩa
là hành động sao cho đạt được kết quả tốt nhất, hoặc khi có sự không chắc chắn, đạt
được kết quả kỳ vọng tốt nhất. Cách tiếp cận này bao hàm các cách tiếp cận khác:
một tác tử có thể hành động hợp lý bằng cách sử dụng các quy tắc suy diễn logic,
nhưng đôi khi hành động theo phản xạ (không cần suy diễn sâu) lại hợp lý hơn trong
các tình huống khẩn cấp. Do đó, nó tập trung vào kết quả cuối cùng thay vì chỉ mô
phỏng quá trình của con người.
Sự phân biệt giữa các cách tiếp cận này không chỉ mang tính học thuật. Nó
phản ánh một sự căng thẳng cơ bản trong lĩnh vực AI: giữa mục tiêu mô phỏng con
người (mimesis) và mục tiêu đạt được hiệu suất tối ưu (rationality). Khóa học này,
bằng cách bắt đầu với logic (một công cụ của sự hợp lý) và sau đó chuyển sang logic
mờ và mạng nơron (những công cụ có thể mô hình hóa tư duy giống con người và
học hỏi từ kinh nghiệm), sẽ ngầm khám phá sự căng thẳng này. Mục tiêu cuối cùng
của một tác tử AI hiện đại là hành động hợp lý, và điều này có thể đạt được bằng
nhiều phương tiện khác nhau.
Bảng 1.1: So sánh các cách tiếp cận định nghĩa Trí tuệ nhân tạo Tiêu chí so Hành động
Suy nghĩ như Suy nghĩ hợp Hành động sánh như người người lý hợp lý Mục tiêu
Thực hiện các Mô phỏng quá Suy diễn một Đạt được mục
hành vi không trình tư duy của cách logic và tiêu một cách thể phân biệt con người. chính xác. tối ưu hoặc kỳ được với con vọng tối ưu. người.
Thước đo thành Vượt qua Phép So khớp mô Chứng minh Tối đa hóa một công thử Turing.
hình với dữ liệu được các kết thước đo hiệu
tâm lý học và luận là hệ quả suất
thần kinh học. logic của tiền (performance đề. measure).
Nền tảng khoa Khoa học xã
Khoa học nhận Logic, Toán Kinh tế học, Lý học
hội, Ngôn ngữ thức, Tâm lý
học, Triết học. thuyết quyết học. học, Khoa học định, Thống kê, thần kinh. Vận trù học.
Ví dụ điển hình Chatbot General
Các hệ chứng Xe tự lái, các hệ (Eugene
Problem Solver minh định lý tự thống giao dịch Goostman, (GPS). động. tự động, robot GPT-41), các công nghiệp. nhân vật trong game. Tổng kết:
Các phân tích ở trên cho thấy một số cách tiếp cận chính trong định nghĩa trí tuệ nhân tạo:
- Lấy con người làm tiêu chuẩn, nghiên cứu tâm lý và thần kinh học để mô
phỏng nhận thức con người, dựa trên đó xây dựng hệ thống trí tuệ nhân tạo. - Lấy kết quả
làm tiêu chuẩn, không nhất thiết phải xây dựng hệ thống mô phỏng người.
- Lấy hành vi và hành động làm mục đích, có thể có quá trình lập luận để hướng dẫn hành động hoặc không.
1 Các chatbot Eugene Goostman và GPT-4 đã vượt qua Bài kiểm tra Turing lần lượt vào năm 2014 và 2024.
TTNT là môn khoa học nghiên cứu và mô phỏng các quá trình sáng tạo của
con người trên máy tính điện tử, nhằm tạo ra các sản phẩm thông minh có khả năng
suy nghĩ, ra quyết định, hoặc hỗ trợ ra quyết định như con người.
1.2. Vai trò của trí tuệ nhân tạo
Vai trò của AI là vô cùng quan trọng đối với cuộc sống của chúng ta. AI có thể
tiếp cận với con người thông qua nhiều lĩnh vực, ngành nghề khác nhau. Ưu điểm của
trí tuệ nhân tạo là khả năng xử lý dữ liệu khoa học hơn, nhanh hơn, hệ thống hơn so
với con người. Việc phát triển và đưa các sản phẩm AI tới tay người dùng đúng cách
sẽ thúc đẩy mạnh mẽ sự phát triển của toàn nhân loại. Mở ra một thế giới hoàn toàn
mới cùng các giải pháp bù đắp cho những vấn đề mà con người không thể giải quyết.
- Theo 1 nghĩa nào đó TTNT tạo nên 1 cách đơn giản để xây dựng lên cấu trúc
các chương trình ra quyết định phức tạp đòi hỏi phải dựa trên những tri thức nhất định.
- Các chương trình TTNT hoạt động giống như bộ não của con người tức là nó có thể
tích hợp những tri thức mới mà không cần thay đổi lại cách làm việc. Vì vậy những
chương trình TTNT có thể dễ dàng cải tiến hơn so với các chương trình truyền thống.
- Khi máy tính được trang bị những phần mềm TTNT kết hợp với môi trường
làm việc thì có thể cho phép giải quyết được các bài toán cỡ lớn và phân tán.
- Một số phần mềm TTNT thể hiện tính thích nghi và mềm dẻo đối với các lớp
bài toán thuộc nhiều lĩnh vực khác nhau.
1.3. Các ứng dụng của trí tuệ nhân tạo
1.3.1 Các lĩnh vực nghiên cứu
Trí tuệ nhân tạo được chia thành một số lĩnh vực nghiên cứu nhỏ hơn và
chuyên sâu nhằm giải quyết những vấn đề khác nhau khi xây dựng một hệ thống trí tuệ
nhân tạo. Một số lĩnh vực chuyên sâu được hình thành để giải quyết một lớp bài toán.
Một số lĩnh vực chuyên sâu khác tập trung vào các hướng tiếp cận hay các kỹ thuật.
Một số lĩnh vực nghiên cứu lại xoay quanh các ứng dụng cụ thể. Trong khi nhiều lĩnh
vực nghiên cứu nhỏ có liên quan mật thiết đến nhau thì có nhiều lĩnh vực khác rất xa
nhau, cả về mục tiêu, phương pháp và cộng đồng nghiên cứu. Các lĩnh vực phổ biến có thể kể đến như sau:
Thông thường, một hệ thống trí tuệ nhân tạo hoàn chỉnh, làm việc trong việc
một môi trường nào đó cần có khả năng: cảm nhận (perception), lập luận (reasoning),
và hành động (action). Dưới đây là một số lĩnh vực nghiên cứu của trí tuệ nhân tạo
được phân chia theo ba thành phần này. a) Cảm nhận (perception)
Hệ thống cần có cơ chế thu nhận thông tin liên quan tới hoạt động từ môi
trường bên ngoài. Đó có thể là camera, cảm biến âm thanh (microphone), cảm biến siêu
âm, radar, cảm biến gia tốc, các cảm biến khác. Đó cũng có thể đơn giản hơn là thông
tin do người dùng nhập vào chương trình bằng tay. Để biến đổi thông tin nhận được về
dạng có thể hiểu được, thông tin cần được xử lý nhờ những kỹ thuật được nghiên cứu
và trong khuôn khổ các lĩnh vực sau:
o Thị giác máy (computer vision) o Nhận dạng mẫu
o Xử lý ngôn ngữ tự nhiên (natural language processing)
b) Lập luận và suy diễn
Sau khi cảm nhận được thông tin về môi trường xung quanh, hệ thống cần có
cơ chế để đưa ra được quyết định phù hợp. Quá trình ra quyết định thường dựa trên
việc kết hợp thông tin cảm nhận được với tri thức có sẵn về thế giới xung quanh. Việc
ra quyết định dựa trên tri thức được thực hiện nhờ lập luận hay suy diễn. Cũng có
những trường hợp hệ thống không thực hiện suy diễn mà dựa trên những kỹ thuật khác
như tìm kiếm hay tập hợp các phản xạ hoặc hành vi đơn giản.
Thành phần lập luận và ra quyết định được xây dựng dựa trên kỹ thuật từ
những lĩnh vực nghiên cứu sau:
o Biểu diễn tri thức (knowledge representation) o Tìm kiếm (search)
o Lập luận, suy diễn (reasoning hay inference)
o Học máy (machine learning) o Deep Learning (Học Sâu)
o Lập kế hoạch (planning) c) Hành động
Cho phép hệ thống tác động vào môi trường xung quanh hoặc đơn giản là đưa
ra thông tin về kết luận của mình. Thành phần này được xây dựng dựa trên những kỹ
thuật sau. Tổng hợp ngôn ngữ tự nhiên và tiếng nói và Kỹ thuật rô bốt (robotics).
Là kỹ thuật xây dựng các cơ quan chấp hành như cánh tay người máy, tổng
hợp tiếng nói, tổng hợp ngôn ngữ tự nhiên. Đây là lĩnh vực nghiên cứu giao thoa giữa
cơ khí, điện tử, và trí tuệ nhân tạo. Bên cạnh kỹ thuật cơ khí để tạo ra các cơ chế vật
lý, chuyển động, cần có thuật toán và chương trình điểu khiển hoạt động và chuyển
động cho các cơ chế đó. Chẳng hạn, với cánh tay máy, cần tính toán quỹ đạo và điều
khiển cụ thể các khớp nối cơ khí khi muốn di chuyển tay tới vị trí xác định và thực hiện
hành động nào đó. Đây là những thành phần của kỹ thuật rô bốt mà trí tuệ nhân tạo có
đóng góp chính. Ngoài ra, việc xây dựng những rô bốt thông minh chính là xây dựng
các hệ thống trí tuệ nhân tạo hoàn chỉnh.
1.3.2 Một số ứng dụng và thành tựu
a. Các chương trình trò chơi
Xây dựng chương trình có khả năng chơi những trò chơi trí tuệ là lĩnh vực
có nhiều thành tựu của trí tuệ nhân tạo. Với những trò chơi tương đối đơn giản như cờ
carô hay cờ thỏ cáo, máy tính đã thắng người từ cách đây vài thập kỷ.
Đối với những trò chơi phức tạp hơn, các hệ thống trí tuệ nhân tạo cũng dần
đuổi kịp và vượt qua con người. Sự kiện quan trọng thường được nhắc tới là vào tháng
5 năm 1997 chương trình cờ vua Deep Blue của IBM đã thắng vô địch cờ vua thế giới
lúc đó là Gary Kasparov. Đây là lần đầu tiên máy tính thắng đương kim vô địch cờ vua
thế giới. Năm 2015 máy chơi cờ vây AlphaGo của Google DeepMind đạt tới đẳng cấp
con người nhờ sử dụng học sâu kết hợp với lấy mẫu cây Monte Carlo. Thách thức
trong Poker là không gian của trạng thái lớn và nó không được quan sát đầy đủ (ta
không biết các quân bài của đối thủ). Libratus vượt chất lượng con người trong môn
Poker sử dụng các chiến thuật có cấu trúc một cách hiệu quả [Brown & Sandholm,
2017]. Những điều này thể hiện một sự tiến triển ấn tượng trong các trò chơi và tầm
quan trọng của các thuật toán nâng cao trong đó.
Một trường hợp tiêu biểu khác là hệ thống trả lời tự động Watson cũng của
IBM đã chiến thắng hai quán quân của Jeopardy trong trò chơi này vào năm 2011.
Jeopardy là trò chơi hỏi đáp trên truyền hình Mỹ, tương tự “Ai là triệu phú” trên truyền
hình Việt Nam nhưng trong đó ba người chơi phải thi với nhau không những trả lời
đúng mà còn phải nhanh. Watson là hệ thống hỏi đáp do IBM xây dựng dựa trên việc
thu thập và phân tích thông tin từ khoảng 200 triệu trang Web, trong đó có toàn bộ
Wikipedia. Trong một cuộc đấu với hai cựu quán quân Jeopardy, Watson đã giành
thắng lợi và phần thưởng 1 triệu USD. Các kỹ thuật sử dụng trong Watson như thu thập
thông tin, phát hiện tri thức, hiểu ngôn ngữ tự nhiên, tìm kiếm, đã được IBM thương
mại hóa và có thể sử dụng trong nhiều ứng dụng. b. Nhận dạng tiếng nói
Nhận dạng tiếng nói là biến đổi từ âm thanh tiếng nói thành các văn bản.
Hiện người dùng công cụ tìm kiếm Google có thể đọc vào câu truy vấn thay cho việc
gõ từ khóa như trước. Các điện thoại di động thông minh cũng có khả năng nhận dạng
giọng nói và trả lời các câu hỏi. Ví dụ điển hình là chương trình trợ giúp Siri trên điện
thoại thông minh của Apple (sử dụng công nghệ nhận dạng tiếng nói của hãng Nuance) hay hệ thống Google Now.
Chất lượng nhận dạng giọng nói đang được cải thiện và tiến bộ rất nhanh
trong vài năm gần đây. Các hệ thống nhận dạng tiếng nói hiện tại cho phép nhận dạng
tới vài chục ngôn ngữ khác nhau và không phụ thuộc vào người nói (ở một mức độ nhất định). c. Thị giác máy tính
Mặc dù nhiều ứng dụng của thị giác máy tính vẫn chưa đạt tới độ chính xác
như người, nhưng trong một số bài toán, thị giác máy tính cho độ chính xác tương
đương hoặc gần với khả năng của người. Tiêu biểu phải kể đến các hệ thống nhận dạng
chữ in với độ chính xác gần như tuyệt đối, hệ thống nhận dạng tròng mắt, vân tay, mặt
người. Những hệ thống dạng này được sử dụng rộng rãi trong sản xuất để kiểm tra sản
phẩm, trong hệ thống camera an ninh. Ứng dụng nhận dạng mặt người trên Facebook
được dùng để xác định những người quen xuất hiện trong ảnh và gán nhãn tên cho người đó.
Các ứng dụng nhận dạng hiện nay đang được cải thiện nhiều nhờ sử dụng
kỹ thuật học sâu (deep learning), trong đó các mạng nơ ron có nhiều lớp được kết nối
với nhau được sử dụng để phát hiện các đặc trưng của đối tượng ở mức từ đơn giản tới phức tạp.
Nhận dạng đối tượng cũng đã tiến một bước dài. Nhận dạng đối tượng trong
ảnh là một tác vụ khó trong năm 2010. Trong bảng xếp hạng ImageNet, Lin và các
cộng sự năm 2010 đạt được tỷ lệ lỗi top-5 là 28%. Tới 2017. Hu và các cộng sự giảm
tỉ lệ lỗi này xuống còn 2,25%. Học sâu đã giúp phân loại cả ngàn vật thể khác nhau
trong các bức ảnh, tự tạo chú thích cho ảnh, tự sinh ảnh.
d. Các thiết bị tự lái
Các thiết bị tự lái bao gồm máy bay, ô tô, tầu thủy, thiết bị thám hiểm vũ trụ
có thể tự di chuyển mà không có sự điều khiển của người (cả điều khiển trực tiếp và
điều khiển từ xa). Hiện ô tô tự lái đang được một số hãng công nghệ và các tổ chức
khác nghiên cứu và phát triển, trong đó có những dự án nổi tiếng như xe tự lái của
Google và Tesla. Mặc dù tại thời điểm viết sách này mới chỉ có một mẫu xe duy nhất
được thương mại hóa dùng cho các khu đi bộ và chỉ có thể chạy với tốc độ khoảng 20
km/giờ nhưng các dự báo cho thấy xe tự lái sẽ được thương mại hóa thành công trong
vòng vài năm tới. Các thiết bị tự lái khác bao gồm cả các xem thám hiểm vũ trụ và hành
tinh khác như xe thám hiểm sao Hỏa của NASA. e. Hệ chuyên gia
Là các hệ thống làm việc dựa trên kinh nghiệm và tri thức của chuyên gia
trong một lĩnh vực tương đối hẹp nào đó để đưa ra khuyến cáo, kết luận, chuẩn đoán
một cách tự động. Các ví dụ gồm:
o MYCIN (1984, Stanford): hệ chuyên gian đầu tiên chẩn đoán bệnh về
nhiễm trùng máu và cách điều trị với khả năng tương đương một bác sĩ giỏi trong lĩnh vực này.
o XCON của DEC: hỗ trợ chọn cấu hình máy tính tự động.
f. Xử lý, hiểu ngôn ngữ tự nhiên
Tiêu biểu là các hệ thống dịch tự động như hệ thống dịch của Google, các hệ
thống tóm tắt nội dung văn bản tự động. Hệ thống dịch tự động của Google sử dụng
các mô hình thống kê xây dựng từ các văn bản song ngữ và các văn bản đơn ngữ. Hệ
thống này có khả năng dịch qua lại giữa vài chục ngôn ngữ.
Các hệ thống hỏi đáp được đề cập tới trong phần về trò chơi và nhận dạng
tiếng nói cũng thuộc loại ứng dụng xử lý ngôn ngữ tự nhiên. Những hệ thống này sử
dụng những thành phần đơn giản hơn như các phân hệ phân tích hình thái, cú pháp, ngữ
nghĩa. Các ứng dụng khác như trợ lý ảo, hệ thống gợi ý sản phẩm của Amazon, hệ
thống gợi ý phim của Netflix.
Các trợ lý thông minh như Apple Siri, Amazon Alexa, hay Google Assistant
có khả năng trả lời các câu hỏi thoại với độ chính xác chấp nhận được. Việc này cũng
bao gồm các tác vụ đơn giản như bật đèn (hữu ích đối với người tàn tật) tới đặt lịch hẹn
cắt tóc và đưa ra các đoạn hội thoại để hỗ trợ các tổng đài chăm sóc khách hàng.
Nhiều kỹ thuật xử lý ngôn ngữ tự nhiên đã được ứng dụng trong các ứng dụng rất
thiết thực như các bộ lọc thư rác. Dịch vụ thư điện tử của Google, Microsoft, Yahoo đều
có các bộ lọc thư rác với cơ chế học tự động và thích nghi với thay đổi của người phát
tán. Khả năng phát hiện thư rác của các hệ thống này là rất cao, gần như tuyệt đối trong một số trường hợp.
ChatGPT là một chatbot do công ty OpenAI của Mỹ phát triển và ra mắt
vào tháng 11 năm 2022. ChatGPT được xây dựng dựa trên GPT-3.5 một dòng mô
hình ngôn ngữ lớn của OpenAI đồng thời được tinh chỉnh bằng cả hai kỹ thuật học tăng
cường lẫn học có giám sát. ChatGPT nhanh chóng thu hút sự chú ý nhờ việc nó có thể
hồi đáp chi tiết và trả lời lưu loát trên nhiều lĩnh vực kiến thức khác nhau.
g. Lập kế hoạch, lập thời khóa biểu
Kỹ thuật trí tuệ nhân tạo được sử dụng nhiều trong bài toán lập thời khóa
biểu cho trường học, xí nghiệp, các bài toán lập kế hoạch khác. Một ví dụ lập kế hoạch
thành công với quy mô lớn là kế hoạch đảm bảo hậu cần cho quân đội Mỹ trong chiến
dịch Cơn bão sa mạc tại Iraq đã được thực hiện gần như hoàn toàn dựa trên kỹ thuật trí
tuệ nhân tạo. Đây là một kế hoạch lớn, liên quan tới khoảng 50000 thiết bị vận tải và
người tại cùng một thời điểm. Kế hoạch bao gồm điểm xuất phát, điểm tới, thời gian,
phương tiện và người tham gia sao cho không mâu thuẫn và tối ưu theo các tiêu chí.
Chương trình lập lịch và điều khiển thông minh trên xe tự hành và Robot tự hành của NASA. h. Rô bốt
Một số rô bốt được xây dựng sao cho có hình dạng tương tự con người và
khả năng toàn diện như thị giác máy, giao tiếp bằng ngôn ngữ tự nhiên, khả năng lập
luận nhất định, khả năng di chuyển và thực hiện các hành động như nhẩy múa. Các rô
bốt này chủ yếu được tạo ra để chứng minh khả năng của kỹ thuật rô bốt thay vì hướng
vào ứng dụng cụ thể. Trong số này có thể kể tới rô bốt Asimo, rô bốt Nao.
Bên cạnh đó, một số rô bốt không mô phỏng người nhưng được sử dụng
trong đời sống hàng ngày hoặc các ứng dụng thực tế. Ví dụ, rô bốt Roomba của hãng
iRobot có khả năng tự động di chuyển trong phòng, tránh vật cản, chui vào các ngóc
ngách để lau sạch toàn bộ sàn. Số lượng rô bốt Roomba đã bán lên tới vài triệu bản.
1.3.3. Những vấn đề chưa được giải quyết
Mặc dù đạt được nhiều thành tựu và có nhiều ứng dụng đáng kể, các hệ thống
trí tuệ nhân tạo hiện nay chưa đạt được mức độ trí tuệ nhân tạo mạnh (strong AI) hay
trí tuệ nhân tạo tổng quát (Artificial General Intelligence). Đây cũng được coi là vấn
đề khó nhất và chưa được giải quyết. Trí tuệ nhân tạo mạnh là khái niệm để chỉ khả
năng của máy tính thực hiện bất cứ công việc trí tuệ nào mà con người có thể thực hiện.
Khái niệm trí tuệ mạnh được sử dụng để phân biệt với trí tuệ nhân tạo yếu (weak AI)
hay trí tuệ nhân tạo ứng dụng (applied AI), tức là dùng máy tính để giải quyết từng bài
toán ra quyết định hay lập luận đơn lẻ. Như vậy, trí tuệ nhân tạo mạnh đòi hỏi giải quyết
đầy đủ các công việc trí tuệ như người trong khi trí tuệ nhân tạo yếu giải quyết bài toán cụ thể.
Các khó khăn để đạt được trí tuệ nhân tạo tổng quát bao gồm khả năng thị
giác máy, xử lý ngôn ngữ tự nhiên, khả năng xử lý các tình hướng mới, tình huống
không ngờ tới khi giải quyết các bài toán thực tế. Đây là những lĩnh vực mà máy tính
còn thua kém con người. Các hệ thống trí tuệ nhân tạo hiện nay có thể giải quyết tốt
bài toán đặt ra trong một phạm vi hẹp.
Tuy nhiên, khi gặp vấn đề thực tế ở phạm vi rộng hơn, hệ thống trí tuệ nhân
tạo thường không thể xử lý được các tình huống mới, vượt ra ngoài ngữ cảnh ban đầu
của bài toán. Ngược lại, con người có khả năng xử lý tốt hơn nhiều những trường hợp
như vậy do có hiểu biết rộng về thế giới xung quanh. Việc trang bị cho máy tính lượng
tri thức như con người hiện vẫn là vấn đề chưa được giải quyết.
1.4. Lịch sử hình thành và phát triển của AI
Lịch sử của Trí tuệ nhân tạo là một câu chuyện về những kỳ vọng lớn lao, những
thành tựu đột phá, những giai đoạn thất vọng và sự tái sinh mạnh mẽ, dẫn đến lĩnh
vực sôi động mà chúng ta thấy ngày nay.
● Giai đoạn manh nha (1943-1955): Trước khi thuật ngữ "Trí tuệ nhân tạo" ra
đời, những nền móng quan trọng đã được đặt. Năm 1943, Warren McCulloch
và Walter Pitts đề xuất mô hình toán học đầu tiên của một nơron nhân tạo, cho
thấy về mặt lý thuyết, một mạng lưới các nơron như vậy có thể tính toán bất kỳ
hàm logic nào. Công trình của Alan Turing vào năm 1950 đã tiên đoán về các
cỗ máy thông minh, học máy và các thuật toán di truyền.
● Sự ra đời và kỳ vọng lớn (1956-1974): Thuật ngữ "Artificial Intelligence"
được chính thức khai sinh tại một hội thảo mùa hè kéo dài hai tháng tại Đại học
Dartmouth vào năm 1956, quy tụ những người sau này trở thành những người
cha đẻ của lĩnh vực này như John McCarthy, Marvin Minsky, Allen Newell và
Herbert Simon. Giai đoạn này chứng kiến một sự lạc quan to lớn và nhiều thành
tựu ban đầu ấn tượng: chương trình Logic Theorist của Newell và Simon có
thể chứng minh các định lý toán học; chương trình chơi cờ đam của Arthur
Samuel có khả năng tự học để chơi giỏi hơn cả người tạo ra nó; và John
McCarthy phát minh ra ngôn ngữ Lisp, trở thành ngôn ngữ thống trị trong AI trong nhiều thập kỷ.
● "Mùa đông AI" (1974-1980): Sự lạc quan ban đầu đã vấp phải thực tế khắc
nghiệt. Các hệ thống AI thời kỳ đầu, dựa trên các thao tác cú pháp đơn giản và
các phương pháp tìm kiếm tổng quát, đã thất bại khi đối mặt với các bài toán
phức tạp trong thế giới thực. Các dự án dịch máy đầy tham vọng đã không
thành công vì chúng thiếu hiểu biết về ngữ cảnh và ngữ nghĩa. Quan trọng hơn,
các nhà nghiên cứu đã đối mặt với vấn đề "bùng nổ tổ hợp" (combinatorial
explosion), khi số lượng các khả năng cần xem xét trong các bài toán tìm kiếm
tăng lên theo cấp số nhân, vượt xa khả năng tính toán của các máy tính thời đó.
Những thất bại này dẫn đến việc cắt giảm mạnh mẽ nguồn tài trợ cho nghiên
cứu AI, đặc biệt là ở Mỹ và Anh, tạo ra một giai đoạn trì trệ được gọi là "Mùa
đông AI" đầu tiên. Giai đoạn này không đơn thuần là một vấn đề về tài chính;
nó là một cuộc khủng hoảng về phương pháp luận, cho thấy sự hạn chế của các
phương pháp AI biểu tượng thuần túy thiếu tri thức chuyên ngành.
● Hệ chuyên gia và sự trỗi dậy của hệ dựa trên tri thức (1969-1980s): Lối
thoát khỏi "Mùa đông AI" đến từ một sự thay đổi trong mô hình: thay vì cố
gắng tạo ra các bộ giải quyết vấn đề tổng quát, các nhà nghiên cứu tập trung
vào việc xây dựng các hệ thống có kiến thức chuyên sâu trong một lĩnh vực
hẹp. Điều này đã khai sinh ra các hệ chuyên gia (expert systems). Hệ thống
DENDRAL (1969) có thể suy ra cấu trúc phân tử từ dữ liệu quang phổ với hiệu
suất vượt trội so với các chuyên gia con người. Hệ thống MYCIN (1974) có
thể chẩn đoán các bệnh nhiễm trùng máu với độ chính xác tương đương các
bác sĩ giỏi. Thành công của các hệ chuyên gia đã chứng minh rằng sức mạnh
của một hệ thống thông minh đến từ tri thức mà nó sở hữu, và khởi động lại ngành công nghiệp AI.
● AI trở thành ngành khoa học và công nghiệp (1980-nay): Giai đoạn này
chứng kiến sự trở lại của mạng nơron nhân tạo, vốn bị lãng quên trong một thời
gian dài. Các thuật toán mới như lan truyền ngược (backpropagation) cho phép
huấn luyện các mạng nơron nhiều lớp, khắc phục những hạn chế của các mô
hình Perceptron ban đầu. AI cũng bắt đầu áp dụng các phương pháp luận khoa
học chặt chẽ hơn, với các lý thuyết dựa trên xác suất và thống kê, và yêu cầu
cao hơn về việc kiểm chứng thực nghiệm. Các công ty bắt đầu thương mại hóa
công nghệ AI, đặc biệt là các hệ chuyên gia, tạo ra một ngành công nghiệp trị
giá hàng tỷ đô la vào cuối những năm 1980.
● Kỷ nguyên Dữ liệu lớn và Học sâu (2001-nay): Sự phát triển của Internet và
khả năng lưu trữ, xử lý dữ liệu khổng lồ đã tạo ra một cuộc cách mạng khác.
Mô hình phát triển AI chuyển dịch từ việc mã hóa tri thức thủ công (như trong
các hệ chuyên gia) sang việc cho phép các hệ thống tự "học" tri thức từ dữ liệu.
Các hệ thống dịch tự động của Google đã đạt được những bước tiến vượt bậc
bằng cách phân tích hàng tỷ tài liệu song ngữ, thay vì dựa vào các quy tắc ngữ
pháp do con người lập trình. Gần đây, sự trỗi dậy của Học sâu (Deep Learning),
một dạng của mạng nơron với nhiều lớp ẩn, đã tạo ra những đột phá ngoạn mục
trong các lĩnh vực như nhận dạng hình ảnh, xử lý giọng nói và ngôn ngữ tự
nhiên, đưa hiệu suất của máy tính trong nhiều tác vụ đến gần, hoặc thậm chí vượt qua con người.
Lịch sử này cho thấy một vòng lặp tiến hóa: từ logic biểu tượng tổng quát, đến
các hệ thống dựa trên tri thức chuyên gia, và cuối cùng là các hệ thống học từ dữ
liệu. Chính sự thất bại của các phương pháp ban đầu đã thúc đẩy sự ra đời của các
phương pháp tiếp theo, giải thích tại sao khóa học này tập trung vào Logic mờ (một
cách xử lý tri thức không chắc chắn của chuyên gia) và Mạng nơron (một công cụ
mạnh mẽ để học từ dữ liệu).
1.5. Biểu diễn tri thức bằng Logic mệnh đề
Để xây dựng các hệ thống có khả năng suy nghĩ hoặc hành động một cách hợp
lý, chúng ta cần một ngôn ngữ hình thức để biểu diễn tri thức và các quy tắc để suy
diễn từ tri thức đó. Logic mệnh đề là dạng logic đơn giản nhất, cung cấp nền tảng
cho các khái niệm về cú pháp, ngữ nghĩa và suy diễn sẽ được sử dụng và so sánh
trong suốt học phần. Đây là điểm khởi đầu của "logic rõ" (crisp logic), nơi mọi mệnh
đề đều hoàn toàn đúng hoặc hoàn toàn sai, trước khi chúng ta chuyển sang "logic
mờ" (fuzzy logic) với các giá trị chân lý linh hoạt hơn.
Tri thức là sự hiểu biết về một miền chủ đề (lĩnh vực) nào đó. Ví dụ:
- Hiểu biết về y học, văn học,.... là tri thức
- Thu thập thông tin ta được dữ liệu và căn cứ vào tri thức ta có được những quyết dịnh phán đoán.
- Đối với quả cam ta xét các dữ liệu như vỏ, cuống, màu sắc,...của nó như thế
nào? và dựa vào hiểu biết của ta mà xác định xem quả cam đó là ngon hay không ngon, ngon vừa,...
Như vậy, tri thức là dạng dữ liệu bậc cao. Khó phân biệt giữa tri thức và dữ liệu
(không có ranh giới rõ ràng giữa chúng). Tuy nhiên ta có thể phân biệt theo bảng sau: Dữ liệu Tri thức - Định lượng - Định tính
- Có cấu trúc đơn giản
- Không có cấu trúc hoặc có - Ở dạng đơn giản cấu trúc phức hợp - Ở dạng phức hợp
Người ta có thể biểu diễn tri thức bằng logic mệnh đề vì nó cung cấp một nền
tảng đơn giản, chặt chẽ và có hệ thống để mô tả và suy luận về thế giới. Đây là
phương pháp nền tảng trong trí tuệ nhân tạo (AI) và khoa học máy tính. Dưới đây là lý do chính:
Tính đơn giản và rõ ràng
Logic mệnh đề chia nhỏ tri thức phức tạp thành những "mệnh đề" cơ bản nhất.
Mỗi mệnh đề là một phát biểu đơn giản chỉ có thể nhận một trong hai giá trị: Đúng (True) hoặc Sai (False).  Ví dụ:
o Mệnh đề P: "Trời đang mưa." (P có thể đúng hoặc sai)
o Mệnh đề Q: "Đường bị ướt." (Q có thể đúng hoặc sai)
Sự đơn giản này giúp máy tính dễ dàng xử lý thông tin, vì nó tương ứng trực
tiếp với hệ nhị phân (1 và 0) trong máy tính.
Tính chính xác và đơn nghĩa
Không giống ngôn ngữ tự nhiên có thể mơ hồ, logic mệnh đề yêu cầu mọi
phát biểu phải tuyệt đối rõ ràng.
 Ngôn ngữ tự nhiên (mơ hồ): "Cái áo này khá đẹp." (Thế nào là "khá đẹp"?)
 Logic mệnh đề (chính xác):
o IS_RED(shirt) (Áo có màu đỏ không?)  Đúng/Sai.
o PRICE_UNDER_500K(shirt) (Giá áo dưới 500k không?)  Đúng/Sai.
Điều này loại bỏ sự nhầm lẫn và đảm bảo rằng mọi suy luận đều dựa trên các
sự thật không thể diễn giải theo cách khác. Khả năng suy luận logic
Đây là lý do quan trọng nhất. Logic mệnh đề cung cấp các quy tắc và toán tử
(như VÀ ∧, HOẶC ∨, KHÔNG ¬, SUY RA ⇒) để kết hợp các mệnh đề đơn lẻ và
tạo ra tri thức mới một cách tự động.
 Xây dựng luật: Chúng ta có thể biểu diễn một quy luật thực tế như: "Nếu trời mưa thì đường ướt." o Công thức logic: P⇒Q
 Suy luận: Nếu hệ thống biết thêm một sự thật là "Trời đang mưa" (tức là P là
Đúng), nó có thể tự động suy ra rằng "Đường bị ướt" (tức là Q cũng phải là
Đúng). Đây là một ví dụ về quy tắc suy luận Modus Ponens.
Khả năng này là cốt lõi của các hệ thống chuyên gia, hệ thống chẩn đoán lỗi
và nhiều ứng dụng AI khác, giúp máy móc "suy nghĩ" một cách có logic.
Nền tảng cho các logic phức tạp hơn
Logic mệnh đề là bước khởi đầu. Mặc dù nó có những hạn chế (sẽ nói ở dưới),
nó xây dựng nền tảng vững chắc cho các hệ thống logic mạnh mẽ hơn như Logic vị
từ (Predicate Logic), vốn có thể biểu diễn các mối quan hệ phức tạp hơn về đối tượng
và thuộc tính của chúng.
Hạn chế của logic mệnh đề
Mặc dù hữu ích, logic mệnh đề cũng có giới hạn:
 Không biểu diễn được mối quan hệ giữa các đối tượng: Nó không thể diễn
tả các câu như "Tất cả mọi người đều phải thở." vì nó không có khái niệm về
"tất cả" hay "đối tượng". Mỗi sự thật, ví dụ "An phải thở", "Bình phải thở",
phải được biểu diễn như một mệnh đề riêng lẻ, rất cồng kềnh.
 Khả năng biểu đạt hạn chế: Nó chỉ làm việc với các phát biểu có giá trị
Đúng/Sai, không phù hợp với các tri thức không chắc chắn hoặc mang tính xác suất.
Phân biệt Cú pháp và ngữ nghĩa: Cú pháp (Syntax)
Là bộ quy tắc về cấu trúc và cách sắp xếp các từ để tạo thành một câu hợp lệ. Nó
chỉ quan tâm đến hình thức, không quan tâm đến ý nghĩa. Các thành phần cơ bản bao gồm :
● Các ký hiệu mệnh đề (Propositional Symbols): Các chữ cái in hoa như P, Q,
R,... đại diện cho các khẳng định về thế giới mà có thể đúng hoặc sai. Ví dụ: P
có thể đại diện cho "Trời đang mưa".