23 trang 24 lượt tải

Tài liệu sưu tầm chương 1. nhập môn trí tuệ nhân tạo

Tài liệu sưu tầm chương 1. nhập môn trí tuệ nhân tạo. Tài liệu tổng hợp được sưu tầm gồm 23 trang. Mời các bạn tham khảo

Môn: Trí tuệ nhân tạo (HUST) 12 tài liệu

Trường: Đại học Bách Khoa Hà Nội 5.7 K tài liệu

Tác giả:

Oroka Abi

2 tháng trước

Tải xuống Báo cáo

Danh sách Quiz

Chương 1: Mở đầu

1.1. Tổng quan về Trí tuệ nhân tạo

Mục tiêu

Nội dung này nhằm cung cấp cho sinh viên một cái nhìn toàn cảnh, bối cảnh

lịch sử và các định nghĩa nền tảng của lĩnh vực Trí tuệ nhân tạo (tiếng Anh: Artificial

intelligence, viết tắt là: AI). Việc nắm vững các khái niệm này sẽ tạo ra một nền

móng vững chắc trước khi đi sâu vào các chủ đề kỹ thuật cụ thể của học phần, giúp

sinh viên hiểu rõ "tại sao" chúng ta nghiên cứu các phương pháp này, chứ không chỉ

là "làm thế nào" để áp dụng chúng.

Nội dung chi tiết

Các định nghĩa và cách tiếp cận AI

Định nghĩa:

Trí tuệ nhân tạo (TTNT) là một lĩnh vực rộng lớn và đa dạng của khoa học máy

tính, với mục tiêu cốt lõi là nghiên cứu và xây dựng các thực thể thông minh như con

người như học tập, suy luận, giải quyết vấn đề, nhận thức và đưa ra quyết định.

Tuy nhiên, bản thân khái niệm "trí tuệ" lại rất khó định nghĩa một cách chính xác,

dẫn đến việc có nhiều cách tiếp cận khác nhau để định nghĩa và xây dựng các hệ

thống TTNT. Các định nghĩa này có thể được phân thành bốn nhóm chính, dựa trên

hai trục so sánh: một là so sánh với con người (humanly) so với một tiêu chuẩn lý

tưởng về sự hợp lý (rationally), và hai là tập trung vào quá trình tư duy (thinking) so

với hành vi bên ngoài (acting).

● Hành động như người (Phép thử Turing):

Cách tiếp cận này định nghĩa trí tuệ thông qua hành vi. Năm 1950, nhà toán

học tiên phong Alan Turing đã đề xuất một bài kiểm tra, sau này được gọi là "Phép

thử Turing" (Turing Test), để xác định xem một cỗ máy có thể thể hiện hành vi

thông minh tương đương hoặc không thể phân biệt được với con người hay không.

Trong phép thử này, một người thẩm vấn sẽ giao tiếp bằng văn bản với hai đối

tượng ẩn danh: một là người thật và một là máy tính. Nếu người thẩm vấn không

thể phân biệt được đâu là máy, thì cỗ máy đó được coi là đã vượt qua bài kiểm tra

và thể hiện được trí tuệ. Để thành công, một hệ thống cần có các khả năng cốt lõi

○ Xử lý ngôn ngữ tự nhiên (Natural Language Processing): Để giao tiếp

hiệu quả bằng ngôn ngữ của con người.

○ Biểu diễn tri thức (Knowledge Representation): Để lưu trữ những gì nó

biết hoặc nghe được.

○ Suy diễn tự động (Automated Reasoning): Để sử dụng thông tin đã lưu

trữ để trả lời câu hỏi và rút ra kết luận mới.

○ Học máy (Machine Learning): Để thích nghi với hoàn cảnh mới và phát

hiện các mẫu. Gần đây, vào năm 2014, một chương trình chatbot tên là

Eugene Goostman đã thuyết phục được 33% giám khảo rằng nó là một

cậu bé 13 tuổi người Ukraine, làm dấy lên cuộc tranh luận về việc liệu

phép thử Turing có thực sự bị vượt qua hay không.

Một số câu hỏi ví dụ về kiểm tra Turing:

 Sự kiện thời thơ ấu đáng nhớ nhất của bạn là gì và nó đã tác động đến bạn như

thế nào cho đến ngày nay?

 Hãy mô tả bản thân bạn chỉ bằng màu sắc và hình dạng.

 Giải thích tại sao thời gian trôi nhanh như tên bắn nhưng trái cây lại bay nhanh

như quả chuối?

 Sự kiện lịch sử nào đã thay đổi bạn nhiều nhất và bạn đang ở đâu khi sự kiện đó

xảy ra?

 Trong các câu hỏi trước, câu hỏi nào khó trả lời nhất và tại sao?

● Suy nghĩ như người (Mô hình nhận thức):

Một số định nghĩa:

"The exciting new effort to make computers think ... machines with minds, in

the full and literal sense." (Haugeland, 1985). Tạm dịch: “Nỗ lực mới thú vị để

làm cho máy tính biết suy nghĩ ... máy móc có trí óc, theo nghĩa đen và đầy đủ”

"[The automation of] activities that we associate with human thinking,

activities such as decision-making, problem solving, learning ..." (Bellman

1978). Tạm dịch, “[Việc tự động hóa] các hoạt động mà chúng ta liên kết với

suy nghĩ của con người, các hoạt động như ra quyết định, giải quyết vấn đề,

học tập ...”

Theo nhóm định nghĩa này, hành động thông minh chỉ đạt được nếu được dẫn

dắt bởi quá trình suy nghĩ tương tự quá trình suy nghĩ của con người.

Những nghiên cứu theo hướng này dựa trên việc nghiên cứu quá trình nhận

thức và tư duy của con người, từ đây mô hình hóa và tạo ra những hệ thống có

mô hình nhận thức, tư duy tương tự. Việc tìm hiểu quá trình nhận thức, tư duy

của người có thể thực hiện theo một số phương pháp như: 1) thực nghiệm về hành

vi con người khi suy nghĩ hoặc giải quyết vấn đề; 2) chụp ảnh sóng não, đo tín

hiệu điện từ hoặc các tín hiệu khác của não trong quá trình thực hiện các công

việc khác nhau; 3) sử dụng các phương pháp nơ ron sinh học khác như kích thích

não, giải phẫu não v.v.

Cách tiếp cận này đi sâu hơn, không chỉ quan tâm đến hành vi mà còn đến quá

trình tư duy bên trong. Để một chương trình có thể "suy nghĩ như người", chúng

ta phải hiểu được cách bộ não con người hoạt động. Lĩnh vực khoa học nhận thức

(cognitive science) là sự giao thoa giữa các mô hình tính toán của AI và các kỹ

thuật thực nghiệm từ tâm lý học để xây dựng các lý thuyết chính xác và có thể

kiểm chứng về hoạt động của trí não con người. Một ví dụ kinh điển là hệ thống

"General Problem Solver" (GPS) do Newell và Simon phát triển vào năm 1961,

được thiết kế để giải quyết vấn đề bằng cách mô phỏng các bước tư duy mà con

người thực hiện.

● Suy nghĩ hợp lý (Các quy tắc tư duy):

Một số định nghĩa:

"The study of mental faculties through the use of computational

models." (Charniak and McDermott, 1985). Tạm dịch “Nghiên cứu về các năng

lực trí tuệ thông qua việc sử dụng các mô hình tính toán”

"The study of the computations that make it possible to perceive, reason,

and act." (Winston, 1992). Tạm dịch: “Nghiên cứu về các tính toán giúp nhận

thức, suy luận và hành động.”

Thay vì mô phỏng con người, cách tiếp cận này hướng tới việc xây dựng các

hệ thống dựa trên các quy tắc tư duy đúng đắn và chặt chẽ. Triết gia Hy Lạp

Aristotle là người đầu tiên cố gắng hệ thống hóa "tư duy đúng đắn" thông qua các

phép tam đoạn luận (syllogisms), cho phép rút ra các kết luận chắc chắn từ các

tiền đề đúng. Sự phát triển của logic hình thức vào cuối thế kỷ 19 và đầu thế kỷ

20 đã cung cấp một bộ công cụ mạnh mẽ để biểu diễn các tri thức và thực hiện các

quá trình suy diễn một cách chính xác. Đây là nền tảng cho việc xây dựng các hệ

thống có khả năng chứng minh định lý toán học hoặc đưa ra các kết luận logic một

cách tự động.

● Hành động hợp lý (Tác tử thông minh - Intelligent Agents):

Một số định nghĩa:

"Computational Intelligence is the study of the design of intelligent

agents." (Poole et al., 1998). Tạm dịch “Trí tuệ tính toán là nghiên cứu về thiết

kế của các tác nhân thông minh”

"AI . . .is concerned with intelligent behavior in artifacts." (Nilsson, 1998).

Tạm dịch “AI . . .là quan tâm đến hành vi thông minh trong hiện vật”

Đây được coi là cách tiếp cận tổng quát và phổ biến nhất trong AI hiện đại.

Một "tác tử thông minh" (intelligent agent) là một thực thể có khả năng nhận thức

môi trường xung quanh thông qua các bộ cảm biến (sensors) và hành động lên môi

trường đó thông qua các cơ cấu chấp hành (effectors). "Hành động hợp lý" có nghĩa

là hành động sao cho đạt được kết quả tốt nhất, hoặc khi có sự không chắc chắn, đạt

được kết quả kỳ vọng tốt nhất. Cách tiếp cận này bao hàm các cách tiếp cận khác:

một tác tử có thể hành động hợp lý bằng cách sử dụng các quy tắc suy diễn logic,

nhưng đôi khi hành động theo phản xạ (không cần suy diễn sâu) lại hợp lý hơn trong

các tình huống khẩn cấp. Do đó, nó tập trung vào kết quả cuối cùng thay vì chỉ mô

phỏng quá trình của con người.

Sự phân biệt giữa các cách tiếp cận này không chỉ mang tính học thuật. Nó

phản ánh một sự căng thẳng cơ bản trong lĩnh vực AI: giữa mục tiêu mô phỏng con

người (mimesis) và mục tiêu đạt được hiệu suất tối ưu (rationality). Khóa học này,

bằng cách bắt đầu với logic (một công cụ của sự hợp lý) và sau đó chuyển sang logic

mờ và mạng nơron (những công cụ có thể mô hình hóa tư duy giống con người và

học hỏi từ kinh nghiệm), sẽ ngầm khám phá sự căng thẳng này. Mục tiêu cuối cùng

của một tác tử AI hiện đại là hành động hợp lý, và điều này có thể đạt được bằng

nhiều phương tiện khác nhau.

Bảng 1.1: So sánh các cách tiếp cận định nghĩa Trí tuệ nhân tạo

Tiêu chí so

sánh

Hành động

như người

Suy nghĩ như

người

Suy nghĩ hợp

lý

Hành động

hợp lý

Mục tiêu Thực hiện các

hành vi không

thể phân biệt

được với con

ngư

ời.

Mô phỏng quá

trình tư duy của

con người.

Suy diễn một

cách logic và

chính xác.

Đạt được mục

tiêu một cách

tối ưu hoặc kỳ

vọng tối ưu.

Thước đo thành

công

Vượt qua Phép

thử Turing.

So khớp mô

hình v

ới dữ liệu

tâm lý học và

thần kinh học.

Chứng minh

được các kết

luận là hệ quả

logic của tiền

ề.

Tối đa hóa một

thước đo hiệu

suất

(performance

measure).

ền tảng khoa

học

Khoa học xã

hội, Ngôn ngữ

học.

Khoa học nhận

thức, Tâm lý

học, Khoa học

ần kinh.

Logic, Toán

học, Triết học.

Kinh tế học, Lý

thuyết quyết

định, Thống kê,

ận tr

ù h

ọc.

Ví dụ điển hình

Chatbot

(Eugene

Goostman,

GPT-4

), các

nhân vật trong

game.

General

Problem Solver

(GPS).

Các hệ chứng

minh định lý tự

động.

Xe t

ự lái, các hệ

thống giao dịch

tự động, robot

công nghiệp.

Tổng kết:

Các phân tích ở trên cho thấy một số cách tiếp cận chính trong định nghĩa trí tuệ nhân

tạo:

- Lấy con người làm tiêu chuẩn, nghiên cứu tâm lý và thần kinh học để mô

phỏng nhận thức con người, dựa trên đó xây dựng hệ thống trí tuệ nhân tạo. - Lấy kết quả

làm tiêu chuẩn, không nhất thiết phải xây dựng hệ thống mô phỏng người.

- Lấy hành vi và hành động làm mục đích, có thể có quá trình lập luận để hướng dẫn

hành động hoặc không.

Các chatbot Eugene Goostman và GPT-4 đã vượt qua Bài kiểm tra Turing lần lượt vào năm 2014 và 2024.

TTNT là môn khoa học nghiên cứu và mô phỏng các quá trình sáng tạo của

con người trên máy tính điện tử, nhằm tạo ra các sản phẩm thông minh có khả năng

suy nghĩ, ra quyết định, hoặc hỗ trợ ra quyết định như con người.

1.2. Vai trò của trí tuệ nhân tạo

Vai trò của AI là vô cùng quan trọng đối với cuộc sống của chúng ta. AI có thể

tiếp cận với con người thông qua nhiều lĩnh vực, ngành nghề khác nhau. Ưu điểm của

trí tuệ nhân tạo là khả năng xử lý dữ liệu khoa học hơn, nhanh hơn, hệ thống hơn so

với con người. Việc phát triển và đưa các sản phẩm AI tới tay người dùng đúng cách

sẽ thúc đẩy mạnh mẽ sự phát triển của toàn nhân loại. Mở ra một thế giới hoàn toàn

mới cùng các giải pháp bù đắp cho những vấn đề mà con người không thể giải quyết.

- Theo 1 nghĩa nào đó TTNT tạo nên 1 cách đơn giản để xây dựng lên cấu trúc

các chương trình ra quyết định phức tạp đòi hỏi phải dựa trên những tri thức nhất định.

- Các chương trình TTNT hoạt động giống như bộ não của con người tức là nó có thể

tích hợp những tri thức mới mà không cần thay đổi lại cách làm việc. Vì vậy những

chương trình TTNT có thể dễ dàng cải tiến hơn so với các chương trình truyền thống.

- Khi máy tính được trang bị những phần mềm TTNT kết hợp với môi trường

làm việc thì có thể cho phép giải quyết được các bài toán cỡ lớn và phân tán.

- Một số phần mềm TTNT thể hiện tính thích nghi và mềm dẻo đối với các lớp

bài toán thuộc nhiều lĩnh vực khác nhau.

1.3. Các ứng dụng của trí tuệ nhân tạo

1.3.1 Các lĩnh vực nghiên cứu

Trí tuệ nhân tạo được chia thành một số lĩnh vực nghiên cứu nhỏ hơn và

chuyên sâu nhằm giải quyết những vấn đề khác nhau khi xây dựng một hệ thống trí tuệ

nhân tạo. Một số lĩnh vực chuyên sâu được hình thành để giải quyết một lớp bài toán.

Một số lĩnh vực chuyên sâu khác tập trung vào các hướng tiếp cận hay các kỹ thuật.

Một số lĩnh vực nghiên cứu lại xoay quanh các ứng dụng cụ thể. Trong khi nhiều lĩnh

vực nghiên cứu nhỏ có liên quan mật thiết đến nhau thì có nhiều lĩnh vực khác rất xa

nhau, cả về mục tiêu, phương pháp và cộng đồng nghiên cứu. Các lĩnh vực phổ biến có

thể kể đến như sau:

Thông thường, một hệ thống trí tuệ nhân tạo hoàn chỉnh, làm việc trong việc

một môi trường nào đó cần có khả năng: cảm nhận (perception), lập luận (reasoning),

và hành động (action). Dưới đây là một số lĩnh vực nghiên cứu của trí tuệ nhân tạo

được phân chia theo ba thành phần này.

a) Cảm nhận (perception)

Hệ thống cần có cơ chế thu nhận thông tin liên quan tới hoạt động từ môi

trường bên ngoài. Đó có thể là camera, cảm biến âm thanh (microphone), cảm biến siêu

âm, radar, cảm biến gia tốc, các cảm biến khác. Đó cũng có thể đơn giản hơn là thông

tin do người dùng nhập vào chương trình bằng tay. Để biến đổi thông tin nhận được về

dạng có thể hiểu được, thông tin cần được xử lý nhờ những kỹ thuật được nghiên cứu

và trong khuôn khổ các lĩnh vực sau:

o Thị giác máy (computer vision)

o Nhận dạng mẫu

o Xử lý ngôn ngữ tự nhiên (natural language processing)

b) Lập luận và suy diễn

Sau khi cảm nhận được thông tin về môi trường xung quanh, hệ thống cần có

cơ chế để đưa ra được quyết định phù hợp. Quá trình ra quyết định thường dựa trên

việc kết hợp thông tin cảm nhận được với tri thức có sẵn về thế giới xung quanh. Việc

ra quyết định dựa trên tri thức được thực hiện nhờ lập luận hay suy diễn. Cũng có

những trường hợp hệ thống không thực hiện suy diễn mà dựa trên những kỹ thuật khác

như tìm kiếm hay tập hợp các phản xạ hoặc hành vi đơn giản.

Thành phần lập luận và ra quyết định được xây dựng dựa trên kỹ thuật từ

những lĩnh vực nghiên cứu sau:

o Biểu diễn tri thức (knowledge representation)

o Tìm kiếm (search)

o Lập luận, suy diễn (reasoning hay inference)

o Học máy (machine learning)

o Deep Learning (Học Sâu)

o Lập kế hoạch (planning)

c) Hành động

Cho phép hệ thống tác động vào môi trường xung quanh hoặc đơn giản là đưa

ra thông tin về kết luận của mình. Thành phần này được xây dựng dựa trên những kỹ

thuật sau. Tổng hợp ngôn ngữ tự nhiên và tiếng nói và Kỹ thuật rô bốt (robotics).

Là kỹ thuật xây dựng các cơ quan chấp hành như cánh tay người máy, tổng

hợp tiếng nói, tổng hợp ngôn ngữ tự nhiên. Đây là lĩnh vực nghiên cứu giao thoa giữa

cơ khí, điện tử, và trí tuệ nhân tạo. Bên cạnh kỹ thuật cơ khí để tạo ra các cơ chế vật

lý, chuyển động, cần có thuật toán và chương trình điểu khiển hoạt động và chuyển

động cho các cơ chế đó. Chẳng hạn, với cánh tay máy, cần tính toán quỹ đạo và điều

khiển cụ thể các khớp nối cơ khí khi muốn di chuyển tay tới vị trí xác định và thực hiện

hành động nào đó. Đây là những thành phần của kỹ thuật rô bốt mà trí tuệ nhân tạo có

đóng góp chính. Ngoài ra, việc xây dựng những rô bốt thông minh chính là xây dựng

các hệ thống trí tuệ nhân tạo hoàn chỉnh.

1.3.2 Một số ứng dụng và thành tựu

a. Các chương trình trò chơi

Xây dựng chương trình có khả năng chơi những trò chơi trí tuệ là lĩnh vực

có nhiều thành tựu của trí tuệ nhân tạo. Với những trò chơi tương đối đơn giản như cờ

carô hay cờ thỏ cáo, máy tính đã thắng người từ cách đây vài thập kỷ.

Đối với những trò chơi phức tạp hơn, các hệ thống trí tuệ nhân tạo cũng dần

đuổi kịp và vượt qua con người. Sự kiện quan trọng thường được nhắc tới là vào tháng

5 năm 1997 chương trình cờ vua Deep Blue của IBM đã thắng vô địch cờ vua thế giới

lúc đó là Gary Kasparov. Đây là lần đầu tiên máy tính thắng đương kim vô địch cờ vua

thế giới. Năm 2015 máy chơi cờ vây AlphaGo của Google DeepMind đạt tới đẳng cấp

con người nhờ sử dụng học sâu kết hợp với lấy mẫu cây Monte Carlo. Thách thức

trong Poker là không gian của trạng thái lớn và nó không được quan sát đầy đủ (ta

không biết các quân bài của đối thủ). Libratus vượt chất lượng con người trong môn

Poker sử dụng các chiến thuật có cấu trúc một cách hiệu quả [Brown & Sandholm,

2017]. Những điều này thể hiện một sự tiến triển ấn tượng trong các trò chơi và tầm

quan trọng của các thuật toán nâng cao trong đó.

Một trường hợp tiêu biểu khác là hệ thống trả lời tự động Watson cũng của

IBM đã chiến thắng hai quán quân của Jeopardy trong trò chơi này vào năm 2011.

Jeopardy là trò chơi hỏi đáp trên truyền hình Mỹ, tương tự “Ai là triệu phú” trên truyền

hình Việt Nam nhưng trong đó ba người chơi phải thi với nhau không những trả lời

đúng mà còn phải nhanh. Watson là hệ thống hỏi đáp do IBM xây dựng dựa trên việc

thu thập và phân tích thông tin từ khoảng 200 triệu trang Web, trong đó có toàn bộ

Wikipedia. Trong một cuộc đấu với hai cựu quán quân Jeopardy, Watson đã giành

thắng lợi và phần thưởng 1 triệu USD. Các kỹ thuật sử dụng trong Watson như thu thập

thông tin, phát hiện tri thức, hiểu ngôn ngữ tự nhiên, tìm kiếm, đã được IBM thương

mại hóa và có thể sử dụng trong nhiều ứng dụng.

b. Nhận dạng tiếng nói

Nhận dạng tiếng nói là biến đổi từ âm thanh tiếng nói thành các văn bản.

Hiện người dùng công cụ tìm kiếm Google có thể đọc vào câu truy vấn thay cho việc

gõ từ khóa như trước. Các điện thoại di động thông minh cũng có khả năng nhận dạng

giọng nói và trả lời các câu hỏi. Ví dụ điển hình là chương trình trợ giúp Siri trên điện

thoại thông minh của Apple (sử dụng công nghệ nhận dạng tiếng nói của hãng Nuance)

hay hệ thống Google Now.

Chất lượng nhận dạng giọng nói đang được cải thiện và tiến bộ rất nhanh

trong vài năm gần đây. Các hệ thống nhận dạng tiếng nói hiện tại cho phép nhận dạng

tới vài chục ngôn ngữ khác nhau và không phụ thuộc vào người nói (ở một mức độ

nhất định).

c. Thị giác máy tính

Mặc dù nhiều ứng dụng của thị giác máy tính vẫn chưa đạt tới độ chính xác

như người, nhưng trong một số bài toán, thị giác máy tính cho độ chính xác tương

đương hoặc gần với khả năng của người. Tiêu biểu phải kể đến các hệ thống nhận dạng

chữ in với độ chính xác gần như tuyệt đối, hệ thống nhận dạng tròng mắt, vân tay, mặt

người. Những hệ thống dạng này được sử dụng rộng rãi trong sản xuất để kiểm tra sản

phẩm, trong hệ thống camera an ninh. Ứng dụng nhận dạng mặt người trên Facebook

được dùng để xác định những người quen xuất hiện trong ảnh và gán nhãn tên cho

người đó.

Các ứng dụng nhận dạng hiện nay đang được cải thiện nhiều nhờ sử dụng

kỹ thuật học sâu (deep learning), trong đó các mạng nơ ron có nhiều lớp được kết nối

với nhau được sử dụng để phát hiện các đặc trưng của đối tượng ở mức từ đơn giản tới

phức tạp.

Nhận dạng đối tượng cũng đã tiến một bước dài. Nhận dạng đối tượng trong

ảnh là một tác vụ khó trong năm 2010. Trong bảng xếp hạng ImageNet, Lin và các

cộng sự năm 2010 đạt được tỷ lệ lỗi top-5 là 28%. Tới 2017. Hu và các cộng sự giảm

tỉ lệ lỗi này xuống còn 2,25%. Học sâu đã giúp phân loại cả ngàn vật thể khác nhau

trong các bức ảnh, tự tạo chú thích cho ảnh, tự sinh ảnh.

d. Các thiết bị tự lái

Các thiết bị tự lái bao gồm máy bay, ô tô, tầu thủy, thiết bị thám hiểm vũ trụ

có thể tự di chuyển mà không có sự điều khiển của người (cả điều khiển trực tiếp và

điều khiển từ xa). Hiện ô tô tự lái đang được một số hãng công nghệ và các tổ chức

khác nghiên cứu và phát triển, trong đó có những dự án nổi tiếng như xe tự lái của

Google và Tesla. Mặc dù tại thời điểm viết sách này mới chỉ có một mẫu xe duy nhất

được thương mại hóa dùng cho các khu đi bộ và chỉ có thể chạy với tốc độ khoảng 20

km/giờ nhưng các dự báo cho thấy xe tự lái sẽ được thương mại hóa thành công trong

vòng vài năm tới. Các thiết bị tự lái khác bao gồm cả các xem thám hiểm vũ trụ và hành

tinh khác như xe thám hiểm sao Hỏa của NASA.

e. Hệ chuyên gia

Là các hệ thống làm việc dựa trên kinh nghiệm và tri thức của chuyên gia

trong một lĩnh vực tương đối hẹp nào đó để đưa ra khuyến cáo, kết luận, chuẩn đoán

một cách tự động. Các ví dụ gồm:

o MYCIN (1984, Stanford): hệ chuyên gian đầu tiên chẩn đoán bệnh về

nhiễm trùng máu và cách điều trị với khả năng tương đương một bác sĩ giỏi

trong lĩnh vực này.

o XCON của DEC: hỗ trợ chọn cấu hình máy tính tự động.

f. Xử lý, hiểu ngôn ngữ tự nhiên

Tiêu biểu là các hệ thống dịch tự động như hệ thống dịch của Google, các hệ

thống tóm tắt nội dung văn bản tự động. Hệ thống dịch tự động của Google sử dụng

các mô hình thống kê xây dựng từ các văn bản song ngữ và các văn bản đơn ngữ. Hệ

thống này có khả năng dịch qua lại giữa vài chục ngôn ngữ.

Các hệ thống hỏi đáp được đề cập tới trong phần về trò chơi và nhận dạng

tiếng nói cũng thuộc loại ứng dụng xử lý ngôn ngữ tự nhiên. Những hệ thống này sử

dụng những thành phần đơn giản hơn như các phân hệ phân tích hình thái, cú pháp, ngữ

nghĩa. Các ứng dụng khác như trợ lý ảo, hệ thống gợi ý sản phẩm của Amazon, hệ

thống gợi ý phim của Netflix.

Các trợ lý thông minh như Apple Siri, Amazon Alexa, hay Google Assistant

có khả năng trả lời các câu hỏi thoại với độ chính xác chấp nhận được. Việc này cũng

bao gồm các tác vụ đơn giản như bật đèn (hữu ích đối với người tàn tật) tới đặt lịch hẹn

cắt tóc và đưa ra các đoạn hội thoại để hỗ trợ các tổng đài chăm sóc khách hàng.

Nhiều kỹ thuật xử lý ngôn ngữ tự nhiên đã được ứng dụng trong các ứng dụng rất

thiết thực như các bộ lọc thư rác. Dịch vụ thư điện tử của Google, Microsoft, Yahoo đều

có các bộ lọc thư rác với cơ chế học tự động và thích nghi với thay đổi của người phát

tán. Khả năng phát hiện thư rác của các hệ thống này là rất cao, gần như tuyệt đối trong

một số trường hợp.

ChatGPT là một chatbot do công ty OpenAI của Mỹ phát triển và ra mắt

vào tháng 11 năm 2022. ChatGPT được xây dựng dựa trên GPT-3.5 một dòng mô

hình ngôn ngữ lớn của OpenAI đồng thời được tinh chỉnh bằng cả hai kỹ thuật học tăng

cường lẫn học có giám sát. ChatGPT nhanh chóng thu hút sự chú ý nhờ việc nó có thể

hồi đáp chi tiết và trả lời lưu loát trên nhiều lĩnh vực kiến thức khác nhau.

g. Lập kế hoạch, lập thời khóa biểu

Kỹ thuật trí tuệ nhân tạo được sử dụng nhiều trong bài toán lập thời khóa

biểu cho trường học, xí nghiệp, các bài toán lập kế hoạch khác. Một ví dụ lập kế hoạch

thành công với quy mô lớn là kế hoạch đảm bảo hậu cần cho quân đội Mỹ trong chiến

dịch Cơn bão sa mạc tại Iraq đã được thực hiện gần như hoàn toàn dựa trên kỹ thuật trí

tuệ nhân tạo. Đây là một kế hoạch lớn, liên quan tới khoảng 50000 thiết bị vận tải và

người tại cùng một thời điểm. Kế hoạch bao gồm điểm xuất phát, điểm tới, thời gian,

phương tiện và người tham gia sao cho không mâu thuẫn và tối ưu theo các tiêu chí.

Chương trình lập lịch và điều khiển thông minh trên xe tự hành và Robot tự

hành của NASA.

h. Rô bốt

Một số rô bốt được xây dựng sao cho có hình dạng tương tự con người và

khả năng toàn diện như thị giác máy, giao tiếp bằng ngôn ngữ tự nhiên, khả năng lập

luận nhất định, khả năng di chuyển và thực hiện các hành động như nhẩy múa. Các rô

bốt này chủ yếu được tạo ra để chứng minh khả năng của kỹ thuật rô bốt thay vì hướng

vào ứng dụng cụ thể. Trong số này có thể kể tới rô bốt Asimo, rô bốt Nao.

Bên cạnh đó, một số rô bốt không mô phỏng người nhưng được sử dụng

trong đời sống hàng ngày hoặc các ứng dụng thực tế. Ví dụ, rô bốt Roomba của hãng

iRobot có khả năng tự động di chuyển trong phòng, tránh vật cản, chui vào các ngóc

ngách để lau sạch toàn bộ sàn. Số lượng rô bốt Roomba đã bán lên tới vài triệu bản.

1.3.3. Những vấn đề chưa được giải quyết

Mặc dù đạt được nhiều thành tựu và có nhiều ứng dụng đáng kể, các hệ thống

trí tuệ nhân tạo hiện nay chưa đạt được mức độ trí tuệ nhân tạo mạnh (strong AI) hay

trí tuệ nhân tạo tổng quát (Artificial General Intelligence). Đây cũng được coi là vấn

đề khó nhất và chưa được giải quyết. Trí tuệ nhân tạo mạnh là khái niệm để chỉ khả

năng của máy tính thực hiện bất cứ công việc trí tuệ nào mà con người có thể thực hiện.

Khái niệm trí tuệ mạnh được sử dụng để phân biệt với trí tuệ nhân tạo yếu (weak AI)

hay trí tuệ nhân tạo ứng dụng (applied AI), tức là dùng máy tính để giải quyết từng bài

toán ra quyết định hay lập luận đơn lẻ. Như vậy, trí tuệ nhân tạo mạnh đòi hỏi giải quyết

đầy đủ các công việc trí tuệ như người trong khi trí tuệ nhân tạo yếu giải quyết bài toán

cụ thể.

Các khó khăn để đạt được trí tuệ nhân tạo tổng quát bao gồm khả năng thị

giác máy, xử lý ngôn ngữ tự nhiên, khả năng xử lý các tình hướng mới, tình huống

không ngờ tới khi giải quyết các bài toán thực tế. Đây là những lĩnh vực mà máy tính

còn thua kém con người. Các hệ thống trí tuệ nhân tạo hiện nay có thể giải quyết tốt

bài toán đặt ra trong một phạm vi hẹp.

Tuy nhiên, khi gặp vấn đề thực tế ở phạm vi rộng hơn, hệ thống trí tuệ nhân

tạo thường không thể xử lý được các tình huống mới, vượt ra ngoài ngữ cảnh ban đầu

của bài toán. Ngược lại, con người có khả năng xử lý tốt hơn nhiều những trường hợp

như vậy do có hiểu biết rộng về thế giới xung quanh. Việc trang bị cho máy tính lượng

tri thức như con người hiện vẫn là vấn đề chưa được giải quyết.

1.4. Lịch sử hình thành và phát triển của AI

Lịch sử của Trí tuệ nhân tạo là một câu chuyện về những kỳ vọng lớn lao, những

thành tựu đột phá, những giai đoạn thất vọng và sự tái sinh mạnh mẽ, dẫn đến lĩnh

vực sôi động mà chúng ta thấy ngày nay.

● Giai đoạn manh nha (1943-1955): Trước khi thuật ngữ "Trí tuệ nhân tạo" ra

đời, những nền móng quan trọng đã được đặt. Năm 1943, Warren McCulloch

và Walter Pitts đề xuất mô hình toán học đầu tiên của một nơron nhân tạo, cho

thấy về mặt lý thuyết, một mạng lưới các nơron như vậy có thể tính toán bất kỳ

hàm logic nào. Công trình của Alan Turing vào năm 1950 đã tiên đoán về các

cỗ máy thông minh, học máy và các thuật toán di truyền.

● Sự ra đời và kỳ vọng lớn (1956-1974): Thuật ngữ "Artificial Intelligence"

được chính thức khai sinh tại một hội thảo mùa hè kéo dài hai tháng tại Đại học

Dartmouth vào năm 1956, quy tụ những người sau này trở thành những người

cha đẻ của lĩnh vực này như John McCarthy, Marvin Minsky, Allen Newell và

Herbert Simon. Giai đoạn này chứng kiến một sự lạc quan to lớn và nhiều thành

tựu ban đầu ấn tượng: chương trình Logic Theorist của Newell và Simon có

thể chứng minh các định lý toán học; chương trình chơi cờ đam của Arthur

Samuel có khả năng tự học để chơi giỏi hơn cả người tạo ra nó; và John

McCarthy phát minh ra ngôn ngữ Lisp, trở thành ngôn ngữ thống trị trong AI

trong nhiều thập kỷ.

● "Mùa đông AI" (1974-1980): Sự lạc quan ban đầu đã vấp phải thực tế khắc

nghiệt. Các hệ thống AI thời kỳ đầu, dựa trên các thao tác cú pháp đơn giản và

các phương pháp tìm kiếm tổng quát, đã thất bại khi đối mặt với các bài toán

phức tạp trong thế giới thực. Các dự án dịch máy đầy tham vọng đã không

thành công vì chúng thiếu hiểu biết về ngữ cảnh và ngữ nghĩa. Quan trọng hơn,

các nhà nghiên cứu đã đối mặt với vấn đề "bùng nổ tổ hợp" (combinatorial

explosion), khi số lượng các khả năng cần xem xét trong các bài toán tìm kiếm

tăng lên theo cấp số nhân, vượt xa khả năng tính toán của các máy tính thời đó.

Những thất bại này dẫn đến việc cắt giảm mạnh mẽ nguồn tài trợ cho nghiên

cứu AI, đặc biệt là ở Mỹ và Anh, tạo ra một giai đoạn trì trệ được gọi là "Mùa

đông AI" đầu tiên. Giai đoạn này không đơn thuần là một vấn đề về tài chính;

nó là một cuộc khủng hoảng về phương pháp luận, cho thấy sự hạn chế của các

phương pháp AI biểu tượng thuần túy thiếu tri thức chuyên ngành.

● Hệ chuyên gia và sự trỗi dậy của hệ dựa trên tri thức (1969-1980s): Lối

thoát khỏi "Mùa đông AI" đến từ một sự thay đổi trong mô hình: thay vì cố

gắng tạo ra các bộ giải quyết vấn đề tổng quát, các nhà nghiên cứu tập trung

vào việc xây dựng các hệ thống có kiến thức chuyên sâu trong một lĩnh vực

hẹp. Điều này đã khai sinh ra các hệ chuyên gia (expert systems). Hệ thống

DENDRAL (1969) có thể suy ra cấu trúc phân tử từ dữ liệu quang phổ với hiệu

suất vượt trội so với các chuyên gia con người. Hệ thống MYCIN (1974) có

thể chẩn đoán các bệnh nhiễm trùng máu với độ chính xác tương đương các

bác sĩ giỏi. Thành công của các hệ chuyên gia đã chứng minh rằng sức mạnh

của một hệ thống thông minh đến từ tri thức mà nó sở hữu, và khởi động lại

ngành công nghiệp AI.

● AI trở thành ngành khoa học và công nghiệp (1980-nay): Giai đoạn này

chứng kiến sự trở lại của mạng nơron nhân tạo, vốn bị lãng quên trong một thời

gian dài. Các thuật toán mới như lan truyền ngược (backpropagation) cho phép

huấn luyện các mạng nơron nhiều lớp, khắc phục những hạn chế của các mô

hình Perceptron ban đầu. AI cũng bắt đầu áp dụng các phương pháp luận khoa

học chặt chẽ hơn, với các lý thuyết dựa trên xác suất và thống kê, và yêu cầu

cao hơn về việc kiểm chứng thực nghiệm. Các công ty bắt đầu thương mại hóa

công nghệ AI, đặc biệt là các hệ chuyên gia, tạo ra một ngành công nghiệp trị

giá hàng tỷ đô la vào cuối những năm 1980.

● Kỷ nguyên Dữ liệu lớn và Học sâu (2001-nay): Sự phát triển của Internet và

khả năng lưu trữ, xử lý dữ liệu khổng lồ đã tạo ra một cuộc cách mạng khác.

Mô hình phát triển AI chuyển dịch từ việc mã hóa tri thức thủ công (như trong

các hệ chuyên gia) sang việc cho phép các hệ thống tự "học" tri thức từ dữ liệu.

Các hệ thống dịch tự động của Google đã đạt được những bước tiến vượt bậc

bằng cách phân tích hàng tỷ tài liệu song ngữ, thay vì dựa vào các quy tắc ngữ

pháp do con người lập trình. Gần đây, sự trỗi dậy của Học sâu (Deep Learning),

một dạng của mạng nơron với nhiều lớp ẩn, đã tạo ra những đột phá ngoạn mục

trong các lĩnh vực như nhận dạng hình ảnh, xử lý giọng nói và ngôn ngữ tự

nhiên, đưa hiệu suất của máy tính trong nhiều tác vụ đến gần, hoặc thậm chí

vượt qua con người.

Lịch sử này cho thấy một vòng lặp tiến hóa: từ logic biểu tượng tổng quát, đến

các hệ thống dựa trên tri thức chuyên gia, và cuối cùng là các hệ thống học từ dữ

liệu. Chính sự thất bại của các phương pháp ban đầu đã thúc đẩy sự ra đời của các

phương pháp tiếp theo, giải thích tại sao khóa học này tập trung vào Logic mờ (một

cách xử lý tri thức không chắc chắn của chuyên gia) và Mạng nơron (một công cụ

mạnh mẽ để học từ dữ liệu).

1.5. Biểu diễn tri thức bằng Logic mệnh đề

Để xây dựng các hệ thống có khả năng suy nghĩ hoặc hành động một cách hợp

lý, chúng ta cần một ngôn ngữ hình thức để biểu diễn tri thức và các quy tắc để suy

diễn từ tri thức đó. Logic mệnh đề là dạng logic đơn giản nhất, cung cấp nền tảng

cho các khái niệm về cú pháp, ngữ nghĩa và suy diễn sẽ được sử dụng và so sánh

trong suốt học phần. Đây là điểm khởi đầu của "logic rõ" (crisp logic), nơi mọi mệnh

đề đều hoàn toàn đúng hoặc hoàn toàn sai, trước khi chúng ta chuyển sang "logic

mờ" (fuzzy logic) với các giá trị chân lý linh hoạt hơn.

Tri thức là sự hiểu biết về một miền chủ đề (lĩnh vực) nào đó.

Ví dụ:

- Hiểu biết về y học, văn học,.... là tri thức

- Thu thập thông tin ta được dữ liệu và căn cứ vào tri thức ta có được những

quyết dịnh phán đoán.

- Đối với quả cam ta xét các dữ liệu như vỏ, cuống, màu sắc,...của nó như thế

nào? và dựa vào hiểu biết của ta mà xác định xem quả cam đó là ngon hay

không ngon, ngon vừa,...

Như vậy, tri thức là dạng dữ liệu bậc cao. Khó phân biệt giữa tri thức và dữ liệu

(không có ranh giới rõ ràng giữa chúng). Tuy nhiên ta có thể phân biệt theo bảng

Dữ liệu Tri thức

- Định lượng

- Có cấu trúc đơn giản

- Ở dạng đơn giản

- Định tính

- Không có cấu trúc hoặc có

cấu trúc phức hợp

Ở

ạ

ng ph

ứ

c h

ợ

Người ta có thể biểu diễn tri thức bằng logic mệnh đề vì nó cung cấp một nền

tảng đơn giản, chặt chẽ và có hệ thống để mô tả và suy luận về thế giới. Đây là

phương pháp nền tảng trong trí tuệ nhân tạo (AI) và khoa học máy tính. Dưới đây là

lý do chính:

Tính đơn giản và rõ ràng

Logic mệnh đề chia nhỏ tri thức phức tạp thành những "mệnh đề" cơ bản nhất.

Mỗi mệnh đề là một phát biểu đơn giản chỉ có thể nhận một trong hai giá trị: Đúng

(True) hoặc Sai (False).

 Ví dụ:

o Mệnh đề P: "Trời đang mưa." (P có thể đúng hoặc sai)

o Mệnh đề Q: "Đường bị ướt." (Q có thể đúng hoặc sai)

Sự đơn giản này giúp máy tính dễ dàng xử lý thông tin, vì nó tương ứng trực

tiếp với hệ nhị phân (1 và 0) trong máy tính.

Tính chính xác và đơn nghĩa

Không giống ngôn ngữ tự nhiên có thể mơ hồ, logic mệnh đề yêu cầu mọi

phát biểu phải tuyệt đối rõ ràng.

 Ngôn ngữ tự nhiên (mơ hồ): "Cái áo này khá đẹp." (Thế nào là "khá đẹp"?)

 Logic mệnh đề (chính xác):

o IS_RED(shirt) (Áo có màu đỏ không?)  Đúng/Sai.

o PRICE_UNDER_500K(shirt) (Giá áo dưới 500k không?) 

Đúng/Sai.

Điều này loại bỏ sự nhầm lẫn và đảm bảo rằng mọi suy luận đều dựa trên các

sự thật không thể diễn giải theo cách khác.

Khả năng suy luận logic

Đây là lý do quan trọng nhất. Logic mệnh đề cung cấp các quy tắc và toán tử

(như VÀ ∧, HOẶC ∨, KHÔNG ¬, SUY RA ⇒) để kết hợp các mệnh đề đơn lẻ và

tạo ra tri thức mới một cách tự động.

 Xây dựng luật: Chúng ta có thể biểu diễn một quy luật thực tế như: "Nếu trời

mưa thì đường ướt."

o Công thức logic: P⇒Q

 Suy luận: Nếu hệ thống biết thêm một sự thật là "Trời đang mưa" (tức là P là

Đúng), nó có thể tự động suy ra rằng "Đường bị ướt" (tức là Q cũng phải là

Đúng). Đây là một ví dụ về quy tắc suy luận Modus Ponens.

Khả năng này là cốt lõi của các hệ thống chuyên gia, hệ thống chẩn đoán lỗi

và nhiều ứng dụng AI khác, giúp máy móc "suy nghĩ" một cách có logic.

Nền tảng cho các logic phức tạp hơn

Logic mệnh đề là bước khởi đầu. Mặc dù nó có những hạn chế (sẽ nói ở dưới),

nó xây dựng nền tảng vững chắc cho các hệ thống logic mạnh mẽ hơn như Logic vị

từ (Predicate Logic), vốn có thể biểu diễn các mối quan hệ phức tạp hơn về đối tượng

và thuộc tính của chúng.

Hạn chế của logic mệnh đề

Mặc dù hữu ích, logic mệnh đề cũng có giới hạn:

 Không biểu diễn được mối quan hệ giữa các đối tượng: Nó không thể diễn

tả các câu như "Tất cả mọi người đều phải thở." vì nó không có khái niệm về

"tất cả" hay "đối tượng". Mỗi sự thật, ví dụ "An phải thở", "Bình phải thở",

phải được biểu diễn như một mệnh đề riêng lẻ, rất cồng kềnh.

 Khả năng biểu đạt hạn chế: Nó chỉ làm việc với các phát biểu có giá trị

Đúng/Sai, không phù hợp với các tri thức không chắc chắn hoặc mang tính

xác suất.

Phân biệt Cú pháp và ngữ nghĩa:

Cú pháp (Syntax)

Là bộ quy tắc về cấu trúc và cách sắp xếp các từ để tạo thành một câu hợp lệ. Nó

chỉ quan tâm đến hình thức, không quan tâm đến ý nghĩa. Các thành phần cơ bản

bao gồm :

● Các ký hiệu mệnh đề (Propositional Symbols): Các chữ cái in hoa như P, Q,

R,... đại diện cho các khẳng định về thế giới mà có thể đúng hoặc sai. Ví dụ: P

có thể đại diện cho "Trời đang mưa".

Bấm Tải xuống để xem toàn bộ.

Preview text:

Chương 1: Mở đầu
1.1. Tổng quan về Trí tuệ nhân tạo Mục tiêu
Nội dung này nhằm cung cấp cho sinh viên một cái nhìn toàn cảnh, bối cảnh
lịch sử và các định nghĩa nền tảng của lĩnh vực Trí tuệ nhân tạo (tiếng Anh: Artificial
intelligence, viết tắt là: AI). Việc nắm vững các khái niệm này sẽ tạo ra một nền
móng vững chắc trước khi đi sâu vào các chủ đề kỹ thuật cụ thể của học phần, giúp
sinh viên hiểu rõ "tại sao" chúng ta nghiên cứu các phương pháp này, chứ không chỉ
là "làm thế nào" để áp dụng chúng. Nội dung chi tiết
Các định nghĩa và cách tiếp cận AI Định nghĩa:
Trí tuệ nhân tạo (TTNT) là một lĩnh vực rộng lớn và đa dạng của khoa học máy
tính, với mục tiêu cốt lõi là nghiên cứu và xây dựng các thực thể thông minh như con
người như học tập, suy luận, giải quyết vấn đề, nhận thức và đưa ra quyết định.
Tuy nhiên, bản thân khái niệm "trí tuệ" lại rất khó định nghĩa một cách chính xác,
dẫn đến việc có nhiều cách tiếp cận khác nhau để định nghĩa và xây dựng các hệ
thống TTNT. Các định nghĩa này có thể được phân thành bốn nhóm chính, dựa trên
hai trục so sánh: một là so sánh với con người (humanly) so với một tiêu chuẩn lý
tưởng về sự hợp lý (rationally), và hai là tập trung vào quá trình tư duy (thinking) so
với hành vi bên ngoài (acting).
● Hành động như người (Phép thử Turing):
Cách tiếp cận này định nghĩa trí tuệ thông qua hành vi. Năm 1950, nhà toán
học tiên phong Alan Turing đã đề xuất một bài kiểm tra, sau này được gọi là "Phép
thử Turing" (Turing Test), để xác định xem một cỗ máy có thể thể hiện hành vi
thông minh tương đương hoặc không thể phân biệt được với con người hay không.
Trong phép thử này, một người thẩm vấn sẽ giao tiếp bằng văn bản với hai đối
tượng ẩn danh: một là người thật và một là máy tính. Nếu người thẩm vấn không
thể phân biệt được đâu là máy, thì cỗ máy đó được coi là đã vượt qua bài kiểm tra
và thể hiện được trí tuệ. Để thành công, một hệ thống cần có các khả năng cốt lõi sau:
○ Xử lý ngôn ngữ tự nhiên (Natural Language Processing): Để giao tiếp
hiệu quả bằng ngôn ngữ của con người.
○ Biểu diễn tri thức (Knowledge Representation): Để lưu trữ những gì nó biết hoặc nghe được.
○ Suy diễn tự động (Automated Reasoning): Để sử dụng thông tin đã lưu
trữ để trả lời câu hỏi và rút ra kết luận mới.
○ Học máy (Machine Learning): Để thích nghi với hoàn cảnh mới và phát
hiện các mẫu. Gần đây, vào năm 2014, một chương trình chatbot tên là
Eugene Goostman đã thuyết phục được 33% giám khảo rằng nó là một
cậu bé 13 tuổi người Ukraine, làm dấy lên cuộc tranh luận về việc liệu
phép thử Turing có thực sự bị vượt qua hay không.
Một số câu hỏi ví dụ về kiểm tra Turing:
 Sự kiện thời thơ ấu đáng nhớ nhất của bạn là gì và nó đã tác động đến bạn như
thế nào cho đến ngày nay?
 Hãy mô tả bản thân bạn chỉ bằng màu sắc và hình dạng.
 Giải thích tại sao thời gian trôi nhanh như tên bắn nhưng trái cây lại bay nhanh như quả chuối?
 Sự kiện lịch sử nào đã thay đổi bạn nhiều nhất và bạn đang ở đâu khi sự kiện đó xảy ra?
 Trong các câu hỏi trước, câu hỏi nào khó trả lời nhất và tại sao?
● Suy nghĩ như người (Mô hình nhận thức): Một số định nghĩa:
"The exciting new effort to make computers think ... machines with minds, in
the full and literal sense." (Haugeland, 1985). Tạm dịch: “Nỗ lực mới thú vị để
làm cho máy tính biết suy nghĩ ... máy móc có trí óc, theo nghĩa đen và đầy đủ”
"[The automation of] activities that we associate with human thinking,
activities such as decision-making, problem solving, learning ..." (Bellman
1978). Tạm dịch, “[Việc tự động hóa] các hoạt động mà chúng ta liên kết với
suy nghĩ của con người, các hoạt động như ra quyết định, giải quyết vấn đề, học tập ...”
Theo nhóm định nghĩa này, hành động thông minh chỉ đạt được nếu được dẫn
dắt bởi quá trình suy nghĩ tương tự quá trình suy nghĩ của con người.
Những nghiên cứu theo hướng này dựa trên việc nghiên cứu quá trình nhận
thức và tư duy của con người, từ đây mô hình hóa và tạo ra những hệ thống có
mô hình nhận thức, tư duy tương tự. Việc tìm hiểu quá trình nhận thức, tư duy
của người có thể thực hiện theo một số phương pháp như: 1) thực nghiệm về hành
vi con người khi suy nghĩ hoặc giải quyết vấn đề; 2) chụp ảnh sóng não, đo tín
hiệu điện từ hoặc các tín hiệu khác của não trong quá trình thực hiện các công
việc khác nhau; 3) sử dụng các phương pháp nơ ron sinh học khác như kích thích não, giải phẫu não v.v.
Cách tiếp cận này đi sâu hơn, không chỉ quan tâm đến hành vi mà còn đến quá
trình tư duy bên trong. Để một chương trình có thể "suy nghĩ như người", chúng
ta phải hiểu được cách bộ não con người hoạt động. Lĩnh vực khoa học nhận thức
(cognitive science) là sự giao thoa giữa các mô hình tính toán của AI và các kỹ
thuật thực nghiệm từ tâm lý học để xây dựng các lý thuyết chính xác và có thể
kiểm chứng về hoạt động của trí não con người. Một ví dụ kinh điển là hệ thống
"General Problem Solver" (GPS) do Newell và Simon phát triển vào năm 1961,
được thiết kế để giải quyết vấn đề bằng cách mô phỏng các bước tư duy mà con người thực hiện.
● Suy nghĩ hợp lý (Các quy tắc tư duy): Một số định nghĩa:
"The study of mental faculties through the use of computational
models." (Charniak and McDermott, 1985). Tạm dịch “Nghiên cứu về các năng
lực trí tuệ thông qua việc sử dụng các mô hình tính toán”
"The study of the computations that make it possible to perceive, reason,
and act." (Winston, 1992). Tạm dịch: “Nghiên cứu về các tính toán giúp nhận
thức, suy luận và hành động.”
Thay vì mô phỏng con người, cách tiếp cận này hướng tới việc xây dựng các
hệ thống dựa trên các quy tắc tư duy đúng đắn và chặt chẽ. Triết gia Hy Lạp
Aristotle là người đầu tiên cố gắng hệ thống hóa "tư duy đúng đắn" thông qua các
phép tam đoạn luận (syllogisms), cho phép rút ra các kết luận chắc chắn từ các
tiền đề đúng. Sự phát triển của logic hình thức vào cuối thế kỷ 19 và đầu thế kỷ
20 đã cung cấp một bộ công cụ mạnh mẽ để biểu diễn các tri thức và thực hiện các
quá trình suy diễn một cách chính xác. Đây là nền tảng cho việc xây dựng các hệ
thống có khả năng chứng minh định lý toán học hoặc đưa ra các kết luận logic một cách tự động.
● Hành động hợp lý (Tác tử thông minh - Intelligent Agents): Một số định nghĩa:
"Computational Intelligence is the study of the design of intelligent
agents." (Poole et al., 1998). Tạm dịch “Trí tuệ tính toán là nghiên cứu về thiết
kế của các tác nhân thông minh”
"AI . . .is concerned with intelligent behavior in artifacts." (Nilsson, 1998).
Tạm dịch “AI . . .là quan tâm đến hành vi thông minh trong hiện vật”
Đây được coi là cách tiếp cận tổng quát và phổ biến nhất trong AI hiện đại.
Một "tác tử thông minh" (intelligent agent) là một thực thể có khả năng nhận thức
môi trường xung quanh thông qua các bộ cảm biến (sensors) và hành động lên môi
trường đó thông qua các cơ cấu chấp hành (effectors). "Hành động hợp lý" có nghĩa
là hành động sao cho đạt được kết quả tốt nhất, hoặc khi có sự không chắc chắn, đạt
được kết quả kỳ vọng tốt nhất. Cách tiếp cận này bao hàm các cách tiếp cận khác:
một tác tử có thể hành động hợp lý bằng cách sử dụng các quy tắc suy diễn logic,
nhưng đôi khi hành động theo phản xạ (không cần suy diễn sâu) lại hợp lý hơn trong
các tình huống khẩn cấp. Do đó, nó tập trung vào kết quả cuối cùng thay vì chỉ mô
phỏng quá trình của con người.
Sự phân biệt giữa các cách tiếp cận này không chỉ mang tính học thuật. Nó
phản ánh một sự căng thẳng cơ bản trong lĩnh vực AI: giữa mục tiêu mô phỏng con
người (mimesis) và mục tiêu đạt được hiệu suất tối ưu (rationality). Khóa học này,
bằng cách bắt đầu với logic (một công cụ của sự hợp lý) và sau đó chuyển sang logic
mờ và mạng nơron (những công cụ có thể mô hình hóa tư duy giống con người và
học hỏi từ kinh nghiệm), sẽ ngầm khám phá sự căng thẳng này. Mục tiêu cuối cùng
của một tác tử AI hiện đại là hành động hợp lý, và điều này có thể đạt được bằng
nhiều phương tiện khác nhau.
Bảng 1.1: So sánh các cách tiếp cận định nghĩa Trí tuệ nhân tạo Tiêu chí so Hành động
Suy nghĩ như Suy nghĩ hợp Hành động sánh như người người lý hợp lý Mục tiêu
Thực hiện các Mô phỏng quá Suy diễn một Đạt được mục
hành vi không trình tư duy của cách logic và tiêu một cách thể phân biệt con người. chính xác. tối ưu hoặc kỳ được với con vọng tối ưu. người.
Thước đo thành Vượt qua Phép So khớp mô Chứng minh Tối đa hóa một công thử Turing.
hình với dữ liệu được các kết thước đo hiệu
tâm lý học và luận là hệ quả suất
thần kinh học. logic của tiền (performance đề. measure).
Nền tảng khoa Khoa học xã
Khoa học nhận Logic, Toán Kinh tế học, Lý học
hội, Ngôn ngữ thức, Tâm lý
học, Triết học. thuyết quyết học. học, Khoa học định, Thống kê, thần kinh. Vận trù học.
Ví dụ điển hình Chatbot General
Các hệ chứng Xe tự lái, các hệ (Eugene
Problem Solver minh định lý tự thống giao dịch Goostman, (GPS). động. tự động, robot GPT-41), các công nghiệp. nhân vật trong game. Tổng kết:
Các phân tích ở trên cho thấy một số cách tiếp cận chính trong định nghĩa trí tuệ nhân tạo:
- Lấy con người làm tiêu chuẩn, nghiên cứu tâm lý và thần kinh học để mô
phỏng nhận thức con người, dựa trên đó xây dựng hệ thống trí tuệ nhân tạo. - Lấy kết quả
làm tiêu chuẩn, không nhất thiết phải xây dựng hệ thống mô phỏng người.
- Lấy hành vi và hành động làm mục đích, có thể có quá trình lập luận để hướng dẫn hành động hoặc không.
1 Các chatbot Eugene Goostman và GPT-4 đã vượt qua Bài kiểm tra Turing lần lượt vào năm 2014 và 2024.
TTNT là môn khoa học nghiên cứu và mô phỏng các quá trình sáng tạo của
con người trên máy tính điện tử, nhằm tạo ra các sản phẩm thông minh có khả năng
suy nghĩ, ra quyết định, hoặc hỗ trợ ra quyết định như con người.
1.2. Vai trò của trí tuệ nhân tạo
Vai trò của AI là vô cùng quan trọng đối với cuộc sống của chúng ta. AI có thể
tiếp cận với con người thông qua nhiều lĩnh vực, ngành nghề khác nhau. Ưu điểm của
trí tuệ nhân tạo là khả năng xử lý dữ liệu khoa học hơn, nhanh hơn, hệ thống hơn so
với con người. Việc phát triển và đưa các sản phẩm AI tới tay người dùng đúng cách
sẽ thúc đẩy mạnh mẽ sự phát triển của toàn nhân loại. Mở ra một thế giới hoàn toàn
mới cùng các giải pháp bù đắp cho những vấn đề mà con người không thể giải quyết.
- Theo 1 nghĩa nào đó TTNT tạo nên 1 cách đơn giản để xây dựng lên cấu trúc
các chương trình ra quyết định phức tạp đòi hỏi phải dựa trên những tri thức nhất định.
- Các chương trình TTNT hoạt động giống như bộ não của con người tức là nó có thể
tích hợp những tri thức mới mà không cần thay đổi lại cách làm việc. Vì vậy những
chương trình TTNT có thể dễ dàng cải tiến hơn so với các chương trình truyền thống.
- Khi máy tính được trang bị những phần mềm TTNT kết hợp với môi trường
làm việc thì có thể cho phép giải quyết được các bài toán cỡ lớn và phân tán.
- Một số phần mềm TTNT thể hiện tính thích nghi và mềm dẻo đối với các lớp
bài toán thuộc nhiều lĩnh vực khác nhau.
1.3. Các ứng dụng của trí tuệ nhân tạo
1.3.1 Các lĩnh vực nghiên cứu
Trí tuệ nhân tạo được chia thành một số lĩnh vực nghiên cứu nhỏ hơn và
chuyên sâu nhằm giải quyết những vấn đề khác nhau khi xây dựng một hệ thống trí tuệ
nhân tạo. Một số lĩnh vực chuyên sâu được hình thành để giải quyết một lớp bài toán.
Một số lĩnh vực chuyên sâu khác tập trung vào các hướng tiếp cận hay các kỹ thuật.
Một số lĩnh vực nghiên cứu lại xoay quanh các ứng dụng cụ thể. Trong khi nhiều lĩnh
vực nghiên cứu nhỏ có liên quan mật thiết đến nhau thì có nhiều lĩnh vực khác rất xa
nhau, cả về mục tiêu, phương pháp và cộng đồng nghiên cứu. Các lĩnh vực phổ biến có thể kể đến như sau:
Thông thường, một hệ thống trí tuệ nhân tạo hoàn chỉnh, làm việc trong việc
một môi trường nào đó cần có khả năng: cảm nhận (perception), lập luận (reasoning),
và hành động (action). Dưới đây là một số lĩnh vực nghiên cứu của trí tuệ nhân tạo
được phân chia theo ba thành phần này. a) Cảm nhận (perception)
Hệ thống cần có cơ chế thu nhận thông tin liên quan tới hoạt động từ môi
trường bên ngoài. Đó có thể là camera, cảm biến âm thanh (microphone), cảm biến siêu
âm, radar, cảm biến gia tốc, các cảm biến khác. Đó cũng có thể đơn giản hơn là thông
tin do người dùng nhập vào chương trình bằng tay. Để biến đổi thông tin nhận được về
dạng có thể hiểu được, thông tin cần được xử lý nhờ những kỹ thuật được nghiên cứu
và trong khuôn khổ các lĩnh vực sau:
o Thị giác máy (computer vision) o Nhận dạng mẫu
o Xử lý ngôn ngữ tự nhiên (natural language processing)
b) Lập luận và suy diễn
Sau khi cảm nhận được thông tin về môi trường xung quanh, hệ thống cần có
cơ chế để đưa ra được quyết định phù hợp. Quá trình ra quyết định thường dựa trên
việc kết hợp thông tin cảm nhận được với tri thức có sẵn về thế giới xung quanh. Việc
ra quyết định dựa trên tri thức được thực hiện nhờ lập luận hay suy diễn. Cũng có
những trường hợp hệ thống không thực hiện suy diễn mà dựa trên những kỹ thuật khác
như tìm kiếm hay tập hợp các phản xạ hoặc hành vi đơn giản.
Thành phần lập luận và ra quyết định được xây dựng dựa trên kỹ thuật từ
những lĩnh vực nghiên cứu sau:
o Biểu diễn tri thức (knowledge representation) o Tìm kiếm (search)
o Lập luận, suy diễn (reasoning hay inference)
o Học máy (machine learning) o Deep Learning (Học Sâu)
o Lập kế hoạch (planning) c) Hành động
Cho phép hệ thống tác động vào môi trường xung quanh hoặc đơn giản là đưa
ra thông tin về kết luận của mình. Thành phần này được xây dựng dựa trên những kỹ
thuật sau. Tổng hợp ngôn ngữ tự nhiên và tiếng nói và Kỹ thuật rô bốt (robotics).
Là kỹ thuật xây dựng các cơ quan chấp hành như cánh tay người máy, tổng
hợp tiếng nói, tổng hợp ngôn ngữ tự nhiên. Đây là lĩnh vực nghiên cứu giao thoa giữa
cơ khí, điện tử, và trí tuệ nhân tạo. Bên cạnh kỹ thuật cơ khí để tạo ra các cơ chế vật
lý, chuyển động, cần có thuật toán và chương trình điểu khiển hoạt động và chuyển
động cho các cơ chế đó. Chẳng hạn, với cánh tay máy, cần tính toán quỹ đạo và điều
khiển cụ thể các khớp nối cơ khí khi muốn di chuyển tay tới vị trí xác định và thực hiện
hành động nào đó. Đây là những thành phần của kỹ thuật rô bốt mà trí tuệ nhân tạo có
đóng góp chính. Ngoài ra, việc xây dựng những rô bốt thông minh chính là xây dựng
các hệ thống trí tuệ nhân tạo hoàn chỉnh.
1.3.2 Một số ứng dụng và thành tựu
a. Các chương trình trò chơi
Xây dựng chương trình có khả năng chơi những trò chơi trí tuệ là lĩnh vực
có nhiều thành tựu của trí tuệ nhân tạo. Với những trò chơi tương đối đơn giản như cờ
carô hay cờ thỏ cáo, máy tính đã thắng người từ cách đây vài thập kỷ.
Đối với những trò chơi phức tạp hơn, các hệ thống trí tuệ nhân tạo cũng dần
đuổi kịp và vượt qua con người. Sự kiện quan trọng thường được nhắc tới là vào tháng
5 năm 1997 chương trình cờ vua Deep Blue của IBM đã thắng vô địch cờ vua thế giới
lúc đó là Gary Kasparov. Đây là lần đầu tiên máy tính thắng đương kim vô địch cờ vua
thế giới. Năm 2015 máy chơi cờ vây AlphaGo của Google DeepMind đạt tới đẳng cấp
con người nhờ sử dụng học sâu kết hợp với lấy mẫu cây Monte Carlo. Thách thức
trong Poker là không gian của trạng thái lớn và nó không được quan sát đầy đủ (ta
không biết các quân bài của đối thủ). Libratus vượt chất lượng con người trong môn
Poker sử dụng các chiến thuật có cấu trúc một cách hiệu quả [Brown & Sandholm,
2017]. Những điều này thể hiện một sự tiến triển ấn tượng trong các trò chơi và tầm
quan trọng của các thuật toán nâng cao trong đó.
Một trường hợp tiêu biểu khác là hệ thống trả lời tự động Watson cũng của
IBM đã chiến thắng hai quán quân của Jeopardy trong trò chơi này vào năm 2011.
Jeopardy là trò chơi hỏi đáp trên truyền hình Mỹ, tương tự “Ai là triệu phú” trên truyền
hình Việt Nam nhưng trong đó ba người chơi phải thi với nhau không những trả lời
đúng mà còn phải nhanh. Watson là hệ thống hỏi đáp do IBM xây dựng dựa trên việc
thu thập và phân tích thông tin từ khoảng 200 triệu trang Web, trong đó có toàn bộ
Wikipedia. Trong một cuộc đấu với hai cựu quán quân Jeopardy, Watson đã giành
thắng lợi và phần thưởng 1 triệu USD. Các kỹ thuật sử dụng trong Watson như thu thập
thông tin, phát hiện tri thức, hiểu ngôn ngữ tự nhiên, tìm kiếm, đã được IBM thương
mại hóa và có thể sử dụng trong nhiều ứng dụng. b. Nhận dạng tiếng nói
Nhận dạng tiếng nói là biến đổi từ âm thanh tiếng nói thành các văn bản.
Hiện người dùng công cụ tìm kiếm Google có thể đọc vào câu truy vấn thay cho việc
gõ từ khóa như trước. Các điện thoại di động thông minh cũng có khả năng nhận dạng
giọng nói và trả lời các câu hỏi. Ví dụ điển hình là chương trình trợ giúp Siri trên điện
thoại thông minh của Apple (sử dụng công nghệ nhận dạng tiếng nói của hãng Nuance) hay hệ thống Google Now.
Chất lượng nhận dạng giọng nói đang được cải thiện và tiến bộ rất nhanh
trong vài năm gần đây. Các hệ thống nhận dạng tiếng nói hiện tại cho phép nhận dạng
tới vài chục ngôn ngữ khác nhau và không phụ thuộc vào người nói (ở một mức độ nhất định). c. Thị giác máy tính
Mặc dù nhiều ứng dụng của thị giác máy tính vẫn chưa đạt tới độ chính xác
như người, nhưng trong một số bài toán, thị giác máy tính cho độ chính xác tương
đương hoặc gần với khả năng của người. Tiêu biểu phải kể đến các hệ thống nhận dạng
chữ in với độ chính xác gần như tuyệt đối, hệ thống nhận dạng tròng mắt, vân tay, mặt
người. Những hệ thống dạng này được sử dụng rộng rãi trong sản xuất để kiểm tra sản
phẩm, trong hệ thống camera an ninh. Ứng dụng nhận dạng mặt người trên Facebook
được dùng để xác định những người quen xuất hiện trong ảnh và gán nhãn tên cho người đó.
Các ứng dụng nhận dạng hiện nay đang được cải thiện nhiều nhờ sử dụng
kỹ thuật học sâu (deep learning), trong đó các mạng nơ ron có nhiều lớp được kết nối
với nhau được sử dụng để phát hiện các đặc trưng của đối tượng ở mức từ đơn giản tới phức tạp.
Nhận dạng đối tượng cũng đã tiến một bước dài. Nhận dạng đối tượng trong
ảnh là một tác vụ khó trong năm 2010. Trong bảng xếp hạng ImageNet, Lin và các
cộng sự năm 2010 đạt được tỷ lệ lỗi top-5 là 28%. Tới 2017. Hu và các cộng sự giảm
tỉ lệ lỗi này xuống còn 2,25%. Học sâu đã giúp phân loại cả ngàn vật thể khác nhau
trong các bức ảnh, tự tạo chú thích cho ảnh, tự sinh ảnh.
d. Các thiết bị tự lái
Các thiết bị tự lái bao gồm máy bay, ô tô, tầu thủy, thiết bị thám hiểm vũ trụ
có thể tự di chuyển mà không có sự điều khiển của người (cả điều khiển trực tiếp và
điều khiển từ xa). Hiện ô tô tự lái đang được một số hãng công nghệ và các tổ chức
khác nghiên cứu và phát triển, trong đó có những dự án nổi tiếng như xe tự lái của
Google và Tesla. Mặc dù tại thời điểm viết sách này mới chỉ có một mẫu xe duy nhất
được thương mại hóa dùng cho các khu đi bộ và chỉ có thể chạy với tốc độ khoảng 20
km/giờ nhưng các dự báo cho thấy xe tự lái sẽ được thương mại hóa thành công trong
vòng vài năm tới. Các thiết bị tự lái khác bao gồm cả các xem thám hiểm vũ trụ và hành
tinh khác như xe thám hiểm sao Hỏa của NASA. e. Hệ chuyên gia
Là các hệ thống làm việc dựa trên kinh nghiệm và tri thức của chuyên gia
trong một lĩnh vực tương đối hẹp nào đó để đưa ra khuyến cáo, kết luận, chuẩn đoán
một cách tự động. Các ví dụ gồm:
o MYCIN (1984, Stanford): hệ chuyên gian đầu tiên chẩn đoán bệnh về
nhiễm trùng máu và cách điều trị với khả năng tương đương một bác sĩ giỏi trong lĩnh vực này.
o XCON của DEC: hỗ trợ chọn cấu hình máy tính tự động.
f. Xử lý, hiểu ngôn ngữ tự nhiên
Tiêu biểu là các hệ thống dịch tự động như hệ thống dịch của Google, các hệ
thống tóm tắt nội dung văn bản tự động. Hệ thống dịch tự động của Google sử dụng
các mô hình thống kê xây dựng từ các văn bản song ngữ và các văn bản đơn ngữ. Hệ
thống này có khả năng dịch qua lại giữa vài chục ngôn ngữ.
Các hệ thống hỏi đáp được đề cập tới trong phần về trò chơi và nhận dạng
tiếng nói cũng thuộc loại ứng dụng xử lý ngôn ngữ tự nhiên. Những hệ thống này sử
dụng những thành phần đơn giản hơn như các phân hệ phân tích hình thái, cú pháp, ngữ
nghĩa. Các ứng dụng khác như trợ lý ảo, hệ thống gợi ý sản phẩm của Amazon, hệ
thống gợi ý phim của Netflix.
Các trợ lý thông minh như Apple Siri, Amazon Alexa, hay Google Assistant
có khả năng trả lời các câu hỏi thoại với độ chính xác chấp nhận được. Việc này cũng
bao gồm các tác vụ đơn giản như bật đèn (hữu ích đối với người tàn tật) tới đặt lịch hẹn
cắt tóc và đưa ra các đoạn hội thoại để hỗ trợ các tổng đài chăm sóc khách hàng.
Nhiều kỹ thuật xử lý ngôn ngữ tự nhiên đã được ứng dụng trong các ứng dụng rất
thiết thực như các bộ lọc thư rác. Dịch vụ thư điện tử của Google, Microsoft, Yahoo đều
có các bộ lọc thư rác với cơ chế học tự động và thích nghi với thay đổi của người phát
tán. Khả năng phát hiện thư rác của các hệ thống này là rất cao, gần như tuyệt đối trong một số trường hợp.
ChatGPT là một chatbot do công ty OpenAI của Mỹ phát triển và ra mắt
vào tháng 11 năm 2022. ChatGPT được xây dựng dựa trên GPT-3.5 một dòng mô
hình ngôn ngữ lớn của OpenAI đồng thời được tinh chỉnh bằng cả hai kỹ thuật học tăng
cường lẫn học có giám sát. ChatGPT nhanh chóng thu hút sự chú ý nhờ việc nó có thể
hồi đáp chi tiết và trả lời lưu loát trên nhiều lĩnh vực kiến thức khác nhau.
g. Lập kế hoạch, lập thời khóa biểu
Kỹ thuật trí tuệ nhân tạo được sử dụng nhiều trong bài toán lập thời khóa
biểu cho trường học, xí nghiệp, các bài toán lập kế hoạch khác. Một ví dụ lập kế hoạch
thành công với quy mô lớn là kế hoạch đảm bảo hậu cần cho quân đội Mỹ trong chiến
dịch Cơn bão sa mạc tại Iraq đã được thực hiện gần như hoàn toàn dựa trên kỹ thuật trí
tuệ nhân tạo. Đây là một kế hoạch lớn, liên quan tới khoảng 50000 thiết bị vận tải và
người tại cùng một thời điểm. Kế hoạch bao gồm điểm xuất phát, điểm tới, thời gian,
phương tiện và người tham gia sao cho không mâu thuẫn và tối ưu theo các tiêu chí.
Chương trình lập lịch và điều khiển thông minh trên xe tự hành và Robot tự hành của NASA. h. Rô bốt
Một số rô bốt được xây dựng sao cho có hình dạng tương tự con người và
khả năng toàn diện như thị giác máy, giao tiếp bằng ngôn ngữ tự nhiên, khả năng lập
luận nhất định, khả năng di chuyển và thực hiện các hành động như nhẩy múa. Các rô
bốt này chủ yếu được tạo ra để chứng minh khả năng của kỹ thuật rô bốt thay vì hướng
vào ứng dụng cụ thể. Trong số này có thể kể tới rô bốt Asimo, rô bốt Nao.
Bên cạnh đó, một số rô bốt không mô phỏng người nhưng được sử dụng
trong đời sống hàng ngày hoặc các ứng dụng thực tế. Ví dụ, rô bốt Roomba của hãng
iRobot có khả năng tự động di chuyển trong phòng, tránh vật cản, chui vào các ngóc
ngách để lau sạch toàn bộ sàn. Số lượng rô bốt Roomba đã bán lên tới vài triệu bản.
1.3.3. Những vấn đề chưa được giải quyết
Mặc dù đạt được nhiều thành tựu và có nhiều ứng dụng đáng kể, các hệ thống
trí tuệ nhân tạo hiện nay chưa đạt được mức độ trí tuệ nhân tạo mạnh (strong AI) hay
trí tuệ nhân tạo tổng quát (Artificial General Intelligence). Đây cũng được coi là vấn
đề khó nhất và chưa được giải quyết. Trí tuệ nhân tạo mạnh là khái niệm để chỉ khả
năng của máy tính thực hiện bất cứ công việc trí tuệ nào mà con người có thể thực hiện.
Khái niệm trí tuệ mạnh được sử dụng để phân biệt với trí tuệ nhân tạo yếu (weak AI)
hay trí tuệ nhân tạo ứng dụng (applied AI), tức là dùng máy tính để giải quyết từng bài
toán ra quyết định hay lập luận đơn lẻ. Như vậy, trí tuệ nhân tạo mạnh đòi hỏi giải quyết
đầy đủ các công việc trí tuệ như người trong khi trí tuệ nhân tạo yếu giải quyết bài toán cụ thể.
Các khó khăn để đạt được trí tuệ nhân tạo tổng quát bao gồm khả năng thị
giác máy, xử lý ngôn ngữ tự nhiên, khả năng xử lý các tình hướng mới, tình huống
không ngờ tới khi giải quyết các bài toán thực tế. Đây là những lĩnh vực mà máy tính
còn thua kém con người. Các hệ thống trí tuệ nhân tạo hiện nay có thể giải quyết tốt
bài toán đặt ra trong một phạm vi hẹp.
Tuy nhiên, khi gặp vấn đề thực tế ở phạm vi rộng hơn, hệ thống trí tuệ nhân
tạo thường không thể xử lý được các tình huống mới, vượt ra ngoài ngữ cảnh ban đầu
của bài toán. Ngược lại, con người có khả năng xử lý tốt hơn nhiều những trường hợp
như vậy do có hiểu biết rộng về thế giới xung quanh. Việc trang bị cho máy tính lượng
tri thức như con người hiện vẫn là vấn đề chưa được giải quyết.
1.4. Lịch sử hình thành và phát triển của AI
Lịch sử của Trí tuệ nhân tạo là một câu chuyện về những kỳ vọng lớn lao, những
thành tựu đột phá, những giai đoạn thất vọng và sự tái sinh mạnh mẽ, dẫn đến lĩnh
vực sôi động mà chúng ta thấy ngày nay.
● Giai đoạn manh nha (1943-1955): Trước khi thuật ngữ "Trí tuệ nhân tạo" ra
đời, những nền móng quan trọng đã được đặt. Năm 1943, Warren McCulloch
và Walter Pitts đề xuất mô hình toán học đầu tiên của một nơron nhân tạo, cho
thấy về mặt lý thuyết, một mạng lưới các nơron như vậy có thể tính toán bất kỳ
hàm logic nào. Công trình của Alan Turing vào năm 1950 đã tiên đoán về các
cỗ máy thông minh, học máy và các thuật toán di truyền.
● Sự ra đời và kỳ vọng lớn (1956-1974): Thuật ngữ "Artificial Intelligence"
được chính thức khai sinh tại một hội thảo mùa hè kéo dài hai tháng tại Đại học
Dartmouth vào năm 1956, quy tụ những người sau này trở thành những người
cha đẻ của lĩnh vực này như John McCarthy, Marvin Minsky, Allen Newell và
Herbert Simon. Giai đoạn này chứng kiến một sự lạc quan to lớn và nhiều thành
tựu ban đầu ấn tượng: chương trình Logic Theorist của Newell và Simon có
thể chứng minh các định lý toán học; chương trình chơi cờ đam của Arthur
Samuel có khả năng tự học để chơi giỏi hơn cả người tạo ra nó; và John
McCarthy phát minh ra ngôn ngữ Lisp, trở thành ngôn ngữ thống trị trong AI trong nhiều thập kỷ.
● "Mùa đông AI" (1974-1980): Sự lạc quan ban đầu đã vấp phải thực tế khắc
nghiệt. Các hệ thống AI thời kỳ đầu, dựa trên các thao tác cú pháp đơn giản và
các phương pháp tìm kiếm tổng quát, đã thất bại khi đối mặt với các bài toán
phức tạp trong thế giới thực. Các dự án dịch máy đầy tham vọng đã không
thành công vì chúng thiếu hiểu biết về ngữ cảnh và ngữ nghĩa. Quan trọng hơn,
các nhà nghiên cứu đã đối mặt với vấn đề "bùng nổ tổ hợp" (combinatorial
explosion), khi số lượng các khả năng cần xem xét trong các bài toán tìm kiếm
tăng lên theo cấp số nhân, vượt xa khả năng tính toán của các máy tính thời đó.
Những thất bại này dẫn đến việc cắt giảm mạnh mẽ nguồn tài trợ cho nghiên
cứu AI, đặc biệt là ở Mỹ và Anh, tạo ra một giai đoạn trì trệ được gọi là "Mùa
đông AI" đầu tiên. Giai đoạn này không đơn thuần là một vấn đề về tài chính;
nó là một cuộc khủng hoảng về phương pháp luận, cho thấy sự hạn chế của các
phương pháp AI biểu tượng thuần túy thiếu tri thức chuyên ngành.
● Hệ chuyên gia và sự trỗi dậy của hệ dựa trên tri thức (1969-1980s): Lối
thoát khỏi "Mùa đông AI" đến từ một sự thay đổi trong mô hình: thay vì cố
gắng tạo ra các bộ giải quyết vấn đề tổng quát, các nhà nghiên cứu tập trung
vào việc xây dựng các hệ thống có kiến thức chuyên sâu trong một lĩnh vực
hẹp. Điều này đã khai sinh ra các hệ chuyên gia (expert systems). Hệ thống
DENDRAL (1969) có thể suy ra cấu trúc phân tử từ dữ liệu quang phổ với hiệu
suất vượt trội so với các chuyên gia con người. Hệ thống MYCIN (1974) có
thể chẩn đoán các bệnh nhiễm trùng máu với độ chính xác tương đương các
bác sĩ giỏi. Thành công của các hệ chuyên gia đã chứng minh rằng sức mạnh
của một hệ thống thông minh đến từ tri thức mà nó sở hữu, và khởi động lại ngành công nghiệp AI.
● AI trở thành ngành khoa học và công nghiệp (1980-nay): Giai đoạn này
chứng kiến sự trở lại của mạng nơron nhân tạo, vốn bị lãng quên trong một thời
gian dài. Các thuật toán mới như lan truyền ngược (backpropagation) cho phép
huấn luyện các mạng nơron nhiều lớp, khắc phục những hạn chế của các mô
hình Perceptron ban đầu. AI cũng bắt đầu áp dụng các phương pháp luận khoa
học chặt chẽ hơn, với các lý thuyết dựa trên xác suất và thống kê, và yêu cầu
cao hơn về việc kiểm chứng thực nghiệm. Các công ty bắt đầu thương mại hóa
công nghệ AI, đặc biệt là các hệ chuyên gia, tạo ra một ngành công nghiệp trị
giá hàng tỷ đô la vào cuối những năm 1980.
● Kỷ nguyên Dữ liệu lớn và Học sâu (2001-nay): Sự phát triển của Internet và
khả năng lưu trữ, xử lý dữ liệu khổng lồ đã tạo ra một cuộc cách mạng khác.
Mô hình phát triển AI chuyển dịch từ việc mã hóa tri thức thủ công (như trong
các hệ chuyên gia) sang việc cho phép các hệ thống tự "học" tri thức từ dữ liệu.
Các hệ thống dịch tự động của Google đã đạt được những bước tiến vượt bậc
bằng cách phân tích hàng tỷ tài liệu song ngữ, thay vì dựa vào các quy tắc ngữ
pháp do con người lập trình. Gần đây, sự trỗi dậy của Học sâu (Deep Learning),
một dạng của mạng nơron với nhiều lớp ẩn, đã tạo ra những đột phá ngoạn mục
trong các lĩnh vực như nhận dạng hình ảnh, xử lý giọng nói và ngôn ngữ tự
nhiên, đưa hiệu suất của máy tính trong nhiều tác vụ đến gần, hoặc thậm chí vượt qua con người.
Lịch sử này cho thấy một vòng lặp tiến hóa: từ logic biểu tượng tổng quát, đến
các hệ thống dựa trên tri thức chuyên gia, và cuối cùng là các hệ thống học từ dữ
liệu. Chính sự thất bại của các phương pháp ban đầu đã thúc đẩy sự ra đời của các
phương pháp tiếp theo, giải thích tại sao khóa học này tập trung vào Logic mờ (một
cách xử lý tri thức không chắc chắn của chuyên gia) và Mạng nơron (một công cụ
mạnh mẽ để học từ dữ liệu).
1.5. Biểu diễn tri thức bằng Logic mệnh đề
Để xây dựng các hệ thống có khả năng suy nghĩ hoặc hành động một cách hợp
lý, chúng ta cần một ngôn ngữ hình thức để biểu diễn tri thức và các quy tắc để suy
diễn từ tri thức đó. Logic mệnh đề là dạng logic đơn giản nhất, cung cấp nền tảng
cho các khái niệm về cú pháp, ngữ nghĩa và suy diễn sẽ được sử dụng và so sánh
trong suốt học phần. Đây là điểm khởi đầu của "logic rõ" (crisp logic), nơi mọi mệnh
đề đều hoàn toàn đúng hoặc hoàn toàn sai, trước khi chúng ta chuyển sang "logic
mờ" (fuzzy logic) với các giá trị chân lý linh hoạt hơn.
Tri thức là sự hiểu biết về một miền chủ đề (lĩnh vực) nào đó. Ví dụ:
- Hiểu biết về y học, văn học,.... là tri thức
- Thu thập thông tin ta được dữ liệu và căn cứ vào tri thức ta có được những quyết dịnh phán đoán.
- Đối với quả cam ta xét các dữ liệu như vỏ, cuống, màu sắc,...của nó như thế
nào? và dựa vào hiểu biết của ta mà xác định xem quả cam đó là ngon hay không ngon, ngon vừa,...
Như vậy, tri thức là dạng dữ liệu bậc cao. Khó phân biệt giữa tri thức và dữ liệu
(không có ranh giới rõ ràng giữa chúng). Tuy nhiên ta có thể phân biệt theo bảng sau: Dữ liệu Tri thức - Định lượng - Định tính
- Có cấu trúc đơn giản
- Không có cấu trúc hoặc có - Ở dạng đơn giản cấu trúc phức hợp - Ở dạng phức hợp
Người ta có thể biểu diễn tri thức bằng logic mệnh đề vì nó cung cấp một nền
tảng đơn giản, chặt chẽ và có hệ thống để mô tả và suy luận về thế giới. Đây là
phương pháp nền tảng trong trí tuệ nhân tạo (AI) và khoa học máy tính. Dưới đây là lý do chính:
Tính đơn giản và rõ ràng
Logic mệnh đề chia nhỏ tri thức phức tạp thành những "mệnh đề" cơ bản nhất.
Mỗi mệnh đề là một phát biểu đơn giản chỉ có thể nhận một trong hai giá trị: Đúng (True) hoặc Sai (False).  Ví dụ:
o Mệnh đề P: "Trời đang mưa." (P có thể đúng hoặc sai)
o Mệnh đề Q: "Đường bị ướt." (Q có thể đúng hoặc sai)
Sự đơn giản này giúp máy tính dễ dàng xử lý thông tin, vì nó tương ứng trực
tiếp với hệ nhị phân (1 và 0) trong máy tính.
Tính chính xác và đơn nghĩa
Không giống ngôn ngữ tự nhiên có thể mơ hồ, logic mệnh đề yêu cầu mọi
phát biểu phải tuyệt đối rõ ràng.
 Ngôn ngữ tự nhiên (mơ hồ): "Cái áo này khá đẹp." (Thế nào là "khá đẹp"?)
 Logic mệnh đề (chính xác):
o IS_RED(shirt) (Áo có màu đỏ không?)  Đúng/Sai.
o PRICE_UNDER_500K(shirt) (Giá áo dưới 500k không?)  Đúng/Sai.
Điều này loại bỏ sự nhầm lẫn và đảm bảo rằng mọi suy luận đều dựa trên các
sự thật không thể diễn giải theo cách khác. Khả năng suy luận logic
Đây là lý do quan trọng nhất. Logic mệnh đề cung cấp các quy tắc và toán tử
(như VÀ ∧, HOẶC ∨, KHÔNG ¬, SUY RA ⇒) để kết hợp các mệnh đề đơn lẻ và
tạo ra tri thức mới một cách tự động.
 Xây dựng luật: Chúng ta có thể biểu diễn một quy luật thực tế như: "Nếu trời mưa thì đường ướt." o Công thức logic: P⇒Q
 Suy luận: Nếu hệ thống biết thêm một sự thật là "Trời đang mưa" (tức là P là
Đúng), nó có thể tự động suy ra rằng "Đường bị ướt" (tức là Q cũng phải là
Đúng). Đây là một ví dụ về quy tắc suy luận Modus Ponens.
Khả năng này là cốt lõi của các hệ thống chuyên gia, hệ thống chẩn đoán lỗi
và nhiều ứng dụng AI khác, giúp máy móc "suy nghĩ" một cách có logic.
Nền tảng cho các logic phức tạp hơn
Logic mệnh đề là bước khởi đầu. Mặc dù nó có những hạn chế (sẽ nói ở dưới),
nó xây dựng nền tảng vững chắc cho các hệ thống logic mạnh mẽ hơn như Logic vị
từ (Predicate Logic), vốn có thể biểu diễn các mối quan hệ phức tạp hơn về đối tượng
và thuộc tính của chúng.
Hạn chế của logic mệnh đề
Mặc dù hữu ích, logic mệnh đề cũng có giới hạn:
 Không biểu diễn được mối quan hệ giữa các đối tượng: Nó không thể diễn
tả các câu như "Tất cả mọi người đều phải thở." vì nó không có khái niệm về
"tất cả" hay "đối tượng". Mỗi sự thật, ví dụ "An phải thở", "Bình phải thở",
phải được biểu diễn như một mệnh đề riêng lẻ, rất cồng kềnh.
 Khả năng biểu đạt hạn chế: Nó chỉ làm việc với các phát biểu có giá trị
Đúng/Sai, không phù hợp với các tri thức không chắc chắn hoặc mang tính xác suất.
Phân biệt Cú pháp và ngữ nghĩa: Cú pháp (Syntax)
Là bộ quy tắc về cấu trúc và cách sắp xếp các từ để tạo thành một câu hợp lệ. Nó
chỉ quan tâm đến hình thức, không quan tâm đến ý nghĩa. Các thành phần cơ bản bao gồm :
● Các ký hiệu mệnh đề (Propositional Symbols): Các chữ cái in hoa như P, Q,
R,... đại diện cho các khẳng định về thế giới mà có thể đúng hoặc sai. Ví dụ: P
có thể đại diện cho "Trời đang mưa".

Tài liệu sưu tầm chương 1. nhập môn trí tuệ nhân tạo

Tài liệu liên quan:

Tài liệu sưu tầm. Chuong 2. Các khái niệm cơ bản về logic mở

Báo cáo Ứng dụng các thuật toán tìm kiếm để giải bài toán ghép tranh (N-Puzzle) môn Trí tuệ nhân tạo | Trường Đại học Bách Khoa Hà Nội

Ứng dụng trí tuệ nhân tạo trong giáo dục - Tài liệu môn Trí tuệ nhân tạo | Trường Đại học Bách Khoa Hà Nội

Báo cáo bài tập lớn môn Trí tuệ nhân tạo | Trường Đại học Bách Khoa Hà Nội