TRƯỜNG ĐẠI HỌC THỦY LỢI
KHOA CÔNG NGHỆ THÔNG TIN
Bộ môn: Tin học và Kỹ thuật tính toán
Nội, 22/09/25
Chương 1
Khai thác dữ liệu và thông tin
Kỹ năng số và khai thác AI
Học phần: KỸ NĂNG SỐ KHAI THÁC AI_Chương 1 Trang 2
Nội dung
1.1 Làm việc với máy tính
1.2 Tìm kiếm dữ liệu, thông tin và nội dung số
1.3 Xác thực dữ liệu, thông tin và nội dung số
1.4 Quản lý dữ liệu, thông tin và nội dung số
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 3
1.1 Làm việc với máy tính
1.1.1 Một số khái niệm cơ bản của tin học
1.1.2 Các thành phần cơ bản của máy tính
1.1.3 Phân loại dữ liệu
1.1.4 Một số hệ điều hành phổ biến
1.1.5 Tệp tin và thư mục
1.1.6 Tổng quan về Internet
1.1.7 Trình duyệt Web
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 4
1.1.1 Một số khái niệm bản
Thông tin sự phản ánh các sự vật, hiện tượng của thế giới
khách quan các hoạt động của con người trong đời sống
hội.
Thông tin dữ liệu đã được tổ chức, xử lý, hoặc phân tích để trở
nên nghĩa thể hiểu được, sử dụng để ra quyết định, giải
quyết vấn đề hoặc truyền đạt ý tưởng.
Thông tin cái để ta hiểu biết nhận thức thế giới (thông tin chứa
đựng ý nghĩa).
Thông tin số thông tin được tạo lập bằng phương pháp dùng tín hiệu số.
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 5
1.1.1 Một số khái niệm bản
Dữ liệu những con số hoặc dữ kiện rời rạc quan sát
hoặc đo đạc được không ngữ cảnh hay diễn giải; được thể
hiện ra ngoài bằng cách hóa dễ dàng truyền tải, được
chuyển thành thông tin bằng cách thêm giá trị thông qua ngữ
cảnh, phân loại, tính toán, hiệu chỉnh đánh giá
Dữ liệu trong máy tính được biểu diễn bằng hai hiệu 0 1.
Mỗi hiệu 0 hoặc 1 được gọi bit.
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 6
Đơn vị đo thông tin trong máy tính
Mỗi hiệu 0 hoặc 1 được gọi Bit
Bit đơn vị nhỏ nhất để đo thông tin
lưu trữ trong máy tính
1 Byte = 8 Bit
Ký hiệu
Tên gọi Giá trị
KB Kilobyte
1024 Bytes
MB
Megabyte
1024 KB
GB Gigabyte 1024 MB
TB Terabyte 1024 GB
PB Petabyte 1024 TB
KB = 2^10 Byte; MB = 2^20 Byte
1.1.1 Một số khái niệm bản
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 7
Phân loại thông tin:
Thông tin số: số nguyên, số thực
Thông tin phi số: văn bản, hình ảnh, âm thanh, video
hóa thông tin: Mọi thông tin đưa vào máy tính đều được hoá
bằng một chuỗi các hiệu 0 1 được gọi dữ liệu nhị phân.
Các số -> hóa -> dữ liệu nhị phân
Các chữ cái -> hóa -> dữ liệu nhị phân
Âm thanh -> hóa -> dữ liệu nhị phân
Hình ảnh -> hóa -> dữ liệu nhị phân
Các loại dữ liệu khác nhau được hóa theo các chuẩn qui ước
1.1.1 Một số khái niệm bản
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 8
Quy trình xử thông tin của máy tính
Nhập dữ liệu: Chuyển đổi dữ liệu
thế giới thực thành dữ liệu trong máy
tính thông qua các thiết bị đầu vào.
Xử dữ liệu: Biến đổi, phân tích,
tổng hợp những dữ liệu ban đầu
bằng những phép toán để được
những thông tin mong muốn.
Xuất dữ liệu: Chuyển đổi dữ
liệu trong máy tính sang dạng
thông tin thế giới thực thông
qua các thiết bị đầu ra.
Lưu trữ: Quá trình nhập DL, xử
xuất thông tin đều thể
được lưu trữ trong bộ nhớ MT.
1.1.1 Một số khái niệm bản
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 9
Thiết bị số thiết bị điện tử, máy tính, viễn thông, truyền dẫn,
thu phát sóng tuyến điện thiết bị tích hợp khác được sử
dụng để sản xuất, truyền đưa, thu thập, xử lý, lưu trữ trao đổi
thông tin số
Môi trường số không gian ảo, nơi c hoạt động, dữ liệu,
thông tin nội dung được tạo ra, lưu trữ trao đổi thông qua
công nghệ số, n mạng Internet, phần mềm các nền tảng
trực tuyến
1.1.1 Một số khái niệm bản
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 10
Năng lực số khả năng truy cập, quản trị,
thấu hiểu, kết hợp, giao tiếp, đánh giá sáng
tạo thông tin một cách an toàn phù hợp
thông qua công nghệ số để phục vụ cho thị
trường lao động phổ thông, các công việc cao
cấp khởi nghiệp kinh doanh. bao gồm các
năng lực thường được biết đến như năng lực
sử dụng máy tính, năng lực công nghệ thông
tin, năng lực thông tin hay năng lực truyền
thông (UNESCO, 2018)
1.1.1 Một số khái niệm bản
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 11
Nội dung số nội dung tồn tại dưới dạng dữ liệu số được
hóa định dạng máy thể đọc được thể được tạo, xem,
phân phối, sửa đổi, lưu trữ bằng máy tính công nghệ kỹ thuật
năng số (digital skills) tập hợp các năng lực, kiến thức
thao tác một người cần để sử dụng thành thạo công nghệ
số, thiết bị điện tử Internet trong học tập, công việc cuộc
sống.
1.1.1 Một số khái niệm bản
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 12
Trí tuệ nhân tạo-Artificial Intelligence (viết tắt AI) việc phát
triển các hệ thống máy tính khả năng thực hiện các nhiệm vụ đòi
hỏi trí tuệ con người, như học tập, suy luận giải quyết vấn đề.
Trí tuệ nhân tạo tạo sinh (Generative Artificial Intelligence hay
còn gọi Gen AI) một lĩnh vực con của AI tập trung vào việc tạo
ra dữ liệu mới, thể văn bản, hình ảnh, âm thanh, hoặc video,
dựa trên dữ liệu đầu vào đã được huấn luyện trước đó.
1.1.1 Một số khái niệm bản
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 13
1.1.2 Các thành phần bản của máy tính
Phân loại
Máy tính
Cấu trúc
Máy tính
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 14
Phần cứng (Hardware): các thành phần thiết bị vật cấu thành máy
tính. Phần cứng gồm:
Các thành phần bên trong (case) bao gồm CPU, bộ nhớ được gắn
vào bo mạch chủ (Mainboard/system board)
Các thiết bị ngoại vi (các thiết bị vào c thiết bị ra) kết nối với máy
tính thông qua các cổng (port).
Phần mềm (Software): các chương trình chạy trên máy tính:
Phần mềm hệ thống: các phần mềm thường trực trong máy tính, cung
cấp môi trường làm việc cho các phần mềm khác.
Phần mềm ứng dụng: các chương trình máy nh giải quyết các công
việc cụ thể.
1.1.2 Các thành phần bản của máy tính
1.1. M VIỆC VỚI MÁY TÍNH Trang 15
Hướng về phía mặt trời bạn sẽ không nhìn thấy bóng tối
1.1.2 Các thành phần bản của máy tính
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 16
Phần cứng máy tính
Bộ xử trung tâm CPU (Center Processing Unit):
Xử dữ liệu (Data processing)
Điều khiển (Control)
Bộ nhớ (Memory): Lưu trữ dữ liệu (Data storage)
Bộ nhớ trong: Bộ nhớ tạm, lưu trữ tạm thời các chương trình dữ
liệu; trao đổi dữ liệu trực tiếp với CPU; gồm RAM ROM;
Bộ nhớ ngoài: Trao đổi dữ liệu gián tiếp với CPU qua module điều
khiển vào ra, gồm đĩa cứng Hard Disk, CD-ROM,
Hệ thống vào/ra: Trao đổi thông tin giữa bên ngoài bên trong máy tính
Bus hệ thống (System bus): vận chuyển dữ liệu (Data movement) giữa
các thành phần
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 17
Tốc độ xử của CPU: thước đo số chu kỳ quay của một CPU
thể thực hiện mỗi giây.
Đơn vị : Hertz (Hz), Kilohertz (KHz), Megahertz (MHz), Gigahertz (GHz)
dụ, một CPU tốc độ 1,8 GHz thể thực hiện 1.800.000.000 chu kỳ
xoay mỗi giây
Tốc độ truyền dữ liệu: số bit trung bình trên mỗi đơn vị thời gian đi
qua một liên kết truyền thông trong hệ thống truyền dữ liệu.
Đơn vị tốc độ truyền dữ liệu phổ biến bội số bit trên giây (bit/s) byte
mỗi giây (B/s), megabit trên giây (Mbit/s), megabyte trên giây (MB/s)
Phần cứng máy tính
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 18
Phần cứng máy tính
Bo
mạch
chủ
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 19
RAM
Đĩa CD/DVD
Phần cứng máy tính
Ổ đĩa cứng gắn ngoài
USB
Ổ đĩa cứng gắn trong
Thẻ nhớ flash
ROM
Bộ nhớ trong
Bộ nhớ ngoài
Bộ nhớ
Bộ nhớ trong:
RAM (Random Access Memory)
Lưu giữ các bản sao đang làm việc của chương trình dữ liệu;
Bộ nhớ thể ghi, đọc dữ liệu;
Khi tắt nguồn, dữ liệu chương trình trong RAM biến mất; Khi đóng
chương trình hay tập tin -> thông tin bị xóa khỏi bộ nhớ.
ROM (Read Only Memory)
Bộ nhớ thể đọc sử dụng, nhưng không thay đổi được;
Chứa các lệnh điều khiển các chức năng bản của máy tính. Khi tắt
nguồn điện, vẫn tồn tại.
Phần cứng y tính

Preview text:

TRƯỜNG ĐẠI HỌC THỦY LỢI
KHOA CÔNG NGHỆ THÔNG TIN
Bộ môn: Tin học và Kỹ thuật tính toán
Kỹ năng số và khai thác AI Chương 1
Khai thác dữ liệu và thông tin
Hà Nội, 22/09/25 Nội dung
1.1 Làm việc với máy tính
1.2 Tìm kiếm dữ liệu, thông tin và nội dung số
1.3 Xác thực dữ liệu, thông tin và nội dung số
1.4 Quản lý dữ liệu, thông tin và nội dung số
Học phần: KỸ NĂNG SỐ VÀ KHAI THÁC AI_Chương 1 Trang 2
1.1 Làm việc với máy tính
1.1.1 Một số khái niệm cơ bản của tin học
1.1.2 Các thành phần cơ bản của máy tính
1.1.3 Phân loại dữ liệu
1.1.4 Một số hệ điều hành phổ biến
1.1.5 Tệp tin và thư mục
1.1.6 Tổng quan về Internet
1.1.7 Trình duyệt Web
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 3
1.1.1 Một số khái niệm cơ bản
Thông tin là sự phản ánh các sự vật, hiện tượng của thế giới
khách quan và các hoạt động của con người trong đời sống xã hội.
– Thông tin là dữ liệu đã được tổ chức, xử lý, hoặc phân tích để trở
nên có nghĩa và có thể hiểu được, sử dụng để ra quyết định, giải
quyết vấn đề hoặc truyền đạt ý tưởng.
– Thông tin là cái để ta hiểu biết và nhận thức thế giới (thông tin chứa đựng ý nghĩa).
Thông tin số là thông tin được tạo lập bằng phương pháp dùng tín hiệu số.
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 4
1.1.1 Một số khái niệm cơ bản
Dữ liệu là những con số hoặc dữ kiện rời rạc mà quan sát
hoặc đo đạc được không có ngữ cảnh hay diễn giải; được thể
hiện ra ngoài bằng cách mã hóa và dễ dàng truyền tải, được
chuyển thành thông tin bằng cách thêm giá trị thông qua ngữ
cảnh, phân loại, tính toán, hiệu chỉnh và đánh giá
Dữ liệu trong máy tính được biểu diễn bằng hai ký hiệu 0 và 1.
Mỗi ký hiệu 0 hoặc 1 được gọi là bit.
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 5
1.1.1 Một số khái niệm cơ bản
Đơn vị đo thông tin trong máy tính Ký hiệu Tên gọi Giá trị
– Mỗi ký hiệu 0 hoặc 1 được gọi là Bit KB Kilobyte 1024 Bytes
– Bit là đơn vị nhỏ nhất để đo thông tin MB Megabyte 1024 KB lưu trữ trong máy tính GB Gigabyte 1024 MB – 1 Byte = 8 Bit TB Terabyte 1024 GB PB Petabyte 1024 TB KB = 2^10 Byte; MB = 2^20 Byte
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 6
1.1.1 Một số khái niệm cơ bản
Phân loại thông tin:
Thông tin số: số nguyên, số thực •
Thông tin phi số: văn bản, hình ảnh, âm thanh, video
Mã hóa thông tin: Mọi thông tin đưa vào máy tính đều được mã hoá
bằng một chuỗi các ký hiệu 0 và 1 được gọi là dữ liệu nhị phân.
• Các số -> mã hóa -> dữ liệu nhị phân
• Các chữ cái -> mã hóa -> dữ liệu nhị phân
• Âm thanh -> mã hóa -> dữ liệu nhị phân
• Hình ảnh -> mã hóa -> dữ liệu nhị phân
● Các loại dữ liệu khác nhau được mã hóa theo các chuẩn qui ước
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 7
1.1.1 Một số khái niệm cơ bản
Quy trình xử lý thông tin của máy tính
Nhập dữ liệu: Chuyển đổi dữ liệu ở ❑ Xuất dữ liệu: Chuyển đổi dữ
thế giới thực thành dữ liệu trong máy
liệu trong máy tính sang dạng
tính thông qua các thiết bị đầu vào.
thông tin ở thế giới thực thông
Xử lý dữ liệu: Biến đổi, phân tích,
qua các thiết bị đầu ra.
tổng hợp những dữ liệu ban đầu
Lưu trữ: Quá trình nhập DL, xử
bằng những phép toán để có được
lý và xuất thông tin đều có thể
những thông tin mong muốn.
được lưu trữ trong bộ nhớ MT.
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 8
1.1.1 Một số khái niệm cơ bản
Thiết bị số là thiết bị điện tử, máy tính, viễn thông, truyền dẫn,
thu phát sóng vô tuyến điện và thiết bị tích hợp khác được sử
dụng để sản xuất, truyền đưa, thu thập, xử lý, lưu trữ và trao đổi thông tin số
Môi trường số là không gian ảo, nơi các hoạt động, dữ liệu,
thông tin và nội dung được tạo ra, lưu trữ và trao đổi thông qua
công nghệ số, như mạng Internet, phần mềm và các nền tảng trực tuyến
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 9
1.1.1 Một số khái niệm cơ bản
Năng lực số là khả năng truy cập, quản trị,
thấu hiểu, kết hợp, giao tiếp, đánh giá và sáng
tạo thông tin một cách an toàn và phù hợp
thông qua công nghệ số để phục vụ cho thị
trường lao động phổ thông, các công việc cao
cấp và khởi nghiệp kinh doanh. Nó bao gồm các
năng lực thường được biết đến như năng lực
sử dụng máy tính, năng lực công nghệ thông
tin, năng lực thông tin hay năng lực truyền thông (UNESCO, 2018)
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 10
1.1.1 Một số khái niệm cơ bản
Nội dung số là nội dung tồn tại dưới dạng dữ liệu số được mã
hóa ở định dạng máy có thể đọc được và có thể được tạo, xem,
phân phối, sửa đổi, lưu trữ bằng máy tính và công nghệ kỹ thuật
Kĩ năng số (digital skills) là tập hợp các năng lực, kiến thức và
thao tác mà một người cần có để sử dụng thành thạo công nghệ
số, thiết bị điện tử và Internet trong học tập, công việc và cuộc sống.
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 11
1.1.1 Một số khái niệm cơ bản
Trí tuệ nhân tạo-Artificial Intelligence (viết tắt là AI) là việc phát
triển các hệ thống máy tính có khả năng thực hiện các nhiệm vụ đòi
hỏi trí tuệ con người, như học tập, suy luận và giải quyết vấn đề.
Trí tuệ nhân tạo tạo sinh (Generative Artificial Intelligence hay
còn gọi là Gen AI) là một lĩnh vực con của AI tập trung vào việc tạo
ra dữ liệu mới, có thể là văn bản, hình ảnh, âm thanh, hoặc video,
dựa trên dữ liệu đầu vào đã được huấn luyện trước đó.
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 12
1.1.2 Các thành phần cơ bản của máy tínhPhân loại Máy tínhCấu trúc Máy tính
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 13
1.1.2 Các thành phần cơ bản của máy tính
Phần cứng (Hardware): các thành phần và thiết bị vật lý cấu thành máy tính. Phần cứng gồm: ▪
Các thành phần bên trong (case) bao gồm CPU, bộ nhớ … được gắn
vào bo mạch chủ (Mainboard/system board) ▪
Các thiết bị ngoại vi (các thiết bị vào và các thiết bị ra) kết nối với máy
tính thông qua các cổng (port).
Phần mềm (Software): các chương trình chạy trên máy tính: ▪
Phần mềm hệ thống: các phần mềm thường trực trong máy tính, cung
cấp môi trường làm việc cho các phần mềm khác. ▪
Phần mềm ứng dụng: các chương trình máy tính giải quyết các công việc cụ thể.
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 14
1.1.2 Các thành phần cơ bản của máy tính1 .1. ớng về M phí VIỆC a mặt VỚ trời I bạnMÁY sẽ TÍNH
không nhìn thấy bóng tối Trang 15
Phần cứng máy tính
Bộ xử lý trung tâm CPU (Center Processing Unit):
• Xử lý dữ liệu (Data processing) • Điều khiển (Control)
Bộ nhớ (Memory): Lưu trữ dữ liệu (Data storage) ▪
Bộ nhớ trong: Bộ nhớ tạm, lưu trữ tạm thời các chương trình và dữ
liệu; trao đổi dữ liệu trực tiếp với CPU; gồm RAM và ROM; ▪
Bộ nhớ ngoài: Trao đổi dữ liệu gián tiếp với CPU qua module điều
khiển vào ra, gồm đĩa cứng Hard Disk, CD-ROM, …
Hệ thống vào/ra: Trao đổi thông tin giữa bên ngoài và bên trong máy tính
Bus hệ thống (System bus): vận chuyển dữ liệu (Data movement) giữa các thành phần
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 16
Phần cứng máy tính
Tốc độ xử lí của CPU: thước đo số chu kỳ quay của một CPU
thể thực hiện mỗi giây.
– Đơn vị : Hertz (Hz), Kilohertz (KHz), Megahertz (MHz), Gigahertz (GHz)
– Ví dụ, một CPU có tốc độ là 1,8 GHz có thể thực hiện 1.800.000.000 chu kỳ xoay mỗi giây
Tốc độ truyền dữ liệu: số bit trung bình trên mỗi đơn vị thời gian đi
qua một liên kết truyền thông trong hệ thống truyền dữ liệu. –
Đơn vị tốc độ truyền dữ liệu phổ biến là bội số bit trên giây (bit/s) và byte
mỗi giây (B/s), megabit trên giây (Mbit/s), megabyte trên giây (MB/s)
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 17
Phần cứng máy tính Bo mạch chủ
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 18Bộ nhớ
Phần cứng máy tính Bộ nhớ trong Bộ nhớ ngoài RAM Ổ đĩa cứng gắn trong USB Đĩa CD/DVD ROM Ổ đĩa cứng gắn ngoài Thẻ nhớ flash
1.1. LÀM VIỆC VỚI MÁY TÍNH Trang 19
Phần cứng máy tínhBộ nhớ trong:
RAM (Random Access Memory)
▪ Lưu giữ các bản sao đang làm việc của chương trình và dữ liệu;
▪ Bộ nhớ có thể ghi, đọc dữ liệu;
▪ Khi tắt nguồn, dữ liệu và chương trình trong RAM biến mất; Khi đóng
chương trình hay tập tin -> thông tin bị xóa khỏi bộ nhớ.
ROM (Read Only Memory)
▪ Bộ nhớ có thể đọc và sử dụng, nhưng không thay đổi được;
▪ Chứa các lệnh điều khiển các chức năng cơ bản của máy tính. Khi tắt
nguồn điện, nó vẫn tồn tại.