Báo cáo học phần xử lý ảnh: Chuyển đổi ký tự trong ảnh thành text | Đại học Thái Nguyên

Chương 1: Tổng quan về xử lý ảnh và đề tai. Chương 2: Cơ sở lý thuyết. Chương 3: Nhận diện ký tự trong ảnh và chuyển thành text. Chương 4: Nhận diện chữ viết tay trong ảnh. Tài liệu giúp bạn tham khảo, ôn tập và đạt kết quả cao. Mời đọc đón xem!

lOMoARcPSD| 46560390
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN
THÔNG THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO
HỌC PHẦN XỬ LÝ ẢNH
Đề tài:
CHUYỂN ĐỔI KÝ TỰ TRONG ẢNH THÀNH TEXT
Nhóm sinh viên thực hiện: Nguyễn Tiến Hoàng KHMT K19A
Văn Nam KHMT K19A
Lục Văn Chiều KHMT K19A
Lưu Hữu Được KHMT K19A
Giáo viên hướng dẫn: ThS. Phùng Thế Huân
Thái Nguyên, năm 2023
lOMoARcPSD| 46560390
1
MỤC LỤC
MỞ ĐẦU..........................................................................................................5
CHƯƠNG I: TỔNG QUAN XỬ LÝ ẢNH VÀ ĐỀ TÀI...............................6
1.1 TỔNG QUAN VỀ XỬ LÝ ẢNH.......................................................6
1.1.1 Khái niệm cơ bản về ảnh.........................................................6
1.1.2 Các lĩnh vực của xử lý ảnh......................................................6
1.1.3 Các kỹ thuật xử lý ảnh phổ biến..............................................7
1.1.4 Các ứng dụng của xử lý ảnh....................................................8
1.1.5 Tương lai của xử lý ảnh..........................................................8
1.1.6 Một số kỹ thuật xử lý ảnh nâng cao........................................8
1.2 GIỚI THIỆU VỀ BÀI TẬP LỚN.....................................................10
1.2.1 Bài toán đề tài "Chuyển đổi ký tự trong ảnh thành text".......10
1.2.2 Các kỹ thuật có thể sử dụng..................................................10
2.3 Ứng dụng của đề tài.................................................................11
1.2.4 Kết luận................................................................................11
1.2.5 Một số vấn đề cần lưu ý........................................................11
CHƯƠNG II: CƠ SỞ LÝ THUYẾT...........................................................13
2.1. NGÔN NGỮ CÀI ĐẶT...................................................................13
2.1.1 Ngôn ngữ Python..................................................................13
2.2. CÁC THƯ VIỆN CẦN THIẾT.......................................................13
2.2.1 Thư viện Opencv..................................................................13
2.2.2. Thư viện Numpy.................................................................14
lOMoARcPSD| 46560390
2
2.2.3 Thư viện EasyOCR...............................................................14
2.2.4 Các khái niệm , thao tác cơ bản dùng khi xử lý ảnh..............15
2.3 Thuật toán KNN...............................................................................17
CHƯƠNG III: NHẬN DIỆN KÝ TỰ TRONG ẢNH VÀ CHUYỂN
THÀNH TEXT..............................................................................................19
3.1. CÁC BƯỚC XỬ LÝ ẢNH..............................................................19
3.1.1 ý tưởng..................................................................................19
3.1.2 chuyển về ảnh xám...............................................................19
3.1.3 chuyển sang ảnh nhị phân.....................................................20
3.1.4 Nhận xét................................................................................22
3.2 DÙNG THƯ VIỆN EASYOCR ĐỂ ĐỌC HOẠT ĐỘNG KÝ TỰ..22
3.2.1 Gọi và sử dụng thư viện EasyOCR.......................................22
3.3 THAO TÁC XỬ LÝ ĐỂ LẤY TỌA ĐỘ VÀ VĂN BẢN DƯỚI
DẠNG TEXT...................................................................................23
3.3.1 Các hàm sử dụng...................................................................23
CHƯƠNG IV: NHẬN DIỆN CHỮ VIẾT TAY TRONG ẢNH.................27
4.1 TƯ TƯỞNG.....................................................................................27
4.2 CHUẨN BỊ DỮ LIỆU HUẤN LUYỆN...........................................27
4.3 PHÁT HIỆN ĐƯỜNG VIỀN CỦA CÁC ĐỐI TƯỢNG..................29
4.3.1 Khái niệm.............................................................................29
4.3.2 Cách cài đặt..........................................................................30
4.4 PHÁT HIỆN ĐỐI TƯỢNG KHÔNG PHẢI KÝ TỰ.......................31
4.5 CẮT CÁC ĐỐI TƯỢNG VÀ RESIZE GIỐNG ẢNH TRONG TẬP
lOMoARcPSD| 46560390
3
DỮ LIỆU MẪU...............................................................................33
4.6 SỬ DỤNG KNN ĐỂ DỰ ĐOÁN KÝ TỰ........................................34
4.7 KẺ KHUNG VIẾT KÝ TỰ DỰ ĐOÁN TRÊN KHUNG VÀ HIỂN
THỊ RA MÀN HÌNH.......................................................................35
CHƯƠNG V: ĐÁNH GIÁ KẾT QUẢ THỰC HIỆN.................................37
5.1 ĐỐI VỚI NHẬN DIỆN CÁC FONT CHỮ PHỔ BIẾN TRÊN CÁC
THIẾT BỊ ĐIỆN TỬ........................................................................37
5.1.1 Ưu nhược điểm.....................................................................37
5.2 ĐỐI VỚI NHẬN DIỆN ẢNH CHỮ VIẾT TAY..............................38
5.2.1 Ưu nhược điẻm.....................................................................38
5.2.2 Các ảnh đã nhận dạng...........................................................38
CHƯƠNG VI: TỔNG KẾT.........................................................................45
6.1 MỤC TIÊU ĐẠT ĐƯỢC.................................................................45
6.1.1 Kiến thức..............................................................................45
6.1.2 Ứng dụng..............................................................................45
6.2 MỤC TIÊU CHƯA ĐẠT ĐƯỢC.....................................................46
KẾT LUẬN....................................................................................................47
TÀI LIỆU THAM KHẢO............................................................................49
lOMoARcPSD| 46560390
4
MỞ ĐẦU
Ngày nay, công nghệ thông tin phát triển đồng nghĩa với việc phát
triển các phần mềm ứng dụng. Xử ảnh đóng vai trò quan trọng trong
nhiều lĩnh vực ứng dụng khác nhau. Trong lĩnh vực xử ảnh, việc chuyển
đổi chữ viết tay sang dạng văn bản thường gặp, đóng góp một phần quan
trọng trong quá trình tự động hóa công tác xử lý tài liệu tìm kiếm thông
tin.
Đề tài này tập trung vào việc nghiên cứu ứng dụng các phương
pháp xử ảnh để chuyển đổi chữ viết tay thành dạng văn bản. Qua q
trình nghiên cứu thực nghiệm, chúng tôi hy vọng đem đến một giải
pháp hiệu quả và đáng tin cậy trong việc xử lý tài liệu chữ viết tay.
Báo cáo này sbao gồm các phần chính như mục tiêu phạm vi đề
tài, các khái niệm bản, phương pháp nghiên cứu kết quả đạt được.
Cuối cùng, chúng tôi sẽ đánh giá các kết quả và đề xuất hướng phát triển
tiếp theo của đề tài.
Chúng em xin chân thành cảm ơn sự hướng dẫn và hỗ trợ nhiệt tình
của các thầy trong qtrình thực hiện đề tài này. Mong rằng báo cáo
này sẽ đem lại giá trị thực tiễn và mang lại những góp ý cần thiết để phát
triển hơn nữa trong tương lai.
Em xin chân thành cảm ơn!
CHƯƠNG I: TỔNG QUAN XỬ LÝ ẢNH
ĐỀ TÀI
1.1 TỔNG QUAN VỀ XỬ LÝ ẢNH
Xử lý ảnh là một lĩnh vực của khoa học máy tính liên quan đến
việc áp dụng các kỹ thuật và thuật toán máy tính để xử lý ảnh số. Mục
lOMoARcPSD| 46560390
5
đích của xử lý ảnh là để cải thiện chất lượng của ảnh, trích xuất thông tin
từ ảnh hoặc tạo ra các hình ảnh mới từ ảnh.
1.1.1 Khái niệm cơ bản về ảnh
Một ảnh số là một ma trận các điểm ảnh, mỗi điểm ảnh được biểu
diễn bằng một số hoặc một bộ số. Số lượng điểm ảnh trong một ảnh
được gọi là độ phân giải của ảnh. Độ phân giải càng cao thì ảnh càng chi
tiết.
Các thông tin trong ảnh được thể hiện bởi các giá trị của các điểm ảnh.
Các giá trị này có thể được biểu diễn bằng các số nguyên, số thực hoặc
số phức.
1.1.2 Các lĩnh vực của xử lý ảnh
Xử lý ảnh có thể được chia thành nhiều lĩnh vực khác nhau, bao gồm:
Thu nhận ảnh: Đây là quá trình thu thập ảnh từ thế giới thực.
lOMoARcPSD| 46560390
6
Downloaded
by ?inh V? T?n D?ng (dungdinh241206@gmail.com)
Cải thiện ảnh: Đây là quá trình cải thiện chất lượng của ảnh, chẳng
hạn như loại bỏ nhiễu, tăng cường độ tương phản hoặc sửa đổi
màu sắc.
Phân tích ảnh: Đây là quá trình trích xuất thông tin từ ảnh, chẳng
hạn như nhận dạng đối tượng, phát hiện khuôn mặt hoặc đo kích
thước.
Tạo ảnh: Đây là quá trình tạo ra các hình ảnh mới từ ảnh, chẳng
hạn như chỉnh sửa ảnh hoặc tạo hình ảnh tổng hợp.
1.1.3 Các kỹ thuật xử lý ảnh phổ biến
Dưới đây là một số kỹ thuật xử lý ảnh phổ biến:
Biến đổi: Biến đổicác phép toán thay đổi định dạng của ảnh.
Các biến đổi phổ biến bao gồm biến đổi Fourier, biến đổi Laplace
và biến đổi wavelet.
Lọc: Lọc là các phép toán làm thay đổi giá trị của các điểm ảnh
trong ảnh. Các bộ lọc phổ biến bao gồm bộ lọc trung bình, bộ lọc
làm mờ và bộ lọc làm nét.
Phân đoạn: Phân đoạn là quá trình chia ảnh thành các khu vực
riêng biệt. Các thuật toán phân đoạn phổ biến bao gồm phân đoạn
dựa trên ngưỡng, phân đoạn dựa trên vùng và phân đoạn dựa trên
cấu trúc.
Nhận dạng: Nhận dạng là quá trình xác định các đối tượng trong
ảnh. Các thuật toán nhận dạng phổ biến bao gồm nhận dạng dựa
lOMoARcPSD| 46560390
7
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com)
trên đặc trưng, nhận dạng dựa trên mô hình và nhận dạng dựa trên
học máy.
1.1.4 Các ứng dụng của xử lý ảnh
Xử lý ảnh có nhiều ứng dụng trong thực tế, bao gồm:
Công nghệ y tế: Xử lý ảnh được sử dụng trong chẩn đoán bệnh,
phẫu thuật và nghiên cứu y học.
Cảnh sát và an ninh: Xử lý ảnh được sử dụng trong theo dõi, nhận
dạng và phân tích hình ảnh.
Công nghệ video: Xử lý ảnh được sử dụng trong xử lý video, phát
hiện chuyển động và theo dõi đối tượng.
Công nghệ giải trí: Xử lý ảnh được sử dụng trong chỉnh sửa ảnh,
tạo hiệu ứng hình ảnh và tạo hình ảnh 3D.
1.1.5 Tương lai của xử lý ảnh
Xử lý ảnh là một lĩnh vực rộng lớn và đang phát triển nhanh
chóng. Các kỹ thuật xử lý ảnh mới được phát triển liên tục để đáp ứng
nhu cầu của các ứng dụng thực tế.
lOMoARcPSD| 46560390
8
Downloaded
by ?inh V? T?n D?ng (dungdinh241206@gmail.com)
1.1.6 Một số k thuật xử lý ảnh nâng cao
Ngoài các kỹ thuật xử lý ảnh phổ biến đã đề cập ở trên, còn có một
số kỹ thuật xử ảnh nâng cao, chẳng hạn như:
Xử lý ảnh dựa trên học máy: Các thuật toán học máy được sử
dụng để tự động hóa các tác vụ xử lý ảnh, chẳng hạn như nhận
dạng đối tượng và phân đoạn ảnh.
Xử lý ảnh đa hướng: Các thuật toán xử lý ảnh đa hướng được sử
dụng để xử lý ảnh từ nhiều nguồn khác nhau, chẳng hạn như ảnh
từ máy ảnh, ảnh từ cảm biến và ảnh từ video.
Xử lý ảnh 3D: Các thuật toán xử lý ảnh 3D được sử dụng để tạo
và xử lý ảnh 3D.
Những kỹ thuật này đang được nghiên cứu và phát triển để mở rộng khả
năng của xử lý ảnh trong các ứng dụng thực tế.
lOMoARcPSD| 46560390
9
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com)
1.2 GIỚI THIỆU VỀ BÀI TẬP LỚN
1.2.1 Bài toán đề tài "Chuyển đổi ký tự trong ảnh thành text"
Mục tiêu của đề tài này là phát triển các kỹ thuật để tự động chuyển đổi
các ký tự trong ảnh thành văn bản. Để giải quyết bài toán này, cần giải
quyết một số vấn đề sau:
Phân đoạn ký tự: Đây là quá trình chia ảnh thành các khu vực
chứa ký tự. Các khu vực này có thể có kích thước và hình dạng
khác nhau.
Chuẩn hóa ký tự: Đây là quá trình điều chỉnh kích thước, độ
nghiêng và độ xoay của các ký tự để chúng có cùng kích thước
định hướng.
Nhận dạng ký tự: Đây là quá trình xác định các tự trong các
khu vực đã được chuẩn hóa.
1.2.2 Các kỹ thuật có thể sử dụng
Để giải quyết các vấn đề này, có thể sử dụng một số kỹ thuật sau:
Kỹ thuật dựa trên đặc trưng: Các đặc trưng được sử dụng để mô t
các ký tự. Các thuật toán phân đoạn và nhận dạng ký tự dựa trên
việc so sánh các đặc trưng của các ký tự trong ảnh với các đặc
trưng của các ký tự trong bộ dữ liệu huấn luyện.
lOMoARcPSD| 46560390
10
Downloaded
by ?inh V? T?n D?ng (dungdinh241206@gmail.com)
Kỹ thuật dựa trên học máy: Các thuật toán học máy được sử dụng
để học mối quan hệ giữa các đặc trưng của các ký tự trong ảnh và
các ký tự tương ứng của chúng.
2.3 Ứng dụng của đề tài
Đề tài này có nhiều ứng dụng trong thực tế, bao gồm:
Chuyển đổi tài liệu giấy thành văn bản điện tử: Đây là một ứng dụng
quan trọng trong lĩnh vực lưu trữ và xử lý tài liệu.
Chuyển đổi văn bản từ các ngôn ngữ khác nhau: Đây là một ứng
dụng quan trọng trong lĩnh vực dịch thuật tự đng.
Cung cấp thông tin cho người khiếm thị: Đây là một ứng dụng quan
trọng trong lĩnh vực trợ giúp người khuyết tật.
1.2.4 Kết luận
Đề tài "Chuyển đổi ký tự trong ảnh thành text" là một đề tài có
nhiều tiềm năng ứng dụng. Để giải quyết đề tài này, cần phát triển các kỹ
thuật mới để cải thiện độ chính xác và hiệu quả của các thuật toán phân
đoạn, chuẩn hóa và nhận dạng ký tự.
1.2.5 Một số vấn đề cần lưu ý
Đề tài này có một số vấn đề cần lưu ý, bao gồm:
lOMoARcPSD| 46560390
11
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com)
Độ chính xác: Các thuật toán phân đoạn, chuẩn hóa và nhận dạng ký
tự cần có độ chính xác cao để đảm bảo kết quả chuyển đi chính xác.
Hiệu quả: Các thuật toán cần có hiệu quả cao để đảm bảo thời gian
chuyển đổi nhanh chóng.
Khả năng mở rng: Các thuật toán cần có khả năng mở rộng để hỗ trợ
các kiểu ký tự khác nhau từ các ngôn ngữ khác nhau.
Để giải quyết các vấn đề này, cần phát triển các kỹ thuật mới và cải thiện
các kỹ thuật hiện có.
lOMoARcPSD| 46560390
12
Downloaded
by ?inh V? T?n D?ng
(dungdinh241206@gmail.com)
CHƯƠNG II: CƠ SỞ LÝ THUYẾT
2.1. NGÔN NGỮ CÀI ĐẶT
2.1.1 Ngôn ngữ Python
Python là một ngôn ngữ lập trình được sử dụng rộng rãi trong các
ứng dụng web, phát triển phần mềm, khoa học dữ liệu và máy học (ML).
Các nhà phát triển sử dụng Python vì nó hiệu quả, dễ học và có thể chạy
trên nhiều nền tảng khác nhau. Phần mềm Python được tải xuống miễn
phí, tích hợp tốt với tất cả các loại hệ thống và tăng tốc đ phát triển.
2.2. CÁC THƯ VIỆN CẦN THIẾT
2.2.1 Thư viện Opencv
2.2.1.1 Khái niệm:
OpenCV là tên viết tắt của open source computer vision library
có thể được hiểu là một thư viện nguồn mở cho máy tính. Cụ thể hơn
OpenCV là kho lưu trữ các mã nguồn mở được dùng để xử lý hình ảnh,
phát triển các ứng dụng đồ họa trong thời gian thực.
2.2.1.2 Chức năng:
OpenCV được cho là một phần mềm đa nhiệm. Nó được ứng dụng trong
rất nhiều trường hợp khác nhau. OpenCV được dùng để khởi tạo ra
những hình ảnh 3 chiều phức tạp. Hoạt độngy rất được yêu thích, nhất
là trong thời đại trí tuệ nhân tạo AI phát triển như thế này.
lOMoARcPSD| 46560390
13
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com)
2.2.1.3 Ứng dụng trong thực tế, hình minh họa:
Tất cả những ứng dụng công nghệ như robot, xe tự lái, bảng cảm
ứng thông minh… đều có sự góp mặt của OpenCV trong khâu xử lý hình
ảnh. Hệ thống mở khóa điện thoại bằng cách nhận diện khuôn mặt người
dùng
2.2.2. Thư viện Numpy
Numpy là một thư viện lõi phục vụ cho khoa học máy tính của
Python, hỗ trợ cho việc tính toán các mảng nhiều chiều, có kích thước
lớn với các hàm đã được tối ưu áp dụng lên các mảng nhiều chiều đó.
Numpy đặc biệt hữu ích khi thực hiện các hàm liên quan tới Đại Số
Tuyến Tính.
2.2.3 Thư viện EasyOCR
EasyOCR là một thư viện Python sử dụng trí tuệ nhân tạo để nhận
dạng và đọc ký tự trong ảnh. Thư viện này được sử dụng để phát hiện
văn bản và trích xuất nội dung từ hình ảnh. EasyOCR hỗ trợ nhiều ngôn
ngữ và cung cấp khả năng nhận dạng văn bản tiếng Anh và tiếng Việt
cũng như nhiều ngôn ngữ khác.
2.2.4 Các khái niệm , thao tác cơ bản dùng khi xử lý ảnh
2.2.4.1 pixel là gì?
lOMoARcPSD| 46560390
14
Downloaded
by ?inh V? T?n D?ng
(dungdinh241206@gmail.com)
Trong tạo Ảnh kỹ thuật số, một pixel hay một điểm ảnh (tiếng
Anh: pixel hay pel, viết tắt picture element) là một điểm vật lý trong một
hình ảnh raster, hoặc một khối màu rất nhỏ và là đơn vị cơ bản nhất để
tạo nên một bức ảnh kỹ thuật s
Hình ảnh minh họa
2.2.4.2 Biểu diễn các pixel dưới dng ma trận
Trong hình ảnh xám, mỗi pixel được biểu diễn bằng một giá trị độ
sáng duy nhất. Ma trận pixel cho hình ảnh xám là một ma trận hai chiều
(hoặc mảng hai chiều) với mỗi phần tử ca ma trận thể hiện giá trị độ
sáng tại một vị trí cụ thể trên hình ảnh. Giá trị này thường nằm trong
khoảng từ 0 đến 255, với 0 thể hiện màu đen và 255 thể hiện màu trắng.
Điều này cho phép biểu diễn hình ảnh xám dưới dạng ma trận số nguyên.
lOMoARcPSD| 46560390
15
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com)
Hình ảnh minh họa
2.4.3 xử lý màu
Trong hình ảnh màu, mỗi pixel thường được biểu diễn bằng ba giá
trị độ sáng tương ứng với ba kênh màu chính: đỏ (R), xanh lá cây (G), và
xanh dương (B). Mỗi kênh màu là một ma trận hai chiều riêng biệt, và
các ma trận này có cùng kích thước. Giá trị của từng kênh màu cho biết
độ sáng của pixel tại một vị trí cụ thể.
Hình ảnh minh họa
2.3 Thuật toán KNN
2.3.1 Khái niệm:
lOMoARcPSD| 46560390
16
Downloaded
by ?inh V? T?n D?ng
(dungdinh241206@gmail.com)
KNN (K-Nearest Neighbors) là một trong những thuật toán học
giám sát đơn giản nhất được sử dụng nhiều trong khai phá dữ liệu và học
máy. Ý tưởng của thuật toán này là nó không học một điều gì từ tập dữ
liệu học (nên KNN được xếp vào loại lazy learning), mọi tính toán được
thực hiện khi nó cần dự đoán nhãn của dữ liệu mới.
Lớp (nhãn) của một đối tượng dữ liệu mới có thể dự đoán từ các lớp
(nhãn) của k hàng xóm gần nó nhất.
ảnh minh họa
Ví dụ : Dự đoán tính cách của một bạn nào đó thì có thể dựa vào tính
cách của nhóm mà bạn ấy chơi thân.
2.3.2. Ý tưởng của KNN
Thuật toán KNN cho rằng những dữ liệu tương tự nhau sẽ tồn tại
gần nhau trong một không gian, từ đó công việc của chúng ta là sẽ tìm k
điểm gần với dữ liệu cần kiểm tra nhất. Việc tìm khoảng cách giữa 2
điểm củng có nhiều công thức có thể sử dụng, tùy trưng hợp mà chúng
lOMoARcPSD| 46560390
17
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com)
ta lựa chọn cho phù hợp. Đây là 3 cách cơ bản để tính khoảng cách 2
điểm dữ liệu x, y có k thuộc tính:
2.3.3 Ưu điểm:
- Thuật toán đơn giản, dễ dàng triển khai.
- Độ phức tạp tính toán nhỏ. - Xử lý tốt với tập dữ liệu nhiễu
2.3.4 Nhược điểm:
- Với K nhỏ dễ gặp nhiễu dẫn tới kết quả đưa ra không chính xác
- Cần nhiều thời gian để thực hiện do phải tính toán khoảng cách
với tất cả các đi tượng trong tập dữ liệu.
- Cần chuyển đổi kiểu dữ liệu thành các yếu tố định tính.
lOMoARcPSD| 46560390
18
Downloaded
by ?inh V? T?n D?ng
(dungdinh241206@gmail.com)
CHƯƠNG III: NHẬN DIỆN KÝ TỰ TRONG
ẢNH VÀ CHUYỂN THÀNH TEXT
3.1. CÁC BƯỚC XỬ LÝ ẢNH
3.1.1 ý tưởng
Dùng thư viện opencv đc ảnh đầu vào
Chuyển ảnh màu vào thành ảnh màu xám
Đưa về ảnh nhị phân
Dùng thư viện easyocr để đọc các ký tự
Thao tác lấy ký tự và tọa đ các ký tự đọc được , vẽ khung cho ký
tự và viết ký tự tương ứng lên các khung đó Hiển thị ra ký tự
đọc được
3.1.2 chuyển về ảnh xám
Trong hình ảnh xám, mỗi pixel được biểu diễn bằng một giá trị độ
sáng duy nhất.
Mục tiêu em về việc chuyển đổi này là giảm số lượng thông tin
màu sắc và chuyển hình ảnh ban đầu thành một ảnh chỉ có mức độ sáng
tại mỗi pixel, thay vì có thông tin về màu sắc. Từ đó sẽ dễ giàng cho việc
chuyển đổi ảnh nhị phân để dễ xử lý và nhận dạng
lOMoARcPSD| 46560390
19
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com)
ảnh trước chuyển
ảnh sau chuyển
3.1.3 chuyển sang ảnh nhị phân
1.3.1 Khái niệm :
Ảnh nhị phân là ảnh cũng gần tương tự như xám đó là ở mỗi một
pixel chỉ mang một giá trị màu là đen (0) hoặc trắng (255) dưới dạng
biểu diễn số nguyên
| 1/46

Preview text:

lOMoAR cPSD| 46560390
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO
HỌC PHẦN XỬ LÝ ẢNH Đề tài:
CHUYỂN ĐỔI KÝ TỰ TRONG ẢNH THÀNH TEXT
Nhóm sinh viên thực hiện: Nguyễn Tiến Hoàng KHMT K19A Lê Văn Nam KHMT K19A Lục Văn Chiều KHMT K19A Lưu Hữu Được KHMT K19A
Giáo viên hướng dẫn: ThS. Phùng Thế Huân
Thái Nguyên, năm 2023 lOMoAR cPSD| 46560390 MỤC LỤC
MỞ ĐẦU..........................................................................................................5
CHƯƠNG I: TỔNG QUAN XỬ LÝ ẢNH VÀ ĐỀ TÀI...............................6
1.1 TỔNG QUAN VỀ XỬ LÝ ẢNH.......................................................6
1.1.1 Khái niệm cơ bản về ảnh.........................................................6
1.1.2 Các lĩnh vực của xử lý ảnh......................................................6
1.1.3 Các kỹ thuật xử lý ảnh phổ biến..............................................7
1.1.4 Các ứng dụng của xử lý ảnh....................................................8
1.1.5 Tương lai của xử lý ảnh..........................................................8
1.1.6 Một số kỹ thuật xử lý ảnh nâng cao........................................8
1.2 GIỚI THIỆU VỀ BÀI TẬP LỚN.....................................................10
1.2.1 Bài toán đề tài "Chuyển đổi ký tự trong ảnh thành text".......10
1.2.2 Các kỹ thuật có thể sử dụng..................................................10
2.3 Ứng dụng của đề tài.................................................................11
1.2.4 Kết luận................................................................................11
1.2.5 Một số vấn đề cần lưu ý........................................................11
CHƯƠNG II: CƠ SỞ LÝ THUYẾT...........................................................13
2.1. NGÔN NGỮ CÀI ĐẶT...................................................................13
2.1.1 Ngôn ngữ Python..................................................................13
2.2. CÁC THƯ VIỆN CẦN THIẾT.......................................................13
2.2.1 Thư viện Opencv..................................................................13
2.2.2. Thư viện Numpy.................................................................14 1 lOMoAR cPSD| 46560390
2.2.3 Thư viện EasyOCR...............................................................14
2.2.4 Các khái niệm , thao tác cơ bản dùng khi xử lý ảnh..............15
2.3 Thuật toán KNN...............................................................................17
CHƯƠNG III: NHẬN DIỆN KÝ TỰ TRONG ẢNH VÀ CHUYỂN
THÀNH TEXT..............................................................................................19
3.1. CÁC BƯỚC XỬ LÝ ẢNH..............................................................19
3.1.1 ý tưởng..................................................................................19
3.1.2 chuyển về ảnh xám...............................................................19
3.1.3 chuyển sang ảnh nhị phân.....................................................20
3.1.4 Nhận xét................................................................................22
3.2 DÙNG THƯ VIỆN EASYOCR ĐỂ ĐỌC HOẠT ĐỘNG KÝ TỰ..22
3.2.1 Gọi và sử dụng thư viện EasyOCR.......................................22
3.3 THAO TÁC XỬ LÝ ĐỂ LẤY TỌA ĐỘ VÀ VĂN BẢN DƯỚI
DẠNG TEXT...................................................................................23
3.3.1 Các hàm sử dụng...................................................................23
CHƯƠNG IV: NHẬN DIỆN CHỮ VIẾT TAY TRONG ẢNH.................27
4.1 TƯ TƯỞNG.....................................................................................27
4.2 CHUẨN BỊ DỮ LIỆU HUẤN LUYỆN...........................................27
4.3 PHÁT HIỆN ĐƯỜNG VIỀN CỦA CÁC ĐỐI TƯỢNG..................29
4.3.1 Khái niệm.............................................................................29
4.3.2 Cách cài đặt..........................................................................30
4.4 PHÁT HIỆN ĐỐI TƯỢNG KHÔNG PHẢI KÝ TỰ.......................31
4.5 CẮT CÁC ĐỐI TƯỢNG VÀ RESIZE GIỐNG ẢNH TRONG TẬP 2 lOMoAR cPSD| 46560390
DỮ LIỆU MẪU...............................................................................33
4.6 SỬ DỤNG KNN ĐỂ DỰ ĐOÁN KÝ TỰ........................................34
4.7 KẺ KHUNG VIẾT KÝ TỰ DỰ ĐOÁN TRÊN KHUNG VÀ HIỂN
THỊ RA MÀN HÌNH.......................................................................35
CHƯƠNG V: ĐÁNH GIÁ KẾT QUẢ THỰC HIỆN.................................37
5.1 ĐỐI VỚI NHẬN DIỆN CÁC FONT CHỮ PHỔ BIẾN TRÊN CÁC
THIẾT BỊ ĐIỆN TỬ........................................................................37
5.1.1 Ưu nhược điểm.....................................................................37
5.2 ĐỐI VỚI NHẬN DIỆN ẢNH CHỮ VIẾT TAY..............................38
5.2.1 Ưu nhược điẻm.....................................................................38
5.2.2 Các ảnh đã nhận dạng...........................................................38
CHƯƠNG VI: TỔNG KẾT.........................................................................45
6.1 MỤC TIÊU ĐẠT ĐƯỢC.................................................................45
6.1.1 Kiến thức..............................................................................45
6.1.2 Ứng dụng..............................................................................45
6.2 MỤC TIÊU CHƯA ĐẠT ĐƯỢC.....................................................46
KẾT LUẬN....................................................................................................47
TÀI LIỆU THAM KHẢO............................................................................49 3 lOMoAR cPSD| 46560390 MỞ ĐẦU
Ngày nay, công nghệ thông tin phát triển đồng nghĩa với việc phát
triển các phần mềm ứng dụng. Xử lý ảnh đóng vai trò quan trọng trong
nhiều lĩnh vực ứng dụng khác nhau. Trong lĩnh vực xử lý ảnh, việc chuyển
đổi chữ viết tay sang dạng văn bản thường gặp, đóng góp một phần quan
trọng trong quá trình tự động hóa công tác xử lý tài liệu và tìm kiếm thông tin.
Đề tài này tập trung vào việc nghiên cứu và ứng dụng các phương
pháp xử lý ảnh để chuyển đổi chữ viết tay thành dạng văn bản. Qua quá
trình nghiên cứu và thực nghiệm, chúng tôi hy vọng đem đến một giải
pháp hiệu quả và đáng tin cậy trong việc xử lý tài liệu chữ viết tay.
Báo cáo này sẽ bao gồm các phần chính như mục tiêu và phạm vi đề
tài, các khái niệm cơ bản, phương pháp nghiên cứu và kết quả đạt được.
Cuối cùng, chúng tôi sẽ đánh giá các kết quả và đề xuất hướng phát triển tiếp theo của đề tài.
Chúng em xin chân thành cảm ơn sự hướng dẫn và hỗ trợ nhiệt tình
của các thầy cô trong quá trình thực hiện đề tài này. Mong rằng báo cáo
này sẽ đem lại giá trị thực tiễn và mang lại những góp ý cần thiết để phát
triển hơn nữa trong tương lai.
Em xin chân thành cảm ơn!
CHƯƠNG I: TỔNG QUAN XỬ LÝ ẢNH VÀ ĐỀ TÀI
1.1 TỔNG QUAN VỀ XỬ LÝ ẢNH
Xử lý ảnh là một lĩnh vực của khoa học máy tính liên quan đến
việc áp dụng các kỹ thuật và thuật toán máy tính để xử lý ảnh số. Mục 4 lOMoAR cPSD| 46560390
đích của xử lý ảnh là để cải thiện chất lượng của ảnh, trích xuất thông tin
từ ảnh hoặc tạo ra các hình ảnh mới từ ảnh.
1.1.1 Khái niệm cơ bản về ảnh
Một ảnh số là một ma trận các điểm ảnh, mỗi điểm ảnh được biểu
diễn bằng một số hoặc một bộ số. Số lượng điểm ảnh trong một ảnh
được gọi là độ phân giải của ảnh. Độ phân giải càng cao thì ảnh càng chi tiết.
Các thông tin trong ảnh được thể hiện bởi các giá trị của các điểm ảnh.
Các giá trị này có thể được biểu diễn bằng các số nguyên, số thực hoặc số phức.
1.1.2 Các lĩnh vực của xử lý ảnh
Xử lý ảnh có thể được chia thành nhiều lĩnh vực khác nhau, bao gồm: •
Thu nhận ảnh: Đây là quá trình thu thập ảnh từ thế giới thực. 5 lOMoAR cPSD| 46560390
Cải thiện ảnh: Đây là quá trình cải thiện chất lượng của ảnh, chẳng
hạn như loại bỏ nhiễu, tăng cường độ tương phản hoặc sửa đổi màu sắc. •
Phân tích ảnh: Đây là quá trình trích xuất thông tin từ ảnh, chẳng
hạn như nhận dạng đối tượng, phát hiện khuôn mặt hoặc đo kích thước. •
Tạo ảnh: Đây là quá trình tạo ra các hình ảnh mới từ ảnh, chẳng
hạn như chỉnh sửa ảnh hoặc tạo hình ảnh tổng hợp.
1.1.3 Các kỹ thuật xử lý ảnh phổ biến
Dưới đây là một số kỹ thuật xử lý ảnh phổ biến: •
Biến đổi: Biến đổi là các phép toán thay đổi định dạng của ảnh.
Các biến đổi phổ biến bao gồm biến đổi Fourier, biến đổi Laplace và biến đổi wavelet. •
Lọc: Lọc là các phép toán làm thay đổi giá trị của các điểm ảnh
trong ảnh. Các bộ lọc phổ biến bao gồm bộ lọc trung bình, bộ lọc
làm mờ và bộ lọc làm nét. •
Phân đoạn: Phân đoạn là quá trình chia ảnh thành các khu vực
riêng biệt. Các thuật toán phân đoạn phổ biến bao gồm phân đoạn
dựa trên ngưỡng, phân đoạn dựa trên vùng và phân đoạn dựa trên cấu trúc. •
Nhận dạng: Nhận dạng là quá trình xác định các đối tượng trong
ảnh. Các thuật toán nhận dạng phổ biến bao gồm nhận dạng dựa 6 Downloaded
by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
trên đặc trưng, nhận dạng dựa trên mô hình và nhận dạng dựa trên học máy.
1.1.4 Các ứng dụng của xử lý ảnh
Xử lý ảnh có nhiều ứng dụng trong thực tế, bao gồm: •
Công nghệ y tế: Xử lý ảnh được sử dụng trong chẩn đoán bệnh,
phẫu thuật và nghiên cứu y học. •
Cảnh sát và an ninh: Xử lý ảnh được sử dụng trong theo dõi, nhận
dạng và phân tích hình ảnh. •
Công nghệ video: Xử lý ảnh được sử dụng trong xử lý video, phát
hiện chuyển động và theo dõi đối tượng. •
Công nghệ giải trí: Xử lý ảnh được sử dụng trong chỉnh sửa ảnh,
tạo hiệu ứng hình ảnh và tạo hình ảnh 3D.
1.1.5 Tương lai của xử lý ảnh
Xử lý ảnh là một lĩnh vực rộng lớn và đang phát triển nhanh
chóng. Các kỹ thuật xử lý ảnh mới được phát triển liên tục để đáp ứng
nhu cầu của các ứng dụng thực tế. 7
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
1.1.6 Một số kỹ thuật xử lý ảnh nâng cao
Ngoài các kỹ thuật xử lý ảnh phổ biến đã đề cập ở trên, còn có một
số kỹ thuật xử lý ảnh nâng cao, chẳng hạn như:
Xử lý ảnh dựa trên học máy: Các thuật toán học máy được sử
dụng để tự động hóa các tác vụ xử lý ảnh, chẳng hạn như nhận
dạng đối tượng và phân đoạn ảnh. •
Xử lý ảnh đa hướng: Các thuật toán xử lý ảnh đa hướng được sử
dụng để xử lý ảnh từ nhiều nguồn khác nhau, chẳng hạn như ảnh
từ máy ảnh, ảnh từ cảm biến và ảnh từ video. •
Xử lý ảnh 3D: Các thuật toán xử lý ảnh 3D được sử dụng để tạo và xử lý ảnh 3D.
Những kỹ thuật này đang được nghiên cứu và phát triển để mở rộng khả
năng của xử lý ảnh trong các ứng dụng thực tế. 8 Downloaded
by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
1.2 GIỚI THIỆU VỀ BÀI TẬP LỚN
1.2.1 Bài toán đề tài "Chuyển đổi ký tự trong ảnh thành text"
Mục tiêu của đề tài này là phát triển các kỹ thuật để tự động chuyển đổi
các ký tự trong ảnh thành văn bản. Để giải quyết bài toán này, cần giải
quyết một số vấn đề sau: •
Phân đoạn ký tự: Đây là quá trình chia ảnh thành các khu vực
chứa ký tự. Các khu vực này có thể có kích thước và hình dạng khác nhau. •
Chuẩn hóa ký tự: Đây là quá trình điều chỉnh kích thước, độ
nghiêng và độ xoay của các ký tự để chúng có cùng kích thước và định hướng. •
Nhận dạng ký tự: Đây là quá trình xác định các ký tự trong các
khu vực đã được chuẩn hóa.
1.2.2 Các kỹ thuật có thể sử dụng
Để giải quyết các vấn đề này, có thể sử dụng một số kỹ thuật sau:
Kỹ thuật dựa trên đặc trưng: Các đặc trưng được sử dụng để mô tả
các ký tự. Các thuật toán phân đoạn và nhận dạng ký tự dựa trên
việc so sánh các đặc trưng của các ký tự trong ảnh với các đặc
trưng của các ký tự trong bộ dữ liệu huấn luyện. 9
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
Kỹ thuật dựa trên học máy: Các thuật toán học máy được sử dụng
để học mối quan hệ giữa các đặc trưng của các ký tự trong ảnh và
các ký tự tương ứng của chúng.
2.3 Ứng dụng của đề tài
Đề tài này có nhiều ứng dụng trong thực tế, bao gồm:
• Chuyển đổi tài liệu giấy thành văn bản điện tử: Đây là một ứng dụng
quan trọng trong lĩnh vực lưu trữ và xử lý tài liệu.
• Chuyển đổi văn bản từ các ngôn ngữ khác nhau: Đây là một ứng
dụng quan trọng trong lĩnh vực dịch thuật tự động.
Cung cấp thông tin cho người khiếm thị: Đây là một ứng dụng quan
trọng trong lĩnh vực trợ giúp người khuyết tật. 1.2.4 Kết luận
Đề tài "Chuyển đổi ký tự trong ảnh thành text" là một đề tài có
nhiều tiềm năng ứng dụng. Để giải quyết đề tài này, cần phát triển các kỹ
thuật mới để cải thiện độ chính xác và hiệu quả của các thuật toán phân
đoạn, chuẩn hóa và nhận dạng ký tự.
1.2.5 Một số vấn đề cần lưu ý
Đề tài này có một số vấn đề cần lưu ý, bao gồm: 10 Downloaded
by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
• Độ chính xác: Các thuật toán phân đoạn, chuẩn hóa và nhận dạng ký
tự cần có độ chính xác cao để đảm bảo kết quả chuyển đổi chính xác.
• Hiệu quả: Các thuật toán cần có hiệu quả cao để đảm bảo thời gian chuyển đổi nhanh chóng.
• Khả năng mở rộng: Các thuật toán cần có khả năng mở rộng để hỗ trợ
các kiểu ký tự khác nhau từ các ngôn ngữ khác nhau.
Để giải quyết các vấn đề này, cần phát triển các kỹ thuật mới và cải thiện các kỹ thuật hiện có. 11
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
CHƯƠNG II: CƠ SỞ LÝ THUYẾT
2.1. NGÔN NGỮ CÀI ĐẶT
2.1.1 Ngôn ngữ Python
Python là một ngôn ngữ lập trình được sử dụng rộng rãi trong các
ứng dụng web, phát triển phần mềm, khoa học dữ liệu và máy học (ML).
Các nhà phát triển sử dụng Python vì nó hiệu quả, dễ học và có thể chạy
trên nhiều nền tảng khác nhau. Phần mềm Python được tải xuống miễn
phí, tích hợp tốt với tất cả các loại hệ thống và tăng tốc độ phát triển.
2.2. CÁC THƯ VIỆN CẦN THIẾT
2.2.1 Thư viện Opencv 2.2.1.1 Khái niệm:
OpenCV là tên viết tắt của open source computer vision library –
có thể được hiểu là một thư viện nguồn mở cho máy tính. Cụ thể hơn
OpenCV là kho lưu trữ các mã nguồn mở được dùng để xử lý hình ảnh,
phát triển các ứng dụng đồ họa trong thời gian thực. 2.2.1.2 Chức năng:
OpenCV được cho là một phần mềm đa nhiệm. Nó được ứng dụng trong
rất nhiều trường hợp khác nhau. OpenCV được dùng để khởi tạo ra
những hình ảnh 3 chiều phức tạp. Hoạt động này rất được yêu thích, nhất
là trong thời đại trí tuệ nhân tạo AI phát triển như thế này. 12 Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
2.2.1.3 Ứng dụng trong thực tế, hình minh họa:
Tất cả những ứng dụng công nghệ như robot, xe tự lái, bảng cảm
ứng thông minh… đều có sự góp mặt của OpenCV trong khâu xử lý hình
ảnh. Hệ thống mở khóa điện thoại bằng cách nhận diện khuôn mặt người dùng
2.2.2. Thư viện Numpy
Numpy là một thư viện lõi phục vụ cho khoa học máy tính của
Python, hỗ trợ cho việc tính toán các mảng nhiều chiều, có kích thước
lớn với các hàm đã được tối ưu áp dụng lên các mảng nhiều chiều đó.
Numpy đặc biệt hữu ích khi thực hiện các hàm liên quan tới Đại Số Tuyến Tính.
2.2.3 Thư viện EasyOCR
EasyOCR là một thư viện Python sử dụng trí tuệ nhân tạo để nhận
dạng và đọc ký tự trong ảnh. Thư viện này được sử dụng để phát hiện
văn bản và trích xuất nội dung từ hình ảnh. EasyOCR hỗ trợ nhiều ngôn
ngữ và cung cấp khả năng nhận dạng văn bản tiếng Anh và tiếng Việt
cũng như nhiều ngôn ngữ khác.
2.2.4 Các khái niệm , thao tác cơ bản dùng khi xử lý ảnh 2.2.4.1 pixel là gì? 13
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
Trong tạo Ảnh kỹ thuật số, một pixel hay một điểm ảnh (tiếng
Anh: pixel hay pel, viết tắt picture element) là một điểm vật lý trong một
hình ảnh raster, hoặc một khối màu rất nhỏ và là đơn vị cơ bản nhất để
tạo nên một bức ảnh kỹ thuật số
Hình ảnh minh họa
2.2.4.2 Biểu diễn các pixel dưới dạng ma trận
Trong hình ảnh xám, mỗi pixel được biểu diễn bằng một giá trị độ
sáng duy nhất. Ma trận pixel cho hình ảnh xám là một ma trận hai chiều
(hoặc mảng hai chiều) với mỗi phần tử của ma trận thể hiện giá trị độ
sáng tại một vị trí cụ thể trên hình ảnh. Giá trị này thường nằm trong
khoảng từ 0 đến 255, với 0 thể hiện màu đen và 255 thể hiện màu trắng.
Điều này cho phép biểu diễn hình ảnh xám dưới dạng ma trận số nguyên. 14 Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
Hình ảnh minh họa 2.4.3 xử lý màu
Trong hình ảnh màu, mỗi pixel thường được biểu diễn bằng ba giá
trị độ sáng tương ứng với ba kênh màu chính: đỏ (R), xanh lá cây (G), và
xanh dương (B). Mỗi kênh màu là một ma trận hai chiều riêng biệt, và
các ma trận này có cùng kích thước. Giá trị của từng kênh màu cho biết
độ sáng của pixel tại một vị trí cụ thể.
Hình ảnh minh họa 2.3 Thuật toán KNN 2.3.1 Khái niệm: 15
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
KNN (K-Nearest Neighbors) là một trong những thuật toán học có
giám sát đơn giản nhất được sử dụng nhiều trong khai phá dữ liệu và học
máy. Ý tưởng của thuật toán này là nó không học một điều gì từ tập dữ
liệu học (nên KNN được xếp vào loại lazy learning), mọi tính toán được
thực hiện khi nó cần dự đoán nhãn của dữ liệu mới.
Lớp (nhãn) của một đối tượng dữ liệu mới có thể dự đoán từ các lớp
(nhãn) của k hàng xóm gần nó nhất.
ảnh minh họa
Ví dụ : Dự đoán tính cách của một bạn nào đó thì có thể dựa vào tính
cách của nhóm mà bạn ấy chơi thân.
2.3.2. Ý tưởng của KNN
Thuật toán KNN cho rằng những dữ liệu tương tự nhau sẽ tồn tại
gần nhau trong một không gian, từ đó công việc của chúng ta là sẽ tìm k
điểm gần với dữ liệu cần kiểm tra nhất. Việc tìm khoảng cách giữa 2
điểm củng có nhiều công thức có thể sử dụng, tùy trường hợp mà chúng 16 Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
ta lựa chọn cho phù hợp. Đây là 3 cách cơ bản để tính khoảng cách 2
điểm dữ liệu x, y có k thuộc tính: 2.3.3 Ưu điểm:
- Thuật toán đơn giản, dễ dàng triển khai.
- Độ phức tạp tính toán nhỏ. - Xử lý tốt với tập dữ liệu nhiễu
2.3.4 Nhược điểm:
- Với K nhỏ dễ gặp nhiễu dẫn tới kết quả đưa ra không chính xác
- Cần nhiều thời gian để thực hiện do phải tính toán khoảng cách
với tất cả các đối tượng trong tập dữ liệu.
- Cần chuyển đổi kiểu dữ liệu thành các yếu tố định tính. 17
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
CHƯƠNG III: NHẬN DIỆN KÝ TỰ TRONG
ẢNH VÀ CHUYỂN THÀNH TEXT
3.1. CÁC BƯỚC XỬ LÝ ẢNH 3.1.1 ý tưởng
• Dùng thư viện opencv đọc ảnh đầu vào
• Chuyển ảnh màu vào thành ảnh màu xám
• Đưa về ảnh nhị phân
• Dùng thư viện easyocr để đọc các ký tự
• Thao tác lấy ký tự và tọa độ các ký tự đọc được , vẽ khung cho ký
tự và viết ký tự tương ứng lên các khung đó Hiển thị ra ký tự đọc được
3.1.2 chuyển về ảnh xám
Trong hình ảnh xám, mỗi pixel được biểu diễn bằng một giá trị độ sáng duy nhất.
Mục tiêu em về việc chuyển đổi này là giảm số lượng thông tin
màu sắc và chuyển hình ảnh ban đầu thành một ảnh chỉ có mức độ sáng
tại mỗi pixel, thay vì có thông tin về màu sắc. Từ đó sẽ dễ giàng cho việc
chuyển đổi ảnh nhị phân để dễ xử lý và nhận dạng 18 Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com) lOMoAR cPSD| 46560390
ảnh trước chuyển
ảnh sau chuyển
3.1.3 chuyển sang ảnh nhị phân 1.3.1 Khái niệm :
Ảnh nhị phân là ảnh cũng gần tương tự như xám đó là ở mỗi một
pixel chỉ mang một giá trị màu là đen (0) hoặc trắng (255) dưới dạng biểu diễn số nguyên 19
Downloaded by ?inh V? T?n D?ng (dungdinh241206@gmail.com)