Tiểu luận: tìm hiểu đặc trưng của lõm 3d và bài toán phát hiện mặt người trong ảnh

Tiểu luận: tìm hiểu đặc trưng của lõm 3d và bài toán phát hiện mặt người trong ảnh

Môn:
Trường:

Đại học Kinh Bắc 64 tài liệu

Thông tin:
46 trang 1 năm trước

Bình luận

Vui lòng đăng nhập hoặc đăng ký để gửi bình luận.

Tiểu luận: tìm hiểu đặc trưng của lõm 3d và bài toán phát hiện mặt người trong ảnh

Tiểu luận: tìm hiểu đặc trưng của lõm 3d và bài toán phát hiện mặt người trong ảnh

90 45 lượt tải Tải xuống
lOMoARcPSD|36149638
GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC KINH BẮC
------------------------------------------------------
TÌM HIỂU ĐẶC TRƢNG LÕM 3D VÀ BÀI TOÁN
PHÁT HIỆN MẶT NGƢỜI TRONG ẢNH
ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
NGÀNH: CÔNG NGHỆ THÔNG TIN
Sinh viên thc hin : Nguyn Th Thơm
Giáo viên hướng dn : PGS. TS. Đỗ Năng Toàn
Mã s sinh viên : 1351010031
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 2
MC LC
MỤC LỤC ..................................................................................................................
1
DANH MỤC HÌNH V ............................................................................................ 3
LỜI CẢM ƠN ............................................................................................................
4
LỜI MỞ ĐẦU ............................................................................................................
5
CHƢƠNG 1. KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN MẶT
NGƢỜI ............................................................................................................. 6
1.1. Khái quát v x nh ......................................................................................... 6
1.1.1. Mt s khái nim bản ...................................................................................
6
1.1.2. Mt s vấn trong x nh .................................................................... 7
1.1.2.1. c h thng x nh ........................................................................ 7
1.1.2.2. Các hình thái ca nh ...........................................................................
8
1.1.3. Mt s ng dng trong x nh ...............................................................
9
1.2. Bài toán nhn dng mặt người .......................................................................... 9
1.2.1. Bài toán nhn dng mặt người ....................................................................
9
1.2.2. Nhng khó khăn của nhn dng khuôn mt ............................................. 10
1.2.3. Tm quan trng ca bài toán nhn din mặt người .................................. 11
1.2.4.Các ng dụng ặc trưng của bài toán nhn din mặt người ...................... 12
1.2.5.Xây dng h thng nhn din mặt người ặc trưng .................................. 13
1.2.6. Mt s phương pháp nhận din mặt người ............................................... 13
1.2.6.1. Da trên tri thc ................................................................................. 14
1.2.6.2. Hướng tiếp cn dựa trên ặc trưng không thay ổi. ......................... 15
1.2.6.3. ng tiếp cn da trên so khp mu ............................................... 18
1.2.6.4. Hướng tiếp cn da trên din mo ..................................................... 19
lOMoARcPSD|36149638
1.3. Pháp phát hin mặt người dựa trên ặc trưng lõm ......................................... 20
CHƢƠNG 2 : TÌM HIỂU VỀ CÁC ĐẶC TRƢNG KHUÔN MẶT ................... 21
2.1. Đặc trưng lõm ................................................................................................. 21
2. 2.Rút trích các ặc trưng lõm ............................................................................. 21
2.2. 1.Điểm lõm ...................................................................................................
21
2.2.2. Dò tìm và ly vùng lõm
............................................................................ 22
2.2.3.Dò và phát hin vùng lõm nhiu mc khác nhau ................................... 24
2.2.3. 1.Tối ưu tốc ộ dò tìm
............................................................................ 25
2.2.4.Phát hin mặt người ...................................................................................
27
2.2.4. 1.Xây dng cu trúc cây lõm
................................................................. 27
2.2.4.2.Xây dựng hàm tính ộ tương ng gia hai cây ................................. 29
2.2.4.2.1. Độ tương ng gia hai nút trên cây ........................................... 30
2.2.4.2.2. Không gian cây và khong cách gia hai cây ............................. 32
2.3.1. Gán nhãn ...................................................................................................
32
2.3.2. Thng ...................................................................................................
33
2.3.3. Đánh giá dùng cho phát hiện khuôn mt .................................................. 34
2.3.4. Hu x ...................................................................................................
35
CHƢƠNG 3 CHƢƠNG TRÌNH THỬ NGHIỆM ............................................... 36
3. 1.Bài toán ............................................................................................................
36
3.2.Phân tích thiết kế ............................................................................................. 36
3.3.Mt s kết qu chương trình ............................................................................ 36
3.3.1 Tp nh th nghim ...................................................................................
36
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 4
3.3.2 Kết qu chương trình .................................................................................
37
3.3.3 Kết qu thc nghim ................................................................................. 41
PHẦN KẾT LUẬN .................................................................................................. 43
TÀI LIỆU THAM KHẢO ...................................................................................... 44
DANH MC HÌNH V
Hình 1.1 Quá trình xnh
Hình 1.2 Các bước cơ bản trong mt h thng x nh
Hình 1.3 Nn nh phc tp
Hinh 1.4 H thng nhn din mặt người ặc trưng
Hình 1.5 Kết cu khuôn mt
Hinh 1.6 Màu sc da mt
Hình 2.1.Dò tìm thông tin lõm
Hình 2.2 Dò tìm vùng lõm trên nh
Hình 2.3 Tp các b lc
Hình 2.4 Dò tìm vùng lõm nhiu mc khác nhau
Hình 2.5 nh tích phân
Hình 2.6 Tính tổng ộ sáng cho hình ch nht R(l,t,r,b)
Hình 2.7 To cây cp bc
Hình 2.8 Mt cây rút trích t khuôn mt
Hình 2.9 V trí vùng tương ối ca nút con
Hình 2.10 Cách tính vecto ại diện ộ sáng cho nút
Hình 2.11 Cây rút trích ược và các thông tin trên mt nút
Hình 2.12 Mô hình phát hin khuôn mt
Hình 3.1 Các nh th nghim
lOMoARcPSD|36149638
Hình 3.2 Giao din chính của chương trình Hình
3.3 Giao din phát hin khuôn mt
Hình 3.4 Phát hiện úng ra khuôn mặt
Hình 3.5 Phát hiện úng ra khuôn mặt
Hình 3.6 Ch phát hiện ược mt khuôn mt Hình
3.7 Không phát hiện ược ra khuôn mt
LI CM ƠN
Trước tiên em xin ược bày t s trân trng lòng biết ơn i vi thy giáo
PGS.TS. Đỗ Năng Toàn giảng viên Vin Khoa Công ngh thông tin. Trong sut
thi gian học làm án tt nghip, thy ã dành rất nhiu thời gian quý báu tn
tình ch bảo, hướng dẫn, ịnh hướng cho em thc hiện ồ án.
Em xin ược cm ơn các thầy giáo Trường Đại hc Dân lp Hải phòng ã ging
dy trong quá trình hc tp, thc hành, làm bài tp, giúp em hiu thấu áo hơn các nội
dung hc tp và nhng hn chế cn khc phc trong vic hc tp, nghiên cu và thc
hin bản ồ án này.
Em xin cảm ơn các bạn bè và nhất là các thành viên trong gia ình ã tạo mi iều
kin tt nhất, ộng viên, c vũ trong suốt quá trình hc tập và ồ án tt nghip.
Hải Phòng, ngày 5 tháng 6 năm 2013.
Sinh viên
Nguyn Th Thơm
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 6
LI M ĐẦU
Công ngh thông tin ngày càng phát trin vai trò hết sc quan trng
không th thiếu trong cuc sng hiện ại. Con người ngày ng to ra nhng c y
thông minh kh năng tự nhn biết x ưc các công vic mt cách t ng, phc
v cho li ích của con người. Trong những năm gần ây, một trong nhng bài toán
nhận ưc nhiu s quan tâm tn nhiu công sc nht của lĩnh vc công ngh thông
tin, ó chính bài toán nhận dng. Tuy mi xut hiện chưa lâu nhưng ã rất ưc
quan tâm vì tính ng dng thc tế của bài toán cũng như s phc tp ca nó.Bài toán
nhn dng rt nhiều lĩnh vực như: nhn dng vt chất(nước, la, ất, á, gỗ..) nhn
dng ch viết, nhn dng ging nói, nhn dang hình dáng, nhn dng khuôn mặt..
trong ó phổ biến ược ng dng nhiều hơn c bài toán nhn din khuôn mặt.Để
nhn dạng ược khuôn mặt, bước ầu tiên nhn dng phát hin ra khuôn mặt, iều
này thc s quan trng hết sc khó khăn. Cho ến tn y gi, các nhà nghiên
cu vẫn chưa ạt ưc s ưng ý trong vic gii quyết các khó khăn của bài toán và cho
kết qu hoàn toàn úng. Tuy nhiên, những gì ã ạt ược cũng chúng ta áp dng rộng
rãi em lại nhng li ích to ln trong cuc sng.Vi s hp dn ca bài toán
nhng thách thức còn ang ở phía trước, vi niềm am mê công nghệ hiện ại và nhng
ng dng thc tế tuyt vi ca nó, vi khát khao khám phá và chinh phc nhng chi
thc mi mẻ.. tôi ã chọn tài nghiên cu: TÌM HIỂU ĐẶC TRƯNG LÕM 3D
BÀI TOÁN PHÁT HIN MẶT NGƯỜI TRONG ẢNH làm tài nghiên cu bo
v luận văn tốt nghiệp ại hc ca mình.
lOMoARcPSD|36149638
CHƢƠNG 1. KHÁI QUÁT V XNH VÀ BÀI TOÁN
PHÁT HIN MT NGƢỜI
1.1. Khái quát về xử lý ảnh
1.1.1. Một số khái niệm cơ bản
X nh mt trong nhng mng quan trng nht trong k thut th giác
máy nh, là tiền ề cho nhiu nghiên cu thuộc lĩnh vực y. Hai nhim v bản ca
quá trình x nh nâng cao chất lượng thông tin hình nh x s liu cung
cp cho các quá trình khác trong ó có việc ng dng th giác vào iều khin.
Quá trình bắt u t vic thu nhn nh ngun (t các thiết b thu nhnnh dng
s hoặc tương tự) gửi ến máy tính. D liu ảnh ược lưu trữ nh dng phù hp vi
quá trình x . Người lp trình s tác ng các thuật toán tương ng lên d liu nh
nhằm thay ổi cu trúc ảnh phù hơp với các ng dng khác nhau.
Quá trình x nhn dng ảnh ược xem như quá trình thao tác ảnh u vào
nhm cho ra kết qu mong mun. Kết qu u ra ca mt quá trình x nh có th
mt ảnh “ ã ược x ” hoặc mt kết lun.
Hình 1.1. Quá trình xử lý ảnh
nh th xem tp hợp các iểm nh mỗi iểm ảnh ược xem như ặc
trưng cường sáng hay mt du hiệu nào ó tại mt v trí nào ó của i ng trong
không gian và nó có th xem như một hàm n biến P(c,c1,c2,…).Do ó,ảnh trong x
nh có th xem như ảnh n chiu .
nh
X
nh
nh
ượ
c x
K
ế
t lu
n
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 8
* Sơ ồ tng quát ca mt h thng x nh:
Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh
1.1.2. Một số vấn ề trong xử lý ảnh
1.1.2.1. Các hệ thống xử lý ảnh
a. Tin x
Tin x lý là giai oạn ầu tiên trong x nh s. Tu thuc vào quá trình x
lý tiếp theo trong giai on này s thc hiện các công oạn khác nhau như: nâng cp,
khôi phc nh, nn chnh hình hc, kh nhiu v.v.. b. Trích chọn ặc iểm
Các ặc iểm của ối tượng ược trích chn tu theo mục ích nhận dng trong quá
trình x nh. Trích chn hiu qu các ặc iểm giúp cho vic nhn dạng các ối tượng
nh chính xác, vi tốc ộ tính toán cao và dung lưng nh lưu tr gim.
c. Đối sánh, nhn dng
Nhn dng t ng (automatic recognition), mô t ối tượng, phân loi và phân
nhóm các mu nhng vấn quan trng trong th giác y, ược ng dng trong
nhiu ngành khoa hc khác nhau. d mu th nh ca vân tay, nh ca mt
vật nào ó ược chp, mt ch viết, khuôn mặt người hoc một ký ồ tín hiu tiếng nói.
Khi biết mt mẫu nào ó, nhn dng hoc phân loi mẫu ó.Hệ thng nhn dng t
ng bao gồm ba khâu tương ứng với ba giai oạn ch yếu sau ây:
Thu nhn d liu và tin x lý.
Biu din d liu.
Nhn dng, ra quyết ịnh.
Bn cách tiếp cn khác nhau trong lý thuyết nhn dng là:
Thu
nh
n
Ti
n x
Trích
tr
ọn ặ
c
iể
u
x
quy
ế
t
nh
Đố
i sánh rút
ra k
ế
t lu
n
Lưu trữ
lOMoARcPSD|36149638
Đối sánh mu dựa trên các ặc trưng ược trích chn.
Phân loi thng kê.
Đối sánh cu trúc.
Phân loi da trên mạng nơ-ron nhân to.
Trong các ng dng rõ ràng là không th ch dùng có mt cách tiếp cận ơn l
phân loại “tối ưu” do vậy cn s dng cùng mt lúc nhiều phương pháp cách tiếp
cn khác nhau. Do vy, các phương thức phân loi t hợp hay ược s dng khi nhn
dạng nay ã những kết qu trin vng da trên thiết kế các h thng lai (hybrid
system) bao gm nhiu mô hình kết hp.
1.1.2.2. Các hình thái ca nh
a.Chuyn nh màu thành nh xám
Đơn vị tế bào ca nh s là pixel. Tùy theo mỗi ịnh dng là nh màu hay nh
xám mà tng pixel có thông s khác nhau. Đối vi nh màu tng pixel s mang thông
tin của ba màu cơ bản to ra bn màu kh kiến Đỏ (R), Xanh (G) Xanh bin
(B) [Thomas 1892]. Trong mi pixel ca ảnh màu, ba màu bản R, G B ược b
trí sát nhau vàcường ộ sáng khác nhau. Thông thường, mi màu cơ bản ược biu
din bằng tám bit tương ứng 256 mức màu khác nhau. Như vậy mi pixel chúng ta
s28x3=224 màu (khong 16.78 triệu màu). Đối vi nh m, thông thường mi
pixel mang thông tin ca 256 mức m (tương ng vi tám bit) như vậy nh m
hoàn toàn có th tái hiện ầy cu trúc ca mt nh màu tương ng thông qua m mt
phẳng bit theo ộ xám. b.Lược ồ xám ca nh (Histogram)
Lược m ca mt nh s các mc xám trong khoảng [0,L−1] một
hàm ri rạc p(rk)=nk/n . Trong ó nk là số pixel có mc xám th rk, n là tng s pixel
trong ảnh k=0,1,2....L−1. Do ó P(rk) cho một xp x xác sut xy ra mc m rk.
V m y vi tt c các giá tr ca k s biu din khái quát s xut hin các mc
xám ca mt ảnh. Chúng ta cũng có thể th hiện lược ồ mc xám ca nh thông qua
tn sut xut hin mi mc xám qua h tọa vuông góc xOy. Trong ó, trc hoành
biu din s mc m t 0 ến N (s bit ca nh xám). Trc tung biu din s pixel
ca mi mc xám.
1.1.3. Một số ứng dụng trong xử lý ảnh
Như ã nói ở trên, các k thut x ảnh trước ây chủ yếu ược s dng nâng
cao chất lượng hình ảnh, chính xác hơn là tạo cm giác v s gia tăng chất lượng nh
quang hc trong mắt người quan sát. Thi gian gần ây, phạm vi ng dng x nh
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 10
m rng không ngng, th nói hiện không lĩnh vực khoa hc nào không s dng
các thành tu ca công ngh x nh s .
Trong y hc các thut toán x nh cho phép biến ổi hình ảnh ược to ra t
ngun bc x X -ray hay ngun bc x siêu âm thành hình nh quang hc trên b mt
film x-quang hoc trc tiếp trên b mt màn hình hin th. Hình ảnh các quan chức
năng của con người sau ó có thể ược xtiếp ể nâng cao ộ tương phn, lc, tách các
thành phn cn thiết (chp ct lp) hoc to ra hình nh trong không gian ba chiu
(siêu âm 3 chiu).
Trong lĩnh vực a cht, hình nh nhận ược t v tinh th ược phân ch
xác nh cu trúc b mặt trái t. K thut m nổi ường biên (image enhancement)
khôi phc hình nh (image restoration) cho phép nâng cao cht lượng nh v tinh
to ra các bản ồ a hình 3-D với ộ chính xác cao.
Trong ngành khí tượng hc, nh nhận ược t h thng v tinh theo dõi thi
tiết cũng ưc x lý, nâng cao chất lượng và ghép hình ể to ra nh b mặt trái ất trên
mt vùng rng lớn, qua ó thể thc hin vic d báo thi tiết một cách chính xác
hơn.
X ảnh còn ược s dng rộng rãi trong lĩnh vực hình s và các h thng
bo mt hoc kim soát truy cp: quá trình x nh vi mục ích nhận dng vân tay
hay khuôn mt cho phép phát hiện nhanh c ối tương nghi vấn cũng như nâng cao
hiu qu h thng bo mật cá nhân cũng như kiểm soát ra vào. Ngoài ra, có th k ến
các ng dng quan trng khác ca k thut x ảnh tĩnh cũng như ảnh ộng trong ời
sống như tự ng nhn dng, nhn dng mc tiêu quân s, y nhìn ng nghip trong
các h thống iều khin t ng, nén ảnh tĩnh, ảnh ộng ể lưu và truyn trong mng vin
thông v.v.
1.2. Bài toán nhận dạng mặt ngƣời
1.2.1. Bài toán nhn dng mặt ngƣời
H thng nhn dng mặt người mt h thng nhn vào là mt nh hoc một
oạn video (mt chui các nh). Qua x nh toán h thống xác ịnh ược v trí mặt
người trong nh (nếu có) xác ịnh người nào trong s những người h thống ã
ược biết (qua quá trình hc) hoặc là người l.
1.2.2. Những khó khăn của nhn dng khuôn mt
a. Tư thế góc chp : nh chp khuôn mt có th thay ổi rt nhiu bi vì
góc chp gia camera và khuôn mt.Chng hạn như : chụp thng, chp xéo bên trái
lOMoARcPSD|36149638
45
0
hay xéo bên phi 45
0
,chp t trên xung, chp t dưới lên,v.v…). Với các tư thế
khác nhau, các thành phn trên khuôn mặt như mắt, mũi, miệng có th b khut mt
phn hoc thm chí khut hết. Khuôn mặt ang nhìn thẳng nhưng góc chụp ca máy
nh li lch nhiu so với hướng nhìn thng ca khuôn mt hoc là lúc chp nh mặt
người quay nghiêng sang mt bên nào ó nhiều ều là những khó khăn rất ln trong
bài toán nhn din mặt người.
b.S xut hin hoc thiếu mt s thành phn ca khuôn mt: Các ặc trưng
như râu mép, râu hàm, mắt kính,v.v… thể xut hin hoc không. Vấn y m
cho bài toán càng khó khăn hơn rất nhiu.
c.S biu cm ca khuôn mt: Biu cm ca khuôn mặt ngưi th m ảnh
hưởng áng kể lên các thông s ca khuôn mt. Chng hn,cùng mt khuôn mt một
người, nhưng có thể s rt khác khi h cười hoc s hãi….
d.S che khut: Khuôn mt th b che khut bởi các ối tượng khác hoc
các khuôn mt khác.
e. Hướng ca nh: Các nh ca khuôn mt có th biến ổi rt nhiu vi các góc quay
khác nhau ca trc camera. Chng hn chp vi trc máy nh nghiêng làm cho khuôn
mt b nghiêng so vi trc ca nh.
f. Điều kin ca nh: Ảnh ược chụp trong các iều kin khác nhau v: chiếu sang, v
tính cht camera (máy k thut s, y hng ngoại,v.v…) ảnh ng rt nhiều ến
chất lượng nh khuôn mt.
g. Nn nh phc tp: nn ca nh phc tpmt trong những khó khăn nht trong
bài toán nhn din khuôn mặt người trong nh, khuôn mặt người s d b nhm ln
vi nhiu khung cnh phc tp xung quanh và ảnh hưởng rt nhiu ến quá trình phân
tích rút trích các ặc trưng của khuôn mt trong nh, th dn ến không nhn ra
khuôn mt hoc là nhn nhm các khung cnh xung quanh thành khuôn mặt người.
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 12
Hình 1.3 Nền ảnh phức tạp
h. Màu sc ca da mt: màu sc ca da mt quá ti hoc gn vi màu sc ca
khung cảnh môi trường xung quanh cũng là một khó khăn với bài toán nhn din mặt
người. Nếu màu sc của da ngưi quá ti thì thut toán s gặp kkhăn trong vic
nhn diện các ặc trưng và có thể không tìm ra ược khuôn mặt người.
1.2.3. Tầm quan trọng của bài toán nhận diện mặt ngƣời
Nếu như công nghệ nhn dng ging nói phù hp vi các ng dng callcenter
và nhược iểm ca tiếng n, không phù hp với nơi công cộng ông người thì
công ngh nhn dng ch cũng gây nhiều phin phức cho người s dụng khó
duy trì ưc chging nhau ngay trong cùng mt thời iểm. Trong khi ó, công nghệ
nhn dng vân tay hiện ã ược dùng khá ph biến, nhưng cũng có nhược iểm là b ảnh
hưởng bởi m da c bit s không chính xác cao vi ngưi có tay hay tiếp xúc
vi hoá cht. Bên cạnh ó, nhận dng bng vân tay còn có nhng hn chế v vic gi
mo, thm chí k gian th s dng tay của người khác xác thc. Còn công ngh
nhn dng mng mt là mt công ngh có nhiều ưu iểm v chính xác cũng như khả
năng chống gi mo. Vic xác thc, nhn dng trong công ngh này dựa trên
mch máu trong võng mc mắt. y rt ít thay ổi k t lúc mi sinh cho tới khi
già và c bit là khi chết, h thống sơ ồ mch máu này s biến mt. Vì thế, không th
dùng người chết ể xác thc cho vic truy cp trái phép. Tuy nhiên, công nghy li
b tác ng bi nhiu yếu t khác như rng ca mắt, lông mi, kính eo khó triển
khai ph biến trên din rng do phc tp ca các thiết b.
Trong khi ó, mặc dù ộ chính xác không là phải ưu iểm ni bt ca công ngh
nhn dng mặt ngưi song không ging vi những phương pháp khác, nhận dng mặt
người công ngh nhn dng không cần ến s tiếp xúc trc tiếp gia ối tượng
thiết b thu nhận. Thay vào ó, công nghệ này mang tính theo dõi, giám sát rt thun
tin cho nhng ng dng bo v mc tiêu, chng khng b ti nhng iểm công cộng
ông người. Đây cũng ưu iểm ni tri ca nhn dng mặt người các công ngh
nhn dng khác khó có th có ược.
1.2.4.Các ứng dụng ặc trƣng của bài toán nhận diện mặt ngƣời
Bài toán phát hin mặt ngưi trong nh mt bài toán phc tạp nhưng lại
hp hn rt nhiều người nghiên cu v nó, l bi tính ng dng thc tế ca bài toán
là rt lớn và a dạng trong cuc sng hiện i. có th k ra mt s ng dng thông dng
nht ca bài toán nhn din mặt ngưi:
lOMoARcPSD|36149638
Hệ thống giao tiếp thông minh giữa ngƣời máy: con ngưi th y
dng nhng h thng thông giao tiếp giữa ngưi máy nh thông qua viêc
nhn din khuôn mt, biu cm trên khuôn mặt người d oán, nhận biết trng
thái tâm lí hin thi ca người ó. Một ngôi nhà thông minh trong tương lai có
thể nhn biết ược ch nhân ca thông qua nhn biết khuôn mặt, dáng người,
giao tiếp qua giọng nói, vân tay…
Nhận dạng tội phạm: h thng th nhn din ra mt khuôn mt ngay tc
thì i chiếu vi hàng triu bn ghi sẵn trong sở d liệu ch ra ó
th là mt ti phạm ang truy m hay không, hoặc ó có thể là mt nhân vật nào
ó ặc bit cn quan tâm..vv..
Giải trí: trong hu hết các máy nh hiện ại ngày nay u chức năng tự ng
nhn din mặt người th ly nét, iều chnh ánh sáng cho phù hp vi
khung cnh xung quanh. Trên mt s trang web cũng ã áp dng công ngh t
ng nhn din mặt người so sánh vi kho d liu khng l của mình ưa
ra nhng li chào, dch v thông mình nhất cho ngưi s dng.
Hệ thống quan sát, theo dõi và bo v: các h thng camera s xác ịnh âu
con người và theo dõi người ó…
Điều khiển ra vào các quan, văn phòng: cho phép nhân viên ra vào các
khu vc quan trong không cn phải ăng nhập hay dùng th. Nếu kết hp
vi s dng vân tay hay hc mt thì s em lại kết qu chính xác cao.
Tổ chức tìm kiếm liên quan ến con người thông qua khuôn mt trên nhiu h
cơ sở d liu ln.
Phân tích cảm xúc ca khuôn mặt người..v..v..
1.2.5.Xây dựng hệ thống nhận diện mặt ngƣời ặc trƣng
Mt h thng nhn din khuôn mặt người có th ược xây dng qua rt nhiều
công oạn khác nhau rt phúc tạp, nhưng ta thể khái quát chung mi h thông
nhn dng khuôn mặt người gm có 3 bước cơ bản sau:
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 14
Hình 1.4 Hệ thng nhận diện mặt ngƣời ặc trƣng
Tin x lý: h thng nhn vào mt ảnh tĩnh, sau ó thể s nh cho cht
lượng tốt hơn, như chỉnh lại ộ sáng, giảm ộ nhiễu .. iều này giúp cho quá trình
rút trích các ặc trưng của khuôn mặt ược d dáng hơn rất nhiu. Quá trình tin
x thưng khá ơn giản nhanh gn nên không cn dùng các thut toán
phc tp và mt nhiu thi gian.
Trích rút các ặc trưng: Trích rút ặc trưng k thut s dng các thut toán
ly ra nhng thông tin mang những ặc iểm riêng bit ca một người.
Nhn din khuôn mặt: sau khi ã rút trích các ặc trưng, sẽ ưa vào khối nhn
dạng ể phân lớp ối tưng.
1.2.6. Một số phƣơng pháp nhận diện mặt ngƣời
Hin ti có khá nhiều phương pháp nhằm xác ịnh khuôn mặt người trong nh,
t nh chất lượng không tốt cho ến tt, không màu( en trắng) ến màu Nhưng
có thể phân chia các phương pháp này thành bốn hướng tiếp cn chính :
- Hướng tiếp cn da trên tri thc: hóa các hiu biết của con người v
khuôn mt thành các lut. các luật này thường mô t quan h của các ặc trưng ca
khuôn mt.
- Hướng tiếp cn da trên din mo: Hướng tiếp cn y dùng mt tp nh
hun luyện cho trước, rồi sau ó h thng s xác ịnh khuôn mặt người, do ócòn
có tên là: hướng tiếp cn da trên phương pháp học.
- Hướng tiếp cn da trên so sánh khp mu: Dùng các mu chun ca khuôn
mặt người ể mô t cho khuôn mặt hay các ặc trưng của khuôn mt.
lOMoARcPSD|36149638
- Hướng tiếp cn dựa trên các ặc trưng không thay i: Các thuật toán i tìm
các ặc trưng mô tả cu trúc khuôn mt người các ặc trưng này sẽ không thay
ổi khi tư thế khuôn mặt, iều kin ánh sáng hay v trí ặt máy ảnh thay ổi.
1.2.6.1. Da trên tri thc
Trong hướng tiếp cn y, các lut s ph thuc rt ln vào tri thc ca nhng
tác gi nghiên cu v bài toán xác nh khuôn mặt người. Đây là ng tiếp cn dng
top-down. D dàng xây dng các luật bản ể mô t c ặc trưng của khuôn mt
các quan h ơng ng. d, mt khuôn mặt thường hai mắt i xng nhau qua
trc thẳng ứng gia khuôn mt và có một mũi, một ming. Các quan h của các ặc
trưng thể ược t như quan hệ v khong cáchv trí. Thông thường s trích
ặc trưng của khuôn mặt trước tiên ược các ng viên, sau ó các ng viên y s
ược xác nh thông qua các lut biết ng viên nào khuôn mt và ng viên nào
không phi khuôn mặt. Thường áp dng quá trình xác nh gim s lượng xác nh
sai.
Mt vn khá phc tạp khi dùng hướng tiếp cn ylàm sao chuyn t tri
thức con người sang các lut mt các hiu qu. Nếu các lut y qchi tiết thì khi
xác nh th xác nh thiếu các khuôn mt trong nh, nhng khuôn mt y
không th tha mãn tt c các lut ưa ra. Nhưng các luật tng quát quá thì có th
chúng ta s xác nh lm một vùng nào ó không phải khuôn mt li xác nh
khuôn mặt. cũng khó khăn mở rng yêu cu t bài toán xác nh các khuôn mt
có nhiều tư thế khác nhau.
Hai tác gi Yang và Huang dùng một phương thức theo hưng tiếp cận như
sau ể xác các khuôn mt. H thng ca hai tác gi y bao gm ba mc lut. mc
cao nht, dùng mt khung ca s quét trên nh thông qua mt tp luật tìm các
ng viên có th là khuôn mt. mc kế tiếp, hai ông dùng mt tp luật ể mô t tng
quát hình dáng khuôn mt. Còn mc cui cùng li dùng mt tp lut khác xem xét
mc chi tiết các ặc trưng khuôn mặt. Mt h thng a phân gii th t ược
dùng xác nh. Các lut mc cao nht m ng viên như: “vùng trung m khuôn
mt bn phn vi mt mức ều bản”, “phần xung quanh bên trên ca mt
khuôn mt có mt mức ều cơ bản”, và mức khác nhau gia các giá tr xám trung
bình ca phn trung tâm và phn bao bên trên là áng kể”. Độ phân gii thp nht ca
nh dùng tìm ng viên khuôn mt mà còn tìm các mc phân gii tốt hơn. mc
hai, xem xét biểu ồ histogram ca các ứng viên ể loi bt ng viên nào không phi
khuôn mặt, ng thi ra cnh bao xung quanh ng viên. mc cui cùng, nhng
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 16
ng viên nào còn li s ược xem xét các ặc trưng của khuôn mt v mt ming.
Hai ông ã dùng một chiến ợc “từ thô ến mịn” hay “làm dần” gim s lượng
tính toán trong x lý. Mc t l chính xác chưa cao, nhưng ây tiền cho nhiu
nghiên cu sau này
Hai tác gi Kotropoulos và Pitas ưa một phương pháp tương tự dùng trên
phân gii thấp. Hai ông dùng phương pháp chiếu xác ịnh các ặc trưng khuôn mặt,
Kanade ã thành công với phương pháp chiếu xác nh biên ca khuôn mt. Vi I(x,y)
là giá tr xám ca một iểm trong nh có kích thước m x n ti v trí (x,y), các hàm ể
chiếu ảnh theo phương ngang và thẳng ng ược ịnh nghĩa như sau:
(2.1)
Da trên biểu ồ hình chiếu ngang, có hai cc tiu ịa phương khi hai ông xét
quá trình thay ổi ộ c của HI, ó chính là cạnh bên trái và phi ca hai bên ầu. Tương
tự vi hình chiếu dc VI, các cc tiểu ịa phương cũng cho ta biết v trí miệng, ỉnh
mũi, và hai mắt. Các ặc trưng này ủ xác ịnh khuôn mt.
1.2.6.2. Hƣớng tiếp cận dựa trên ặc trƣng không thay ổi.
Đây hướng tiếp cn theo kiu bottom-up. Các tác gi c gắng tìm các c
trưng không thay ổi ca khuôn mt người ể xác ịnh khuôn mt người. Da trên nhn
xét thc tế, con người d dàng nhn biết các khuôn mt và các ối tượng trong các tư
thế khác nhau iều kin ánh sáng khác nhau, thì phi tn ti các thuộc tính hay ặc
trưng không thay ổi. Có nhiu nghiên cứu ầu tiên xác ịnh các ặc trưng khuôn mặt ri
ch ra khuôn mt trong nh hay không. Các ặc trưng như: lông y, mắt, mũi,
miệng, và ường vin ca tóc ược trích bằng phương pháp xác nh cạnh. Trên cơ sở
các ặc trưng này, y dựng mt hình thng t quan h của các ặc trưng
này và xác ịnh s tn ti ca khuôn mt trong nh. Mt vấn ề ca các thuật toán theo
hướng tiếp cân ặc trưng cần phi iều chnh cho phù hợp iều kin ánh sáng, nhiu, và
b che khuất. Đôi khi bóng của khuôn mt s to thêm cnh mi, cnh y lại rõ
hơn cạnh tht s ca khuôn mt, thế nếu dùng cạnh xác nh s gặp khó khăn.
a.Các ặc trƣng khuôn mặt :
lOMoARcPSD|36149638
Sirohey ưa một phương pháp xác nh khuôn mt t mt nh hình nn
phc tạp. Phương pháp dựa trên cnh (dùng phương pháp Candy và heuristics loi
b các cạnh còn li duy nht mt ường bao xung quanh khuôn mt. Mt hình ellipse
dùng bao khuôn mt, tách biệt vùng ầu và hình nn. T l chính xác ca thut toán
là 80%. Cũng dùng phương pháp cạnh như Sirohey, Chetverikov Lerch dùng một
phưong pháp dựa trên blob streak (hình dng giọt nước sc xen kẽ), xác ịnh
theo hướng các cnh. Hai ông dùng hai blob ti và ba blob sáng mô t hai mt, hai
bên má, mũi. hình y dùng các treak t hình dáng ngoài ca khuôn
mt, lông mày, và môi. Dùng nh phân gii thp theo biến ổi Laplace ể xác nh
khuôn mt thông qua blob.
Leung trình bày mt nh xác sut xác nh khuôn mt trong nh
hình nn phc tạp trên sở mt b xác ịnh ặc trưng cục b so khớp th ngẫu
nhiên. Dùng m ặc trưng (hai mắt, hai l mũi, phần ni giữa mũi ming)
t mt khuôn mt. Luôn tính quan h khong cách với các ặc trưng cặp (như mắt trái,
mt phi), dùng phân b Gauss mô hình hóa. Mt mu khuôn mt ược ưa ra thông
qua trung bình tương ứng cho mt tập a ng, a tỷ l ca b lc o hàm Gauss. T
mt ảnh, các ặc trưng ứng viên ược xác nh bng cách so khp từng iểm nh khi lọc
tương ng vi vector mẫu (tương tự mối tương quan), chn hai ng viên ặc trưng
ng u tìm kiếm cho các ặc trưng khác ca khuôn mt. Giống như y dựng m
th quan h mi node của th tương ứng như các ặc trưng của mt khuôn mặt, ưa
xác suất vào ể xác ịnh. T l xác nh chính xác là 86%.
b.Kết cấu khuôn mặt:
Khuôn mặt con người nhng kết cu riêng bit th dùng phân loi
so vi các ối tượng khác. Augusteijn Skufca cho rng hình dng ca khuôn mt
dùng làm kết cu phân loi, gi kết cu ging khuôn mt (face-like texture). Tính
kết cấu qua các ặc trưng thống th t th hai (SGLD) trên vùng kích thước
16×16 iểm nh. Có ba loại ặc trưng ược xem xét: màu da, tóc, và nhng th khác. Hai
ông dùng mng neural v mối tương quan cascade cho phân loại giám sát các kết
cu mt ánh x ặc trưng tự t chức Kohonen gom nhóm các lp kết cu khác
nhau. Hai tác gi xuất dùng phương pháp bầu c khi không quyết ịnh ược kết cấu
ưa vào là kết cu ca da hay kết cu ca tóc.
Manian Ross dùng biến i wavelet y dng tp d liu kết cu ca
khuôn mt trong nh xám thông qua nhiều phân gii khác nhau kết hp xác sut
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 18
thông xác nh khuôn mặt người. Mi mu s chín ặc trưng. Tỷ l chính xác
là 87%, t l xác ịnh sai là 18%.
Hình 1.5 Kết cấu khuôn mặt
c.Sắc màu của da:
Thông thường các ảnh màu không xác nh trc tiếp trên toàn b d liu nh
các tác gi dùng tính cht sc màu ca da người (khuôn mặt người) ể chn ra ược
các ng viên có thkhuôn mặt người (lúc này d liu ã thu hẹp áng kể) ể xác ịnh
khuôn mặt người. Tôi s trình y chi tiết v hình hóa màu da người mt bài
sau.
Hinh 1.6 Màu sắc da mặt
d.Đa ặc trƣng
Gn ây có nhiều nghiên cu s dng các ặc trưng toàn cục như: màu da
người, kích thước, hình dáng tìm các ng viên khuôn mt, rồi sau ó sẽ xác nh
ng viên nào khuôn mặt thông qua dùng các c trưng cục b (chi tiết) như: mắt,
lông mày, mũi, miệng, và tóc. Tùy mi tác gi s s dng tập ặc trưng khác nhau.
lOMoARcPSD|36149638
1.2.6.3. Hƣớng tiếp cận dựa trên so khớp mẫu
Trong so khp mu, các mu chun ca khuôn mặt (thường là khuôn mt ược
chp thng) s ược xác ịnh trước hoặc xác nh các tham s thông qua mt hàm. T
mt ảnh ưa vào, nh c giá trị tương quan so với các mu chun v ường vin khuôn
mt, mắt, mũi miệng. Thông qua các giá tr ơng quan y các tác gi quyết
nh có hay không có tn ti khuôn mt trong ảnh. Hướng tiếp cn này có li thế là rt
d cài ặt, nhưng không hiệu qu khi t lệ, tư thế, và hình dáng thay i. Nhiều ộ phân
giải, a tỷ l, các mu con, các mu biến dng ược xem xét thành bt biến v t l
hình dáng. Hướng tiếp cn y th i theo phương pháp sau: a.Xác ịnh mẫu
trƣớc
Tác gi Sakai ã cố gng th xác nh khuôn mặt người chp thng trong nh.
Ông dùng vài mu con v mắt, mũi, miệng, ường vin khuôn mặt hình hóa
mt khuôn mt. Mi mu con ược ịnh nghĩa trong giới hn ca các oạn thẳng. Các
ường thng trong ảnh ược trích bằng phương pháp xem xét thay i gradient nhiu
nht so khp các mẫu con. Đầu tiên m các ng viên thông qua mối tương quan
giữa các nh con các mu v ường viền. Sau ó, so khớp vi các mu con khác.
Hay nói mt cách khác, giai oạn ầu xem như là giai oạn sơ chế tìm ứng viên, giai
an th hai là giai oạn tinh chế xác ịnh có tn ti hay không mt khuôn mặt người.
Ý tưởng này ược duy trì cho ến các nghiên cu sau này.
Còn tác gi Craw ưa ra một phương pháp xác nh khuôn mặt người da vào
các mu v hình dáng ca các nh ược chp thng (dùng v b ngoài ca hình dáng
khuôn mt). Đầu tiên dùng phép lc Sobel ể tìm các cnh. Các cnh này s ược nhóm
li theo mt s ràng buộc. Sau ó, tìm ường vin ca u, quá trình ơng tự ược lặp i
lặp li vi mi t l khác nhau xác ịnh các ặc trưng khác như: mắt, lông mày,và
môi.
Sau ó Craw mô t một phương thức xác nh dùng mt tp có 40 mu tìm các
ặc trưng khuôn mặt và iều khin chiến lưc dò tìm. b.Các mẫu bị biến dạng
Tác gi Yuille dùng các mu biến dạng hình hóa các ặc trưng của khuôn
mt, hình y kh năng linh hoạt cho các ặc trưng khuôn mặt. Trong hướng
tiếp cận này, các ặc trưng khuôn mặt ược mô t bng các mu ược tham s hóa. Một
hàm năng lượng (gtrị) ược ịnh nghĩa ể liên kết các cnh, nh, thung lũng trong
nh tương ng vi các tham s trong mu. hình này tt nht khi ti thiểu m
năng lượng qua các tham s, Mc dù kết qu tt vi mu biến dng trong theo vết ối
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 20
tượng trên ặc trưng không mô hình theo lưới, mt hn chế của hướng tiếp cn này là
các mu biến dng phi ược khi to trong phm vi gn các ối tượng ể xác ịnh.
Hai tác gi Huang Su dùng thuyết ng chy xác nh ường vin
khuôn mt da trên c tính hình hc. Hai ông dùng lý thuyết tập ng mc (Level Set)
loang t các khi ng ban u ược các khuôn mặt người.
1.2.6.4. Hƣớng tiếp cận dựa trên diện mạo
Trái ngược với các phưong pháp so khớp mu vi các mu ã ược nh nghĩa
trước bi nhng chuyên gia, c mẫu trong hướng tiếp cận này ược hc t các nh
mu. Mt các tổng quát, các phương pháp theo hướng tiếp cn y áp dng các k
thuật theo ng xác sut thng y hc tìm nhng c tính liên quan ca
khuôn mt không phi khuôn mặt. Các ặc tính ã ược hc trong hình thái các
mô hình phân b hay các hàm bit s nên dùng có th dùng cácc tính này ể xác ịnh
khuôn mặt người. Đng thi, bài toán gim s chiều thường ược quan tâm tăng
hiệu qu tính toán cũng như hiệu qu xác ịnh.
nhiều phương pháp áp dụng xác sut thống gii quyết. Mt nh hay
một vector ặc trưng xuất phát t mt ảnh ược xem như một biến ngu nhiên x, biến
ngẫu nhiên c tính khuôn mt hay không phi khuôn mt bi công thc tính theo
các hàm mt phân lp theo iều kin. P(x | khuôn mt) và P(x | ~ khuôn mt)
Có th dùng phân loi Bayes hoc kh năng cực ại ể phân loi mt ng viên
là khuôn mt hay không phi là khuôn mt. Không th càit trc tiếp phân loi
Bayes bi vì s chiu ca x khá cao, bi vì P(x | khuôn mt) và P(x | không phi
khuôn mặt) là a phương thức, và chưa thể hiu nếu xây dng các dng tham s hóa
mt cách t nhiên cho P(x | khuôn mt) và P(x | không phi khuôn mt) .Có khá
nhiu nghiên cứu theo hướng tiếp cn này quan tâm xp x có tham s hay không có
tham s cho P(x | khuôn mt) và P(x | không phi khuôn mt) .
Các tiếp cận khác trong hướng tiếp cn da trên din mo tìm mt hàm bit
s (như: mặt phng quyết ịnh, siêu phẳng tách d liệu, m ngưỡng) phân bit hai
lp d liu: khuôn mt không phi khuôn mặt. Bình thường, các mu nh ược
chiếu vào không gian có s chiu thấp hơn, rồi sau ó dùng một hàm bit s (dựa trên
các ộ o khoảng cách) ể phân loi, hoc xây dng mt quyết ịnh phi tuyến bng mng
neural a tầng. Hoc dùng SVM (Support Vector Machine) và các phương thức kernel,
chiếu hoàn toàn các mu vào không gian có s chiều cao hơn d liu b ri rc hoàn
toàn ta th dùng mt mt phng quyết nh phân loi các mu khuôn mt
không phi khuôn mt.
lOMoARcPSD|36149638
1.3. Phƣơng pháp phát hiện mặt ngƣời dựa trên ặc trƣng lõm
Năm 1983, James L. Crowley ã ưa ra khái niệm ridge và peak.
Ridge là các iểm li trên nh. Tập các iểm ridge trên nh s to thành những
ường xương sống và các ường y s to thành các chùm tia gi peak (chùm).
James L. Crowley s dng phép hiu ca lọc Low Pass rút ra các iểm ridge (li)
trên ảnh, sau ó một thut toán duyệt kết chúng li vi nhau thành các ặc trưng
ridge peak. Tiếp sau ó, mt s các phương pháp ược xuất rút trích các thông
tin v ridge valley (lõm). Hu hết các phương pháp y dùng mt b lọc tăng
cường thông tin v cnh trên ảnh sau ó tìm quỹ tích các iểm cc tr. Qu tích các
iểm cc tr này ược xem là các ặc trưng lồi và lõm. Trong ặc trưng lồi và lõm ược dò
tìm trên nhiều phân gii khác nhau, cho kết qu áng kể. Tuy nhiên, chất lượng của
các ặc trưng lồi m này còn ph thuc khá nhiều vào iều kin chiếu sáng cũng như
các mức phân giải ưc la chn trước. Để gii quyết s ph thuộc y, Lindeberg ã
xut một phương pháp tự ng chọn ộ phân gii tt nht. Gần ây Hải Trần ưa ra một
cách tiếp cn s dụng Laplacian tăng cường thông tin cạnh sau ó tìm ridge
peak dưới nhiu mc khác nhau. Trong hướng tiếp cận này, các ặc trưng ridge
peak ược biu diễn dưới dạng các ồ th quan h hoc các cây cp bc vi các tng
các ridge và peak ược dò tìm ti các mc khác nhau.
CHƢƠNG 2 : TÌM HIỂU V C ĐẶC TRƢNG KHUÔN MT
2.1. Đặc trƣng lõm
Ta có th hiu một cách ơn giản rng: lõm là những iểm thp nht, ví d như
lõm là những thung lũng. Trong nh v tinh, lõm là ưng khe chy gia hai dãy núi.
Trong nh y tế, m các thành phần trũng xuống. Còn trong nh khuôn mt, các
phn hc mắt ược coi là lõm.
Tác gi Hi Trn s dng mt b lc Laplacian-of-Gaussian, sau ó áp dng
mt thuật toán ể tìm qu tích của các iểm cc tr. Hình 2.1 biu din các ặc trưng
lõm tương tự như kết qu ca Hi Trn. Các iểm lõm ược tô màu xanh. Chúng ta lưu
ý rằng các iểm lõm rút trích ược ch biu din ưc các vùng m nh, chi tiết, chng
hạn như: mắt, chân mày, mũi, và miệng.
Trong nhng phn tiếp theo, chúng ta s m các ặc trưng lõm ti các mc khác
nhau. Ví d như, tại mc thp nht, cần dò tìm c ặc trưng lõm có kích thước nh
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 22
chi tiết như mắt, mũi, v.v... Trong những mức cao hơn kế tiếp, s tìm các vùng
lõm lớn hơn. Cũng giống như khi nhìn một người t rt xa, ta ch th nhìn ược
dáng, gần hơn một ta th nhìn ược mặt nhưng không nhìn ược các chi tiết mắt,
mũi, miệng trên khuôn mt, gần hơn nữa ta mi th nhìn chi tiết mt mũi, miệng.
Việc này tương ứng vi cách tiếp cn phân tích nhiu mc khác nhau
Hình 2.1.Dò tìm thông tin lõm
2.2.Rút trích các ặc trƣng lõm
2.2.1.Điểm lõm
Gi I(x, y) là mt hàm hai biến biu din mt nh I. Hàm s này thiết lp mt
mt (x, y, I(x, y)) . Mc tiêu của chúng ta là dò tìm các iểm có kh năng là iểm lõm
trên mt y. Mt ch chính xác theo toán học, iểm m nhng iểm tại ó cả
hai ạo hàm:
(2.2)
t cc tr. Trên thc tế, do nh mt hàm s không liên tc, hàm
ri rc do s s hóa ca máy tính, vì vy s rt kht khe nếu chúng ta ch tìm các
iểm cc tr. chúng ta s b mt mt s thông tin của các iểm ảnh lõm cũng như
những iểm lân cn chúng. vy ta ưa ra các công thức sau ây nhằm gim bớt các
iều kin ràng buộc i với iểm lõm :
V
P
= {(x,y)│| LoG(x,y)│≥ δ LoG(x,y) < 0
(2.3)
lOMoARcPSD|36149638
Trong ó V
P
tập các iểm lõm. Ký hiu LoG ( x, y) là giá tr ca Laplacian-
of-Gaussian tại iểm (x, y) . Mục ích là rút trích các vùng lõm chứ không ch rút trích
iểm lõm.
2.2.2. Dò tìm và ly vùng lõm
Để ánh giá một vùng phi lõm hoc không m, chúng ta xut mt b
lọc như sau:
B lc vuông
Hình 2.2 Dò tìm vùng lõm trên ảnh
ng với vùng ang xét mt hình vuông s x s , chúng ta tính giá tr ca b lc trên
vùng y theo công thc (2.3). Đạt S1, S2, S3, S4 c hình ch nhật en xung
quanh hình vuông R giá tr lọc F(R) ược ịnh nghĩ như sau:
(2.4)
Trong công thc (2.3), hàm sum(X) là m tng giá tr sáng trong vùng X. Datrên
giá tr F(R) vừa tính ược, chúng ta ánh giá vùng R theo công thức sau:
(2.5)
Ảnh ang xét
s Vùng
ánh giá
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 24
Công thc (2.5) là công thc m rng ca (2.2) và (2.3) nhằm ể dò tìm các vùng lõm
trên nh. S khác bit ch yếu ch ta s dng b lc hiu trong (2.5) thay vì s dng
Laplacian-of-Gaussian trong (2.2) (2.3). Chúng ta ý rng, bng cách thay kích
thước S ca vùng ang xét, hay nói cách khác là kích thước ca lc, chúng ta có th
tìm các vùng lõm ng vi nhiu kích c, mức khác nhau. Ngoài ra, dò tìm và rút
trích các vùng lõm có hình dng khác nhau, s dng mt tp các lc hình hc có hình
dng thay vì ch s dng mt b lc vuông.
L c hình vuông Lc ch nht ngang Lc ch nhật ứng
Hình 2.3 Tp các b lc
Do ó ta có thể biến ổi công thc (2.4) thành công thc sau:
(2.6)
(2.7)
F
S
(R) ược s dụng tính giá
tr lc vuông n F
R
(R) ưc s dụng tính giá tr các lc nh ch nht. Chúng ta
d dàng nhn thy rng các công thc tính lọc ều tương tự vi công thc ca một
Laplacian, nhưng một chút khác bit s dng vùng thay vì từng iểm ơn. Trong
công thức (2.6) và (2.7), h s ng trước m sum(R) ược là do t l gia din tích
vùng tâm (vùng ang xét) tng din tích ca vùng lân cn. Trong hình (2.3a), tng
din tích của các vùng en xung quanh gấp ôi diện tích phn gia, vy chúng ta
có h s 2. Trong hình (2.3b) và (2.3c), tng diện tích các vùng en gấp rưỡi din tích
phn hình ch nht gia. Mt cách chính xác chúng ta phi dùng h s 1.5 trước
hàm sum(R), nhưng vic tính toán trên s thc rt chậm, do ó tăng tốc tính toán
ta dùng 2 h s nguyên là 3 và 2 thay vì ch dùng 1 h s 1.5.
lOMoARcPSD|36149638
Mt thông s quan trng khác trong công thc (2.5) ngưỡng . Ngưỡng
phi ph thuc tuyến tính vào din ch của vùng ang xét. Chúng ta sử dng
1
=KS
2
i vi lọc hình vuông có kích thước S
2
=4KS
2
i vi các lc. hình ch nhật
có kích thước S. Kmt thông s thc nghiệm. Ngưỡng
1
là tích ca K và S2 din
tích ca lọc vuông. Tương tự, trong (2.7), chúng ta ã gấp ôi giá trị ca F
R
(R) tránh
chuyn tính toán trên s thc. thế, chúng ta cũng phi gấp ôi ngưng
2
tăng
chính xác ca việc ánh giá.
2.2.3.Dò và phát hiện vùng lõm o nhiều mức khác nhau
Sau ây là một phương pháp sử dng các lc hiu nhiu mc khác nhau ể
tìm các vùng lõm. Các lọc ược gii thiu trong phần trước s ược s dng vi nhiều
kích thước khác nhau vy chúng s tìm ược các vùng li nhiu mc khác nhau.
=10, nh sau khi smoth vi Các vùng lõm dò với kích thước lc 1
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 26
=20, nh sau khi smoth vi Các vùng lõm dò tìm vi kích
Gausian 20 2 thước lc 20
Hình 2.4 Dò tìm vùng lõm nhiu mc khác nhau
Đặt
1
,
2
,..
n
là các mức ộ ược ịnh nghĩa trước và có ộ lớn tăng dần.
1 mức thp nht. Ti mức y, chúng ta th tìm các vùng lõm, kích
thước nh chi tiết.
n
mức cao nht tại ó chúng ta thể dò m các vùng
lõm lớn hơn, ít chi tiết hơn. Tại mi mức, trước tiên áp dng mt lc
Gaussian vi ch thước
i
2 sau ó chúng ta sử dng 3 b lc hiệu như hình (2.3) với
kích thước S =
i
. Trong hình (2.4), các hình vuông và hình ch nht màu xanh là các
vùng lõm. Trong thc tế, nhiu vùng lõm khác cũng ược m ược, tuy nhiên
trong hình (2.4), ch tp trung vào các vùng lõm dò tìm ược trong vùng nh quan tâm
vùng nh khuôn mt. Trong phn tiếp theo, s trình y phương pháp cu trúc các
vùng lõm rút trích ược này thành các cây cp bc.
2.2.3.1.Tối ƣu tốc ộ dò tìm
Trong vùng ang xét, chúng ta phải thường xuyên tính tổng sáng iểm nh
ca mt vùng hình ch nht, mt s hình trong chúng th chng lên nhau. Vic
này làm cho tính toán chậm i rất nhiu do phi tính nhiu ln tổng sáng cho một
vùng. Để giảm phc tp ca tính toán y,tôi s dụng phương pháp tương tự như
nh tích phân (integral image) và k thut lp trình quy hoạch ộng.
Phương pháp này ược trình bày như sau:
Cho trước mt nh mc xám I (x, y) , chúng ta ịnh nghĩa một nh tích phân
Gausian 10
2
lOMoARcPSD|36149638
S(x, y) sao cho S(x, y) tng mc sáng ca toàn b iểm nh trong hình ch nht
R(1,1, x, y) . Chúng ta có th d dàng tính ược S (x, y) theo công thc truy hi:
(2.8)
Hình 2.5 nh tích phân
T nh S (x, y) , ta d dáng tính ưc tổng sáng ca mt nh ch nht bt k
R(l, r,t,b) theo công thc sau:
(2.9)
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 28
Hình 2.6:Tính tổng ộ sáng cho hình ch nht R(l,t,r,b)
Phương pháp này cải tiến áng kể tốc tính toán bi chúng ta ch cn tính
mt ln nh tích phân và s dng trong tt c các ca s hình ch nht con và c
biệt ộ phc tp tính toán không ph thuộc vào kích thước của vùng ang xét.
2.2.4.Phát hin mặt ngƣời
2.2.4.1.Xây dng cu trúc cây lõm
T các vùng lõm rút trích ược, chúng ta xây dng các y quan h cp bc.
Những vùng ược rút trích mc cao nht s tr thành nhng nút gc ca các cây
s to. Những vùng rút trích ược mc thp nht
1
s ược chèn vào cây như là nhng
nút lá.
Hình 2.7 To cây cp bc
Công vic chính ca vic to y kết nối các vùng rút trích ược ti mt mức
ến các vùng ca mc kế tiếp. Nếu vùng R ti mc
1
b che khuất n hai phn ba din
tích ca bởi vùng R’ của mc , R s ược gán nhãn nút con của R’. Bng
cách y chúng ta th d dàng to y cp bc t các vùng ã rút trích ược. c
vùng rút trích ược trong hình ược xây dựng thành cây như sau :
n
i+1
V
V
V
V
V
R
V
R
V
lOMoARcPSD|36149638
Hình 2.8 Mt cây rút trích t khuôn mt
Đối vi mi nút trong cây, chúng ta cần lưu các thông tin của nút y như: loại (lõm),
hình dng (vuông, ch nht ngang, ch nhật ng), v trí tương i ca so vi nút
cha ca nó (có giá tr t 0 ến 12, xem hình 2.9), và thông tin v sáng ca nó.
Hình 2.9: v trí vùng tương ối ca nút con
Trong hình biu din các v trí tương i ca nút con trên nút cha lần t có
dng vuông, ch nht ngang, và ch nhật ứng. Vic xét mt nút con có v trí tương ối
như thế nào i với nút cha khá ơn giản. Nếu tâm ca nút con (tâm ca hình vuông hay
hình ch nhật) rơi vào vùng nào trong hình thì chỉ s của vùng ó chính giá tr v trí
tương ối của nút con trong nút cha. Lưu ý rằng i vi các nút gc giá tr y s 0.
Bên cạnh ó thông tin về sáng cũng rất quan trng trong các bài toán phát hin
nhn dang khuôn mt v sau. Để lưu trữ thông tin y trên cây, ta s dụng phương
pháp phân tích thành phần chính (Principal Component Analysis PCA) gim s
chiu ca nh mc xám trên vùng nh của nút ó. Bng cách y ta giảm ược áng kể
thông tin phải u trữ v sáng ca nh. Thay phải lưu trữ toàn b iểm sáng ca
các vùng lõm (các nút), chúng ta ch cn lưu một vector PCA cha ni dung của các
iểm sáng y. Cách này giúp cho gim thông tin phải lưu trữ, x cũng không
mất mát quá nhiu thông tin.
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 30
Hình 2.10: cách tính vecto ại din ộ sáng cho nút
C th ta thc hiện như sau: dùng một ca s con S kích thước 9x9 quét theo
ường zic-zac trên nh xám ca vùng lõm. Các ca c này có th chng lp lên nhau
hai phần ba kích thưc ca nó. Ti mỗi iểm, ta lưu lại trung bình mc sáng của các
iểm nh trong ca s S. Như vậy ta lưu ược một vector tương ứng cho biu din mc
sáng của iểm nh tại nút ó.
Hình 2.11: cây rút trích ược và các thông tin trên mt nút
Bên cạnh ó, ta sử dng mt s luật ta bt nhánh cho các cây. Nếu mt nút
cùng kiu (lõm) so vi nút cha của thì ược xem là mt nút lp. Trong trường
hp y, nút lp s ược ta khi y. Nếu mt nút lá, chúng ta d dàng xóa
khi cây.
2.2.4.2.Xây dựng hàm tính ộ tƣơng ồng gia hai cây
Trong phn này ta cùng tìm hiu một cách tính ộ tương ồng gia hai cây lõm
theo cách biu diễn như phần trước. Vic xây dựng hàm tương ồng gia hai y là rt
Zoom out N
i dung c
a
nút
Đượ
c phóng ra:
1.Ki
u lõm
2
.Hình vuông
3.V
trí: 1
V
V
V
V
V
R
V
R
V
lOMoARcPSD|36149638
cn thiết trong tt c các x liên quan ến ặc trưng này. tính cht quyết nh
ảnh hưởng ến ộ chính xác ca phát hin và nhn dng khuôn mt.
2.2.4.2.1. Độ tƣơng ồng gia hai nút trên cây
Để xây dng m nh ộ tương ồng giữa hai y trưc hết ta cn y dng hàm
tính tương ng ca hai nút trên hai cây. Với iều kin rng hai nút thuc hai y khác
nhau này cùng mc
i
nào ó.
Đặt N1 N2 hai nút cùng cấp trên hai cây T1 T2. Khi ó N1 N2
nhng thuc tính sau:
(2.10)
Trong ó: t {ridge, valley} : loi ca
nút (lõm).
s = {square, horizontal rectangle, vertical rectangle} hình dng ca nút
(vuông,hình ch nht ngang, hình ch nhật ứng).
p [0..12] : là v trí tương ối ca nút trong nút cha ca nó.
i (a1,a2,...,an) : vector chứa thông tin sáng của nút. Trong ó n thay ổi y theo
cp ca nút. mc
i
càng cao, kích thưc của vùng lõm tương ứng vi nút càng ln,
s chiu n ca vector này càng cao.
Da trên các thuc tính của node ịnh nghĩa trong công thức 3.9, ta xây dng
công thức tính ộ tương ng giữa 2 nút như sau:
(2.11)
Trong công thc (2.11),
1
,
1
, và
1
là các thông s thc ngim, hàm E(x,y) dùng xét
s ging nhau gia 2 thuộc tính ược ịnh nghĩa như sau:
(2.12)
Bên cạnh ó hiệu EV(x,y) m tính tương ng giữa 2 vector ược chun
hóa v oạn [0,1]. Trong ó x và y là hai vector ộ sáng có n chiu
(a1,a2,...an).
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 32
(2.13)
Do mi thành phần ai
trong vector ộ sáng có giá tr
sáng (ai [0,255]) nên d dàng chứng minh ược EV(x,y) [0,1]. EV(x,y) t giá tr
ln nht là 1 khi hai vector x y trùng nhau. Và EV(x,y) ạt giá tr nh nht là 0 khi
hai vector khong cách Euclid xa nhau nht. Và t ó ta cũng dễ dàng suy ra ược
giá tr ca NS (N1, N 2 ) [0,1] vi mi cp nút N1 và N2.
Độ tương ồng gia hai cây :
Trên sở hàm tính tương ng gia hai nút, ta y dng lên m tính
tương ồng gia hai y. Gọi T1 và T2 và hai cây ang cần tính ộ tươngng. T1 và T2
có nhng thuc tính sau:
T1,T2 Tree = {(r, n, c1, c2 ,...,cn )} (2.14)
Trong ó:
r : là nút gc ca cây r Node. n :
là s nhánh con ca cây n N.
ci : là cây (nhánh) con th i ca y ci Tree và i [1..n]. ci có th là mt nút là hoc
cũng có thể là mt cây khác.
T công thc (2.13), tay dng công thức tính ộ tương ồng ca 2 cây như sau:
(2.15)
Trong ó
2
là thông s thc nghim. Các thông s thc nghim
1
,
1
, và trong
công thc (2.10)
2
trong (2.14) s ược tho lun chi tiết trong phn thc nghim
nhm chn thông s thc nghim tt nht. Theo công thc (2.15) ta cũng dễ dàng
nhn thy TS (T1,T2 ) [0,1] vi mi cp y T1 T2. Giá tr ca hàm y ng
ln, hai cây này càng ging nhau càng nhiu hơn.
1
lOMoARcPSD|36149638
Ngoài ra, trong phn th nghim chúng tôi có th nghiệm ặc trưng lồi lõm
không s dụng ến thông tin sáng. Khi ó công thức(2.10) tính tương ng giữa hai
nút ược ơn giản hóa như sau:
(2.16)
2.2.4.2.2. Không gian cây và khoảng cách giữa hai cây
Trong mt s trưng hợp, hàm tính tương ng gia hai y không tính
toán trong mt s trường hợp. Để ưa về bài toán không gian, ta xây dng mt “không
gian cây” (tree-space), không gian y s sở cho các bài toán phát hin nhn
dng khuôn mt v sau.
Trong không gian cây y, mỗi cây ưc xem một iểm trong không gian.
Trên cơ sở ó ta xây dựng hàm tính khong cách giữa hai cây như sau:
(2.17)
D dàng nhn thy, khong cách gia hai y mt giá tr thuộc oạn [0,1].
Và khong cách tiến dn v bng không khi hai cây càng ging nhau.
Trên c s các công thc nh tương ồng, khong cách này, ta xây dng mt
hình thống tìm phát hin khuôn mt. hình có th dùng cho nhn
dng khuôn mặt cũng như mở rng cho bài toán phân loại ối ng. Phn hình
này s ược trình bày trong chương sau. Các phần tho lun v kh năng mở rng ca
hình này cho bài toán nhn dng khuôn mt phân loại ối tượng s ược trình bài
trong chương kết luận và hướng phát trin.
2.3. Phát hiện mặt ngƣời trong ảnh dựa trên ặc trƣng lõm
2.3.1. Gán nhãn
T tp nh học, ta dùng phương pháp trình bày trong chương 3 rút trích các
cây lõm trên ảnh. Các cây này ược gán nhãn th công. Mi y bt k ược gán nhãn
mt (face) hay không phi khuôn mt (non-face). Như vậy, t mt tp nh học ta
rút trích ược hai tp cây. Tp y biu din khuôn mt và tp cây biu diễn ối tượng
không phi là khuôn mt.
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 34
2.3.2. Thng kê
Mục ích của bưc này là xp x ược mt cu trúc cây khuôn mt. Trong bước
gán nhãn, tôi tiến hành rút trích y và gán nhãn. Kết qu thu ược mt s lượng y
thuc lớp “khuôn mặt”. Các cây y ưc dùng làm d liu hc thng kê. hình
thống kê ược s dụng như sau:
Đặt S(Tx) là tng khong cách ca mt cây T
x
bt k ến tt c các cây còn li
trong tp hc.
(2.18)
Ta s có tp hc tr thành
(2.19)
Trong ó FaceSet tập các y ược gán nhãn “khuôn mặt”. Việc hc thng
theo hình của y khá ơn giản. Trưc tiên, chn trong tp Training ra k
cây có giá tr S(T) bé nht. k cây này s là ại din tiêu biu cho mt lp khuôn mt.
T kết qu k cây rút trích ược, tm gi là tp cây chun, ta có th dùng chúng
phát hin khuôn mặt theo mô hình như sau:
lOMoARcPSD|36149638
Hình 2.12 Mô hình phát hin khuôn mt
Trong hình y, trước tiên t ảnh ầu vào ta dùng phương pháp rút trích m
ta s nhận ược mt danh sách các cây lõm. ng vi mi y ta da vào tp y chuẩn
kim tra xem liệu ây có phải là cây biu diễn “khuôn mặt” hay không. Nếu thỏa iều
kiện ánh giá s tr thành ng viên khuôn mt. Trong bước cui cùng, hu x lý,
các ng viên s ược kim tra ràng buc. Và sau cùng kh trùng lp khuôn mt do
có mt sy có mt phn ca nút gc chng lên nhau.
2.3.3. Đánh giá dùng cho phát hiện khuôn mt
Da trên tp cây chun, mt cây bt k ược ánh giá có khả năng là khuôn mt
hay không da trên trung bình khong cách của cây ang xét ến tt c các y trong
tp cây chun.
(2.20)
Trong ó:
D(t) : trung bình khong cách của y t ến các y trong tp chun t:
là cây ang xét
T
i
: là các cây trong tp k cây chun
Căn cứ vào giá tr D , cây t ược ánh giá là ng viên mt hay không da theo công
thc sau:
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 36
(2.21)
Ngưỡng
1
ngưng thc nghiệm, ngưỡng này s ược ly khoảng 0.2 ến 0.4.
Ngoài cách tính trung bình khong cách, ta th ánh giá ng viên thông qua việc
tính trung bình ộ tương ồng ca cây ng viên vi tp cây chun.
(2.22)
Trong ó:
S (t) : là trung bình tương ồng ca cây t so vi các cây trong tp chun t:
cây ang xét
T
i
: là các cây trong tp k cây chun
Tương tự như trường hp trên, giá tr S (t) s ược dùng ánh xem cây t có kh
năng là khuôn mặt hay không.
(2.23)
D thy ngưỡng
2
s gn vi mt, th nói
2
1-
1
. Ngưỡng y s ược
trong ly khonh t 0.6 ến 0.8. Tuy nhiên, v bn cht hai cách y hoàn toàn ging
nhau.
2.3.4. Hậu xử lí
Các kết qu thu ược cho thy rng mt vùng khuôn mặt ưc phát hin
mt phn chng lp lên nhau. th phát hin ra nhiu y ứng viên ược ánh giá là
“khuôn mặt”, nhưng thật s chúng là s chng lp ca nhiu cây lên mt v trí khuôn
mt. vy, chúng ta cn mt thut toán tốt gim nhng phát hin các ứng viên
trùng này. Trước hết ta s dng một ánh giá ơn giản liên kết các vùng trùng lp.
Nếu hai ng viên khuôn mt vùng din tích b chng lp lên nhau quá mt phn
ba din tích của nó, chúng ưc xem các mặt trùng ược liên kết li thành mt
vùng lớn hơn. Vùng iện tích xem xét ó chính vùng din tích ca nút gc ca y
ng viên.
lOMoARcPSD|36149638
Sau khi gom nhóm ược vùng, thu ược mt hay nhiu vùng cha khuôn mt. Tuy
nhiên, do sai s của ch thước của y ch thước khuôn mặt, nên luôn ược
vùng khuôn mt phát hiện ược lớn hơn khuôn mặt thc tế. Áp dng tiếp k thut xác
nh vùng lõm vi mc nh hơn nhằm phát hin chính xác vùng. ta ch áp dng thuật
toán dò tìm ặc trưng lõm trên vùng bao khuôn mặt, sau ó liên kết các vùng lõm cùng
loi li vi nhau.
Vùng khuôn mt tht s s vùng liên thông ln nhất trong ó. Với cách như vậy,
chúng ta s thu nhỏ, và xác ịnh chính xác hơn vị trí khuôn mt.
CHƢƠNG 3 CHƢƠNG TRÌNH TH NGHIM
3.1.Bài toán
- Ni dung : Tìm hiểu ặc trưng m 3D i toán phát hiện mặt người trong nh +
Đầu vào : Ảnh có chứa mặt người.
+ Đầu ra : Ảnh vào có thêm khoanh vùng mặt phát hiện ược.
3.2.Phân tích thiết kế
Bài toán :Tìm hiểu ặc trưng lõm 3D Bài toán phát hiện mặt người trong
ảnh chương trình thực hin trên open CV
Phát hin mặt người trong nh có nhiu ng dng trong cuc sng, tuy nhiên,
trong khóa lun y, tôi ch y dng một chương trình nhỏ minh ha cho các
thuyết trên. C th y là một chương trình phát hiện mặt người trong nh ược viết
trên nn visual C# ca Microsoft, s dụng thư viện mã ngun m OpenCV ca Intel.
Dựa trên thư viện Luxand thc hiện chương trình: Phát hiện, ánh dấu lc
vùng khuôn mt.
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 38
3.3.Một số kết quả chƣơng trình
3.3.1 Tập ảnh thử nghiệm
Hình 3.1 Các ảnh thử nghiệm
3.3.2 Kết quả chƣơng trình
lOMoARcPSD|36149638
Hình 3.2 Giao diện chính của chương trình
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 40
Hình 3.3 Giao diện phát hiện khuôn mặt
Hình 3.4 Phát hiện úng ra khuôn mặt
lOMoARcPSD|36149638
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 42
Hình 3.5 Phát hiện úng ra khuôn mặt
lOMoARcPSD|36149638
3.3.3 Kết quả thực nghiệm
Tp nh th
nghim
Kết qu
Đúng
Sai
T l chính xác
nh u vào
20
17
3
85 %
Hình 3.6 Chỉ phát hiện ược một khuôn mặt
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 44
Hình 3.7 Không phát hiện ược ra khuôn mặt
PHN KT LUN
Qua luận văn này, tôi ã óng góp ược một hướng tiếp cn mi cho bài toán phát
hin khuôn mt. Bên cạnh ó, hứa hn vic m ra mt loại ặc trưng mới th phát
triển cho xác nh v trí ca các thành phn trên khuôn mặt như mắt, mũi, miệng, v.v…
Ngoài ra có thể phát trin rộng hơn ể tr thành bài toán nhn dng khuôn mt.
lOMoARcPSD|36149638
Tôi ã tìm hiểu ược bài toán phát hin mặt người dựa trên ặc trưng lõm 3D ể nhn
dạng ược khuôn mặt và xác ịnh ược các ng dụng ặc trưng của bài toán phát hin mặt
người. T ó ta xây dựng ược h thng nhn diện người .
Chương trình phát hiện mặt người trong ảnh ã nhân dạng ược ra khuôn mt
các chi tiết trên khuôn mt. Nhằm ưa ra ược nhng ng dng thc tế trong cuc sng
hiện ại:
Phân tích cm xúc ca khuôn mặt ngưi.
T chc tìm kiếm liên quan ến con ngưi thông qua khuôn mt trên nhiu h
cơ sở d liu ln.
Điều khiển ra vào các cơ quan, văn phòng.
H thng quan sát, theo dõi và bo v.
Gii trí.
Nhn dng ti phm.
H thng giao tiếp thông minh giữa người và máy.
TÀI LIU THAM KHO
[A]. Tài liệu Tiếng Anh
[1]. Ming-Hsuan Yang, David J. Kriegman, Narendra Ahuja, “Detecting Faces in
Images: A Survey”, IEEE Transaction on Pattern Analysis and Machine Intelligence
(PAMI), Vol. 24, No 1, pp. 34-47, Jan 2002.
lOMoARcPSD|3614963
Nguyn Th Thơm - Lp CT1301 46
[2]. T. Kanade, “Picture Processing Computer Complex and Recognition of Human
Faces”, PhD thesis, Kyoto Univ., 1973.
[3]. G. Yang, T. S. Huang, “Human Face Detection in Complex Background”, Pattern
Recognition, Vol. 27, No. 1, pp. 53-63, 1994.
[4]. C. Kotropoulos, I. Pitas, “Rule-based Face Detection in Frontal Views”, Proc.
Int’l Conf. Acoustics, Speech and Signal Processing, Vol. 4, pp. 2637-2540, 1997.
[5]. T. K. Leung, M.C. Burl, P. Perona, “Finding Faces in Cluttered Scenes Using
Random Labeled Graph Matching”, Proc. 5th IEEE Conf. Computer Vision
(ICCV’95), pp. 637-644, 1995.
[6]. K. C. Yow, R. Cipolla, Feature-Based Human Face Detection”, Image and
Vision Computing, Vol. 15, No. 9, pp. 713-735, 1997.
[7]. I. Craw, D. Tock, A. Bennett, “Finding Face Features”, Proc. 2nd European
Conf. Computer Vision (ECCV’92), Vol. 2, pp. 92-96, 1992.
[8]. A. Lanitis, C. J. Taylor, T. F. Cootes, “An Automatic Face Identification System
Using Flexible Appearance Models”, Image and Vision Computing, Vol. 13, No. 5,
pp. 393-401, 1995.
[B]. Tài liệu Tiếng Việt
[9]. PGS.TS Đỗ Năng Toàn, TS. Phạm Vit Bình, “Giáo trình Xử Ảnh”, Đại hc
Thái Nguyên, 2007.
[10]. Phm Thế Bo, Nguyn Thành Nht, Cao Minh Thnh, Trn Anh Tun, Phan
Phúc Doãn, “Tổng quan các phương pháp xác nh khuôn mặt người”, Tạp chí Công
ngh thông tin & Truyn thông, 2007.
[11]. Luxand FaceSDK 4.0, Trial Version, Luxand.Inc, 2011.
http://www.luxand.com.
| 1/46

Preview text:

lOMoARcPSD| 36149638
GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC KINH BẮC
------------------------------------------------------
TÌM HIỂU ĐẶC TRƢNG LÕM 3D VÀ BÀI TOÁN
PHÁT HIỆN MẶT NGƢỜI TRONG ẢNH
ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
NGÀNH: CÔNG NGHỆ THÔNG TIN
Sinh viên thực hiện : Nguyễn Thị Thơm
Giáo viên hướng dẫn : PGS. TS. Đỗ Năng Toàn
Mã số sinh viên : 1351010031 lOMoARcPSD| 3614963 MỤC LỤC
MỤC LỤC .................................................................................................................. 1
DANH MỤC HÌNH VẼ ............................................................................................ 3
LỜI CẢM ƠN ............................................................................................................ 4
LỜI MỞ ĐẦU ............................................................................................................ 5
CHƢƠNG 1. KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN MẶT
NGƢỜI ............................................................................................................. 6
1.1. Khái quát về xử lý ảnh ......................................................................................... 6
1.1.1. Một số khái niệm cơ bản ................................................................................... 6
1.1.2. Một số vấn ề trong xử lý ảnh .................................................................... 7
1.1.2.1. Các hệ thống xử lý ảnh ........................................................................ 7
1.1.2.2. Các hình thái của ảnh ........................................................................... 8
1.1.3. Một số ứng dụng trong xử lý ảnh ............................................................... 9
1.2. Bài toán nhận dạng mặt người .......................................................................... 9
1.2.1. Bài toán nhận dạng mặt người .................................................................... 9
1.2.2. Những khó khăn của nhận dạng khuôn mặt ............................................. 10
1.2.3. Tầm quan trọng của bài toán nhận diện mặt người .................................. 11
1.2.4.Các ứng dụng ặc trưng của bài toán nhận diện mặt người ...................... 12
1.2.5.Xây dựng hệ thống nhận diện mặt người ặc trưng .................................. 13
1.2.6. Một số phương pháp nhận diện mặt người ............................................... 13
1.2.6.1. Dựa trên tri thức ................................................................................. 14
1.2.6.2. Hướng tiếp cận dựa trên ặc trưng không thay ổi. ......................... 15
1.2.6.3. Hướng tiếp cận dựa trên so khớp mẫu ............................................... 18
1.2.6.4. Hướng tiếp cận dựa trên diện mạo ..................................................... 19
Nguyễn Thị Thơm - Lớp CT1301 2 lOMoARcPSD| 36149638
1.3. Pháp phát hiện mặt người dựa trên ặc trưng lõm ......................................... 20
CHƢƠNG 2 : TÌM HIỂU VỀ CÁC ĐẶC TRƢNG KHUÔN MẶT ................... 21
2.1. Đặc trưng lõm ................................................................................................. 21 2.
2.Rút trích các ặc trưng lõm ............................................................................. 21
2.2. 1.Điểm lõm ................................................................................................... 21
2.2.2. Dò tìm và lấy vùng lõm
............................................................................ 22
2.2.3.Dò và phát hiện vùng lõm ở nhiều mức khác nhau ................................... 24
2.2.3. 1.Tối ưu tốc ộ dò tìm
............................................................................ 25
2.2.4.Phát hiện mặt người ................................................................................... 27
2.2.4. 1.Xây dựng cấu trúc cây lõm
................................................................. 27
2.2.4.2.Xây dựng hàm tính ộ tương ồng giữa hai cây ................................. 29
2.2.4.2.1. Độ tương ồng giữa hai nút trên cây ........................................... 30
2.2.4.2.2. Không gian cây và khoảng cách giữa hai cây ............................. 32
2.3.1. Gán nhãn ................................................................................................... 32
2.3.2. Thống kê ................................................................................................... 33
2.3.3. Đánh giá dùng cho phát hiện khuôn mặt .................................................. 34
2.3.4. Hậu xử lí ................................................................................................... 35
CHƢƠNG 3 CHƢƠNG TRÌNH THỬ NGHIỆM ............................................... 36 3.
1.Bài toán ............................................................................................................ 36
3.2.Phân tích thiết kế ............................................................................................. 36
3.3.Một số kết quả chương trình ............................................................................ 36
3.3.1 Tập ảnh thử nghiệm ................................................................................... 36 lOMoARcPSD| 3614963
3.3.2 Kết quả chương trình ................................................................................. 37
3.3.3 Kết quả thực nghiệm ................................................................................. 41
PHẦN KẾT LUẬN .................................................................................................. 43
TÀI LIỆU THAM KHẢO ...................................................................................... 44 DANH MỤC HÌNH VẼ
Hình 1.1 Quá trình xử lý ảnh
Hình 1.2 Các bước cơ bản trong một hệ thống xử lý ảnh
Hình 1.3 Nền ảnh phức tạp
Hinh 1.4 Hệ thống nhận diện mặt người ặc trưng
Hình 1.5 Kết cấu khuôn mặt Hinh 1.6 Màu sắc da mặt
Hình 2.1.Dò tìm thông tin lõm
Hình 2.2 Dò tìm vùng lõm trên ảnh
Hình 2.3 Tập các bộ lọc
Hình 2.4 Dò tìm vùng lõm ở nhiều mức khác nhau Hình 2.5 Ảnh tích phân
Hình 2.6 Tính tổng ộ sáng cho hình chữ nhật R(l,t,r,b)
Hình 2.7 Tạo cây cấp bậc
Hình 2.8 Một cây rút trích từ khuôn mặt
Hình 2.9 Vị trí vùng tương ối của nút con
Hình 2.10 Cách tính vecto ại diện ộ sáng cho nút
Hình 2.11 Cây rút trích ược và các thông tin trên một nút
Hình 2.12 Mô hình phát hiện khuôn mặt
Hình 3.1 Các ảnh thử nghiệm
Nguyễn Thị Thơm - Lớp CT1301 4 lOMoARcPSD| 36149638
Hình 3.2 Giao diện chính của chương trình Hình
3.3 Giao diện phát hiện khuôn mặt
Hình 3.4 Phát hiện úng ra khuôn mặt
Hình 3.5 Phát hiện úng ra khuôn mặt
Hình 3.6 Chỉ phát hiện ược một khuôn mặt Hình
3.7 Không phát hiện ược ra khuôn mặt LỜI CẢM ƠN
Trước tiên em xin ược bày tỏ sự trân trọng và lòng biết ơn ối với thầy giáo
PGS.TS. Đỗ Năng Toàn giảng viên – Viện Khoa Công nghệ thông tin. Trong suốt
thời gian học và làm ồ án tốt nghiệp, thầy ã dành rất nhiều thời gian quý báu ể tận
tình chỉ bảo, hướng dẫn, ịnh hướng cho em thực hiện ồ án.
Em xin ược cảm ơn các thầy cô giáo Trường Đại học Dân lập Hải phòng ã giảng
dạy trong quá trình học tập, thực hành, làm bài tập, giúp em hiểu thấu áo hơn các nội
dung học tập và những hạn chế cần khắc phục trong việc học tập, nghiên cứu và thực hiện bản ồ án này.
Em xin cảm ơn các bạn bè và nhất là các thành viên trong gia ình ã tạo mọi iều
kiện tốt nhất, ộng viên, cổ vũ trong suốt quá trình học tập và ồ án tốt nghiệp.
Hải Phòng, ngày 5 tháng 6 năm 2013. Sinh viên Nguyễn Thị Thơm lOMoARcPSD| 3614963 LỜI MỞ ĐẦU
Công nghệ thông tin ngày càng phát triển và có vai trò hết sức quan trọng
không thể thiếu trong cuộc sống hiện ại. Con người ngày càng tạo ra những cỗ máy
thông minh có khả năng tự nhận biết và xử lí ược các công việc một cách tự ộng, phục
vụ cho lợi ích của con người. Trong những năm gần ây, một trong những bài toán
nhận ược nhiều sự quan tâm và tốn nhiều công sức nhất của lĩnh vực công nghệ thông
tin, ó chính là bài toán nhận dạng. Tuy mới xuất hiện chưa lâu nhưng nó ã rất ược
quan tâm vì tính ứng dụng thực tế của bài toán cũng như sự phức tạp của nó.Bài toán
nhận dạng có rất nhiều lĩnh vực như: nhận dạng vất chất(nước, lửa, ất, á, gỗ..) nhận
dạng chữ viết, nhận dạng giọng nói, nhận dang hình dáng, nhận dạng khuôn mặt..
trong ó phổ biến và ược ứng dụng nhiều hơn cả là bài toán nhận diện khuôn mặt.Để
nhận dạng ược khuôn mặt, bước ầu tiên ể nhận dạng là phát hiện ra khuôn mặt, iều
này thực sự là quan trọng và hết sức khó khăn. Cho ến tận bây giờ, các nhà nghiên
cứu vẫn chưa ạt ược sự ưng ý trong việc giải quyết các khó khăn của bài toán và cho
kết quả hoàn toàn úng. Tuy nhiên, những gì ã ạt ược cũng ủ ể chúng ta áp dụng rộng
rãi và em lại những lợi ích to lớn trong cuộc sống.Với sự hấp dẫn của bài toán và
những thách thức còn ang ở phía trước, với niềm am mê công nghệ hiện ại và những
ứng dụng thực tế tuyệt với của nó, với khát khao khám phá và chinh phục những chi
thức mới mẻ.. tôi ã chọn ề tài nghiên cứu: TÌM HIỂU ĐẶC TRƯNG LÕM 3D VÀ
BÀI TOÁN PHÁT HIỆN MẶT NGƯỜI TRONG ẢNH làm ể tài nghiên cứu và bảo
vệ luận văn tốt nghiệp ại học của mình.
Nguyễn Thị Thơm - Lớp CT1301 6 lOMoARcPSD| 36149638
CHƢƠNG 1. KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN
PHÁT HIỆN MẶT NGƢỜI
1.1. Khái quát về xử lý ảnh
1.1.1. Một số khái niệm cơ bản
Xử lý ảnh là một trong những mảng quan trọng nhất trong kỹ thuật thị giác
máy tính, là tiền ề cho nhiều nghiên cứu thuộc lĩnh vực này. Hai nhiệm vụ cơ bản của
quá trình xử lý ảnh là nâng cao chất lượng thông tin hình ảnh và xử lý số liệu cung
cấp cho các quá trình khác trong ó có việc ứng dụng thị giác vào iều khiển.
Quá trình bắt ầu từ việc thu nhận ảnh nguồn (từ các thiết bị thu nhậnảnh dạng
số hoặc tương tự) gửi ến máy tính. Dữ liệu ảnh ược lưu trữ ở ịnh dạng phù hợp với
quá trình xử lý. Người lập trình sẽ tác ộng các thuật toán tương ứng lên dữ liệu ảnh
nhằm thay ổi cấu trúc ảnh phù hơp với các ứng dụng khác nhau.
Quá trình xử lý nhận dạng ảnh ược xem như là quá trình thao tác ảnh ầu vào
nhằm cho ra kết quả mong muốn. Kết quả ầu ra của một quá trình xử lý ảnh có thể là
một ảnh “ ã ược xử lý” hoặc một kết luận. Ả nh ượ c x ử lý Ả nh X ử lý ả nh K ế t lu ậ n
Hình 1.1. Quá trình xử lý ảnh
Ảnh có thể xem là tập hợp các iểm ảnh và mỗi iểm ảnh ược xem như là ặc
trưng cường ộ sáng hay một dấu hiệu nào ó tại một vị trí nào ó của ối tượng trong
không gian và nó có thể xem như một hàm n biến P(c,c1,c2,…).Do ó,ảnh trong xử lý
ảnh có thể xem như ảnh n chiều . lOMoARcPSD| 3614963
* Sơ ồ tổng quát của một hệ thống xử lý ảnh: H ệ quy ế t ị nh Đố i sánh rút Thu Ti ề n x ử Trích H ậ u ra k ế t lu ậ n nh ậ n lý tr ọn ặ c x ử lý ả iể Lưu trữ
Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh
1.1.2. Một số vấn ề trong xử lý ảnh
1.1.2.1. Các hệ thống xử lý ảnh a. Tiền xử lý
Tiền xử lý là giai oạn ầu tiên trong xử lý ảnh số. Tuỳ thuộc vào quá trình xử
lý tiếp theo trong giai oạn này sẽ thực hiện các công oạn khác nhau như: nâng cấp,
khôi phục ảnh, nắn chỉnh hình học, khử nhiễu v.v.. b. Trích chọn ặc iểm
Các ặc iểm của ối tượng ược trích chọn tuỳ theo mục ích nhận dạng trong quá
trình xử lý ảnh. Trích chọn hiệu quả các ặc iểm giúp cho việc nhận dạng các ối tượng
ảnh chính xác, với tốc ộ tính toán cao và dung lượng nhớ lưu trữ giảm.
c. Đối sánh, nhận dạng
Nhận dạng tự ộng (automatic recognition), mô tả ối tượng, phân loại và phân
nhóm các mẫu là những vấn ề quan trọng trong thị giác máy, ược ứng dụng trong
nhiều ngành khoa học khác nhau. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một
vật nào ó ược chụp, một chữ viết, khuôn mặt người hoặc một ký ồ tín hiệu tiếng nói.
Khi biết một mẫu nào ó, ể nhận dạng hoặc phân loại mẫu ó.Hệ thống nhận dạng tự
ộng bao gồm ba khâu tương ứng với ba giai oạn chủ yếu sau ây:
Thu nhận dữ liệu và tiền xử lý. Biểu diễn dữ liệu.
Nhận dạng, ra quyết ịnh.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
Nguyễn Thị Thơm - Lớp CT1301 8 lOMoARcPSD| 36149638
Đối sánh mẫu dựa trên các ặc trưng ược trích chọn. Phân loại thống kê. Đối sánh cấu trúc.
Phân loại dựa trên mạng nơ-ron nhân tạo.
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận ơn lẻ
ể phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp
cận khác nhau. Do vậy, các phương thức phân loại tổ hợp hay ược sử dụng khi nhận
dạng và nay ã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai (hybrid
system) bao gồm nhiều mô hình kết hợp.
1.1.2.2. Các hình thái của ảnh
a.Chuyển ảnh màu thành ảnh xám
Đơn vị tế bào của ảnh số là pixel. Tùy theo mỗi ịnh dạng là ảnh màu hay ảnh
xám mà từng pixel có thông số khác nhau. Đối với ảnh màu từng pixel sẽ mang thông
tin của ba màu cơ bản tạo ra bản màu khả kiến là Đỏ (R), Xanh lá (G) và Xanh biển
(B) [Thomas 1892]. Trong mỗi pixel của ảnh màu, ba màu cơ bản R, G và B ược bố
trí sát nhau và có cường ộ sáng khác nhau. Thông thường, mỗi màu cơ bản ược biểu
diễn bằng tám bit tương ứng 256 mức ộ màu khác nhau. Như vậy mỗi pixel chúng ta
sẽ có 28x3=224 màu (khoảng 16.78 triệu màu). Đối với ảnh xám, thông thường mỗi
pixel mang thông tin của 256 mức xám (tương ứng với tám bit) như vậy ảnh xám
hoàn toàn có thể tái hiện ầy ủ cấu trúc của một ảnh màu tương ứng thông qua tám mặt
phẳng bit theo ộ xám. b.Lược ồ xám của ảnh (Histogram)
Lược ồ xám của một ảnh số có các mức xám trong khoảng [0,L−1] là một
hàm rời rạc p(rk)=nk/n . Trong ó nk là số pixel có mức xám thứ rk, n là tổng số pixel
trong ảnh và k=0,1,2....L−1. Do ó P(rk) cho một xấp xỉ xác suất xảy ra mức xám rk.
Vẽ hàm này với tất cả các giá trị của k sẽ biểu diễn khái quát sự xuất hiện các mức
xám của một ảnh. Chúng ta cũng có thể thề hiện lược ồ mức xám của ảnh thông qua
tần suất xuất hiện mỗi mức xám qua hệ tọa ộ vuông góc xOy. Trong ó, trục hoành
biểu diễn số mức xám từ 0 ến N (số bit của ảnh xám). Trục tung biểu diễn số pixel của mỗi mức xám.
1.1.3. Một số ứng dụng trong xử lý ảnh
Như ã nói ở trên, các kỹ thuật xử lý ảnh trước ây chủ yếu ược sử dụng ể nâng
cao chất lượng hình ảnh, chính xác hơn là tạo cảm giác về sự gia tăng chất lượng ảnh
quang học trong mắt người quan sát. Thời gian gần ây, phạm vi ứng dụng xử lý ảnh lOMoARcPSD| 3614963
mở rộng không ngừng, có thể nói hiện không có lĩnh vực khoa học nào không sử dụng
các thành tựu của công nghệ xử lý ảnh số .
Trong y học các thuật toán xử lý ảnh cho phép biến ổi hình ảnh ược tạo ra từ
nguồn bức xạ X -ray hay nguồn bức xạ siêu âm thành hình ảnh quang học trên bề mặt
film x-quang hoặc trực tiếp trên bề mặt màn hình hiển thị. Hình ảnh các cơ quan chức
năng của con người sau ó có thể ược xử lý tiếp ể nâng cao ộ tương phản, lọc, tách các
thành phần cần thiết (chụp cắt lớp) hoặc tạo ra hình ảnh trong không gian ba chiều (siêu âm 3 chiều).
Trong lĩnh vực ịa chất, hình ảnh nhận ược từ vệ tinh có thể ược phân tích ể
xác ịnh cấu trúc bề mặt trái ất. Kỹ thuật làm nổi ường biên (image enhancement) và
khôi phục hình ảnh (image restoration) cho phép nâng cao chất lượng ảnh vệ tinh và
tạo ra các bản ồ ịa hình 3-D với ộ chính xác cao.
Trong ngành khí tượng học, ảnh nhận ược từ hệ thống vệ tinh theo dõi thời
tiết cũng ược xử lý, nâng cao chất lượng và ghép hình ể tạo ra ảnh bề mặt trái ất trên
một vùng rộng lớn, qua ó có thể thực hiện việc dự báo thời tiết một cách chính xác hơn.
Xử lý ảnh còn ược sử dụng rộng rãi trong lĩnh vực hình sự và các hệ thống
bảo mật hoặc kiểm soát truy cập: quá trình xử lý ảnh với mục ích nhận dạng vân tay
hay khuôn mặt cho phép phát hiện nhanh các ối tương nghi vấn cũng như nâng cao
hiệu quả hệ thống bảo mật cá nhân cũng như kiểm soát ra vào. Ngoài ra, có thể kể ến
các ứng dụng quan trọng khác của kỹ thuật xử lý ảnh tĩnh cũng như ảnh ộng trong ời
sống như tự ộng nhận dạng, nhận dạng mục tiêu quân sự, máy nhìn công nghiệp trong
các hệ thống iều khiển tự ộng, nén ảnh tĩnh, ảnh ộng ể lưu và truyền trong mạng viễn thông v.v.
1.2. Bài toán nhận dạng mặt ngƣời
1.2.1. Bài toán nhận dạng mặt ngƣời
Hệ thống nhận dạng mặt người là một hệ thống nhận vào là một ảnh hoặc một
oạn video (một chuỗi các ảnh). Qua xử lý tính toán hệ thống xác ịnh ược vị trí mặt
người trong ảnh (nếu có) và xác ịnh là người nào trong số những người hệ thống ã
ược biết (qua quá trình học) hoặc là người lạ.
1.2.2. Những khó khăn của nhận dạng khuôn mặt
a. Tư thế góc chụp : Ảnh chụp khuôn mặt có thể thay ổi rất nhiều bởi vì
góc chụp giữa camera và khuôn mặt.Chẳng hạn như : chụp thẳng, chụp xéo bên trái
Nguyễn Thị Thơm - Lớp CT1301 10 lOMoARcPSD| 36149638
450 hay xéo bên phải 450,chụp từ trên xuống, chụp từ dưới lên,v.v…). Với các tư thế
khác nhau, các thành phần trên khuôn mặt như mắt, mũi, miệng có thể bị khuất một
phần hoặc thậm chí khuất hết. Khuôn mặt ang nhìn thẳng nhưng góc chụp của máy
ảnh lại lệch nhiều so với hướng nhìn thẳng của khuôn mặt hoặc là lúc chụp ảnh mặt
người quay nghiêng sang một bên nào ó nhiều ều là những khó khăn rất lớn trong
bài toán nhận diện mặt người.
b.Sự xuất hiện hoặc thiếu một số thành phần của khuôn mặt: Các ặc trưng
như râu mép, râu hàm, mắt kính,v.v… có thể xuất hiện hoặc không. Vấn ề này làm
cho bài toán càng khó khăn hơn rất nhiều.
c.Sự biểu cảm của khuôn mặt: Biểu cảm của khuôn mặt người có thể làm ảnh
hưởng áng kể lên các thông số của khuôn mặt. Chẳng hạn,cùng một khuôn mặt một
người, nhưng có thể sẽ rất khác khi họ cười hoặc sợ hãi….
d.Sự che khuất: Khuôn mặt có thể bị che khuất bởi các ối tượng khác hoặc các khuôn mặt khác.
e. Hướng của ảnh: Các ảnh của khuôn mặt có thể biến ổi rất nhiều với các góc quay
khác nhau của trục camera. Chẳng hạn chụp với trục máy ảnh nghiêng làm cho khuôn
mặt bị nghiêng so với trục của ảnh.
f. Điều kiện của ảnh: Ảnh ược chụp trong các iều kiện khác nhau về: chiếu sang, về
tính chất camera (máy kỹ thuật số, máy hồng ngoại,v.v…) ảnh hưởng rất nhiều ến
chất lượng ảnh khuôn mặt.
g. Nền ảnh phức tạp: nền của ảnh phức tạp là một trong những khó khăn nhất trong
bài toán nhận diện khuôn mặt người trong ảnh, khuôn mặt người sẽ dễ bị nhầm lẫn
với nhiều khung cảnh phức tạp xung quanh và ảnh hưởng rất nhiều ến quá trình phân
tích và rút trích các ặc trưng của khuôn mặt trong ảnh, có thể dẫn ến không nhận ra
khuôn mặt hoặc là nhận nhầm các khung cảnh xung quanh thành khuôn mặt người. lOMoARcPSD| 3614963
Hình 1.3 Nền ảnh phức tạp
h. Màu sắc của da mặt: màu sắc của da mặt quá tối hoặc gần với màu sắc của
khung cảnh môi trường xung quanh cũng là một khó khăn với bài toán nhận diện mặt
người. Nếu màu sắc của da người quá tối thì thuật toán sẽ gặp khó khăn trong việc
nhận diện các ặc trưng và có thể không tìm ra ược khuôn mặt người.
1.2.3. Tầm quan trọng của bài toán nhận diện mặt ngƣời
Nếu như công nghệ nhận dạng giọng nói phù hợp với các ứng dụng callcenter
và nhược iểm của nó là tiếng ồn, không phù hợp với nơi công cộng ông người thì
công nghệ nhận dạng chữ ký cũng gây nhiều phiền phức cho người sử dụng vì khó
duy trì ược chữ ký giống nhau ngay trong cùng một thời iểm. Trong khi ó, công nghệ
nhận dạng vân tay hiện ã ược dùng khá phổ biến, nhưng cũng có nhược iểm là bị ảnh
hưởng bởi ộ ẩm da và ặc biệt sẽ không chính xác cao với người có tay hay tiếp xúc
với hoá chất. Bên cạnh ó, nhận dạng bằng vân tay còn có những hạn chế về việc giả
mạo, thậm chí kẻ gian có thể sử dụng tay của người khác ể xác thực. Còn công nghệ
nhận dạng mống mắt là một công nghệ có nhiều ưu iểm về ộ chính xác cũng như khả
năng chống giả mạo. Việc xác thực, nhận dạng trong công nghệ này dựa trên sơ ồ
mạch máu trong võng mạc mắt. Sơ ồ này rất ít thay ổi kể từ lúc mới sinh cho tới khi
già và ặc biệt là khi chết, hệ thống sơ ồ mạch máu này sẽ biến mất. Vì thế, không thể
dùng người chết ể xác thực cho việc truy cập trái phép. Tuy nhiên, công nghệ này lại
bị tác ộng bởi nhiều yếu tố khác như ộ rộng của mắt, lông mi, kính eo và khó triển
khai phổ biến trên diện rộng do ộ phức tạp của các thiết bị.
Trong khi ó, mặc dù ộ chính xác không là phải ưu iểm nổi bật của công nghệ
nhận dạng mặt người song không giống với những phương pháp khác, nhận dạng mặt
người là công nghệ nhận dạng không cần ến sự tiếp xúc trực tiếp giữa ối tượng và
thiết bị thu nhận. Thay vào ó, công nghệ này mang tính theo dõi, giám sát và rất thuận
tiện cho những ứng dụng bảo vệ mục tiêu, chống khủng bố tại những iểm công cộng
ông người. Đây cũng là ưu iểm nổi trội của nhận dạng mặt người mà các công nghệ
nhận dạng khác khó có thể có ược.
1.2.4.Các ứng dụng ặc trƣng của bài toán nhận diện mặt ngƣời
Bài toán phát hiện mặt người trong ảnh là một bài toán phức tạp nhưng lại
hấp hẫn rất nhiều người nghiên cứu về nó, có lẽ bởi tính ứng dụng thực tế của bài toán
là rất lớn và a dạng trong cuộc sống hiện ại. có thể kể ra một số ứng dụng thông dụng
nhất của bài toán nhận diện mặt người:
Nguyễn Thị Thơm - Lớp CT1301 12 lOMoARcPSD| 36149638
Hệ thống giao tiếp thông minh giữa ngƣời và máy: con người có thể xây
dựng những hệ thống thông giao tiếp giữa người và máy tính thông qua viêc
nhận diện khuôn mặt, biểu cảm trên khuôn mặt người ể dự oán, nhận biết trạng
thái tâm lí hiện thời của người ó. Một ngôi nhà thông minh trong tương lai có
thể nhận biết ược chủ nhân của nó thông qua nhận biết khuôn mặt, dáng người,
giao tiếp qua giọng nói, vân tay…
Nhận dạng tội phạm: hệ thống có thể nhận diện ra một khuôn mặt ngay tức
thì và ối chiếu với hàng triệu bản ghi có sẵn trong cơ sở dữ liệu ể chỉ ra ó có
thể là một tội phạm ang truy tìm hay không, hoặc ó có thể là một nhân vật nào
ó ặc biệt cần quan tâm..vv..
Giải trí: trong hẩu hết các máy ảnh hiện ại ngày nay ều có chức năng tự ộng
nhận diện mặt người ể có thể lấy ộ nét, iều chỉnh ánh sáng cho phù hợp với
khung cảnh xung quanh. Trên một số trang web cũng ã áp dụng công nghệ tự
ộng nhận diện mặt người và so sánh với kho dữ liệu khổng lồ của mình ể ưa
ra những lời chào, dịch vụ thông mình nhất cho người sử dụng.
Hệ thống quan sát, theo dõi và bảo vệ: các hệ thống camera sẽ xác ịnh âu là
con người và theo dõi người ó…
Điều khiển ra vào các cơ quan, văn phòng: cho phép nhân viên ra vào các
khu vực quan trong mà không cần phải ăng nhập hay dùng thẻ. Nếu kết hợp
với sử dụng vân tay hay hốc mắt thì sẽ em lại kết quả chính xác cao.
Tổ chức tìm kiếm liên quan ến con người thông qua khuôn mặt trên nhiều hệ cơ sở dữ liệu lớn.
Phân tích cảm xúc của khuôn mặt người..v..v..
1.2.5.Xây dựng hệ thống nhận diện mặt ngƣời ặc trƣng
Một hệ thống nhận diện khuôn mặt người có thể ược xây dựng qua rất nhiều
công oạn khác nhau và rất phúc tạp, nhưng ta có thể khái quát chung mọi hệ thông
nhận dạng khuôn mặt người gồm có 3 bước cơ bản sau: lOMoARcPSD| 3614963
Hình 1.4 Hệ thống nhận diện mặt ngƣời ặc trƣng
 Tiền xứ lý: hệ thống nhận vào một ảnh tĩnh, sau ó có thể sử lý ảnh cho chất
lượng tốt hơn, như chỉnh lại ộ sáng, giảm ộ nhiễu .. iều này giúp cho quá trình
rút trích các ặc trưng của khuôn mặt ược dễ dáng hơn rất nhiều. Quá trình tiền
xử lý thường khá ơn giản và nhanh gọn nên không cần dùng các thuật toán
phức tạp và mất nhiều thời gian.
 Trích rút các ặc trưng: Trích rút ặc trưng là kỹ thuật sử dụng các thuật toán ể
lấy ra những thông tin mang những ặc iểm riêng biệt của một người.
 Nhận diện khuôn mặt: sau khi ã rút trích các ặc trưng, sẽ ưa vào khối nhận
dạng ể phân lớp ối tượng.
1.2.6. Một số phƣơng pháp nhận diện mặt ngƣời
Hiện tại có khá nhiều phương pháp nhằm xác ịnh khuôn mặt người trong ảnh,
từ ảnh có chất lượng không tốt cho ến tốt, không màu( en trắng) ến có màu Nhưng
có thể phân chia các phương pháp này thành bốn hướng tiếp cận chính : -
Hướng tiếp cận dựa trên tri thức: Mã hóa các hiểu biết của con người về
khuôn mặt thành các luật. các luật này thường mô tả quan hệ của các ặc trưng của khuôn mặt. -
Hướng tiếp cận dựa trên diện mạo: Hướng tiếp cận này dùng một tập ảnh
huấn luyện cho trước, rồi sau ó hệ thống sẽ xác ịnh khuôn mặt người, do ó nó còn
có tên là: hướng tiếp cận dựa trên phương pháp học. -
Hướng tiếp cận dựa trên so sánh khớp mẫu: Dùng các mẫu chuẩn của khuôn
mặt người ể mô tả cho khuôn mặt hay các ặc trưng của khuôn mặt.
Nguyễn Thị Thơm - Lớp CT1301 14 lOMoARcPSD| 36149638 -
Hướng tiếp cận dựa trên các ặc trưng không thay ổi: Các thuật toán i tìm
các ặc trưng mô tả cấu trúc khuôn mặt người mà các ặc trưng này sẽ không thay
ổi khi tư thế khuôn mặt, iều kiện ánh sáng hay vị trí ặt máy ảnh thay ổi.
1.2.6.1. Dựa trên tri thức
Trong hướng tiếp cận này, các luật sẽ phụ thuộc rất lớn vào tri thức của những
tác giả nghiên cứu về bài toán xác ịnh khuôn mặt người. Đây là hướng tiếp cận dạng
top-down. Dễ dàng xây dựng các luật cơ bản ể mô tả các ặc trưng của khuôn mặt và
các quan hệ tương ứng. Ví dụ, một khuôn mặt thường có hai mắt ối xứng nhau qua
trục thẳng ứng ở giữa khuôn mặt và có một mũi, một miệng. Các quan hệ của các ặc
trưng có thể ược mô tả như quan hệ về khoảng cách và vị trí. Thông thường sẽ trích
ặc trưng của khuôn mặt trước tiên ể có ược các ứng viên, sau ó các ứng viên này sẽ
ược xác ịnh thông qua các luật ể biết ứng viên nào là khuôn mặt và ứng viên nào
không phải khuôn mặt. Thường áp dụng quá trình xác ịnh ể giảm số lượng xác ịnh sai.
Một vấn ề khá phức tạp khi dùng hướng tiếp cận này là làm sao chuyển từ tri
thức con người sang các luật một các hiệu quả. Nếu các luật này quá chi tiết thì khi
xác ịnh có thể xác ịnh thiếu các khuôn mặt có trong ảnh, vì những khuôn mặt này
không thể thỏa mãn tất cả các luật ưa ra. Nhưng các luật tổng quát quá thì có thể
chúng ta sẽ xác ịnh lầm một vùng nào ó không phải là khuôn mặt mà lại xác ịnh là
khuôn mặt. Và cũng khó khăn mở rộng yêu cầu từ bài toán ể xác ịnh các khuôn mặt
có nhiều tư thế khác nhau.
Hai tác giả Yang và Huang dùng một phương thức theo hướng tiếp cận như
sau ể xác các khuôn mặt. Hệ thống của hai tác giả này bao gồm ba mức luật. Ở mức
cao nhất, dùng một khung cửa sổ quét trên ảnh và thông qua một tập luật ể tìm các
ứng viên có thể là khuôn mặt. Ở mức kế tiếp, hai ông dùng một tập luật ể mô tả tổng
quát hình dáng khuôn mặt. Còn ở mức cuối cùng lại dùng một tập luật khác ể xem xét
ở mức chi tiết các ặc trưng khuôn mặt. Một hệ thống a ộ phân giải có thứ tự ược
dùng ể xác ịnh. Các luật ở mức cao nhất ể tìm ứng viên như: “vùng trung tâm khuôn
mặt có bốn phần với một mức ộ ều cơ bản”, “phần xung quanh bên trên của một
khuôn mặt có một mức ộ ều cơ bản”, và “mức ộ khác nhau giữa các giá trị xám trung
bình của phần trung tâm và phần bao bên trên là áng kể”. Độ phân giải thấp nhất của
ảnh dùng ể tìm ứng viên khuôn mặt mà còn tìm ở các mức phân giải tốt hơn. Ở mức
hai, xem xét biểu ồ histogram của các ứng viên ể loại bớt ứng viên nào không phải là
khuôn mặt, ồng thời dò ra cạnh bao xung quanh ứng viên. Ở mức cuối cùng, những lOMoARcPSD| 3614963
ứng viên nào còn lại sẽ ược xem xét các ặc trưng của khuôn mặt về mắt và miệng.
Hai ông ã dùng một chiến lược “từ thô ến mịn” hay “làm rõ dần” ể giảm số lượng
tính toán trong xử lý. Mặc dù tỷ lệ chính xác chưa cao, nhưng ây là tiền ề cho nhiều nghiên cứu sau này
Hai tác giả Kotropoulos và Pitas ưa một phương pháp tương tự dùng trên ộ
phân giải thấp. Hai ông dùng phương pháp chiếu ể xác ịnh các ặc trưng khuôn mặt,
Kanade ã thành công với phương pháp chiếu ể xác ịnh biên của khuôn mặt. Với I(x,y)
là giá trị xám của một iểm trong ảnh có kích thước m x n ở tại vị trí (x,y), các hàm ể
chiếu ảnh theo phương ngang và thẳng ứng ược ịnh nghĩa như sau: (2.1)
Dựa trên biểu ồ hình chiếu ngang, có hai cực tiểu ịa phương khi hai ông xét
quá trình thay ổi ộ ốc của HI, ó chính là cạnh bên trái và phải của hai bên ầu. Tương
tự với hình chiếu dọc VI, các cực tiểu ịa phương cũng cho ta biết vị trí miệng, ỉnh
mũi, và hai mắt. Các ặc trưng này ủ ể xác ịnh khuôn mặt.
1.2.6.2. Hƣớng tiếp cận dựa trên ặc trƣng không thay ổi.
Đây là hướng tiếp cận theo kiểu bottom-up. Các tác giả cố gắng tìm các ặc
trưng không thay ổi của khuôn mặt người ể xác ịnh khuôn mặt người. Dựa trên nhận
xét thực tế, con người dễ dàng nhận biết các khuôn mặt và các ối tượng trong các tư
thế khác nhau và iều kiện ánh sáng khác nhau, thì phải tồn tại các thuộc tính hay ặc
trưng không thay ổi. Có nhiều nghiên cứu ầu tiên xác ịnh các ặc trưng khuôn mặt rồi
chỉ ra có khuôn mặt trong ảnh hay không. Các ặc trưng như: lông mày, mắt, mũi,
miệng, và ường viền của tóc ược trích bằng phương pháp xác ịnh cạnh. Trên cơ sở
các ặc trưng này, xây dựng một mô hình thống kê ể mô tả quan hệ của các ặc trưng
này và xác ịnh sự tồn tại của khuôn mặt trong ảnh. Một vấn ề của các thuật toán theo
hướng tiếp cân ặc trưng cần phải iều chỉnh cho phù hợp iều kiện ánh sáng, nhiễu, và
bị che khuất. Đôi khi bóng của khuôn mặt sẽ tạo thêm cạnh mới, mà cạnh này lại rõ
hơn cạnh thật sự của khuôn mặt, vì thế nếu dùng cạnh ể xác ịnh sẽ gặp khó khăn.
a.Các ặc trƣng khuôn mặt :
Nguyễn Thị Thơm - Lớp CT1301 16 lOMoARcPSD| 36149638
Sirohey ưa một phương pháp xác ịnh khuôn mặt từ một ảnh có hình nền
phức tạp. Phương pháp dựa trên cạnh (dùng phương pháp Candy và heuristics ể loại
bỏ các cạnh ể còn lại duy nhất một ường bao xung quanh khuôn mặt. Một hình ellipse
dùng ể bao khuôn mặt, tách biệt vùng ầu và hình nền. Tỷ lệ chính xác của thuật toán
là 80%. Cũng dùng phương pháp cạnh như Sirohey, Chetverikov và Lerch dùng một
phưong pháp dựa trên blob và streak (hình dạng giọt nước và sọc xen kẽ), ể xác ịnh
theo hướng các cạnh. Hai ông dùng hai blob tối và ba blob sáng ể mô tả hai mắt, hai
bên gò má, và mũi. Mô hình này dùng các treak ể mô tả hình dáng ngoài của khuôn
mặt, lông mày, và môi. Dùng ảnh có ộ phân giải thấp theo biến ổi Laplace ể xác ịnh khuôn mặt thông qua blob.
Leung trình bày một mô hình xác suất ể xác ịnh khuôn mặt ở trong ảnh có
hình nền phức tạp trên cơ sở một bộ xác ịnh ặc trưng cục bộ và so khớp ồ thị ngẫu
nhiên. Dùng năm ặc trưng (hai mắt, hai lỗ mũi, phần nối giữa mũi và miệng) ể mô
tả một khuôn mặt. Luôn tính quan hệ khoảng cách với các ặc trưng cặp (như mắt trái,
mắt phải), dùng phân bố Gauss ể mô hình hóa. Một mẫu khuôn mặt ược ưa ra thông
qua trung bình tương ứng cho một tập a hướng, a tỷ lệ của bộ lọc ạo hàm Gauss. Từ
một ảnh, các ặc trưng ứng viên ược xác ịnh bằng cách so khớp từng iểm ảnh khi lọc
tương ứng với vector mẫu (tương tự mối tương quan), chọn hai ứng viên ặc trưng
ứng ầu ể tìm kiếm cho các ặc trưng khác của khuôn mặt. Giống như xây dựng mộ
ồ thị quan hệ mỗi node của ồ thị tương ứng như các ặc trưng của một khuôn mặt, ưa
xác suất vào ể xác ịnh. Tỷ lệ xác ịnh chính xác là 86%.
b.Kết cấu khuôn mặt:
Khuôn mặt con người có những kết cấu riêng biệt mà có thể dùng ể phân loại
so với các ối tượng khác. Augusteijn và Skufca cho rằng hình dạng của khuôn mặt
dùng làm kết cấu phân loại, gọi là kết cấu giống khuôn mặt (face-like texture). Tính
kết cấu qua các ặc trưng thống kê thứ tự thứ hai (SGLD) trên vùng có kích thước
16×16 iểm ảnh. Có ba loại ặc trưng ược xem xét: màu da, tóc, và những thứ khác. Hai
ông dùng mạng neural về mối tương quan cascade cho phân loại có giám sát các kết
cấu và một ánh xạ ặc trưng tự tổ chức Kohonen ể gom nhóm các lớp kết cấu khác
nhau. Hai tác giả ề xuất dùng phương pháp bầu cử khi không quyết ịnh ược kết cấu
ưa vào là kết cấu của da hay kết cấu của tóc.
Manian và Ross dùng biến ổi wavelet ể xây dựng tập dữ liệu kết cấu của
khuôn mặt trong ảnh xám thông qua nhiều ộ phân giải khác nhau kết hợp xác suất lOMoARcPSD| 3614963
thông kê ể xác ịnh khuôn mặt người. Mỗi mẫu sẽ có chín ặc trưng. Tỷ lệ chính xác
là 87%, tỷ lệ xác ịnh sai là 18%.
Hình 1.5 Kết cấu khuôn mặt
c.Sắc màu của da:
Thông thường các ảnh màu không xác ịnh trực tiếp trên toàn bộ dữ liệu ảnh
mà các tác giả dùng tính chất sắc màu của da người (khuôn mặt người) ể chọn ra ược
các ứng viên có thể là khuôn mặt người (lúc này dữ liệu ã thu hẹp áng kể) ể xác ịnh
khuôn mặt người. Tôi sẽ trình bày chi tiết về mô hình hóa màu da người ở một bài sau.
Hinh 1.6 Màu sắc da mặt d.Đa ặc trƣng
Gần ây có nhiều nghiên cứu sử dụng các ặc trưng toàn cục như: màu da
người, kích thước, và hình dáng ể tìm các ứng viên khuôn mặt, rồi sau ó sẽ xác ịnh
ứng viên nào là khuôn mặt thông qua dùng các ặc trưng cục bộ (chi tiết) như: mắt,
lông mày, mũi, miệng, và tóc. Tùy mỗi tác giả sẽ sử dụng tập ặc trưng khác nhau.
Nguyễn Thị Thơm - Lớp CT1301 18 lOMoARcPSD| 36149638
1.2.6.3. Hƣớng tiếp cận dựa trên so khớp mẫu
Trong so khớp mẫu, các mẫu chuẩn của khuôn mặt (thường là khuôn mặt ược
chụp thẳng) sẽ ược xác ịnh trước hoặc xác ịnh các tham số thông qua một hàm. Từ
một ảnh ưa vào, tính các giá trị tương quan so với các mẫu chuẩn về ường viền khuôn
mặt, mắt, mũi và miệng. Thông qua các giá trị tương quan này mà các tác giả quyết
ịnh có hay không có tồn tại khuôn mặt trong ảnh. Hướng tiếp cận này có lợi thế là rất
dễ cài ặt, nhưng không hiệu quả khi tỷ lệ, tư thế, và hình dáng thay ổi. Nhiều ộ phân
giải, a tỷ lệ, các mẫu con, và các mẫu biến dạng ược xem xét thành bất biến về tỷ lệ
và hình dáng. Hướng tiếp cận này có thể i theo phương pháp sau: a.Xác ịnh mẫu trƣớc
Tác giả Sakai ã cố gắng thử xác ịnh khuôn mặt người chụp thẳng trong ảnh.
Ông dùng vài mẫu con về mắt, mũi, miệng, và ường viền khuôn mặt ể mô hình hóa
một khuôn mặt. Mỗi mẫu con ược ịnh nghĩa trong giới hạn của các oạn thẳng. Các
ường thẳng trong ảnh ược trích bằng phương pháp xem xét thay ổi gradient nhiều
nhất và so khớp các mẫu con. Đầu tiên tìm các ứng viên thông qua mối tương quan
giữa các ảnh con và các mẫu về ường viền. Sau ó, so khớp với các mẫu con khác.
Hay nói một cách khác, giai oạn ầu xem như là giai oạn sơ chế ể tìm ứng viên, giai
ọan thứ hai là giai oạn tinh chế ể xác ịnh có tồn tại hay không một khuôn mặt người.
Ý tưởng này ược duy trì cho ến các nghiên cứu sau này.
Còn tác giả Craw ưa ra một phương pháp xác ịnh khuôn mặt người dựa vào
các mẫu về hình dáng của các ảnh ược chụp thẳng (dùng vẻ bề ngoài của hình dáng
khuôn mặt). Đầu tiên dùng phép lọc Sobel ể tìm các cạnh. Các cạnh này sẽ ược nhóm
lại theo một số ràng buộc. Sau ó, tìm ường viền của ầu, quá trình tương tự ược lặp i
lặp lại với mỗi tỷ lệ khác nhau ể xác ịnh các ặc trưng khác như: mắt, lông mày,và môi.
Sau ó Craw mô tả một phương thức xác ịnh dùng một tập có 40 mẫu ể tìm các
ặc trưng khuôn mặt và iều khiển chiến lược dò tìm. b.Các mẫu bị biến dạng
Tác giả Yuille dùng các mẫu biến dạng ể mô hình hóa các ặc trưng của khuôn
mặt, mô hình này có khả năng linh hoạt cho các ặc trưng khuôn mặt. Trong hướng
tiếp cận này, các ặc trưng khuôn mặt ược mô tả bằng các mẫu ược tham số hóa. Một
hàm năng lượng (giá trị) ược ịnh nghĩa ể liên kết các cạnh, ỉnh, và thung lũng trong
ảnh ể tương ứng với các tham số trong mẫu. Mô hình này tốt nhất khi tối thiểu hàm
năng lượng qua các tham số, Mặc dù kết quả tốt với mẫu biến dạng trong theo vết ối lOMoARcPSD| 3614963
tượng trên ặc trưng không mô hình theo lưới, một hạn chế của hướng tiếp cận này là
các mẫu biến dạng phải ược khởi tạo trong phạm vi gần các ối tượng ể xác ịnh.
Hai tác giả Huang và Su dùng lý thuyết dòng chảy ể xác ịnh ường viền
khuôn mặt dựa trên ặc tính hình học. Hai ông dùng lý thuyết tập ồng mức (Level Set)
ể loang từ các khởi ộng ban ầu ể có ược các khuôn mặt người.
1.2.6.4. Hƣớng tiếp cận dựa trên diện mạo
Trái ngược với các phưong pháp so khớp mẫu với các mẫu ã ược ịnh nghĩa
trước bởi những chuyên gia, các mẫu trong hướng tiếp cận này ược học từ các ảnh
mẫu. Một các tổng quát, các phương pháp theo hướng tiếp cận này áp dụng các kỹ
thuật theo hướng xác suất thống kê và máy học ể tìm những ặc tính liên quan của
khuôn mặt và không phải là khuôn mặt. Các ặc tính ã ược học ở trong hình thái các
mô hình phân bố hay các hàm biệt số nên dùng có thể dùng các ặc tính này ể xác ịnh
khuôn mặt người. Đồng thời, bài toán giảm số chiều thường ược quan tâm ể tăng
hiệu quả tính toán cũng như hiệu quả xác ịnh.
Có nhiều phương pháp áp dụng xác suất thống kê ể giải quyết. Một ảnh hay
một vector ặc trưng xuất phát từ một ảnh ược xem như một biến ngẫu nhiên x, và biến
ngẫu nhiên có ặc tính là khuôn mặt hay không phải khuôn mặt bởi công thức tính theo
các hàm mật ộ phân lớp theo iều kiện. P(x | khuôn mặt) và P(x | ~ khuôn mặt)
Có thể dùng phân loại Bayes hoặc khả năng cực ại ể phân loại một ứng viên
là khuôn mặt hay không phải là khuôn mặt. Không thể cài ặt trực tiếp phân loại
Bayes bởi vì số chiều của x khá cao, bởi vì P(x | khuôn mặt) và P(x | không phải
khuôn mặt) là a phương thức, và chưa thể hiểu nếu xây dựng các dạng tham số hóa
một cách tự nhiên cho P(x | khuôn mặt) và P(x | không phải khuôn mặt) .Có khá
nhiều nghiên cứu theo hướng tiếp cận này quan tâm xấp xỉ có tham số hay không có
tham số cho P(x | khuôn mặt) và P(x | không phải khuôn mặt) .
Các tiếp cận khác trong hướng tiếp cận dựa trên diện mạo là tìm một hàm biệt
số (như: mặt phẳng quyết ịnh, siêu phẳng ể tách dữ liệu, hàm ngưỡng) ể phân biệt hai
lớp dữ liệu: khuôn mặt và không phải khuôn mặt. Bình thường, các mẫu ảnh ược
chiếu vào không gian có số chiều thấp hơn, rồi sau ó dùng một hàm biệt số (dựa trên
các ộ o khoảng cách) ể phân loại, hoặc xây dựng mặt quyết ịnh phi tuyến bằng mạng
neural a tầng. Hoặc dùng SVM (Support Vector Machine) và các phương thức kernel,
chiếu hoàn toàn các mẫu vào không gian có số chiều cao hơn ể dữ liệu bị rời rạc hoàn
toàn và ta có thể dùng một mặt phẳng quyết ịnh phân loại các mẫu khuôn mặt và không phải khuôn mặt.
Nguyễn Thị Thơm - Lớp CT1301 20 lOMoARcPSD| 36149638
1.3. Phƣơng pháp phát hiện mặt ngƣời dựa trên ặc trƣng lõm
Năm 1983, James L. Crowley ã ưa ra khái niệm ridge và peak.
Ridge là các iểm lồi trên ảnh. Tập các iểm ridge trên ảnh sẽ tạo thành những
ường xương sống và các ường này sẽ tạo thành các chùm tia gọi là peak (chùm).
James L. Crowley sử dụng phép hiệu của lọc Low Pass ể rút ra các iểm ridge (lồi)
trên ảnh, và sau ó một thuật toán duyệt ể kết chúng lại với nhau thành các ặc trưng
ridge và peak. Tiếp sau ó, một số các phương pháp ược ề xuất ể rút trích các thông
tin về ridge và valley (lõm). Hầu hết các phương pháp này dùng một bộ lọc ể tăng
cường thông tin về cạnh trên ảnh sau ó dò tìm quỹ tích các iểm cực trị. Quỹ tích các
iểm cực trị này ược xem là các ặc trưng lồi và lõm. Trong ặc trưng lồi và lõm ược dò
tìm trên nhiều ộ phân giải khác nhau, cho kết quả áng kể. Tuy nhiên, chất lượng của
các ặc trưng lồi lõm này còn phụ thuộc khá nhiều vào iều kiện chiếu sáng cũng như
các mức phân giải ược lựa chọn trước. Để giải quyết sự phụ thuộc này, Lindeberg ã
ề xuất một phương pháp tự ộng chọn ộ phân giải tốt nhất. Gần ây Hải Trần ưa ra một
cách tiếp cận sử dụng Laplacian ể tăng cường thông tin cạnh sau ó dò tìm ridge và
peak dưới nhiều mức khác nhau. Trong hướng tiếp cận này, các ặc trưng ridge và
peak ược biểu diễn dưới dạng các ồ thị quan hệ hoặc các cây cấp bậc với các tầng là
các ridge và peak ược dò tìm tại các mức khác nhau.
CHƢƠNG 2 : TÌM HIỂU VỀ CÁC ĐẶC TRƢNG KHUÔN MẶT
2.1. Đặc trƣng lõm
Ta có thể hiểu một cách ơn giản rằng: lõm là những iểm thấp nhất, ví dụ như
lõm là những thung lũng. Trong ảnh vệ tinh, lõm là ường khe chạy giữa hai dãy núi.
Trong ảnh y tế, lõm là các thành phần trũng xuống. Còn trong ảnh khuôn mặt, các
phần hốc mắt ược coi là lõm.
Tác giả Hải Trần sử dụng một bộ lọc Laplacian-of-Gaussian, sau ó áp dụng
một thuật toán ể dò tìm quỹ tích của các iểm cực trị. Hình 2.1 biểu diễn các ặc trưng
lõm tương tự như kết quả của Hải Trần. Các iểm lõm ược tô màu xanh. Chúng ta lưu
ý rằng các iểm lõm rút trích ược chỉ biểu diễn ược các vùng lõm nhỏ, chi tiết, chẳng
hạn như: mắt, chân mày, mũi, và miệng.
Trong những phần tiếp theo, chúng ta sẽ dò tìm các ặc trưng lõm tại các mức khác
nhau. Ví dụ như, tại mức thấp nhất, cần dò tìm các ặc trưng lõm có kích thước nhỏ và lOMoARcPSD| 3614963
chi tiết như mắt, mũi, v.v... Trong những mức ộ cao hơn kế tiếp, sẽ dò tìm các vùng
lõm lớn hơn. Cũng giống như khi nhìn một người từ rất xa, ta chỉ có thể nhìn ược
dáng, gần hơn một tí ta có thể nhìn ược mặt nhưng không nhìn ược các chi tiết mắt,
mũi, miệng trên khuôn mặt, và gần hơn nữa ta mới có thể nhìn chi tiết mắt mũi, miệng.
Việc này tương ứng với cách tiếp cận phân tích nhiều mức khác nhau
Hình 2.1.Dò tìm thông tin lõm
2.2.Rút trích các ặc trƣng lõm 2.2.1.Điểm lõm
Gọi I(x, y) là một hàm hai biến biểu diễn một ảnh I. Hàm số này thiết lập một
mặt (x, y, I(x, y)) . Mục tiêu của chúng ta là dò tìm các iểm có khả năng là iểm lõm
trên mặt này. Một cách chính xác theo toán học, iểm lõm là những iểm mà tại ó cả hai ạo hàm: (2.2)
ạt cực trị. Trên thực tế, do ảnh
là một hàm số không liên tục, hàm
rời rạc do sự số hóa của máy tính, vì vậy sẽ rất khắt khe nếu chúng ta chỉ dò tìm các
iểm cực trị. Và chúng ta sẽ bị mất một số thông tin của các iểm ảnh lõm cũng như
những iểm lân cận chúng. Vì vậy ta ưa ra các công thức sau ây nhằm giảm bớt các
iều kiện ràng buộc ối với iểm lõm : (2.3)
VP = {(x,y)│| LoG(x,y)│≥ δ LoG(x,y) < 0
Nguyễn Thị Thơm - Lớp CT1301 22 lOMoARcPSD| 36149638
Trong ó VP là tập các iểm lõm. Ký hiệu LoG ( x, y) là giá trị của Laplacian-
of-Gaussian tại iểm (x, y) . Mục ích là rút trích các vùng lõm chứ không chỉ rút trích iểm lõm.
2.2.2. Dò tìm và lấy vùng lõm
Để ánh giá một vùng có phải là lõm hoặc không lõm, chúng ta ề xuất một bộ lọc như sau: Ảnh ang xét s Vùng ánh giá Bộ lọc vuông
Hình 2.2 Dò tìm vùng lõm trên ảnh
Ứng với vùng ang xét – một hình vuông s x s , chúng ta tính giá trị của bộ lọc trên
vùng này theo công thức (2.3). Đạt S1, S2, S3, và S4 là các hình chữ nhật en xung
quanh hình vuông R giá trị lọc F(R) ược ịnh nghĩ như sau: (2.4)
Trong công thức (2.3), hàm sum(X) là hàm tổng giá trị ộ sáng trong vùng X. Dựatrên
giá trị F(R) vừa tính ược, chúng ta ánh giá vùng R theo công thức sau: (2.5) lOMoARcPSD| 3614963
Công thức (2.5) là công thức mở rộng của (2.2) và (2.3) nhằm ể dò tìm các vùng lõm
trên ảnh. Sự khác biệt chủ yếu ở chổ ta sử dụng bộ lọc hiệu trong (2.5) thay vì sử dụng
Laplacian-of-Gaussian trong (2.2) và (2.3). Chúng ta ể ý rằng, bằng cách thay kích
thước S của vùng ang xét, hay nói cách khác là kích thước của lọc, chúng ta có thể dò
tìm các vùng lõm ứng với nhiều kích cở, mức ộ khác nhau. Ngoài ra, ể dò tìm và rút
trích các vùng lõm có hình dạng khác nhau, sử dụng một tập các lọc hình học có hình
dạng thay vì chỉ sử dụng một bộ lọc vuông.
L ọc hình vuông Lọc chữ nhật ngang Lọc chữ nhật ứng
Hình 2.3 Tập các bộ lọc
Do ó ta có thể biến ổi công thức (2.4) thành công thức sau: (2.6) (2.7)
FS(R) ược sử dụng ể tính giá
trị lọc vuông còn FR (R) ược sử dụng ể tính giá trị các lọc hình chữ nhật. Chúng ta
dễ dàng nhận thấy rằng các công thức tính lọc ều tương tự với công thức của một
Laplacian, nhưng có một chút khác biệt là sử dụng vùng thay vì từng iểm ơn. Trong
công thức (2.6) và (2.7), hệ số ứng trước hàm sum(R) có ược là do tỷ lệ giữa diện tích
vùng ở tâm (vùng ang xét) và tổng diện tích của vùng lân cận. Trong hình (2.3a), tổng
diện tích của các vùng en xung quanh gấp ôi diện tích phần ở giữa, vì vậy chúng ta
có hệ số 2. Trong hình (2.3b) và (2.3c), tổng diện tích các vùng en gấp rưỡi diện tích
phần hình chữ nhật ở giữa. Một cách chính xác chúng ta phải dùng hệ số 1.5 trước
hàm sum(R), nhưng việc tính toán trên số thực rất chậm, do ó ể tăng tốc ộ tính toán
ta dùng 2 hệ số nguyên là 3 và 2 thay vì chỉ dùng 1 hệ số 1.5.
Nguyễn Thị Thơm - Lớp CT1301 24 lOMoARcPSD| 36149638
Một thông số quan trọng khác trong công thức (2.5) là ngưỡng . Ngưỡng
phải phụ thuộc tuyến tính vào diện tích của vùng ang xét. Chúng ta sử dụng
1=KS2 ối với lọc hình vuông có kích thước S và 2=4KS2 ối với các lọc. hình chữ nhật
có kích thước S. K là một thông số thực nghiệm. Ngưỡng 1 là tích của K và S2 – diện
tích của lọc vuông. Tương tự, trong (2.7), chúng ta ã gấp ôi giá trị của FR(R) ể tránh
chuyện tính toán trên số thực. Vì thế, chúng ta cũng phải gấp ôi ngưỡng 2 ể tăng ộ
chính xác của việc ánh giá.
2.2.3.Dò và phát hiện vùng lõm o nhiều mức khác nhau
Sau ây là một phương pháp sử dụng các lọc hiệu ở nhiều mức khác nhau ể dò
tìm các vùng lõm. Các lọc ược giới thiệu trong phần trước sẽ ược sử dụng với nhiều
kích thước khác nhau vì vậy chúng sẽ dò tìm ược các vùng lồi ở nhiều mức khác nhau.
=10, ảnh sau khi smoth với Các vùng lõm dò với kích thước lọc 1 lOMoARcPSD| 3614963 Gausian 10 2
=20, ảnh sau khi smoth với Các vùng lõm dò tìm với kích
Gausian 20 2 thước lọc 20
Hình 2.4 Dò tìm vùng lõm ở nhiều mức khác nhau
Đặt 1 , 2 ,.. n là các mức ộ ược ịnh nghĩa trước và có ộ lớn tăng dần.
1 là mức ộ thấp nhất. Tại mức ộ này, chúng ta có thể dò tìm các vùng lõm, có kích
thước nhỏ và chi tiết. n là mức ộ cao nhất mà tại ó chúng ta có thể dò tìm các vùng
lõm lớn hơn, ít chi tiết hơn. Tại mỗi mức, trước tiên áp dụng một lọc
Gaussian với kích thước i 2 sau ó chúng ta sử dụng 3 bộ lọc hiệu như hình (2.3) với
kích thước S = i . Trong hình (2.4), các hình vuông và hình chữ nhật màu xanh là các
vùng lõm. Trong thực tế, có nhiều vùng lõm khác cũng ược dò tìm ược, tuy nhiên
trong hình (2.4), chỉ tập trung vào các vùng lõm dò tìm ược trong vùng ảnh quan tâm
– vùng ảnh khuôn mặt. Trong phần tiếp theo, sẽ trình bày phương pháp cấu trúc các
vùng lõm rút trích ược này thành các cây cấp bậc.
2.2.3.1.Tối ƣu tốc ộ dò tìm
Trong vùng ang xét, chúng ta phải thường xuyên tính tổng ộ sáng iểm ảnh
của một vùng hình chữ nhật, một số hình trong chúng có thể chồng lên nhau. Việc
này làm cho tính toán chậm i rất nhiều do phải tính nhiều lần tổng ộ sáng cho một
vùng. Để giảm ộ phức tạp của tính toán này,tôi sử dụng phương pháp tương tự như
ảnh tích phân (integral image) và kỹ thuật lập trình quy hoạch ộng.
Phương pháp này ược trình bày như sau:
Cho trước một ảnh mức xám I (x, y) , chúng ta ịnh nghĩa một ảnh tích phân
Nguyễn Thị Thơm - Lớp CT1301 26 lOMoARcPSD| 36149638
S(x, y) sao cho S(x, y) là tổng mức sáng của toàn bộ iểm ảnh trong hình chữ nhật
R(1,1, x, y) . Chúng ta có thể dễ dàng tính ược S (x, y) theo công thức truy hồi: (2.8)
Hình 2.5 Ảnh tích phân
Từ ảnh S (x, y) , ta dễ dáng tính ược tổng ộ sáng của một hình chữ nhật bất kỳ
R(l, r,t,b) theo công thức sau: (2.9) lOMoARcPSD| 3614963
Hình 2.6:Tính tổng ộ sáng cho hình chữ nhật R(l,t,r,b)
Phương pháp này cải tiến áng kể tốc ộ tính toán bởi vì chúng ta chỉ cần tính
một lần ảnh tích phân và sử dụng nó trong tất cả các cửa sổ hình chữ nhật con và ặc
biệt ộ phức tạp tính toán không phụ thuộc vào kích thước của vùng ang xét.
2.2.4.Phát hiện mặt ngƣời
2.2.4.1.Xây dựng cấu trúc cây lõm
Từ các vùng lõm rút trích ược, chúng ta xây dựng các cây quan hệ cấp bậc.
Những vùng ược rút trích ở mức cao nhất n sẽ trở thành những nút gốc của các cây
sẽ tạo. Những vùng rút trích ược ở mức thấp nhất 1 sẽ ược chèn vào cây như là những nút lá.
Hình 2.7 Tạo cây cấp bậc
Công việc chính của việc tạo cây là kết nối các vùng rút trích ược tại một mức
ến các vùng của mức kế tiếp. Nếu vùng R tại mức 1 bị che khuất hơn hai phần ba diện
tích của nó bởi vùng R’ của mức i +1 ,
R sẽ ược gán nhãn là nút con của R’. Bằng
cách này chúng ta có thể dễ dàng tạo cây cấp bậc từ các vùng ã rút trích ược. Các
vùng rút trích ược trong hình ược xây dựng thành cây như sau : R R V V V V R V V R V
Nguyễn Thị Thơm - Lớp CT1301 28 lOMoARcPSD| 36149638
Hình 2.8 Một cây rút trích từ khuôn mặt
Đối với mỗi nút trong cây, chúng ta cần lưu các thông tin của nút này như: loại (lõm),
hình dạng (vuông, chữ nhật ngang, chữ nhật ứng), vị trí tương ối của nó so với nút
cha của nó (có giá trị từ 0 ến 12, xem hình 2.9), và thông tin về ộ sáng của nó.
Hình 2.9: vị trí vùng tương ối của nút con
Trong hình biểu diễn các vị trí tương ối của nút con trên nút cha lần lượt có
dạng vuông, chữ nhật ngang, và chữ nhật ứng. Việc xét một nút con có vị trí tương ối
như thế nào ối với nút cha khá ơn giản. Nếu tâm của nút con (tâm của hình vuông hay
hình chữ nhật) rơi vào vùng nào trong hình thì chỉ số của vùng ó chính là giá trị vị trí
tương ối của nút con trong nút cha. Lưu ý rằng ối với các nút gốc giá trị này sẽ là 0.
Bên cạnh ó thông tin về ộ sáng cũng rất quan trọng trong các bài toán phát hiện và
nhận dang khuôn mặt về sau. Để lưu trữ thông tin này trên cây, ta sử dụng phương
pháp phân tích thành phần chính (Principal Component Analysis – PCA) ể giảm số
chiều của ảnh mức xám trên vùng ảnh của nút ó. Bằng cách này ta giảm ược áng kể
thông tin phải lưu trữ về ộ sáng của ảnh. Thay vì phải lưu trữ toàn bộ iểm sáng của
các vùng lõm (các nút), chúng ta chỉ cần lưu một vector PCA chứa nội dung của các
iểm sáng này. Cách này giúp cho giảm thông tin phải lưu trữ, xử lý mà cũng không
mất mát quá nhiều thông tin. lOMoARcPSD| 3614963
Hình 2.10: cách tính vecto ại diện ộ sáng cho nút
Cụ thể ta thực hiện như sau: dùng một cửa sổ con S kích thước 9x9 quét theo
ường zic-zac trên ảnh xám của vùng lõm. Các cửa cổ này có thể chồng lắp lên nhau
hai phần ba kích thước của nó. Tại mỗi iểm, ta lưu lại trung bình mức sáng của các
iểm ảnh trong cửa sổ S. Như vậy ta lưu ược một vector tương ứng cho biểu diễn mức
sáng của iểm ảnh tại nút ó. R Zoom out N ộ i dung c ủ a nút Đượ c phóng ra: R V V V 1.Ki ể u lõm 2 .Hình vuông 3.V ị trí: 1 V R V V R V
Hình 2.11: cây rút trích ược và các thông tin trên một nút
Bên cạnh ó, ta sử dụng một số luật ể tỉa bớt nhánh cho các cây. Nếu một nút
cùng kiểu (lõm) so với nút cha của nó thì nó ược xem là một nút lặp. Trong trường
hợp này, nút lặp sẽ ược tỉa khỏi cây. Nếu nó là một nút lá, chúng ta dễ dàng xóa nó khỏi cây.
2.2.4.2.Xây dựng hàm tính ộ tƣơng ồng giữa hai cây
Trong phần này ta cùng tìm hiểu một cách tính ộ tương ồng giữa hai cây lõm
theo cách biểu diễn như phần trước. Việc xây dựng hàm tương ồng giữa hai cây là rất
Nguyễn Thị Thơm - Lớp CT1301 30 lOMoARcPSD| 36149638
cần thiết trong tất cả các xử lý liên quan ến ặc trưng này. Nó có tính chất quyết ịnh
ảnh hưởng ến ộ chính xác của phát hiện và nhận dạng khuôn mặt.
2.2.4.2.1. Độ tƣơng ồng giữa hai nút trên cây
Để xây dựng hàm tính ộ tương ồng giữa hai cây trước hết ta cần xây dựng hàm
tính ộ tương ồng của hai nút trên hai cây. Với iều kiện rằng hai nút thuộc hai cây khác
nhau này cùng mức i nào ó.
Đặt N1 và N2 là hai nút cùng cấp trên hai cây T1 và T2. Khi ó N1 và N2 có những thuộc tính sau: (2.10)
Trong ó: t {ridge, valley} : là loại của nút (lõm).
s = {square, horizontal rectangle, vertical rectangle} là hình dạng của nút
(vuông,hình chữ nhật ngang, hình chữ nhật ứng).
p [0..12] : là vị trí tương ối của nút trong nút cha của nó.
i (a1,a2,...,an) : là vector chứa thông tin ộ sáng của nút. Trong ó n thay ổi tùy theo
cấp của nút. Ở mức i càng cao, kích thước của vùng lõm tương ứng với nút càng lớn,
số chiều n của vector này càng cao.
Dựa trên các thuộc tính của node ịnh nghĩa trong công thức 3.9, ta xây dựng
công thức tính ộ tương ồng giữa 2 nút như sau: (2.11)
Trong công thức (2.11), 1 , 1 , và 1 là các thông số thực ngiệm, hàm E(x,y) dùng ể xét
sự giống nhau giữa 2 thuộc tính ược ịnh nghĩa như sau: (2.12)
Bên cạnh ó ký hiệu EV(x,y) là hàm tính ộ tương ồng giữa 2 vector ược chuẩn
hóa về oạn [0,1]. Trong ó x và y là hai vector ộ sáng có n chiều (a1,a2,...an). lOMoARcPSD| 3614963 (2.13) Do mỗi thành phần ai trong
vector ộ sáng có giá trị là
ộ sáng (ai [0,255]) nên dễ dàng chứng minh ược EV(x,y) [0,1]. EV(x,y) ạt giá trị
lớn nhất là 1 khi hai vector x và y trùng nhau. Và EV(x,y) ạt giá trị nhỏ nhất là 0 khi
hai vector có khoảng cách Euclid xa nhau nhất. Và từ ó ta cũng dễ dàng suy ra ược
giá trị của NS (N1, N 2 ) [0,1] với mọi cặp nút N1 và N2.
Độ tương ồng giữa hai cây :
Trên cơ sở hàm tính ộ tương ồng giữa hai nút, ta xây dựng lên hàm tính ộ
tương ồng giữa hai cây. Gọi T1 và T2 và hai cây ang cần tính ộ tương ồng. T1 và T2
có những thuộc tính sau:
T1,T2 Tree = {(r, n, c1, c2 ,...,cn )} (2.14) Trong ó:
r : là nút gốc của cây r Node. n :
là số nhánh con của cây n N.
ci : là cây (nhánh) con thứ i của cây ci Tree và i [1..n]. ci có thể là một nút là hoặc
cũng có thể là một cây khác.
Từ công thức (2.13), ta xây dựng công thức tính ộ tương ồng của 2 cây như sau: (2.15)
Trong ó 2 là thông số thực nghiệm. Các thông số thực nghiệm 1, 1, và 1 trong
công thức (2.10) và 2 trong (2.14) sẽ ược thảo luận chi tiết trong phần thực nghiệm
nhằm chọn thông số thực nghiệm tốt nhất. Theo công thức (2.15) ta cũng dễ dàng
nhận thấy TS (T1,T2 ) [0,1] với mọi cặp cây T1 và T2. Giá trị của hàm này càng
lớn, hai cây này càng giống nhau càng nhiều hơn.
Nguyễn Thị Thơm - Lớp CT1301 32 lOMoARcPSD| 36149638
Ngoài ra, trong phần thử nghiệm chúng tôi có thử nghiệm ặc trưng lồi lõm mà
không sử dụng ến thông tin ộ sáng. Khi ó công thức(2.10) tính ộ tương ồng giữa hai
nút ược ơn giản hóa như sau: (2.16)
2.2.4.2.2. Không gian cây và khoảng cách giữa hai cây
Trong một số trường hợp, hàm tính ộ tương ồng giữa hai cây không ủ ể tính
toán trong một số trường hợp. Để ưa về bài toán không gian, ta xây dựng một “không
gian cây” (tree-space), không gian này sẽ là cơ sở ể cho các bài toán phát hiện và nhận dạng khuôn mặt về sau.
Trong không gian cây này, mỗi cây ược xem là một iểm trong không gian.
Trên cơ sở ó ta xây dựng hàm tính khoảng cách giữa hai cây như sau: (2.17)
Dễ dàng nhận thấy, khoảng cách giữa hai cây là một giá trị thuộc oạn [0,1].
Và khoảng cách tiến dần về bằng không khi hai cây càng giống nhau.
Trên cở sở các công thức tính ộ tương ồng, khoảng cách này, ta xây dựng một
mô hình thống kê ể dò tìm và phát hiện khuôn mặt. Mô hình có thể dùng cho nhận
dạng khuôn mặt cũng như mở rộng cho bài toán phân loại ối tượng. Phần mô hình
này sẽ ược trình bày trong chương sau. Các phần thảo luận về khả năng mở rộng của
mô hình này cho bài toán nhận dạng khuôn mặt và phân loại ối tượng sẽ ược trình bài
trong chương kết luận và hướng phát triển.
2.3. Phát hiện mặt ngƣời trong ảnh dựa trên ặc trƣng lõm 2.3.1. Gán nhãn
Từ tập ảnh học, ta dùng phương pháp trình bày trong chương 3 ể rút trích các
cây lõm trên ảnh. Các cây này ược gán nhãn thủ công. Mỗi cây bất kỳ ược gán nhãn
là mặt (face) hay không phải khuôn mặt (non-face). Như vậy, từ một tập ảnh học ta
rút trích ược hai tập cây. Tập cây biểu diễn khuôn mặt và tập cây biểu diễn ối tượng
không phải là khuôn mặt. lOMoARcPSD| 3614963 2.3.2. Thống kê
Mục ích của bước này là xấp xỉ ược một cấu trúc cây khuôn mặt. Trong bước
gán nhãn, tôi tiến hành rút trích cây và gán nhãn. Kết quả thu ược một số lượng cây
thuộc lớp “khuôn mặt”. Các cây này ược dùng làm dữ liệu học thống kê. Mô hình
thống kê ược sử dụng như sau:
Đặt S(Tx) là tổng khoảng cách của một cây Tx bất kỳ ến tất cả các cây còn lại trong tập học. (2.18)
Ta sẽ có tập học trở thành (2.19)
Trong ó FaceSet là tập các cây ược gán nhãn là “khuôn mặt”. Việc học thống
kê theo mô hình của này khá ơn giản. Trước tiên, chọn trong tập Training ra k
cây có giá trị S(T) bé nhất. k cây này sẽ là ại diện tiêu biểu cho một lớp khuôn mặt.
Từ kết quả k cây rút trích ược, tạm gọi là tập cây chuẩn, ta có thể dùng chúng
ể phát hiện khuôn mặt theo mô hình như sau:
Nguyễn Thị Thơm - Lớp CT1301 34 lOMoARcPSD| 36149638
Hình 2.12 Mô hình phát hiện khuôn mặt
Trong mô hình này, trước tiên từ ảnh ầu vào ta dùng phương pháp rút trích lõm
ta sẽ nhận ược một danh sách các cây lõm. Ứng với mỗi cây ta dựa vào tập cây chuẩn
ể kiểm tra xem liệu ây có phải là cây biểu diễn “khuôn mặt” hay không. Nếu thỏa iều
kiện ánh giá nó sẽ trở thành ứng viên khuôn mặt. Trong bước cuối cùng, hậu xử lý,
các ứng viên sẽ ược kiểm tra ràng buộc. Và sau cùng là khử trùng lắp khuôn mặt do
có một số cây có một phần của nút gốc chồng lên nhau.
2.3.3. Đánh giá dùng cho phát hiện khuôn mặt
Dựa trên tập cây chuẩn, một cây bất kỳ ược ánh giá có khả năng là khuôn mặt
hay không dựa trên trung bình khoảng cách của cây ang xét ến tất cả các cây trong tập cây chuẩn. (2.20) Trong ó:
D(t) : là trung bình khoảng cách của cây t ến các cây trong tập chuẩn t: là cây ang xét
Ti: là các cây trong tập k cây chuẩn
Căn cứ vào giá trị D , cây t ược ánh giá là ứng viên mặt hay không dựa theo công thức sau: lOMoARcPSD| 3614963 (2.21)
Ngưỡng 1 là ngưỡng thực nghiệm, ngưỡng này sẽ ược lấy khoảng 0.2 ến 0.4.
Ngoài cách tính trung bình khoảng cách, ta có thể ánh giá ứng viên thông qua việc
tính trung bình ộ tương ồng của cây ứng viên với tập cây chuẩn. (2.22) Trong ó:
S (t) : là trung bình ộ tương ồng của cây t so với các cây trong tập chuẩn t: là cây ang xét
Ti: là các cây trong tập k cây chuẩn
Tương tự như trường hợp trên, giá trị S (t) sẽ ược dùng ể ánh xem cây t có khả
năng là khuôn mặt hay không. (2.23)
Dễ thấy ngưỡng 2 là số gần với một, có thể nói 2 ≅ 1
- 1. Ngưỡng này sẽ ược
trong lấy khoảnh từ 0.6 ến 0.8. Tuy nhiên, về bản chất hai cách này hoàn toàn giống nhau.
2.3.4. Hậu xử lí
Các kết quả thu ược cho thấy rằng có một vùng khuôn mặt ược phát hiện có
một phần chồng lắp lên nhau. Có thể phát hiện ra nhiều cây ứng viên ược ánh giá là
“khuôn mặt”, nhưng thật sự chúng là sự chồng lắp của nhiều cây lên một vị trí khuôn
mặt. Vì vậy, chúng ta cần một thuật toán tốt ể giảm những phát hiện các ứng viên
trùng này. Trước hết ta sử dụng một ánh giá ơn giản ể liên kết các vùng trùng lấp.
Nếu hai ứng viên khuôn mặt có vùng diện tích bị chồng lắp lên nhau quá một phần
ba diện tích của nó, chúng ược xem là các mặt trùng và ược liên kết lại thành một
vùng lớn hơn. Vùng iện tích xem xét ó chính là vùng diện tích của nút gốc của cây ứng viên.
Nguyễn Thị Thơm - Lớp CT1301 36 lOMoARcPSD| 36149638
Sau khi gom nhóm ược vùng, thu ược một hay nhiều vùng chứa khuôn mặt. Tuy
nhiên, do sai số của kích thước của cây và kích thước khuôn mặt, nên luôn có ược
vùng khuôn mặt phát hiện ược lớn hơn khuôn mặt thực tế. Áp dụng tiếp kỹ thuật xác
ịnh vùng lõm với mức nhỏ hơn nhằm ể phát hiện chính xác vùng. ta chỉ áp dụng thuật
toán dò tìm ặc trưng lõm trên vùng bao khuôn mặt, sau ó liên kết các vùng lõm cùng loại lại với nhau.
Vùng khuôn mặt thật sự sẽ là vùng liên thông lớn nhất trong ó. Với cách như vậy,
chúng ta sẽ thu nhỏ, và xác ịnh chính xác hơn vị trí khuôn mặt.
CHƢƠNG 3 CHƢƠNG TRÌNH THỬ NGHIỆM 3.1.Bài toán
- Nội dung : Tìm hiểu ặc trưng lõm 3D và bài toán phát hiện mặt người trong ảnh +
Đầu vào : Ảnh có chứa mặt người.
+ Đầu ra : Ảnh vào có thêm khoanh vùng mặt phát hiện ược.
3.2.Phân tích thiết kế
Bài toán :Tìm hiểu ặc trưng lõm 3D và Bài toán phát hiện mặt người trong
ảnh chương trình thực hiện trên open CV
Phát hiện mặt người trong ảnh có nhiều ứng dụng trong cuộc sống, tuy nhiên,
trong khóa luận này, tôi chỉ xây dựng một chương trình nhỏ ể minh họa cho các lý
thuyết ở trên. Cụ thể ấy là một chương trình phát hiện mặt người trong ảnh ược viết
trên nền visual C# của Microsoft, sử dụng thư viện mã nguồn mở OpenCV của Intel.
Dựa trên thư viện Luxand ể thực hiện chương trình: Phát hiện, ánh dấu và lọc vùng khuôn mặt. lOMoARcPSD| 3614963
3.3.Một số kết quả chƣơng trình
3.3.1 Tập ảnh thử nghiệm
Hình 3.1 Các ảnh thử nghiệm
3.3.2 Kết quả chƣơng trình
Nguyễn Thị Thơm - Lớp CT1301 38 lOMoARcPSD| 36149638
Hình 3.2 Giao diện chính của chương trình lOMoARcPSD| 3614963
Hình 3.3 Giao diện phát hiện khuôn mặt
Hình 3.4 Phát hiện úng ra khuôn mặt
Nguyễn Thị Thơm - Lớp CT1301 40 lOMoARcPSD| 36149638 lOMoARcPSD| 3614963
Hình 3.5 Phát hiện úng ra khuôn mặt
Nguyễn Thị Thơm - Lớp CT1301 42 lOMoARcPSD| 36149638
3.3.3 Kết quả thực nghiệm Đúng Tập ảnh thử Kết quả Sai Tỉ lệ chính xác nghiệm ảnh ầu vào 20 17 3 85 %
Hình 3.6 Chỉ phát hiện ược một khuôn mặt lOMoARcPSD| 3614963
Hình 3.7 Không phát hiện ược ra khuôn mặt PHẦN KẾT LUẬN
Qua luận văn này, tôi ã óng góp ược một hướng tiếp cận mới cho bài toán phát
hiện khuôn mặt. Bên cạnh ó, hứa hẹn việc mở ra một loại ặc trưng mới có thể phát
triển cho xác ịnh vị trí của các thành phần trên khuôn mặt như mắt, mũi, miệng, v.v…
Ngoài ra có thể phát triển rộng hơn ể trở thành bài toán nhận dạng khuôn mặt.
Nguyễn Thị Thơm - Lớp CT1301 44 lOMoARcPSD| 36149638
Tôi ã tìm hiểu ược bài toán phát hiện mặt người dựa trên ặc trưng lõm 3D ể nhận
dạng ược khuôn mặt và xác ịnh ược các ứng dụng ặc trưng của bài toán phát hiện mặt
người. Từ ó ta xây dựng ược hệ thống nhận diện người .
Chương trình phát hiện mặt người trong ảnh ã nhân dạng ược ra khuôn mặt và
các chi tiết trên khuôn mặt. Nhằm ưa ra ược những ứng dụng thực tế trong cuộc sống hiện ại:
Phân tích cảm xúc của khuôn mặt người.
Tổ chức tìm kiếm liên quan ến con người thông qua khuôn mặt trên nhiều hệ cơ sở dữ liệu lớn.
Điều khiển ra vào các cơ quan, văn phòng.
Hệ thống quan sát, theo dõi và bảo vệ. Giải trí. Nhận dạng tội phạm.
Hệ thống giao tiếp thông minh giữa người và máy.
TÀI LIỆU THAM KHẢO
[A]. Tài liệu Tiếng Anh
[1]. Ming-Hsuan Yang, David J. Kriegman, Narendra Ahuja, “Detecting Faces in
Images: A Survey”, IEEE Transaction on Pattern Analysis and Machine Intelligence
(PAMI), Vol. 24, No 1, pp. 34-47, Jan 2002. lOMoARcPSD| 3614963
[2]. T. Kanade, “Picture Processing Computer Complex and Recognition of Human
Faces”, PhD thesis, Kyoto Univ., 1973.
[3]. G. Yang, T. S. Huang, “Human Face Detection in Complex Background”, Pattern
Recognition, Vol. 27, No. 1, pp. 53-63, 1994.
[4]. C. Kotropoulos, I. Pitas, “Rule-based Face Detection in Frontal Views”, Proc.
Int’l Conf. Acoustics, Speech and Signal Processing, Vol. 4, pp. 2637-2540, 1997.
[5]. T. K. Leung, M.C. Burl, P. Perona, “Finding Faces in Cluttered Scenes Using
Random Labeled Graph Matching”, Proc. 5th IEEE Conf. Computer Vision
(ICCV’95), pp. 637-644, 1995.
[6]. K. C. Yow, R. Cipolla, “Feature-Based Human Face Detection”, Image and
Vision Computing, Vol. 15, No. 9, pp. 713-735, 1997. [7].
I. Craw, D. Tock, A. Bennett, “Finding Face Features”, Proc. 2nd European
Conf. Computer Vision (ECCV’92), Vol. 2, pp. 92-96, 1992.
[8]. A. Lanitis, C. J. Taylor, T. F. Cootes, “An Automatic Face Identification System
Using Flexible Appearance Models”, Image and Vision Computing, Vol. 13, No. 5, pp. 393-401, 1995.
[B]. Tài liệu Tiếng Việt
[9]. PGS.TS Đỗ Năng Toàn, TS. Phạm Việt Bình, “Giáo trình Xử Lý Ảnh”, Đại học Thái Nguyên, 2007.
[10]. Phạm Thế Bảo, Nguyễn Thành Nhựt, Cao Minh Thịnh, Trần Anh Tuấn, Phan
Phúc Doãn, “Tổng quan các phương pháp xác ịnh khuôn mặt người”, Tạp chí Công
nghệ thông tin & Truyền thông, 2007. [11]. Luxand FaceSDK 4.0, Trial Version, Luxand.Inc, 2011. http://www.luxand.com.
Nguyễn Thị Thơm - Lớp CT1301 46