ỨNG DỤNG PHƯƠNG PHÁP PHÂN TÍCH CỤM VÀ PHÂN TÍCH BIỆT SỐ ĐÁNH GIÁ NHIỄM MẶN TẦNG CHỨA NƯỚC PLEISTOCEN Ở HUYỆN TÂN THÀNH, TỈNH BÀ RỊA - VŨNG TÀU

Phân tích thống kê đa biến (MSA - Multivariate Statistics Analysis) bao gồm các kỹ thuật thống kê khác nhau, chẳng hạn như phân tích cụm (CA - Cluster Analysis) và phân tích biệt số (DA - Discriminant Analysis - DA), phân tích nhân tố (FA -Factor Analysis ), phân tích thành phần chính (PCA - Principal omponent Analysis). Tài liệu giúp bạn tham khảo ôn tập và đạt kết quả cao. Mời bạn đọc đón xem!

Thông tin:
9 trang 4 tháng trước

Bình luận

Vui lòng đăng nhập hoặc đăng ký để gửi bình luận.

ỨNG DỤNG PHƯƠNG PHÁP PHÂN TÍCH CỤM VÀ PHÂN TÍCH BIỆT SỐ ĐÁNH GIÁ NHIỄM MẶN TẦNG CHỨA NƯỚC PLEISTOCEN Ở HUYỆN TÂN THÀNH, TỈNH BÀ RỊA - VŨNG TÀU

Phân tích thống kê đa biến (MSA - Multivariate Statistics Analysis) bao gồm các kỹ thuật thống kê khác nhau, chẳng hạn như phân tích cụm (CA - Cluster Analysis) và phân tích biệt số (DA - Discriminant Analysis - DA), phân tích nhân tố (FA -Factor Analysis ), phân tích thành phần chính (PCA - Principal omponent Analysis). Tài liệu giúp bạn tham khảo ôn tập và đạt kết quả cao. Mời bạn đọc đón xem!

70 35 lượt tải Tải xuống
lOMoARcPSD|50205883
DOI:10.22144/ctu.jsi.2017.061
ỨNG DỤNG PHƯƠNG PHÁP PHÂN TÍCH CỤM VÀ PHÂN TÍCH BIỆT SỐ
ĐÁNH GIÁ NHIỄM MẶN TẦNG CHỨA NƯỚC PLEISTOCEN Ở
HUYỆN TÂN THÀNH, TỈNH BÀ RỊA - VŨNG TÀU
Phan Nguyễn Hồng Ngọc
1
, Hoàng Thị Thanh Thủy
1
và Nguyễn Hải Âu
2
1
Trường Đại học Tài nguyên và Môi trường Thành phố Hồ Chí Minh
2
Viện Môi trường và Tài nguyên, Đại hc Quốc gia Thành phố Hồ Chí Minh
Thông tin chung:
Ngày nhận bài: 28/07/2017
Ngày nhận bài sửa: 19/09/2017
Ngày duyệt ăng: 26/10/2017
Title: Application of cluster
analysis and discriminant
analysis assess salinity
intrusion in Pleistocene
aquifer of Tan
Thanh district, Ba Ria - Vung
Tau province, Vietnam
Từ khóa: Nước dưới ất, phân
tích cụm,
phân tích biệt số, xâm nhập
mặn
Keywords:
Cluster analysis, discriminant
analysis, groundwater,
salinity intrusion
ABSTRACT
Cluster Analysis (CA) and
Discriminant Analysis (DA)
were applied to assess salinity
intrusion of groundwater in the
Pleistocene aquifer in Tan
Thanh district, Ba Ria Vung
Tau province. Groundwater
samples were collected from 18
monitoring wells in April 2012. The water quality parameters selected for
statistical analysis include pH, hardness, TDS, Cl
-
, F
-
, NO
3
-
, SO
4
2-
, Cr
6+
, Cu
2+
,
Ca
2+
, Mg
2+
, Na
+
, K
+
, HCO
3
-
and Fe
2+
.
CA groups the wells into three distinct clusters related to agricultural activities,
industry, and salinization. DA revealed the existence of significant differences
between these clusters, built a function discriminant analysis and determined
group which causes difference among clusters in the data set. The parameters
representing salinity intrusion (TDS, Mg
2+
, Cl
-
, Hardness, Na
+
, K
+
, Ca
2+
, and
SO
4
2-
) accounted for 99.8% of the variance of dependent variables explained by
the DA model.
The results showed that cluster analysis and discriminant analysis are the
effective statistical methods in the clustering of salt intrusion.
TÓM TẮT
Phương pháp phân tích cụm (Cluster Analysis - CA) phân tích biệt số
(Discriminant Analysis - DA) ã ược sử dụng nhằm ánh giá nhiễm mặn nước
dưới t khu vực huyện Tân Thành, tỉnh Rịa Vũng Tàu. Các mẫu nước
dưới ất ược thu thập từ 18 giếng quan trắc vào tháng 4 năm 2012. Các thông
số chất lượng nước ược lựa chọn trong kỹ thuật phân tích thống trên bao
gồm: pH, cứng, TDS, Cl
-,
F
-
, NO
3
-
, SO
4
2-
, Cr
6+
, Cu
2+
, Ca
2+
, Mg
2+
, Na
+
, K
+
,
HCO
3
-
và Fe
2+
.
Kết quả phân tích CA nhóm bộ dữ liệu quan trắc thành ba cụm giếng liên
quan ến hoạt ộng nông nghiệp, hoạt ộng công nghiệp sự nhiễm mặn. Phân
tích biệt số ược thực hiện nhằm nghiên cứu sự tồn tại khác biệt có ý nghĩa giữa
các cụm, xây dựng hàm phân tích phân biệt và xác ịnh cụm gây ra sự khác biệt
giữa các nhóm cụm. Các thông số ại diện cho yếu tố xâm nhập mặn (TDS, Mg
2+
,
Cl
-
, ộ cứng, Na
+
, K
+
, Ca
2+
, SO
4
2-
) chiếm 99,8% phương sai các biến phụ thuộc
cụm ược giải thích bởi mô hình DA.
Kết quả nghiên cứu ã cho thấy phân tích cụm và biệt số là những phương pháp
thống kê hiệu quả trong phân vùng xâm nhập mặn.
Trích dẫn: Phan Nguyễn Hồng Ngọc, Hoàng Thị Thanh Thủy và Nguyễn Hải Âu, 2017. Ứng dụng phương
pháp phân tích cụm và phân tích biệt số ánh giá nhiễm mặn tầng chứa nước pleistocen ở huyện Tân Thành,
tỉnh Bà Rịa - ng Tàu. Tạp chí Khoa học Trường Đại học Cần Thơ. Số chuyên ề:
Môi trường và Biến ổi khí hậu (2): 129-136.
lOMoARcPSD|50205883
130
1 GIỚI THIỆU
Phân tích thống a biến
(MSA - Multivariate Statistics
Analysis) bao gồm các kỹ thuật
thống kê khác nhau, chẳng hạn
như phân tích cụm (CA -
Cluster Analysis) phân tích
biệt số (DA - Discriminant
Analysis - DA), phân tích nhân
tố (FA -Factor Analysis ), phân
tích thành phần chính (PCA -
Principal Component
Analysis),… Các phương pháp
này giúp giải thích các ma trận
dữ liệu phức tạp hiểu hơn
về chất lượng nước, cho phép
xác ịnh các nhân tố hoặc nguồn
ảnh hưởng ến chất lượng nước
cung cấp một ng cụ giá
trị quản khai thác sử
dụng tài nguyên nước.
Một trong những thuận lợi
chính của những kỹ thuật này
khnăng phân tích dữ liệu
lớn phức tạp, nhiều biến
nhiều ơn vị thí nghiệm.
Những phương pháp này ôi khi
tạo ra các biến mới bằng cách
giảm số lượng của các biến ban
ầu trong việc so sánh giải
thích các dữ liệu. Phân tích
cụm (CA) phương pháp
phân loại c ối tượng hay các
biến sao cho các i tượng trong
cùng một cụm xét theo các ặc
tính ược chọn phân tích. Phân
tích phân biệt (DA) phương
pháp phân tích dữ liệu khi biến
phụ thuộc biến phân loại
biến ộc lập biến ịnh lượng.
Phân tích phân biệt òi hỏi phải
biết trước số nhóm các i
tượng trong mỗi nhóm trước
khi tiến hành phân tích, xây
dựng hàm phân tích phân biệt,
nghiên cứu sự tồn tại khác biệt
ý nghĩa giữa các nhóm, xác
ịnh biến ộc lập là nguyên nhân
lớn nhất gây ra sự khác biệt
giữa các nhóm phân loại c
quan sát vào một nhóm nhất
ịnh dựa vào giá trị của các biến ộc lập.
Trong những năm gần ây, các phương pháp phân tích cụm và phân tích
phân biệt ã ược sử dụng rộng rãi trong các ứng dụng môi trường, bao gồm
các ánh giá quan trắc diễn biến chất lượng nước ngầm, nước mặt, kiểm tra
kết quả c hình phỏng chất lượng nước theo không gian thời
gian, xác ịnh các yếu tố hóa học liên quan ến các iều kiện thủy văn, và ánh
giá các chỉ thị chất lượng môi trường. Mcác nước châu Âu như Pháp,
Thổ Nhĩ Kỳ (Varol et al., 2012) các quốc gia châu Á như Nhật Bản
(Shrestha et al., 2007), Malaysia (Kura et al., 2013), Ấn Độ (Mavukkandy
et al., 2014), Trung Quốc (Yang et al., 2015), các nghiên cứu này ã ứng
dụng nhiều phương pháp thng a biến ánh giá chất lượng nước mặt, nước
dưới ất ở các lưu vực sông dựa vào mối quan hệ giữa các thông số o ạc với
các ặc iểm nguồn thải, xuất ược các thông số ặc trưng chất lượng nước
của lưu vực ể giám sát và quản lí hiệu quả.
Việt Nam, các thuật thống a biến cũng ược sử dụng rộng rãi
trong nhiều lĩnh vực khác nhau như tâm lý, kinh tế, hội, kỹ thuật trong
ó lĩnh vực môi trường. Các nghiên cứu trong lĩnh vực môi trường chủ
yếu sử dụng phương pháp phân tích hồi quy tuyến tính xử các số liệu
phân tích thí nghiệm, kiểm ịnh thông số mô hình mô phỏng. Phân tích ánh
giá chất lượng nước chỉ dựa vào phương pháp so sánh với qui chuẩn cho
phép, phân vùng dựa vào chỉ số chất lượng nước (WQI) hình toán,
chưa có nghiên cứu nào sử dụng các kĩ thuật phân tích thống kê a biến ánh
giá chất lượng nước một cách ầy ủ, riêng biệt.
Huyện Tân Thành ã ang trở thành một trong ba ịa phương nền
kinh tế phát triển bậc nhất tỉnh Rịa Vũng Tàu, nơi tập trung nhiều
khu công nghiệp nhất của tỉnh. Nhu cầu sử dụng nước trên ịa bàn huyện là
khá lớn ể phục vụ phát triển kinh tế, trong khi ó các nguồn khai thác nước
mặt tsông hồ không áp ứng nhu cầu ó. Theo số liệu iều tra m 2012 từ
Sở Tài Nguyên Môi trường tỉnh Rịa - Vũng Tàu thì tổng lưu lượng
khai thác nước dưới ất trung bình
18.608.430 m
3
/năm, trong ó cấp nước sinh hoạt 13.174.310m
3
/năm
cho sản xuất 5.434.120 m
3
/năm, nước ược khai thác chủ yếu trong tầng
chứa nước lỗ hổng các trầm tích Pleistocen. Tầng chứa nước lỗ hổng
Pleistocen ược tạo thành từ ất á hạt thô nằm dưới hệ tầng Củ Chi, hệ tầng
Thủ Đức hệ tầng Trảng Bom với c khoáng vật chính: Fluorit-apatit,
felspat, thạch cao, turmalin, montmorilonit, ilmenit và một số tạp chất khác.
Hai nguyên nhân chính nh hưởng ến chất lượng nước dưới ất khu vực
nghiên cứu là do phía Tây huyện Tân Thành nằm dọc theo sông Thị Vải
hoạt ộng khai thác nước dưới ất từ các trạm cấp nước lớn (Phú Mỹ - M
Xuân, Tóc Tn) và nh lẻ thuộc ịa bàn; một số giếng tổng khoáng hóa
tăng cao cho thấy chất lượng nước dưới ất có khả năng chịu sự tác ộng của
quá trình biên mặn lấn sâu vào ất liền và hoạt ộng phát triển kinh tế - hội
trên lưu vực.
Trong nghiên cứu này, các thông số lí hóa của chất lượng nước dưới ất
trong tầng chứa nước Pleistocen khu vực huyện Tân Thành, tỉnh Bà Rịa
Vũng Tàu ược tập trung phân tích bằng c phương pháp thống a biến
(CA và DA). Kết quả phân tích cho phép ánh giá thông tin về sự tương ồng
trong các trạm quan trắc khác nhau, tó xác ịnh các thông số chất lượng
nước ặc trưng theo không gian, tác ộng của các nguồn ô nhiễm trên lưu vực
ến chất lượng nước.
lOMoARcPSD|50205883
2 TÀI LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Mô tả vùng nghiên cứu
Huyện Tân Thành thuộc tỉnh Bà Rịa ng Tàu, phía Đông giáp huyện
Châu Đức, phía Tây giáp huyện Cần Giờ và thành phố Vũng Tàu, phía Nam
giáp thành phố Bà Rịa và phía Bắc giáp huyện Long Thành, tỉnh Đồng Nai.
Diện tích tự nhiên (33.825 ha), dân số trung bình (137.334 người). Mùa khô
kéo dài từ tháng 12 ến tháng 4 m sau, có nền nhiệt ộ trung bình hàng năm
cao (26,3
o
C) hầu như không thay ổi nhiều trong năm. Mùa mưa bắt ầu
từ tháng 5 ến tháng 11, lượng mưa phân bều trong năm (trung bình 1356.5
mm/năm).
2.2 Tài liệu nghiên cứu
Trong bài báo này, 15 thông số chất lượng nước
(Ca
2+
, Mg
2+
, Na
+
, K
+
, HCO
3-
, pH, ộ cứng, TDS, Cl
-
,
F
-
, NO
3
-
, SO
4
2-
, Cr
6+
, Cu
2+
và Fe
2+
) từ 18 giếng quan
trắc chất ợng nước dưới ất trên ịa bàn huyện Tân
Thành ược Sở Tài nguyên i trường tỉnh Bà Rịa
Vũng Tàu thực hiện vào mùa khô năm 2012
(NB2C, NB2A, NB3A, NB1B, NB4, VT2B, NB1A,
VT2A, VT6, QT5B, NB2B, QT11, QT7B, NB3B,
QT5A, VT4B, QT7A,
VT4A) ược lựa chọn xử ánh giá. Vị trí các
giếng quan trắc ược trình bày trong vị trí quan
trắc ở Hình 1.
2.3 Phương pháp phân tích thống kê a biến
và xử lý số liệu
Tất cả c tính toán toán học thống ược
thực hiện bằng cách sử dụng phần mềm
Excel 2013 (Microsoft Office). Các phân tích CA,
DA ược xử bằng phần
mềm SPSS
(PASW Statistics 21).
2.3.1 Phân tích cụm (Clustering Analysis - CA)
Trong nghiên cứu này, phương pháp phân tích
CA ược lựa chọn là phương pháp phân tích cụm tích
tụ dựa vào phương sai “thủ tục Ward” trong loại
thủ tục phân cụm thứ bậc (Hierarchical clustering).
Theo thủ tục Ward thì ta sẽ tính giá trị trung bình tất
cả các biến cho từng cụm một; sau ó, tính khoảng
cách Euclid bình phương (Squared Euclidean
distance) giữa c phần tử trong cụm với giá trị trung
bình của cụm, rồi lấy tổng tất cả các khoảng cách
bình phương này. Ở mỗi giai oạn tích tụ, hai cụm
phần tăng trong tổng các khoảng cách bình phương
trong nội bộ cụm nếu kết hợp với nhau nhỏ nhất
sẽ ược kết hợp. Cụ thể hơn, trong phương pháp này
Hình 1: Sơ ồ vị trí quan trắc huyện Tân Thành, tỉnh Bà Rịa Vũng Tàu
lOMoARcPSD|50205883
132
khoảng cách hoặc sự giống nhau giữa 2 nhóm A
B ược xem là khoảng cách nh nhất giữa 2 iểm A
B:
D(A,B) = Range{d(xi,xj),với xi є A và xj є B}(1)
Khi d(xi,xj) khoảng cách Euclid bình phương
trong công thức (1). Tại mỗi bước khoảng cách ược
tìm thấy từng cặp nhóm 2 nhóm khoảng cách
nhỏ nhất (giống nhau nhiều nhất) ược gộp lại. Sau
khi 2 nhóm ược gộp lại, tiếp tục lặp lại các bước tiếp
theo: khoảng cách giữa tất cả các cặp nhóm ược tính
lại lần nữa, cặp khoảng cách ngắn nhất ược
gộp vào nhóm ơn. Kết quả của việc phân nhóm cấu
trúc ược biểu diễn bằng thị - biểu hình y
(Nguyễn Hải Âu ctv., 2014).
2.3.2 Phân tích biệt số (Discriminant Analysis
- DA)
Phương pháp phân tích phân biệt (DA) kỹ
thuật phân tích dữ liệu khi biến phụ thuộc biến
phân loại và biến ộc lập là biến ịnh lượng. Mục tiêu
của phân tích biệt số là việc xây dựng các hàm phân
tích phân biệt hay một m tuyến nh kết hợp các
biến ộc lập sao cho phân biệt các biểu hiện của
biến phụ thuộc, nghiên cứu sự tồn tại khác biệt có ý
nghĩa giữa các nhóm xét theo biến ộc lập, xác ịnh
biến ộc lập nào là nguyên nhân chính gây ra sự khác
biệt giữa các nhóm phân loại các quan sát này vào
trong một nhóm nhất ịnh dựa vào các giá trị của biến
ộc lập. Mô hình phân tích biệt số có dạng tuyến tính
như sau:
D = b0 + b1X1 + b2X2 + …+ bkXk (2)
Trong ó, D là biệt số, b là hsố hay trọng số phân
biệt và X là biến ộc lập. Các hệ số hay trọng số ược
tính toán sao cho các nhóm các giá trị của hàm
phân biệt (biệt số D) khác nhau càng nhiều càng tốt.
Điều này xảy ra khi tỉ lệ của tổng các lệch nh
phương của biệt số giữa các nhóm so với tổng các ộ
lệch bình phương của biệt số trong nội bộ nhóm ạt
cực ại (Hoàng Trọng và ctv., 2008).
3 KẾT QUẢ VÀ THẢO LUẬN
3.1 Sự biến thiên theo không gian các cụm
giếng
Dựa vào biểu phân tích cụm (Hình 2) kết
quả phân tích phân bố các cụm giếng quan trắc
(Bảng 2) cho thấy chất lượng nước của 18 giếng
quan trắc ược phân thành 3 cụm như sau:
Cụm 1 gồm 13 giếng với giá trị trung bình
NO
3
-
vượt trội hơn so với hai cụm còn lại, hiện
tượng này có thể kết luận rằng các giếng thuộc cụm
1 chịu ảnh hưởng khá lớn bởi hoạt ộng nông nghiệp
diễn ra xung quanh khu vực quan trắc. Các giếng
NB2C, NB2A, NB1B, VT2B, VT2A, NB1A
QT11 nằm vị trí gần khu vực trồng cây công
nghiệp; giếng VT6 tọa lạc khu vực nuôi trồng thủy
sản, chịu nh hưởng bởi các chất hữu từ lượng
thức ăn tàn trong quá trình nuôi trồng ; giếng
NB4 nằm ngay khu vực bãi rác Tóc Tiên với lượng
hữu phân hủy lớn. Tuy nhiên, giá trị trung NO
3
-
ạt 0,827 mg/l vẫn nằm trong quy chuẩn cho phép
(<15 mg/l) do ó chất lượng nước thuộc các giếng ở
cụm 1 vẫn còn khá tốt (Yang, et al., 2015).
Cụm 2 gồm 2 giếng có giá trị Cr
6+
và Cu
2+
cao hơn so với hai cụm còn lại. Khả năng khá lớn
khi nhận ịnh rằng cụm 2 bị ảnh hưởng bởi quá trình
xả thải của các khu công nghiệp bởi vị trí hiện diện
của hai giếng (NB3B, QT5A) thuộc cụm 2 là rất gần
với các khu công nghiệp nặng (Mỹ Xuân B1).
Cụm 3 gồm 3 giếng mang giá trị Mg
2+
, Na
+
, K
+
,
ộ cứng, TDS, Cl
-
, F
-
, SO
4
2-
và Fe
2+
vượt trội hơn rất
nhiều so với hai cụm ầu tiên. Đặc biệt, giá trị Cl
-
Fe
2+
còn vượt cả quy chuẩn cho phép với Cl
-
vượt
gấp 2,4 lần và Fe
2+
vượt 5,9 lần cho thấy rằng cụm 3
có khả năng chịu nh hưởng của quá trình xâm nhập
mặn lên các giếng vtrí gần bờ biển cũng ngần
các ranh mặn.
lOMoARcPSD|50205883
Hình 2: Biểu ồ phân tích cụm
Bảng 2: Bảng phân bố các cụm giếng quan trắc
Thông số
quan trắc
Đơn vị
Cụm 1
Cụm 2
Cụm 3
NB2C, NB2A, NB3A, NB1B, NB4, VT2B,
NB1A, VT2A, VT6, QT5B, NB2B, QT11, QT7B
Giá trị trung bình
NB3B,
QT5A
VT4B,
QT7A, VT4A
17,3 14,7 179,358
9,9 2,250 89,072
69,6 7,340 681,878
5,9 0,935 53,183
54,17 42,715 96,615
6,25 4,76 5,66
96,21 13,75 407,83
216 102 1041
90,24 27,47 608,55
0,275 0,105 0,59
0,827 0,566 0,363
48,28 36,98 72,84
0,009 0,047 0,010
0,027 0,102 0,044
7,229 1,390 29,517
lOMoARcPSD|50205883
134
yếu liên hệ chặt chẽ với hàm thứ nhất, cụ thể
yếu tố nhiễm mặn (Bảng 3 và 4).
Giá trị Eigenvalue tương ứng của hàm 1 lớn
chiếm 99,1% phương sai giải thích kết quả. Hệ số
Canonical tương ứng 0,999, bình phương của hệ
số y (0,999)
2
= 0,998 cho thấy 99,8% phương
sai của biến phụ thuộc Cụm ược giải thích bởi
hình DA (Bảng 5).
Bảng 5: Bảng Hệ số Eigenvalue trong DA
Hàm Eigenvalue % Phương sai % Phương sai trích Tương quan Canonical
1 367.556 99,1 99,1 0,999
2 3.350 0,9 100 0,878
Bảng 3: Ma trận cấu trúc trong DA
2
0,1
29
0,0
21
-
0,1
13
0,0
18
0,0
04
0,0
83
0,0
28
0,0
33
-
0,00
1
0,0
01
0,43
5
*
-
0,08
8
*
0,08
1
*
0,06
0
*
0,05
2
*
Bảng 4: Hệ số hàm phân biệt
NO3-
TDS
Cu
2+
Mg
2+
Cl
-
Độ cứng
Na
+
K
+
Ca
2+
HCO
3
-
pH
Cr
6+
SO42-
F
-
Fe
2+
Hàm số
1
0,241
*
0,150
*
0,138
*
0,094
*
0,091
*
0,089
*
0,077
*
0,064
*
0,044
*
0,015
*
-0,017
-0,008 0,025
0,023
0,007
Ca
2+
Mg
2+
Na
+
K
+
HCO
3
-
pH
Độ
cứng
TDS
Cl
-
F
-
SO42-
(Consta
nt)
Nông
nghiệp
0,
85
2
-
4,6
64
0,
140
-
0,7
35
-
0,2
51
62,
914
-
0,
67
1
0,
09
5
0,
29
3
75,
844
0,157 -
201,036
CỤM
0,900
-2,355
0,003 -2,663
-0,303 50,306
-0,677 0,156
0,218
55,220
0,111 -
127,917
Nhiễm
mặn
-
1,06
0
54,6
13 -
6,70
3
16,9
33 -
1,65
9
16,675
1,466
-1,108
2,626
273,6
52
0,5
24 -
1093,67
2
Công nghiệp
lOMoARcPSD|50205883
Biểu phân tán của các nhóm ảnh hưởng ến chất
lượng nước dưới ất (Nông nghiệp, Công nghiệp
Xâm nhập mặn) ược diễn tả theo hàm thứ nhất
hàm thứ hai của biểu ồ. Có thể thấy rõ rằng nhóm 3
(Xâm nhập mặn) trị số cao nhất theo m thứ nhất
so với hai nhóm còn lại, m thứ nhất chủ yếu gắn
với các biến (TDS, Mg
2+
, Cl
-
, ộ cứng, Na
+
, K
+
, Ca
2+
,
SO
4
-
) n thể thấy rằng nhóm 3 ược phân biệt một
cách ràng theo các biến này. Những giếng mang
giá trị cao m thứ hai nguy bị nhiễm mặn
nhiều hơn so với các giếng còn lại (Hình 3).
Biểu vị trí Territorial Map (Hình 4) biểu diễn
giá trị trung tâm (centroid) của mỗi nhóm. Ranh giới
của các nhóm ược thể hiện bằng các con số 1, 2, 3
tương ứng với cụm Nông nghiệp, Công nghiệp
Xâm nhập mặn. thể thấy rằng trung tâm của
nhóm 3 (Xâm nhập mặn) nằm tại vị trí n ịnh ít
bị lẫn so với hai nhóm còn lại, dấu hiệu y cho thấy
nhóm 3 mang tính ại diện cao nhất cho bộ dữ liệu
quan trắc với ba giếng ặc trưng cho yếu tố nhiễm
mặn (VT4A, VT4BQT7A) của chất lượng nước
dưới ất năm 2012.
Hình 4: Biểu ồ thể hiện giá trị trung tâm của
Hình 3: Sự phân bố các cụm phân biệt
mỗi nhóm
Sự nhiễm mặn thể hiện hàm lượng cao của
TDS cũng như xu hướng tập trung cao các ion Cl
-
,
SO
4
2-
, Na
+
, K
+
, Mg
2+
một số muối sắt hiện hữu.
Bên cạnh ó, vào mùa khô, lượng nước bổ cập cho
tầng chứa nước là rất ít, hầu như không xảy ra mạnh
mẽ nmùa mưa. Một nguyên nhân nữa là do mực
nước các vùng ng hồ giảm gây khó khăn trong
việc khai thác, do ó tần suất khai thác nước dưới ất
phục vụ cho sinh hoạt cũng như các hoạt ng nông
nghiệp, ng nghiệp diễn ra với cường lớn, góp
phần gây suy giảm chất lượng và cạn kiệt nước dưới
ất. VT4A, VT4B, QT7A các giếng quan trắc
quan hệ thủy lực với nước sông, ặc iểm tầng
chứa nước nằm nông, lớp ch nước nguồn gốc
sông - biển và nằm ngay ranh giới mặn nhạt, theo
quy luật thì mùa mưa bị ẩy ra biển và mùa khô xâm
nhập mặn sẽ lại tiến u vào ất liền gây nh hưởng
ến chất lượng nước dưới ất khu vực nghiên cứu.
Giá trị trung tâm
lOMoARcPSD|50205883
136
3.3 Sự phân bố các ion chính
Hầu hết các giếng quan trắc ều phân bố khu
vực thuộc loại nước Ca
2+
- Mg
2+
, Na
+
- K
+
loại
nước Cl
-
- SO
4
2-
(Hình 5). Hơn thế nữa, các giếng
quan trắcn có xu hướng trội hơn nghiêng về loại
nước Cl
-
- SO
4
2-
, ặc biệt một số giếng quan trắc còn
mang hàm lượng TDS rất lớn (VT4A, VT4B). Từ ó
thể giả ịnh ược rằng kết quả trên thể do sự
hạ thấp mực nước dưới ất vào mùa khô và quá trình
nhiễm mặn ã ảnh hưởng nhất ịnh ến các giếng quan
trắc phân bố ở khu vực gần bờ biển.
4 KẾT LUẬN
Kỹ thuật thống a biến ược ứng dụng trong
nghiên cứu này như một công cụ hữu hiệu trong việc
phân tích giải thích chất ợng nước, giúp các nhà
quản lý hiểu hơn về sự biến ổi theo không gian
của chất lượng nước dưới ất, từ ó ưa ra ược các giải
pháp nhằm quản lý bền vững nguồn tài nguyên nước.
Kết quả phân tích cụm (CA) ã nhóm 18 giếng quan
trắc thành 3 cụm ặc trưng cho chất lượng nước của
các giếng quan trắc (hoạt ộng nông nghiệp, hoạt ng
công nghiệp nhiễm mặn) dựa vào ặc tính tương
ồng của bộ dữ liệu. Phân tích biệt số (DA) tiếp tục
kiểm ịnh kết quả phân tích cụm bằng cách xác nh
các biến phân biệt ý nghĩa giữa các cụm, giải
thích ược 99,8% phương sai các biến và chỉ ra nhóm
3 (VT4A, VT4B, QT7A) mang tính ại diện cao nhất
cho bộ dữ liệu ban ầu.
LỜI CẢM ƠN
Nghiên cứu này ược thực hiện bởi sự hỗ trợ dữ
liệu từ Sở Tài nguyên Môi trường tỉnh Rịa
Vũng Tàu.
TÀI LIỆU THAM KHẢO
Hoàng Trọng và Chu Nguyễn Mộng Ngọc., 2008.
Phân tích dữ liệu nghiên cứu với SPSS. Nhà xuất
bản Hồng Đức, TP.HCM, 179 trang.
Kura, N. U., Ramli, M. F., Sulaiman, W. N. A.,
Ibrahim, S., Aris, A. Z., and Mustapha, A., 2013.
Evaluation of factors influencing the groundwater
chemistry in a small tropical island of Malaysia.
International journal of environmental research and
public health. 10: 1861-1881.
Mavukkandy, M. O., Karmakar, S., and Harikumar,
P., 2014. Assessment and rationalization of water
quality monitoring network: a multivariate
statistical approach to the Kabbini River (India).
Environmental Science and Pollution Research.
21: 10045-10066.
Hình 5: Biểu ồ phân bố các ion chính
lOMoARcPSD|50205883
Nguyễn Hải Âu và Vũ Văn Nghị, 2014. Bước ầu áp
dụng kỹ thuật phân tích thống kê a biến phân tích
số liệu chất lượng nước lưu vực sông Thị Tính,
tỉnh Bình Dương. Tạp chí Phát triển Khoa học và
Công nghệ của Viện Hàn Lâm Khoa học và Công
nghệ Việt Nam. 52: 190-199.
Shrestha, S. and Kazama, F., 2007. Assessment of
surface water quality using multivariate statistical
techniques: A case study of the Fuji river basin,
Japan. Environmental Modelling & Software. 22:
464-475.
Sở Tài nguyên và Môi trường tỉnh Bà Rịa Vũng Tàu,
2013. Báo cáo “Vận hành mạng quan trắc nước dưới
ất tỉnh Bà Rịa – Vũng Tàu giai oạn 2012 – 2013.
Varol, M. and Şen, B., 2012. Assessment of nutrient and
heavy metal contamination in surface water and
sediments of the upper Tigris River, Turkey. Catena.
92: 1-10.
Yang, Q., Zhang, J., Wang, Y., Fang, Y., and Martín, J.
D., 2015. Multivariate statistical analysis of
hydrochemical data for shallow ground water quality
factor identification in a coastal aquifer.
Polish Journal of Environmental Studies. 24:
102-11
| 1/9

Preview text:

lOMoARcPSD| 50205883
DOI:10.22144/ctu.jsi.2017.061
ỨNG DỤNG PHƯƠNG PHÁP PHÂN TÍCH CỤM VÀ PHÂN TÍCH BIỆT SỐ
ĐÁNH GIÁ NHIỄM MẶN TẦNG CHỨA NƯỚC PLEISTOCEN Ở
HUYỆN TÂN THÀNH, TỈNH BÀ RỊA - VŨNG TÀU
Phan Nguyễn Hồng Ngọc1, Hoàng Thị Thanh Thủy1 và Nguyễn Hải Âu2
1Trường Đại học Tài nguyên và Môi trường Thành phố Hồ Chí Minh
2Viện Môi trường và Tài nguyên, Đại học Quốc gia Thành phố Hồ Chí Minh
Thông tin chung:
monitoring wells in April 2012. The water quality parameters selected for
Ngày nhận bài: 28/07/2017
statistical analysis include pH, hardness, TDS, Cl-, F-, NO - 2- 3 , SO4 , Cr6+, Cu2+,
Ngày nhận bài sửa: 19/09/2017 -
Ca2+, Mg2+, Na+, K+, HCO3 and Fe2+.
Ngày duyệt ăng: 26/10/2017
CA groups the wells into three distinct clusters related to agricultural activities,
industry, and salinization. DA revealed the existence of significant differences
Title: Application of cluster
between these clusters, built a function discriminant analysis and determined
analysis and discriminant
group which causes difference among clusters in the data set. The parameters
analysis assess salinity
representing salinity intrusion (TDS, Mg2+, Cl-, Hardness, Na+, K+, Ca2+, and 2-
intrusion in Pleistocene
SO4 ) accounted for 99.8% of the variance of dependent variables explained by aquifer of Tan the DA model.
Thanh district, Ba Ria - Vung
The results showed that cluster analysis and discriminant analysis are the Tau province, Vietnam
effective statistical methods in the clustering of salt intrusion. TÓM TẮT
Từ khóa: Nước dưới ất, phân tích cụm,
Phương pháp phân tích cụm (Cluster Analysis - CA) và phân tích biệt số
phân tích biệt số, xâm nhập
(Discriminant Analysis - DA) ã ược sử dụng nhằm ánh giá nhiễm mặn nước mặn
dưới ất ở khu vực huyện Tân Thành, tỉnh Bà Rịa – Vũng Tàu. Các mẫu nước
dưới ất ược thu thập từ 18 giếng quan trắc vào tháng 4 năm 2012. Các thông
số chất lượng nước ược lựa chọn trong kỹ thuật phân tích thống kê trên bao
Keywords:
gồm: pH, ộ cứng, TDS, Cl-, F-, NO - 2-
3 , SO4 , Cr6+, Cu2+, Ca2+, Mg2+, Na+, K+,
Cluster analysis, discriminant HCO - 3 và Fe2+. analysis, groundwater, salinity intrusion
Kết quả phân tích CA nhóm bộ dữ liệu quan trắc thành ba cụm giếng có liên ABSTRACT
quan ến hoạt ộng nông nghiệp, hoạt ộng công nghiệp và sự nhiễm mặn. Phân
tích biệt số ược thực hiện nhằm nghiên cứu sự tồn tại khác biệt có ý nghĩa giữa

Cluster Analysis (CA) and
các cụm, xây dựng hàm phân tích phân biệt và xác ịnh cụm gây ra sự khác biệt Discriminant Analysis (DA)
giữa các nhóm cụm. Các thông số ại diện cho yếu tố xâm nhập mặn (TDS, Mg2+,
were applied to assess salinity
Cl-, ộ cứng, Na+, K+, Ca2+, SO 2-
4 ) chiếm 99,8% phương sai các biến phụ thuộc
intrusion of groundwater in the
Trích dẫn: Phan Nguyễn Hồng Ngọc, Hoàng Thị Thanh Thủy và Nguyễn Hải Âu, 2017. Ứng dụng phương
pháp phân tích cụm và phân tích biệt số ánh giá nhiễm mặn tầng chứa nước pleistocen ở huyện Tân Thành,
tỉnh Bà Rịa - Vũng Tàu. Tạp chí Khoa học Trường Đại học Cần Thơ. Số chuyên ề:
Môi trường và Biến ổi khí hậu (2): 129-136.
Pleistocene aquifer in Tan
cụm ược giải thích bởi mô hình DA.
Thanh district, Ba Ria – Vung
Kết quả nghiên cứu ã cho thấy phân tích cụm và biệt số là những phương pháp Tau province. Groundwater
thống kê hiệu quả trong phân vùng xâm nhập mặn.
samples were collected from 18 lOMoARcPSD| 50205883 1 GIỚI THIỆU
ịnh dựa vào giá trị của các biến ộc lập.
Phân tích thống kê a biến
Trong những năm gần ây, các phương pháp phân tích cụm và phân tích
(MSA - Multivariate Statistics
phân biệt ã ược sử dụng rộng rãi trong các ứng dụng môi trường, bao gồm
Analysis) bao gồm các kỹ thuật
các ánh giá quan trắc diễn biến chất lượng nước ngầm, nước mặt, kiểm tra
thống kê khác nhau, chẳng hạn
kết quả các mô hình mô phỏng chất lượng nước theo không gian và thời như phân tích cụm (CA -
gian, xác ịnh các yếu tố hóa học liên quan ến các iều kiện thủy văn, và ánh
Cluster Analysis) và phân tích
giá các chỉ thị chất lượng môi trường. Ở Mỹ và các nước châu Âu như Pháp,
biệt số (DA - Discriminant
Thổ Nhĩ Kỳ (Varol et al., 2012) và các quốc gia ở châu Á như Nhật Bản
Analysis - DA), phân tích nhân
(Shrestha et al., 2007), Malaysia (Kura et al., 2013), Ấn Độ (Mavukkandy
tố (FA -Factor Analysis ), phân
et al., 2014), Trung Quốc (Yang et al., 2015), các nghiên cứu này ã ứng
tích thành phần chính (PCA -
dụng nhiều phương pháp thống kê a biến ánh giá chất lượng nước mặt, nước Principal Component
dưới ất ở các lưu vực sông dựa vào mối quan hệ giữa các thông số o ạc với
Analysis),… Các phương pháp
các ặc iểm nguồn thải, ề xuất ược các thông số ặc trưng chất lượng nước
này giúp giải thích các ma trận
của lưu vực ể giám sát và quản lí hiệu quả.
dữ liệu phức tạp ể hiểu rõ hơn
Ở Việt Nam, các kĩ thuật thống kê a biến cũng ược sử dụng rộng rãi
về chất lượng nước, cho phép
trong nhiều lĩnh vực khác nhau như tâm lý, kinh tế, xã hội, kỹ thuật trong
xác ịnh các nhân tố hoặc nguồn
ó có lĩnh vực môi trường. Các nghiên cứu trong lĩnh vực môi trường chủ
ảnh hưởng ến chất lượng nước
yếu sử dụng phương pháp phân tích hồi quy tuyến tính ể xử lí các số liệu
và cung cấp một công cụ có giá
phân tích thí nghiệm, kiểm ịnh thông số mô hình mô phỏng. Phân tích ánh
trị ể quản lý và khai thác sử
giá chất lượng nước chỉ dựa vào phương pháp so sánh với qui chuẩn cho dụng tài nguyên nước.
phép, phân vùng dựa vào chỉ số chất lượng nước (WQI) và mô hình toán,
Một trong những thuận lợi
chưa có nghiên cứu nào sử dụng các kĩ thuật phân tích thống kê a biến ánh
chính của những kỹ thuật này
giá chất lượng nước một cách ầy ủ, riêng biệt.
là khả năng phân tích dữ liệu
Huyện Tân Thành ã và ang trở thành một trong ba ịa phương có nền
lớn và phức tạp, có nhiều biến
kinh tế phát triển bậc nhất tỉnh Bà Rịa –
và nhiều ơn vị thí nghiệm.
Vũng Tàu, là nơi tập trung nhiều
khu công nghiệp nhất của tỉnh. Nhu cầu sử dụng nước trên ịa bàn huyện là
Những phương pháp này ôi khi
khá lớn ể phục vụ phát triển kinh tế, trong khi ó các nguồn khai thác nước
tạo ra các biến mới bằng cách
mặt từ sông hồ không áp ứng nhu cầu ó. Theo số liệu iều tra năm
giảm số lượng của các biến ban 2012 từ
Sở Tài Nguyên và Môi trường tỉnh Bà Rịa
ầu trong việc so sánh và giải
- Vũng Tàu thì tổng lưu lượng
khai thác nước dưới ất trung bình
thích các dữ liệu. Phân tích cụm (CA) là phương pháp
18.608.430 m3/năm, trong ó cấp nước sinh hoạt là 13.174.310m3/năm và
cho sản xuất là 5.434.120 m3/năm, nước ược khai thác chủ yếu trong tầng
phân loại các ối tượng hay các
biến sao cho các ối tượng trong
chứa nước lỗ hổng các trầm tích Pleistocen. Tầng chứa nước lỗ hổng
Pleistocen ược tạo thành từ ất á hạt thô nằm dưới hệ tầng Củ Chi, hệ tầng
cùng một cụm xét theo các ặc
Thủ Đức và hệ tầng Trảng Bom với các khoáng vật chính: Fluorit
tính ược chọn ể phân tích. Phân -apatit,
felspat, thạch cao, turmalin, montmorilonit, ilmenit và một số tạp chất khác.
tích phân biệt (DA) là phương
Hai nguyên nhân chính ảnh hưởng ến chất lượng nước dưới ất ở khu vực
pháp phân tích dữ liệu khi biến
nghiên cứu là do phía Tây huyện Tân Thành nằm dọc theo sông Thị Vải và
phụ thuộc là biến phân loại và
hoạt ộng khai thác nước dưới ất từ các trạm cấp nước lớn (Phú Mỹ
biến ộc lập là biến ịnh lượng. - Mỹ
Phân tích phân biệt òi hỏi phải
Xuân, Tóc Tiên) và nhỏ lẻ thuộc ịa bàn; một số giếng có ộ tổng khoáng hóa
tăng cao cho thấy chất lượng nước dưới ất có khả năng chịu sự tác ộng của
biết trước số nhóm và các ối
quá trình biên mặn lấn sâu vào ất liền và hoạt ộng phát triển kinh tế
tượng trong mỗi nhóm trước - xã hội trên lưu vực.
khi tiến hành phân tích, xây
dựng hàm phân tích phân biệt,
Trong nghiên cứu này, các thông số lí hóa của chất lượng nước dưới ất
nghiên cứu sự tồn tại khác biệt
trong tầng chứa nước Pleistocen khu vực huyện Tân Thành, tỉnh Bà Rịa –
có ý nghĩa giữa các nhóm, xác
Vũng Tàu ược tập trung phân tích bằng các phương pháp thống kê a biến
ịnh biến ộc lập là nguyên nhân
(CA và DA). Kết quả phân tích cho phép ánh giá thông tin về sự tương ồng
lớn nhất gây ra sự khác biệt
trong các trạm quan trắc khác nhau, từ ó xác ịnh các thông số chất lượng
giữa các nhóm và phân loại các
nước ặc trưng theo không gian, tác ộng của các nguồn ô nhiễm trên lưu vực
quan sát vào một nhóm nhất ến chất lượng nước. 130 lOMoARcPSD| 50205883
2 TÀI LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Mô tả vùng nghiên cứu
Huyện Tân Thành thuộc tỉnh Bà Rịa – Vũng Tàu, phía Đông giáp huyện
Châu Đức, phía Tây giáp huyện Cần Giờ và thành phố Vũng Tàu, phía Nam
giáp thành phố Bà Rịa và phía Bắc giáp huyện Long Thành, tỉnh Đồng Nai.
Diện tích tự nhiên (33.825 ha), dân số trung bình (137.334 người). Mùa khô
kéo dài từ tháng 12 ến tháng 4 năm sau, có nền nhiệt ộ trung bình hàng năm
cao (26,3oC) và hầu như không thay ổi nhiều trong năm. Mùa mưa bắt ầu
từ tháng 5 ến tháng 11, lượng mưa phân bố ều trong năm (trung bình 1356.5 mm/năm).
2.2 Tài liệu nghiên cứu
Excel 2013 (Microsoft Office). Các phân tích CA,
Trong bài báo này, 15 thông số chất lượng nước DA ược xử lí bằng phần mềm SPSS
(Ca2+, Mg2+, Na+, K+, HCO3-, pH, ộ cứng, TDS, Cl-, (PASW Statistics 21). F-, NO - 2-
3 , SO4 , Cr6+, Cu2+ và Fe2+) từ 18 giếng quan
trắc chất lượng nước dưới ất trên ịa bàn huyện Tân
2.3.1 Phân tích cụm (Clustering Analysis - CA)
Thành ược Sở Tài nguyên và Môi trường tỉnh Bà Rịa
Trong nghiên cứu này, phương pháp phân tích
– Vũng Tàu thực hiện vào mùa khô năm 2012
CA ược lựa chọn là phương pháp phân tích cụm tích
(NB2C, NB2A, NB3A, NB1B, NB4, VT2B, NB1A,
tụ dựa vào phương sai là “thủ tục Ward” trong loại
VT2A, VT6, QT5B, NB2B, QT11, QT7B, NB3B,
thủ tục phân cụm thứ bậc (Hierarchical clustering). QT5A, VT4B, QT7A,
Theo thủ tục Ward thì ta sẽ tính giá trị trung bình tất
VT4A) ược lựa chọn xử lý và ánh giá. Vị trí các
cả các biến cho từng cụm một; sau ó, tính khoảng
giếng quan trắc ược trình bày trong sơ ồ vị trí quan
cách Euclid bình phương (Squared Euclidean trắc ở Hình 1.
distance) giữa các phần tử trong cụm với giá trị trung
2.3 Phương pháp phân tích thống kê a biến
bình của cụm, rồi lấy tổng tất cả các khoảng cách
và xử lý số liệu
bình phương này. Ở mỗi giai oạn tích tụ, hai cụm có
Tất cả các tính toán toán học và thống kê ược
phần tăng trong tổng các khoảng cách bình phương
thực hiện bằng cách sử dụng phần mềm
trong nội bộ cụm nếu kết hợp với nhau là nhỏ nhất
sẽ ược kết hợp. Cụ thể hơn, trong phương pháp này
Hình 1: Sơ ồ vị trí quan trắc huyện Tân Thành, tỉnh Bà Rịa – Vũng Tàu lOMoARcPSD| 50205883
khoảng cách hoặc sự giống nhau giữa 2 nhóm A và
3 KẾT QUẢ VÀ THẢO LUẬN
B ược xem là khoảng cách nhỏ nhất giữa 2 iểm A và
3.1 Sự biến thiên theo không gian các cụm B: giếng
D(A,B) = Range{d(xi,xj),với xi є A và xj є B}(1)
Dựa vào biểu ồ phân tích cụm (Hình 2) và kết
Khi d(xi,xj) là khoảng cách Euclid bình phương
quả phân tích phân bố các cụm giếng quan trắc
trong công thức (1). Tại mỗi bước khoảng cách ược
(Bảng 2) cho thấy chất lượng nước của 18 giếng
tìm thấy từng cặp nhóm và 2 nhóm có khoảng cách
quan trắc ược phân thành 3 cụm như sau:
nhỏ nhất (giống nhau nhiều nhất) ược gộp lại. Sau
Cụm 1 gồm 13 giếng với giá trị trung bình
khi 2 nhóm ược gộp lại, tiếp tục lặp lại các bước tiếp
NO - vượt trội hơn so với hai cụm còn lại, hiện
theo: khoảng cách giữa tất cả các cặp nhóm ược tính 3
tượng này có thể kết luận rằng các giếng thuộc cụm
lại lần nữa, và cặp có khoảng cách ngắn nhất ược
1 chịu ảnh hưởng khá lớn bởi hoạt ộng nông nghiệp
gộp vào nhóm ơn. Kết quả của việc phân nhóm cấu
diễn ra xung quanh khu vực quan trắc. Các giếng
trúc ược biểu diễn bằng ồ thị - biểu ồ hình cây
NB2C, NB2A, NB1B, VT2B, VT2A, NB1A và
(Nguyễn Hải Âu ctv., 2014).
QT11 nằm ở vị trí gần khu vực trồng cây công
2.3.2 Phân tích biệt số (Discriminant Analysis
nghiệp; giếng VT6 tọa lạc ở khu vực nuôi trồng thủy - DA)
sản, chịu ảnh hưởng bởi các chất hữu cơ từ lượng
thức ăn tàn dư trong quá trình nuôi trồng ; giếng
Phương pháp phân tích phân biệt (DA) là kỹ
NB4 nằm ngay khu vực bãi rác Tóc Tiên với lượng
thuật phân tích dữ liệu khi biến phụ thuộc là biến
hữu cơ phân hủy lớn. Tuy nhiên, giá trị trung NO -
phân loại và biến ộc lập là biến ịnh lượng. Mục tiêu 3
ạt 0,827 mg/l vẫn nằm trong quy chuẩn cho phép
của phân tích biệt số là việc xây dựng các hàm phân
(<15 mg/l) do ó chất lượng nước thuộc các giếng ở
tích phân biệt hay một hàm tuyến tính kết hợp các
cụm 1 vẫn còn khá tốt (Yang, et al., 2015).
biến ộc lập sao cho phân biệt rõ các biểu hiện của
biến phụ thuộc, nghiên cứu sự tồn tại khác biệt có ý
Cụm 2 gồm 2 giếng có giá trị Cr6+ và Cu2+
nghĩa giữa các nhóm xét theo biến ộc lập, xác ịnh
cao hơn so với hai cụm còn lại. Khả năng khá lớn
biến ộc lập nào là nguyên nhân chính gây ra sự khác
khi nhận ịnh rằng cụm 2 bị ảnh hưởng bởi quá trình
biệt giữa các nhóm và phân loại các quan sát này vào
xả thải của các khu công nghiệp bởi vị trí hiện diện
trong một nhóm nhất ịnh dựa vào các giá trị của biến
của hai giếng (NB3B, QT5A) thuộc cụm 2 là rất gần
ộc lập. Mô hình phân tích biệt số có dạng tuyến tính
với các khu công nghiệp nặng (Mỹ Xuân B1). như sau:
Cụm 3 gồm 3 giếng mang giá trị Mg2+, Na+, K+, 2- ộ cứng, TDS, Cl- D = b
, F-, SO và Fe2+ vượt trội hơn rất 0 + b1X1 + b2X2 + …+ bkXk (2) 4
nhiều so với hai cụm ầu tiên. Đặc biệt, giá trị Cl- và
Trong ó, D là biệt số, b là hệ số hay trọng số phân
Fe2+ còn vượt cả quy chuẩn cho phép với Cl- vượt
biệt và X là biến ộc lập. Các hệ số hay trọng số ược
gấp 2,4 lần và Fe2+ vượt 5,9 lần cho thấy rằng cụm 3
tính toán sao cho các nhóm có các giá trị của hàm
có khả năng chịu ảnh hưởng của quá trình xâm nhập
phân biệt (biệt số D) khác nhau càng nhiều càng tốt.
mặn lên các giếng có vị trí gần bờ biển cũng như gần
Điều này xảy ra khi tỉ lệ của tổng các ộ lệch bình các ranh mặn.
phương của biệt số giữa các nhóm so với tổng các ộ
lệch bình phương của biệt số trong nội bộ nhóm ạt
cực ại (Hoàng Trọng và ctv., 2008). 132 lOMoARcPSD| 50205883
Hình 2: Biểu ồ phân tích cụm
Bảng 2: Bảng phân bố các cụm giếng quan trắc Cụm 1 Cụm 2 Cụm 3 Thông số Đơn vị
NB2C, NB2A, NB3A, NB1B, NB4, VT2B, NB3B, VT4B, quan trắc
NB1A, VT2A, VT6, QT5B, NB2B, QT11, QT7B
QT5A QT7A, VT4A Giá trị trung bình Ca2+ mg/l 17,3 14,7 179,358 Mg2+ mg/l 9,9 2,250 89,072 Na+ mg/l 69,6 7,340 681,878 K+ mg/l 5,9 0,935 53,183 HCO - 3 mg/l 54,17 42,715 96,615 pH mg/l 6,25 4,76 5,66 Độ cứng mg/l 96,21 13,75 407,83 TDS mg/l 216 102 1041 Cl- mg/l 90,24 27,47 608,55 F- mg/l 0,275 0,105 0,59 NO - 3 mg/l 0,827 0,566 0,363 SO 2- 4 mg/l 48,28 36,98 72,84 Cr6+ mg/l 0,009 0,047 0,010 Cu2+ mg/l 0,027 0,102 0,044 Fe2+ mg/l 7,229 1,390 29,517 lOMoARcPSD| 50205883
Bảng 3: Ma trận cấu trúc trong DA
Bảng 4: Hệ số hàm phân biệt 2 0,1 29 Công nghiệp 0,0 CỤM Nông Nhiễm Hàm số NO 3- 21 Ca2+ nghiệp 0,900 mặn TDS 1 - Mg2+ 0, -2,355 - Cu2+ 0,241* 0,1 Na+ 85 0,003 -2,663 1,06 0,150* 13 Mg2+ K+ 2 -0,303 50,306 0 0,138* 0,0 54,6 Cl- HCO - -0,677 0,156 3 0,094* 18 13 - Độ cứng 0,218 - pH 4,6 0,091* 0,0 55,220 6,70 Na+ Độ 64 0,089* 04 0,111 - 3 K+ cứng 0, 0,077* 0,0 127,917 16,9 Ca2+ TDS 140 33 - 0,064* 83 - HCO - Cl- 3 1,65 0,044* 0,0 0,7 pH F- 9 0,015* -0,017 28 35 16,675 Cr6+ SO 0,0 42- -0,008 0,025 - 1,466 SO (Consta 42- 0,023 33 0,2 -1,108 F- nt) 51 0,007 - 2,626 Fe2+ 0,00 62, 914 273,6 1 - 52 0,0 0, 0,5 01 67 24 - 0,43 1 1093,67 5* 0, 2 - 09 0,08 5 8* 0, 0,08 29 1* 3 0,06 75, 0* 844 0,05 0,157 - 2* 201,036
3.2 Xác ịnh các biến phân biệt có ý nghĩa giữa
yếu có liên hệ chặt chẽ với hàm thứ nhất, cụ thể là các cụm
yếu tố nhiễm mặn (Bảng 3 và 4).
Từ kết quả phân tích DA cho thấy các biến thuộc
Giá trị Eigenvalue tương ứng của hàm 1 lớn và
yếu tố nhiễm mặn (TDS, Mg2+, Cl-, ộ cứng, Na+, K+,
chiếm 99,1% phương sai giải thích kết quả. Hệ số Ca2+, SO 2-
4 ) chiếm ưu thế hệ số chuẩn hóa, hệ số
Canonical tương ứng là 0,999, bình phương của hệ
chuẩn hóa càng lớn thì óng góp nhiều vào khả năng
số này là (0,999)2 = 0,998 cho thấy 99,8% phương
phân biệt của hàm, các biến này chủ
sai của biến phụ thuộc Cụm ược giải thích bởi mô hình DA (Bảng 5).
Bảng 5: Bảng Hệ số Eigenvalue trong DA Hàm
Eigenvalue % Phương sai % Phương sai trích
Tương quan Canonical 1 367.556 99,1 99,1 0,999 2 3.350 0,9 100 0,878 134 lOMoARcPSD| 50205883
Biểu ồ phân tán của các nhóm ảnh hưởng ến chất
Biểu ồ vị trí Territorial Map (Hình 4) biểu diễn
lượng nước dưới ất (Nông nghiệp, Công nghiệp và
giá trị trung tâm (centroid) của mỗi nhóm. Ranh giới
Xâm nhập mặn) ược diễn tả theo hàm thứ nhất và
của các nhóm ược thể hiện bằng các con số 1, 2, 3
hàm thứ hai của biểu ồ. Có thể thấy rõ rằng nhóm 3
tương ứng với cụm Nông nghiệp, Công nghiệp và
(Xâm nhập mặn) có trị số cao nhất theo hàm thứ nhất
Xâm nhập mặn. Có thể thấy rằng trung tâm của
so với hai nhóm còn lại, vì hàm thứ nhất chủ yếu gắn
nhóm 3 (Xâm nhập mặn) nằm tại vị trí ổn ịnh và ít
với các biến (TDS, Mg2+, Cl-, ộ cứng, Na+, K+, Ca2+,
bị lẫn so với hai nhóm còn lại, dấu hiệu này cho thấy SO -
4 ) nên có thể thấy rằng nhóm 3 ược phân biệt một
nhóm 3 mang tính ại diện cao nhất cho bộ dữ liệu
cách rõ ràng theo các biến này. Những giếng mang
quan trắc với ba giếng ặc trưng cho yếu tố nhiễm
giá trị cao ở hàm thứ hai có nguy cơ bị nhiễm mặn
mặn (VT4A, VT4B và QT7A) của chất lượng nước
nhiều hơn so với các giếng còn lại (Hình 3). dưới ất năm 2012. Giá trị trung tâm
Hình 4: Biểu ồ thể hiện giá trị trung tâm của
Hình 3: Sự phân bố các cụm phân biệt mỗi nhóm
Sự nhiễm mặn thể hiện ở hàm lượng cao của
TDS cũng như xu hướng tập trung cao các ion Cl-, SO 2-
4 , Na+, K+, Mg2+ và một số muối sắt hiện hữu.
Bên cạnh ó, vào mùa khô, lượng nước bổ cập cho
tầng chứa nước là rất ít, hầu như không xảy ra mạnh
mẽ như mùa mưa. Một nguyên nhân nữa là do mực
nước các vùng sông hồ giảm gây khó khăn trong
việc khai thác, do ó tần suất khai thác nước dưới ất
phục vụ cho sinh hoạt cũng như các hoạt ộng nông
nghiệp, công nghiệp diễn ra với cường ộ lớn, góp
phần gây suy giảm chất lượng và cạn kiệt nước dưới
ất. VT4A, VT4B, QT7A là các giếng quan trắc có
quan hệ thủy lực với nước sông, có ặc iểm là tầng
chứa nước nằm nông, lớp cách nước có nguồn gốc
sông - biển và nằm ngay ranh giới mặn – nhạt, theo
quy luật thì mùa mưa bị ẩy ra biển và mùa khô xâm
nhập mặn sẽ lại tiến sâu vào ất liền gây ảnh hưởng
ến chất lượng nước dưới ất khu vực nghiên cứu. lOMoARcPSD| 50205883
3.3 Sự phân bố các ion chính
Hầu hết các giếng quan trắc ều phân bố ở khu
vực thuộc loại nước Ca2+- Mg2+, Na+- K+ và loại nước Cl- - SO 2-
4 (Hình 5). Hơn thế nữa, các giếng
quan trắc còn có xu hướng trội hơn nghiêng về loại nước Cl- - SO 2-
4 , ặc biệt một số giếng quan trắc còn
mang hàm lượng TDS rất lớn (VT4A, VT4B). Từ ó
có thể giả ịnh ược rằng kết quả trên có thể là do sự
hạ thấp mực nước dưới ất vào mùa khô và quá trình
nhiễm mặn ã ảnh hưởng nhất ịnh ến các giếng quan
trắc phân bố ở khu vực gần bờ biển. 4 KẾT LUẬN LỜI CẢM ƠN
Kỹ thuật thống kê a biến ược ứng dụng trong
Nghiên cứu này ược thực hiện bởi sự hỗ trợ dữ
nghiên cứu này như một công cụ hữu hiệu trong việc
liệu từ Sở Tài nguyên và Môi trường tỉnh Bà Rịa –
phân tích và giải thích chất lượng nước, giúp các nhà Vũng Tàu.
quản lý hiểu rõ hơn về sự biến ổi theo không gian
TÀI LIỆU THAM KHẢO
của chất lượng nước dưới ất, từ ó ưa ra ược các giải
pháp nhằm quản lý bền vững nguồn tài nguyên nước.
Hoàng Trọng và Chu Nguyễn Mộng Ngọc., 2008.
Kết quả phân tích cụm (CA) ã nhóm 18 giếng quan
Phân tích dữ liệu nghiên cứu với SPSS. Nhà xuất
trắc thành 3 cụm ặc trưng cho chất lượng nước của
bản Hồng Đức, TP.HCM, 179 trang.
các giếng quan trắc (hoạt ộng nông nghiệp, hoạt ộng
Kura, N. U., Ramli, M. F., Sulaiman, W. N. A.,
công nghiệp và nhiễm mặn) dựa vào ặc tính tương
Ibrahim, S., Aris, A. Z., and Mustapha, A., 2013.
ồng của bộ dữ liệu. Phân tích biệt số (DA) tiếp tục
Evaluation of factors influencing the groundwater
chemistry in a small tropical island of Malaysia.
kiểm ịnh kết quả phân tích cụm bằng cách xác ịnh
International journal of environmental research and
các biến phân biệt có ý nghĩa giữa các cụm, giải public health. 10: 1861-1881.
thích ược 99,8% phương sai các biến và chỉ ra nhóm
Mavukkandy, M. O., Karmakar, S., and Harikumar,
3 (VT4A, VT4B, QT7A) mang tính ại diện cao nhất
P., 2014. Assessment and rationalization of water
cho bộ dữ liệu ban ầu.
quality monitoring network: a multivariate
statistical approach to the Kabbini River (India).
Environmental Science and Pollution Research. 21: 10045-10066. 136
Hình 5: Biểu ồ phân bố các ion chính lOMoARcPSD| 50205883
Nguyễn Hải Âu và Vũ Văn Nghị, 2014. Bước ầu áp
dụng kỹ thuật phân tích thống kê a biến phân tích
số liệu chất lượng nước lưu vực sông Thị Tính,
tỉnh Bình Dương. Tạp chí Phát triển Khoa học và
Công nghệ của Viện Hàn Lâm Khoa học và Công
nghệ Việt Nam. 52: 190-199.
Shrestha, S. and Kazama, F., 2007. Assessment of
surface water quality using multivariate statistical
techniques: A case study of the Fuji river basin,
Japan. Environmental Modelling & Software. 22: 464-475.
Sở Tài nguyên và Môi trường tỉnh Bà Rịa – Vũng Tàu,
2013. Báo cáo “Vận hành mạng quan trắc nước dưới
ất tỉnh Bà Rịa – Vũng Tàu giai oạn 2012 – 2013.
Varol, M. and Şen, B., 2012. Assessment of nutrient and
heavy metal contamination in surface water and
sediments of the upper Tigris River, Turkey. Catena. 92: 1-10.
Yang, Q., Zhang, J., Wang, Y., Fang, Y., and Martín, J.
D., 2015. Multivariate statistical analysis of
hydrochemical data for shallow ground water quality
factor identification in a coastal aquifer.
Polish Journal of Environmental Studies. 24: 102-11