Bài tập lớn "Các phương pháp chọn mẫu trong nghiên cứu công chúng các kĩ thuật, phần mềm xử lí số liệu, dữ liệu nghiên cứu công chúng phổ biến hiện nay"
Tiểu luận môn Công chúng báo chí với đề tài: Các phương pháp chọn mẫu trong nghiên cứu công chúng các kĩ thuật, phần mềm xử lí số liệu, dữ liệu nghiên cứu công chúng phổ biến hiện nay" của các sinh viên nhóm 3 giúp bạn tham khảo và hoàn thành tốt bài tiểu luận của mình đạt kết quả cao.
Môn: Công Chúng Báo Chí- Truyền Thông
Trường: Học viện Báo chí và Tuyên truyền
Thông tin:
Tác giả:
Preview text:
lOMoARcPSD|37752136 lOMoARcPSD|37752136
HỌC VIỆN BÁO CHÍ VÀ TUYÊN TRUYỀNVIỆN BÁO CHÍ ****** BÀI TẬP NHÓM
MÔN: CÔNG CHÚNG BÁO CHÍ ĐỀ BÀI:
CÁC PHƯƠNG PHÁP CHỌN MẪU TRONG NGHIÊN CỨU CÔNG CHÚNG
CÁC KỸ THUẬT, PHẦN MỀM XỬ LÝ SỐ LIỆU, DỮ LIỆU NGHIÊN CỨU
CÔNG CHÚNG PHỔ BIẾN HIỆN NAY Nhóm 3
Nhóm trưởng: Lê Thùy Phương Thành viên: Nguyễn Lệ Thanh Ngô Tuyết Hạnh Nguyễn Mỹ Hạnh Đỗ Bảo Châu Lê Anh Thư Lê Trương Vĩnh Khánh Trần Lê Hương Linh Lê Minh Thảo Nguyễn Yến Dung
Hà Nội, tháng 09 năm 2023 1 lOMoARcPSD|37752136 NỘI DUNG
I. CÁC PHƯƠNG PHÁP CHỌN MẪU TRONG NGHIÊN CỨU CÔNG CHÚNG 1. Khái niệm
Mẫu: là một bộ phận của tổng thể điều tra, được lựa chọn để trực tiếp thu thập thông
tin và có khả năng suy rộng cho tổng thể điều tra đó.
Chọn mẫu: chính là quá trình sử dụng các phương pháp khác nhau nhằm tìm ra được
một tập hợp các đơn vị (nhóm công chúng) mà những đặc trưng và cơ cấu có thể
đại diện cho một tập hợp công chúng lớn hơn.
Cỡ mẫu: là số lượng đơn vị được chọn để điều tra. Cỡ mẫu phụ thuộc vào 5 yếu tố sau:
Khả năng vật chất, tài chính, năng lực
Yêu cầu về độ chính xác
Yêu cầu về số lượng tiêu thức điều tra
Mức độ thuần nhất của tổng thể
Số lượng đơn vị trong tổng thể điều tra 2.
Ưu - Nhược của điều tra chọn mẫu a. Ưu điểm:
Tiết kiệm hơn cả về mặt thời gian & chi phí so với điều tra toàn bộ
Do điều tra ít đơn vị nên có thể mở rộng nội dung điều tra đi sâu nghiên cứu chi tiết
nhiều mặt của hiện tượng
Tài liệu thu được trong điều tra chọn mẫu có độ chính xác cao hơn do giảm được sai số phi chọn mẫu:
Do phạm vi điều tra nhỏ hơn nên được chuẩn bị và kiểm tra kỹ lượng tỉ mỉ
hơn cả trước, trong và sau cuộc điều tra
Do số đơn vị điều tra ít nên cần ít điều tra viên, do đó có điều kiện chọn được
người có trình độ chuyên môn cao.
Dựa trên cơ sở khoa học của lý thuyết xác suất thống kê và quy luật số lớn
nên có thể tính được sai số và độ tin cậy của tài liệu.
Tiến hành nhanh gọn, bảo đảm tính kịp thời của số liệu thống kê. Mặt khác, điều tra
chọn mẫu không đòi hỏi phải có tổ chức lớn, chỉ cần một cơ quan hoặc một nhóm
người cũng có thể tiến hành điều tra được. b. Nhược điểm:
Không cho biết thông tin đầy đủ, chi tiết về từng đơn vị tổng thể, không cho biết quy mô tổng thể.
Do chỉ tiến hành điều tra một số đơn vị rồi dùng kết quả để suy rộng cho toàn bộ
tổng thể nên chắc chắn không tránh khỏi sai số khi suy rộng.
Kết quả điều tra chọn mẫu không thể tiến hành phân nhỏ theo phạm vi và tiêu thức
nghiên cứu như điều tra toàn bộ mà chỉ có thể thực hiện ở một mức độ nhất định tùy
thuộc vào quy mô mẫu và cách rải mẫu. 2 lOMoARcPSD|37752136
c. Các trường hợp vận dụng điều tra chọn mẫu
Sử dụng để thay thế điều tra toàn bộ trong trường hợp đối tượng nghiên cứu cho
phép vừa có thể điều tra toàn bộ vừa có thể điều tra chọn mẫu hoặc với những trường
hợp không cho phép điều tra toàn bộ, hoặc do quy mô điều tra toàn bộ quá lớn, cần
thu thập nhiều chỉ tiêu nhưng không đủ kinh phí và nhân lực để tiến hành điều tra toàn bộ.
Kết hợp với điều tra toàn bộ để mở rộng nội dung điều tra và đánh giá kết quả của điều tra toàn bộ.
Sử dụng để tổng hợp nhanh tài liệu của điều tra toàn bộ phục vụ kịp thời yêu cầu
thông tin cho các đối tượng sử dụng.
Ví dụ: Trong tổng điều tra dân số việc tổng hợp tài liệu đòi hỏi phải có thời gian dài, vì vậy
để kịp thời phục vụ cho công tác lãnh đạo và kế hoạch hoá có thể sử dụng điều tra chọn
mẫu để có được tài liệu một cách nhanh chóng.
Sử dụng trong trường hợp muốn so sánh các hiện tượng với nhau hoặc muốn đưa ra
một nhận định nào đó mà chưa có tài liệu cụ thể (để kiểm tra giả thiết thống kê).
Ví dụ: Sau một thời gian thử nghiệm hai phương pháp giáo dục trẻ em, có ý kiến cho rằng,
phương pháp A tốt hơn phương pháp B. Để kiểm tra giả thiết đó có đúng hay không, người
ta tiến hành chọn 2 đứa trẻ và sẽ cho chúng được đào tạo theo hai phương pháp khác nhau
ở trên. Sau đó, sử dụng phương pháp thống kê phù hợp để kết luận xem liệu có cơ sở nào
để bác bỏ giả thiết đặt ra ở trên hay không.
3. Các phương pháp chọn mẫu a.
Chọn kinh nghiệm và xét đoán (chọn mẫu phi xác suất) Lấy mẫu thuận tiện
Khái niệm: Chọn mẫu thuận tiện là lấy mẫu dựa trên sự thuận lợi hay
tính dễ tiếp cận của đối tượng, ở những nơi mà nhân viên điều tra có
nhiều khả năng gặp được đối tượng. Đặc điểm:
Phương pháp này không quan tâm đến việc: lựa chọn có ngẫu nhiên
hay không, đồng thời rất khó xác định tính đại diện của mẫu.
Sự lựa chọn các đơn vị mẫu mang tính chủ quan của người nghiên
cứu, vì thế độ chính xác và độ tin cậy không cao, ít được sử dụng rộng rãi.
Ưu điểm: Chọn phần tử dựa trên sự thuận tiện, dễ tiếp cận, dễ lấy thông tin. Nhược điểm: 3 lOMoARcPSD|37752136
Không xác định được sai số lấy mẫu và không thể kết luận cho
tổng thể từ kết quả mẫu.
Sử dụng phổ biến khi giới hạn về thời gian và chi phí.
Ứng dụng: Lấy mẫu thuận tiện thường được dùng trong nghiên cứu
khám phá, để xác định ý nghĩa thực tiễn của vấn đề nghiên cứu; hoặc
để kiểm tra trước bảng câu hỏi nhằm hoàn chỉnh bảng; hoặc khi muốn
ước lượng sơ bộ về vấn đề đang quan tâm mà không muốn mất nhiều thời gian và chi phí.
Ví dụ: Nhân viên điều tra có thể chặn bất cứ người nào mà họ gặp ở
trung tâm thương mại, đường phố, cửa hàng,. để xin thực hiện cuộc
phỏng vấn. Nếu người được phỏng vấn không đồng ý thì họ chuyển sang đối tượng khác. Lấy mẫu tích lũy nhanh
Khái niệm: Theo phương pháp này, những đơn vị lấy mẫu (hay phần
tử) ban đầu được lựa chọn bằng cách sử dụng các phương pháp xác
suất, nhưng những đơn vị bổ sung tiếp đó được xác định từ thông tin
được cung cấp bởi các đơn vị lấy mẫu ban đầu. Dù phương pháp xác
suất nào được sử dụng để lựa chọn những đơn vị lấy mẫu ban đầu, thì
toàn bộ mẫu vẫn được coi là mẫu phi xác suất vì những quy nguyên
theo sau được chứa đựng trong mẫu ấy.
Bắt đầu từ một phần tử được chọn lọc nào đó. Sau đó nhờ người này
giới thiệu hoặc định danh những người khác cùng đặc tính như họ để phỏng vấn tiếp. Đặc điểm:
Ưu điểm: Giảm kích thước mẫu và thời gian hao phí
Nhược điểm: Có thể có sai lệch vì những người được giới thiệu
ra thường có một số đặc điểm tương đồng về nhân khẩu học
hay tâm lý, sở thích (chọn mẫu quá nhiều ở 1 nhóm nào đó và
bỏ sót các nhóm mẫu/ quần thể khác). Tuy nhiên, kỹ thuật chọn
mẫu RDS (Respondent driven sampling - Dây chuyền có kiểm
soát) đã khắc phục được hạn chế của phương pháp này thông
qua hình thức chi trả kép: trả tiền cho đối tượng tham gia
nghiên cứu và trả tiền khi họ mời thêm được đối tượng tham
gia nghiên cứu đạt chất lượng. Đồng thời, đối tượng NC cũng
chỉ được mời thêm đối tượng mới với số lượng hạn chế tùy
theo thiết kế của NC, thường là từ 3- 5 đối tượng. Với phương
thức tuyển dụng này và qua vòng tuyển dụng đủ lớn (5 - 7 4 lOMoARcPSD|37752136
vòng) thì mẫu được chọn vào NC sẽ đạt tính đại diện cho quần
thể NC mà không còn phụ thuộc vào đặc tính cá nhân của đối
tượng nghiên cứu đầu tiên.
Ứng dụng: Áp dụng cho các nghiên cứu khá đặc biệt, mẫu khó tìm hoặc khó tiếp cận.
Ví dụ: Quần thể nghiên cứu khó tiếp cận (hard to reach population)
trong lĩnh vực y tế công cộng thường được nhắc đến như: nhóm đối
tượng tiêm chích ma túy, phụ nữ mại dâm, người vô gia cư, nam quan
hệ tình dục đồng tưới hoặc nhóm chuyển giới. Chọn mẫu trong quần
thể “khó tiếp cận” luôn gặp khó khăn do không có khung mẫu (không
có danh sách đối tượng của quần thể) đồng thời các nhóm này chiếm
tỷ lệ nhỏ trong quần thể chung và người bên ngoài khó có thể “xâm
nhập” do nhiều nguyên nhân, trong đó có kỳ thị xã hội. Lấy mẫu phán đoán
Khái niệm: Là phương pháp mà phỏng vấn viên là người tự đưa ra
phán đoán về đối tượng cần chọn vào mẫu, khi xác định các nhóm đối
tượng quan trọng trong quần thể. Từ đó, xác định tỷ lệ chọn mẫu phù
hợp cho các nhóm, với điều kiện các mẫu này có tính đại diện cho tổng thể nghiên cứu. Đặc điểm:
Là phương pháp phổ biến nhất trong nghiên cứu định tính.
Chọn tập hợp những người tham gia dựa theo những tiêu chí có tính
đại diện liên quan tới 1 câu hỏi nghiên cứu.
Cỡ mẫu có thể ấn định hoặc không ấn đinh trước khi thu thập thông
tin vì cỡ mẫu phụ thuộc vào: Nguồn cung cấp thông tin.
Hạn định về thời gian. Mục tiêu nghiên cứu.
Tính đại diện của mẫu phụ thuộc nhiều vào kinh nghiệm và sự hiểu
biết của người tổ chức việc điều tra và cả người đi thu thập dữ liệu. Ưu điểm:
Chọn phần tử dựa trên sự thuận tiện, dễ tiếp cận, dễ lấy thông
tin (giống chọn mẫu thuận tiện), nếu có khả năng hoặc kinh
nghiệm phán đoán tốt sẽ cho mẫu tốt hơn chọn mẫu thuận tiện. 5 lOMoARcPSD|37752136
Nhược điểm: Chỉ áp dụng khi các đặc tính của phần tử được chọn đã khá rõ ràng.
Ứng dụng: Chọn mẫu phán đoán thường được dùng trong điều tra
thăm dò và phỏng vấn sâu.
Ví dụ: muốn tìm hiểu thói quen tiêu dùng của phụ nữ thành đạt, nhân
viên phỏng vấn sẽ được yêu cầu đến các trung tâm thương mại chọn
các phụ nữ ăn mặc sang trọng để phỏng vấn. Như vậy không có tiêu
chuẩn cụ thể “thế nào là sang trọng” mà hoàn toàn dựa vào phán đoán
để chọn ra người cần phỏng vấn. Lấy mẫu tỷ lệ
Khái niệm: Chọn mẫu kiểm tra tỷ lệ là phương pháp chọn mẫu mà
trong đó người nghiên cứu cố gắng bảo đảm mẫu được lựa chọn có
một tỷ lệ tương ứng với tỷ lệ tổng thể theo các tham số quan trọng nào
đó (tuổi tác, giới tính, nghề nghiệp. .). Các phần tử trong mẫu cũng
được chọn theo chủ ý của người nghiên cứu chứ không phải dựa vào quy luật ngẫu nhiên. Đặc điểm:
Mẫu tỷ lệ được xác định dựa trên tỷ lệ của các đặc điểm quan trọng
trong quần thể, đảm bảo mẫu được lấy ra một cách có tính đại diện cho quần thể
Việc lựa chọn đối tượng trong mẫu được thực hiện dựa trên tỷ lệ đã
xác định, giúp đảm bảo mẫu dược lấy ra một cách ngẫu nhiên và không chọn lọc
Phương pháp mẫu tỷ lệ cho phép kiểm soát kích thước mẫu cho từng
đặc điểm quan trọng, giúp đảm bảo mẫu đủ lớn để đạt được độ chính
xác cần thiết cho từng đặc điểm
Mẫu tỷ lệ có thể được sử dụng để lấy mẫu cho các nhóm dân số khác
nhau, giúp đảm bảo tính đại diện cho tất cả các nhóm trong quần thể
Mẫu tỷ lệ cho phép kiểm soát được sự phân bố của các đặc điểm quan
trọng trong mẫu, giúp đảm bảo rằng mẫu có tính đại diện và đủ độ da
dạng cho mỗi đặc điểm Ưu điểm:
Mẫu được lựa chọn được đảm bảo là có tỷ lệ tương ứng theo
các tham số quan trọng như tuổi, nghề nghiệp, giới tính. 6 lOMoARcPSD|37752136
Các phần tử cũng được lựa chọn theo chủ ý của nhà nghiên cứu, mang tính chủ quan. Nhược điểm:
Chọn theo chủ ý nên kết quả có thể bị 1 chiều
Có thể xảy ra trường hợp không chọn được/ khó chọn mẫu bởi
mẫu không tương ứng với các yêu cầu chung bởi một số lý do khách quan hoặc chủ quan
Ứng dụng: Phương pháp mẫu tỷ lệ được sử dụng phổ biến trong
nghiên cứu khoa học, đặc biệt là trong các nghiên cứu xã hội như điều
tra dân số, khảo sát ý kiến, nghiên cứu thị trường, khảo sát đối tượng
khách hàng và nghiên cứu y tế.
Ví dụ: Nếu ta muốn thực hiện một cuộc khảo sát về ý kiến của người
dân về một chính sách chính phủ, ta có thể lựa chọn các đối tượng để
tham gia vào nghiên cứu dựa trên các đặc điểm như giới tính, độ tuổi,
vùng địa lý, trình độ học vấn và thu nhập. Ta có thể xác định tỷ lệ cho
mỗi đặc điểm này trong quần thể, ví dụ như 50% nam, 50% nữ, 30%
dưới 30 tuổi, 40% trong khoảng từ 30 đến 50 tuổi và 30% trên 50 tuổi.
Sau đó, ta có thể lựa chọn các đối tượng để tham gia vào nghiên cứu dựa trên tỷ lệ này.
b. Chọn mẫu ngẫu nhiên (chọn mẫu theo xác suất)
Chọn mẫu ngẫu nhiên đơn giản
Khái niệm: Là phương pháp chọn mẫu trong đó tất cả các cá thể trong
tổng thể có cùng cơ hội (cùng xác suất) để được chọn vào mẫu. Mỗi
đối tượng trong tổng thể được gán một con số, sau đó các con số được
lựa chọn một cách ngẫu nhiên. Đặc điểm:
Ưu điểm: Là phương pháp chọn mẫu xác suất cơ bản và có thể
lồng vào tất cả các phương pháp chọn mẫu xác suất phức tạp
khác, cách làm đơn giản, tính ngẫu nhiên và tính đại diện cao. Nhược điểm:
Cần có một danh sách đơn vị mẫu để phục vụ chọn mẫu. Điều
này thường không thể thực hiện đối với mẫu lớn hoặc mẫu dao động. 7 lOMoARcPSD|37752136
Các cá thể được chọn vào mẫu có thể phân bố tản mạn trong
tổng thể, do vậy, việc thu thập dữ liệu rất tốn kém và mất thời gian.
Cách chọn này không quan tâm đến các tầng, các nhóm đối
tượng nghiên cứu trong tổng thể nên xác suất chọn vào mẫu có
thể không đồng đều giữa các tầng dẫn đến kết quả chung có thể bị ảnh hưởng.
Ứng dụng: Thường vận dụng khi các đơn vị của tổng thể chung không
phân bố quá rộng về mặt địa lý, các đơn vị khá đồng đều nhau về đặc
điểm đang nghiên cứu. Thường áp dụng trong kiểm tra chất lượng sản
phẩm trong các dây chuyền sản xuất hàng loạt.
Ví dụ: Tiến hành chọn ra 100 cơ sở rau sạch ở Đà Lạt. Trong đó theo
thống kê ở đây có 2000 doanh nghiệp rau sạch. Từ danh sách các
doanh nghiệp cho trước đánh số thứ tự, tiến hành chọn mẫu các doanh
nghiệp theo phương pháp chọn mẫu ngẫu nhiên đơn giản bằng bảng
số ngẫu nhiên (hiện nay có các phần mềm thống kê hỗ trợ cho việc
lấy mẫu ngẫu nhiên khá thuận lợi, đáp ứng được yêu cầu quy mô mẫu
điều tra ngày càng lớn).
Chọn mẫu ngẫu nhiên có hệ thống
Khái niệm: Toàn bộ đối tượng trong tổng thể được liệt kê theo thứ tự
định trước, sau đó quyết định khoảng cách các đối tượng được lựa chọn.
Trình tự được tiến hành như sau:
- Trước hết sắp xếp các đơn vị tổng thể theo trình tự nào đó, sau đó
đánh số thứ tự các đơn vị trong danh sách (Ví dụ: tăng dần hoặc giảm
dần của lượng biến theo tiêu thức cần nghiên cứu; hoặc theo vần A, B, C,. .).
- Căn cứ vào trật tự sắp xếp này, sau một khoảng cách nhất định lại
chọn ra một đơn vị mẫu, sau đó cứ cách đều d đơn vị lại chọn ra 1 đơn
vị vào mẫu,…cứ như thế cho đến khi chọn đủ số đơn vị của mẫu.
Khoảng cách để chọn ra đơn vị mẫu được tính là: d = N / n (trong đó:
N là số đơn vị tổng thể chung, n là số đơn vị của tổng thể mẫu). Đặc điểm:
Ưu điểm: Nhanh và dễ áp dụng, có tính đại diện cao hơn chọn ngẫu nhiên. Nếu danh
sách cá thể của tổng thể được xếp ngẫu nhiên, chọn mẫu hệ thống tương tự như chọn ngẫu nhiên đơn. 8 lOMoARcPSD|37752136
Nhược điểm: Khung mẫu được thiết lập có tính chu kỳ nên mẫu có thể bị sai lệch
Ứng dụng: Phương pháp này thường được sử dụng khi các đơn vị
trong tổng thể chung không đồng đều về đặc điểm và nằm ở vị trí địa lý khác nhau. Ví dụ:
Chẳng hạn chúng ta tiến hành chọn ra 293 doanh nghiệp trong một địa
phương có 3000 doanh nghiệp, theo phương pháp chọn mẫu ngẫu
nhiên hệ thống, việc đầu tiên chúng ta sẽ tính khoảng cách d. d = N / n = 3000 / 293 = 10,23
Chúng ta sẽ làm tròn xuống, khoảng cách chọn được xác định d = 10.
Tiếp theo, chúng ta sắp xếp danh sách các doanh nghiệp này theo tiêu
thức nào đó (chẳng hạn theo tên doanh nghiệp hay theo phương hướng,. .).
Trong nhóm 10 doanh nghiệp đầu tiên sẽ lấy ngẫu nhiên một doanh
nghiệp nào đó, (chẳng hạn lấy được doanh nghiệp thứ 6, tiến hành
chọn các doanh nghiệp tiếp theo là doanh nghiệp thứ 16, 26, 36, 46,. .
cho đến khi lấy đủ 293 doanh nghiệp).
Chọn mẫu ngẫu nhiên phân chùm
Khái niệm: Theo phương pháp chọn mẫu này, các đơn vị của tổng thể
chung được chia thành các khối (chùm) với số lượng đơn vị có thể
bằng hoặc không bằng nhau. Từ các khối đó, người ta chọn ngẫu nhiên
một số khối để điều tra. Các đơn vị mẫu lúc này không phải là từng
đơn vị lẻ tẻ mà từng khối đơn vị. Đặc điểm: Ưu điểm:
Thường được áp dụng trong các nghiên cứu điều tra có một
phạm vi rộng lớn, độ phân tán cao, danh sách của tất cả các cá
thể trong tổng thể không thể có được trong khi chỉ có danh sách các chùm.
Sự lựa chọn thường dễ hơn, chi phí cho nghiên cứu với mẫu
chùm thường rẻ hơn nhiều do các cá thể trong một chùm thường gần nhau.
Nhược điểm: Tính đại diện cho quần thể hoặc tính chính xác
của mẫu được chọn theo phương pháp mẫu chùm thường thấp 9 lOMoARcPSD|37752136
hơn so với mẫu được chọn bằng phương pháp ngẫu nhiên đơn (nếu có cùng cỡ mẫu)
Ứng dụng: Sử dụng khi không có sẵn danh sách đầy đủ của các đơn
vị trong tổng thể cần nghiên cứu hoặc khi tổng thể chung quá lớn, ví
dụ như cả một quốc gia Ví dụ:
Bước 1: Xác định các chùm thích hợp. Đó là tập hợp các cá thể gần
nhau như làng, xã, trường học, bệnh viện,. Bởi vậy chúng thường có
chung 1 đặc điểm. Thông thường, chùm không có cùng kích cỡ.
Bước 2: Chọn ngẫu nhiên một số khối và điều tra tất cả các đơn vị trong khối đã chọn.
=> Tổng thể chung là sinh viên của một trường đại học. Khi đó ta sẽ
lập danh sách các lớp chứ không lập danh sách sinh viên, tiếp theo
chọn ra các lớp điều tra. Chọn mẫu phân tổ
Khái niệm: Chọn mẫu phân tổ là phương pháp mà các đơn vị mẫu
được chọn khi tổng thể chung đã được phân chia thành các tổ theo tiêu
thức liên quan trực tiếp đến mục đích nghiên cứu. Việc chọn các đơn
vị từ các tổ được tiến hành theo phương pháp chọn ngẫu nhiên. Muốn
chọn mẫu phân tổ, trước tiên phân chia tổng thể thành các tổ theo 1
tiêu thức hay nhiều tiêu thức có liên quan đến mục đích nghiên cứu
(như phân tổ các doanh nghiệp theo vùng, theo khu vực, theo loại
hình, theo quy mô,…). Sau đó trong từng tổ, dùng cách chọn mẫu
ngẫu nhiên đơn giản hay chọn mẫu hệ thống để chọn ra các đơn vị của
mẫu. Đối với chọn mẫu phân tầng, số đơn vị chọn ra ở mỗi tổ có thể
tuân theo tỷ lệ số đơn vị tổ đó chiếm trong tổng thể, hoặc có thể không
tuân theo tỷ lệ. Phương pháp phân tổ này phần nào cũng dựa vào
những kinh nghiệm phán đoán chủ quan nên cần phải tuân theo những
nguyên tắc chung khi tiến hành phân tổ như:
- Trong mỗi tổ phải đảm bảo tính đồng chất;
- Số tổ không nên chia quá ít hoặc quá nhiều;
- Số đơn vị mẫu của từng tổ phải đủ lớn để đảm bảo độ tin cậy cho
suy rộng, hay ước lượng Đặc điểm: Ưu điểm: 10 lOMoARcPSD|37752136
Phương pháp chọn mẫu này cho phép chọn được tổng thể mẫu
có kết cấu gần giống với kết cấu của tổng thể chung (trong
trường hợp chọn theo tỉ lệ) nên tính đại biểu cao, sai số chọn
mẫu nhỏ. Phương pháp này khoa học hơn hai phương pháp
chọn mẫu ngẫu nhiên đơn giản và chọn mẫu ngẫu nhiên hệ
thống nên nó được áp dụng rộng rãi hơn, nhất là đối với hiện
tượng cần điều tra có số đơn vị tổng thể lớn không thể chọn
theo phương pháp chọn máy móc được. Song cách chọn này
đòi hỏi phải có sẵn các nguồn thông tin về tổng thể và có kiến thức phân tổ. Nhược điểm:
Cần phải thông tin, danh sách đầy đủ của các đơn vị mẫu để
phục vụ cho chọn mẫu. Điều này thường khó/ không thể có
được với một mẫu lớn hoặc một mẫu giao động.
Tổng thể phải bao gồm nhiều nhóm phần tử có đặc tính riêng biệt.
Ứng dụng: Được áp dụng rộng rãi hơn, nhất là đối với hiện tượng cần
điều tra có số đơn vị tổng thể lớn không thể chọn theo phương pháp
chọn máy móc được với điều kiện có sẵn các nguồn thông tin về tổng
thể và có kiến thức phân tổ
Ví dụ: Một toà soạn báo muốn tiến hành nghiên cứu trên một mẫu
1000 doanh nghiệp trên cả nước về sự quan tâm của họ đối với tờ báo
nhằm tiếp thị việc đưa thông tin quảng cáo trên báo. Toà soạn có thể
căn cứ vào các tiêu thức : vùng địa lý (miền Bắc, miền Trung, miền
Nam) ; hình thức sở hữu (quốc doanh, ngoài quốc doanh, công ty
100% vốn nước ngoài,…) để quyết định cơ cấu của mẫu nghiên cứu.
4. Sai số trong điều tra chọn mẫu a. Khái niệm
Sai số trong điều tra thống kê là chênh lệch giữa kết quả thu được qua điều tra và trị số
thực tế của hiện tượng nghiên cứu trong tổng thể chung.
Đây là vấn đề không thể tránh khỏi trong bất kỳ cuộc điều tra nào. Sai số này làm giảm
chất lượng của các cuộc điều tra, ảnh hưởng đến kết quả của tổng hợp và phân tích. Do
đó, ảnh hưởng đến chất lượng của toàn bộ quá trình nghiên cứu thống kê. Trong các cuộc
điều tra thống kê, người ta cần phải cố gắng hạn chế sai số này. b. Các loại sai số 11 lOMoARcPSD|37752136
Căn cứ vào tính chất của các sai số, ta có thể phân biệt hai loại: sai số do đăng ký, ghi
chép và sai số do tính đại diện.
Sai số do đăng ký, ghi chép
Sai số này xảy ra đối với mọi cuộc điều tra thống kê. Nó phát sinh do việc đăng kí
số liệu ban đầu không chính xác. Nguyên nhân gây ra loại sai số này rất đa dạng,
có thể do cân đong, đo, đếm sai, tính toán sai, ghi chép sai, do dụng cụ đo lường
không chuẩn xác,. . Ta có thể phân chia loại sai số này thành sai số ngẫu nhiên và sai số có hệ thống.
Sai số ngẫu nhiên: là sai số phát sinh một cách tình cờ, không có chủ định, không
có bất kì một sự sắp đặt trước nào của người tham gia điều tra (cả người hỏi và
người trả lời). Nó xảy ra hoàn toàn ngẫu nhiên. Loại sai số này chịu sự chi phối
của quy luật số lớn, tức là nếu ta điều tra càng nhiều đơn vị, các sai lệch ngẫu
nhiên sẽ có khả năng bù trừ, triệt tiêu nhau làm cho sai số chung càng nhỏ.
Sai số có hệ thống: là sai số có chủ đích, thường xảy ra do chủ đích của người điều
tra, người trả lời hoặc sai số một cách có hệ thống do lỗi của hệ thống đo lường, hệ
thống thang đo được thiết kế không chuẩn xác,. .
Sai số do tính đại diện
Sai số này chỉ xảy ra trong điều tra chọn mẫu. Nguyên nhân là do trong các cuộc
điều tra này, người ta chỉ chọn một số đơn vị để điều tra thực tế. Các đơn vị này
không đủ đảm bảo đại diện cho toàn bộ tổng thể nên phát sinh sai số, ngay cả
trong trường hợp việc lựa chọn số đơn vị để điều tra được thực hiện một cách hoàn toàn ngẫu nhiên.
5. Đạo đức trong việc chọn mẫu nghiên cứu a. Khái niệm:
Một định nghĩa về đạo đức nghiên cứu trong các nghiên cứu xã hội được John
Barnes đưa ra năm 1979. Ông cho rằng “Đạo đức trong nghiên cứu khoa học là những
điều đặt ra khi chúng ta quyết định giữa việc cần thực hiện một hành động này với
những điều khác không chỉ xét trên tính thích hợp hay hiệu quả mà còn bằng việc
tham khảo các tiêu chuẩn đúng hay sai về mặt đạo đức” (J.A. Barnes, 1979; trang 16).
Barnes đã đưa ra sự phân định và đặt cơ sở cho quan điểm các quyết định đạo đức
cần dựa trên các nguyên tắc chứ không dựa vào sự thích hợp. Đây là một điển ghi nhớ
quan trọng. Các quyết định đạo đức không chỉ được xác định trên cơ sở sự thuận tiện cho
nhà nghiên cứu hay đề tài nghiên cứu mà nhà nghiên cứu đó đang tham gia. Người ta cần
quan tâm đến điều gì là đúng, không chỉ đối với đề tài nghiên cứu, nhà tài trợ nghiên cứu
hay nhà nghiên cứu mà còn đối với những người tham gia trong nghiên cứu. Các quyết
định đạo đức sẽ phải dựa trên các giá trị của nhà nghiên cứu và cộng đồng nghiên cứu,
nhà tài trợ, những người tham gia vào nhóm nghiên cứu và sẽ dựa trên những thương
lượng giữa nhóm nghiên cứu nói trên và kể cả những người đóng vai trò kiểm soát, đánh
giá các thông tin mà nhà nghiên cứu thu được. Việc thực hiện các giám sát trong quá
trình nghiên cứu sẽ ảnh hưởng đến chính các quyết định đạo đức của các nhà nghiên cứu khoa học. 12 lOMoARcPSD|37752136 a.
Tầm quan trọng của đạo đức trong nghiên cứu
Các chuẩn mực thúc đẩy các mục đích của nghiên cứu, chẳng hạn như kiến thức,
sự thật và tránh sai sót.
Vì nghiên cứu thường bao gồm rất nhiều sự hợp tác và phối hợp giữa nhiều người
khác nhau trong các lĩnh vực và tổ chức khác nhau, các tiêu chuẩn đạo đức thúc
đẩy các giá trị cần thiết cho công việc hợp tác, chẳng hạn như sự tin cậy, trách
nhiệm giải trình, tôn trọng lẫn nhau và công bằng.
Nhiều chuẩn mực đạo đức giúp đảm bảo rằng các nhà nghiên cứu có thể chịu trách nhiệm trước công chúng.
Các chuẩn mực đạo đức trong nghiên cứu cũng giúp xây dựng sự ủng hộ của công
chúng đối với nghiên cứu. Mọi người có nhiều khả năng tài trợ cho một dự án
nghiên cứu hơn nếu họ có thể tin tưởng vào chất lượng và tính toàn vẹn của nghiên cứu.
nhiều tiêu chuẩn nghiên cứu thúc đẩy một loạt các giá trị đạo đức và xã hội quan
trọng khác, chẳng hạn như trách nhiệm xã hội, quyền con người, quyền lợi động
vật, tuân thủ luật pháp, sức khỏe và an toàn cộng đồng. Sự thiếu sót về mặt đạo
đức trong nghiên cứu có thể gây hại đáng kể cho các đối tượng con người và động
vật, sinh viên và công chúng.
b. Một số vấn đề đạo đức đáng chú ý trong các nghiên cứu truyền thông trực tuyến
Ví dụ: Nghiên cứu công chúng trên không gian ảo
Hiện nay, sự xuất hiện của các môi trường nghiên cứu mới với nhiều hứa hẹn thú vị tiếp
theo sự phát triển và bùng nổ của Internet và các công nghệ trực tuyến đang tạo ra không
ít những thách thức về đạo đức đối với các nhà nghiên cứu nói chung và nghiên cứu báo
chí truyền thông nói riêng. Những thách thức này đến lượt nó đòi hỏi các nhà nghiên cứu
cần phải xem xét và định nghĩa lại các nguyên tắc đạo đức vốn vẫn được nghiễm nhiên áp
dụng trong các nghiên cứu trước đây.
Về dữ liệu trên không gian ảo
Hiện nay, một số cho rằng, những dữ liệu trên không gian ảo (thảo luận và tin
nhắn đăng tải trên Internet) là các tài liệu công, nhưng một số khác thì không cho là như
vậy. Trong số những người sử dụng Internet thì nhiều người cũng cho rằng những thông
tin, câu chuyện mà họ đăng tải trên không gian mạng là của riêng họ và do vậy không hài
lòng khi các nhà nghiên cứu dùng những thông tin riêng tư đó trong nghiên cứu của họ.
Một số người cũng gợi ý rằng nhà nghiên cứu có thể xác định ranh giới giữa cái chung và
riêng về thông tin như vậy bằng cách xem xét cách thức đăng nhập và đăng ký vào diễn
đàn/trang thông tin, số lượng người đăng ký và có thể truy cập, các qui định, qui ước và
nhóm đối tượng đích của diễn đàn/trang. .
Do vậy, nếu nhà nghiên cứu quan tâm và muốn thực hiện nghiên cứu của mình, ví dụ
phân tích thông điệp truyền thông hay quan niệm của một nhóm dân số nào đó về các chủ
đề nhạy cảm như khuyết tật, lạm dụng tình dục, bạo lực, v.v. trong một nhóm thảo luận
riêng thì cần phải chú ý và xử lý triệt để các vấn đề liên quan đến sự cho phép truy cập, 13 lOMoARcPSD|37752136
sự đồng ý tham gia có thông tin của nhóm và các cá nhân trong nhóm và đặc biệt là sự
cho phép sử dụng và đăng tải lại các trao đổi trên diễn đàn. Về yêu cầu bảo mật
Yêu cầu bảo mật trong các nghiên cứu trực tuyến khó được bảo toàn hơn so với các
nghiên cứu ngoại tuyến. Việc thu thập các thông tin trên mạng cũng có rất nhiều rủi ro.
Ví dụ, để đảm bảo tính xác thực của thông tin, nhiều người còn đăng chính xác không chỉ
nội dung thông tin mà còn tên nhóm, tên nhân vật và ngày tháng đăng tải của những
thông tin đó… hay các thông tin trao đổi có thể bị “nghe trộm” hoặc “lan truyền” khi bị hack…
Ví dụ: Vụ rò rỉ thông tin khách hàng của hãng hàng không Vietnam Airlines. Sau khi bị
tấn công mạng từ hacker, hàng chục màn hình thông báo bay, máy tính làm thủ tục, màn
hình tại cửa khởi hành, một số máy chủ bị xóa dữ liệu, các bộ phận không thể dùng các
ứng dụng (file lịch bay) của SAGS, TOC, VIAGS, buộc các hãng hàng không phải thực
hiện thủ công các thủ tục cho hành khách, làm chậm hàng chục chuyến bay.
Ảnh chụp màn hình website của Vietnam Airlines bị tin tặc tấn công ngày 29/7/2016.
Theo báo cáo thống kê của Cục An ninh mạng (A68), cuộc tấn công mạng ngày
29/7/2016 đã phá hủy nhiều hệ thống máy chủ và máy chủ ảo của Vietnam Airlines,
thông tin của hơn 410.000 khách hàng thường xuyên của Tổng công ty Hàng không Việt 14 lOMoARcPSD|37752136
Nam bị đăng tải lên mạng Internet; các hãng hàng không phải làm thủ tục thủ công, thậm
chí dùng loa cầm tay, bảng trắng để phục vụ hành khách; làm trễ gần 100 chuyến bay,
gây thiệt hại về uy tín của Tổng công ty Hàng không Việt Nam.
Các màn hình thông báo ở sân bay Nội Bài chiều 29/7/2016 tắt, hành khách dồn ứ vì
không thể làm thủ tục.
Để giảm thiểu nguy cơ này, trước hết, những người tình nguyện tham gia vào các nghiên
cứu trực tuyến cần được cung cấp các thông tin cần thiết về nghiên cứu để từ đó có thể có
những lựa chọn có thông tin. Ngoài ra, họ có thể sử dụng các tên hiệu riêng để bảo toàn
nhân dạng và địa điểm thật của bản thân. Người tham gia cũng được toàn quyền quyết
định mức độ thông tin mà họ muốn chia sẻ. Về phần các nhà nghiên cứu, họ cũng cần
thận trọng với lời hứa về mức độ bảo mật đối với người tham gia.
Về sự an nguy của người tham gia nghiên cứu
Trong không gian nghiên cứu nào thì nhà nghiên cứu đều có trách nhiệm bảo vệ người
tham gia nghiên cứu tránh khỏi những rủi ro và mối nguy hại không mong muốn. Trong
các nghiên cứu trên môi trường ảo, sự quan tâm của nhà nghiên cứu tới một cộng đồng
nào đó trên không gian mạng có thể ảnh hưởng không nhỏ tới cộng đồng đó.
Thông tin đã được chia sẻ trên mạng thì nó sẽ tồn tại mãi. Đây cũng chính là một thực tế
mà các nhà nghiên cứu cần phải chú ý khi thực hiện nghiên cứu trực tuyến. Nhiều người
tham gia nghiên cứu có thể vẫn có suy nghĩ rằng không gian mạng không bị kiểm soát và
kiểm duyệt nên dễ dàng chia sẻ những gì thầm kín nhất của mình (chẳng hạn như việc sử 15 lOMoARcPSD|37752136
dụng ma tuý, hay hành vi phạm pháp trước đây của bản thân). Đặc biệt, người tham gia
đôi khi còn cảm thấy thoải mái và do vậy thường là không “cảnh giác” trong những thông
tin mà họ chia sẻ vì tưởng rằng họ được “an toàn” khi không phải tham gia vào những
giao tiếp mặt đối mặt với nhà nghiên cứu - trong nhiều trường hợp là người lạ, chỉ là gặp
gỡ trên mạng, người chưa từng và sẽ không bao giờ gặp mặt họ trực tiếp. Trong một
nghiên cứu ngoại tuyến thông thường, nhà nghiên cứu có thể ngay lập tức cảnh báo người
tham gia, tắt băng ghi âm hay thậm chí không gỡ những đoạn băng nhạy cảm đó. Còn
trong nghiên cứu trực tuyến, nhà nghiên cứu có nỗ lực nhiều như thế nào để xoá các
thông tin “nhạy cảm” nhằm bảo vệ người tham gia thì không bao giờ xoá được tận gốc.
Một lo ngại khác nữa đó là khả năng gian dối trong các giao tiếp trực tuyến.
Sự gian dối này có thể là từ phía người đồng thuận tham gia nghiên cứu. Họ có thể
không nói thực về nhân dạng chính xác của mình (họ thực sự là ai?). Ngoài việc
chấp nhận những gì mình nghe thấy, nhìn thấy và biết là thực, nhà nghiên cứu rất
khó có thể chứng thực được người được phỏng vấn đúng là đối tượng mình cần
tuyển dụng cho nghiên cứu.
Về phía nhà nghiên cứu, bản thân nhà nghiên cứu nếu cần thiết cũng có thể che
giấu hoặc tạo dựng những thông tin cá nhân của mình khi tham gia nghiên cứu
(tuổi, giới tính, tầng lớp xuất thân, dân tộc, sức khoẻ. .). Sự không thành thật này
có vẻ là cần thiết đối với một số nghiên cứu, giúp nhà nghiên cứu có quyền tiếp
cận, truy cập vào một cộng đồng ảo nào đó hay gây dựng mối quan hệ với nhóm
yếu thế, tuy vậy, sự không thành thực, đặc biệt khi bị phát hiện, sẽ có ảnh hưởng
không nhỏ tới uy tín của nhà nghiên cứu, kết quả nghiên cứu và tâm lý của người tham gia nghiên cứu.
II. CÁC KỸ THUẬT, PHẦN MỀM XỬ LÝ SỐ LIỆU, DỮ LIỆU NGHIÊN CỨU
CÔNG CHÚNG PHỔ BIẾN
1. Định nghĩa và phân loại a. Dữ liệu
Dữ liệu đề cập đến các phần thông tin riêng biệt, thường được định dạng và lưu trữ theo
cách phù hợp với mục đích cụ thể.
Dữ liệu có thể tồn tại ở nhiều dạng khác nhau: dưới dạng số liệu, văn bản được ghi trên
giấy, dưới dạng bit hoặc byte được lưu trữ trong bộ nhớ của thiết bị điện tử hoặc dưới
dạng dữ kiện trong tâm trí của một người.
Tuy nhiên, kể từ khi khoa học máy tính ra đời vào giữa những năm 1900, dữ liệu thường
đề cập đến thông tin được truyền hoặc lưu trữ dưới dạng điện tử.
Dữ liệu được chia thành 2 nhóm: dữ liệu truyền thống và dữ liệu lớn 16 lOMoARcPSD|37752136 ●
Dữ liệu truyền thống
Theo Tổ chức đối tác toàn cầu về tài chính toàn diện (GPFI), dữ liệu truyền thống là loại
dữ liệu có cấu trúc, nghĩa là dạng dữ liệu được tổ chức và phân loại theo cấu trúc xác
định. Dữ liệu truyền thống được thu thập và xử lý bằng các công cụ, phần mềm truyền
thống chẳng hạn như Microsoft Excel. ●
Dữ liệu lớn (Big Data)
Big Data được sử dụng trong định nghĩa dữ liệu để mô tả dữ liệu nằm trong phạm vi petabyte hoặc cao hơn.
Big Data được mô tả bởi 5 đặc trưng sau:
Khối lượng dữ liệu (Volume) Tốc độ (Velocity) Giá trị (Value)
Độ tin cậy/chính xác (Veracity) Đa dạng (Variety).
Ngày nay, thương mại điện tử dựa trên web rất phổ biến, các mô hình kinh doanh dựa
trên Big Data đã phát triển một cách rực rỡ và họ xem dữ liệu như một loại tài sản. Big
Data mang đến rất nhiều lợi ích chẳng hạn như giảm bớt chi phí, nâng cao hiệu quả, nâng cao doanh số bán hàng, …
Dữ liệu lớn khác với dữ liệu truyền thống (ví dụ, kho dữ liệu - Data Warehouse) ở 4 điểm:
Dữ liệu đa dạng hơn; lưu trữ dữ liệu lớn hơn; truy vấn nhanh hơn; độ chính xác caohơn. Khối lượng Sự thay đổi Đa dạng
Dữ liệu Lưu trữ dữ liệu truyền
Kho dữ liệu truyền thống Khi khai thác dữ liệu
truyền thống vô cùng phức tạp
thì lâu lâu mới được cập truyền thống (dữ liệu thống
và luôn đặt ra câu hỏi: nhật và trong tình trạng có cấu trúc), chúng ta - Lưu như thế nào? không theo dõi thường
thường phải trả lời các
- Dung lượng kho lưu trữ xuyên gây ra tình trạng câu hỏi: bao nhiêu là đủ?
lỗi cấu trúc truy vấn dẫn - Dữ liệu lấy ra kiểu
- Gắn kèm với câu hỏi đó đến không tìm kiếm gì?
là chi phí đầu tư tương
được thông tin đáp ứng - Định dạng dữ liệu ứng. theo yêu cầu. như thế nào?
Dữ liệu Công nghệ lưu trữ dữ Truy vấn dữ liệu nhanh Khi khai thác, phân lớn
liệu lớn hiện nay đã phần hơn: Dữ liệu lớn được tích dữ liệu lớn chúng (Big nào có thể giải quyết cập nhật liên tục ta không cần quan Data)
được vấn đề trên nhờ
Dữ liệu lớn khi đưa vào tâm đến kiểu dữ liệu
những công nghệ lưu trữ sử dụng thường được và định dạng của 17 lOMoARcPSD|37752136 đám mây, phân phối lưu
kiểm định lại dữ liệu với chúng; điều quan tâm
trữ dữ liệu phân tán và có những điều kiện chặt là giá trị mà dữ liệu
thể kết hợp các dữ liệu
chẽ, số lượng thông tin mang lại có đáp ứng
phân tán lại với nhau một được kiểm tra thông được cho công việc cách chính xác và xử lý
thường rất lớn, và đảm hiện tại và tương lai nhanh trong thời gian
bảo về nguồn lấy dữ liệu hay không. thực. không có sự tác động của con người vào thay đổi số liệu thu thập.
b. Phân tích dữ liệu là gì?
Phân tích dữ liệu (Data Analysis) là quá trình kiểm tra các tập dữ liệu để tìm ra xu hướng
và đưa ra kết luận về thông tin mà chúng đang lưu giữ.
Tùy theo các ngành nghề và mục đích nghiên cứu mà quá trình phân tích dữ liệu được gọi
theo nhiều tên gọi khác nhau: phân tích chẩn đoán, phân tích dự đoán, phân tích theo mô
tả, phân tích thống kê, phân tích đề xuất, phân tích khám phá,…
Tuy nhiên, về bản chất tất cả đều thuộc một trong hai nhóm: phân tích định tính hoặc phân tích định lượng.
2. Các kỹ thuật, phần mềm xử lý số liệu, dữ liệu nghiên cứu công chúng phổ biến hiện nay
• Phân tích định tính: Là phương pháp phân tích lấy dữ liệu thông qua từ ngữ, ký hiệu,
hình ảnh và quan sát. Bao gồm: Phân tích nội dung, để phân tích dữ liệu hành vi và lời
nói; Phân tích tường thuật, để làm việc với dữ liệu được chọn lọc từ các cuộc phỏng vấn,
nhật ký, khảo sát; Lý thuyết có cơ sở, để phát triển các giải thích nhân quả của một sự
kiện nhất định bằng cách nghiên cứu và ngoại suy từ một hoặc nhiều trường hợp trong
quá khứ. Phương pháp này không sử dụng số liệu thống kê.
Phần mềm định tính: SAS, SPSS, NVivo 2.1. SAS a) Tổng quan
SAS là từ viết tắt của Statistical Analysis System (Hệ thống phân tích thống kê). Nó
thường được sử dụng cho các phân tích nâng cao, phân tích kinh doanh và các tác vụ
quản lý dữ liệu khác nhau. 18 lOMoARcPSD|37752136
Sử dụng ngôn ngữ lập trình SAS để phân tích dữ liệu, cung cấp các biểu diễn trực quan
cho người nghiên cứu để đánh giá. b) Chức năng SAS cho phép thực hiện:
- Nhập, truy cập, quản lý và khai thác dữ liệu
- Xuất báo cáo bằng văn bản và đồ họa - Phân tích thống kê
- Lập kế hoạch kinh doanh, dự báo, và ra quyết định hỗ trợ
- Hoạt động nghiên cứu và quản lý dự án - Cải tiến chất lượng
- Các ứng dụng phát triển
- Kho dữ liệu (trích xuất, chuyển đổi, tải)
- Nền tảng điện toán độc lập và từ xa c) Đối tượng
Dành cho những người cần phân tích nâng cao, phân tích kinh doanh và các tác vụ quản
lý dữ liệu khác nhau. Sử dụng ngôn ngữ lập trình SAS để phân tích dữ liệu, cung cấp các
biểu diễn trực quan cho người nghiên cứu để đánh giá. d) Ưu điểm
– SAS có thể làm việc với nhiều file dữ liệu cùng một lúc; điều này giảm đi tính phức tạp
trong chuẩn bị dữ liệu đối với những nhiệm vụ phân tích đòi hỏi phải làm việc với nhiều
file dữ liệu cùng một lúc.
– SAS có thể quản lý những file dữ liệu khổng lồ lên đến 32.768 biến và số lượng bản ghi
là rất lớn chỉ phụ thuộc vào kích cỡ của đĩa cứng.
– Đối với phân tích thống kê, sức mạnh lớn nhất của SAS có thể tìm thấy trong phân tích
ANOVA, phân tích mô hình hỗn hợp và phân tích nhiều chiều.
– SAS có các công cụ vẽ đồ thị mạnh nhất (SAS/Graph) so với hai bộ chương trình còn lại. e) Nhược điểm 19 lOMoARcPSD|37752136
– Mất nhiều thời gian để học và hiểu được cách quản lý dữ liệu của SAS và nhiều nhiệm
vụ quản lý phức tạp của nó lại được thực hiện bằng những lệnh đơn giản trong SPSS và STATA
– Yếu đối với hồi quy logistic kiểu thứ tự và kiểu phạm trù (vì các lệnh này là đặc biệt
khó) và các phương pháp ước lượng mạnh.
– Nó cũng có hỗ trợ một ít cho phân tích dữ liệu theo lược đồ mẫu, nhưng lại hạn chế hơn so với STATA. 2.2. SPSS a) Tổng quan
Phần mềm SPSS là một gói phần mềm ứng dụng trong phân tích thông kê , phân tích lô
và phân tích tương tác. Giao diện giữa người và máy cho phép sử dụng các menu thả
xuống để chọn các lệnh thực hiện b) Chức năng
Phần mềm SPSS là một gói phần mềm (software package) ứng dụng trong phân tích
thông kê (statistical analysis), phân tích lô (batch analysis) và phân tích tương tác (interactive analysis).
Giao diện giữa người và máy cho phép sử dụng các menu thả xuống để chọn các lệnh thực hiện
SPSS có những chức năng chính trong việc xử lý dữ liệu như: ●
Nhập và làm sạch dữ liệu. ●
Xử lý các biến đổi và quản lý các dữ liệu đó. ●
Tổng hợp dữ liệu và trình bày dưới các dạng bảng, đồ thị,. . ●
Phân tích dữ liệu, tính toán các tham số thống kê và diễn giải kết quả. c) Đối tượng
Đối tượng sử dụng SPSS khá đông đảo trải dài từ nhiều ngành nghề: ●
Học sinh, sinh viên, học viên các trường đại học. ●
Người nghiên cứu xã hội. ●
Nhà kinh doanh cần nghiên cứu thị trường. 20 lOMoARcPSD|37752136 ●
Người nghiên cứu khoa học. . d) Ưu điểm
– SPSS có một bộ soạn thảo dữ liệu tương tự như excel, bộ soạn thảo cho phép vào các
dữ liệu và mô tả các thuộc tính của chúng, chính vì vậy SPSS khá dễ sử dụng.
– Sức mạnh lớn nhất của SPSS là lĩnh vực phân tích phương sai (SPSS cho phép thực
hiện nhiều loại kiểm định tác động riêng biệt) và phân tích nhiều chiều (thí dụ phân tích
phương sai nhiều chiều, phân tích nhân tố, phân tích nhóm tổ).
– SPSS có một giao diện giữa người và máy rất đơn giản để tạo ra các đồ thị và khi đã tạo
được một đồ thị, nhờ giao diện này mà người sử dụng có thể tuỳ ý hiệu chỉnh đồ thị cũng
như hoàn thiện chúng. Các đồ thị có chất lượng rất cao và có thể dán vào các tài liệu
khác, thí dụ như Word hoặc Powerpoint. e) Nhược điểm
– Cái yếu nhất của SPSS là khả năng xử lý đối với những vấn đề ước lượng phức tạp và
do đó khó đưa ra được các ước lượng sai số đối với các ước lượng này.
– SPSS cũng không hỗ trợ các công cụ phân tích dữ liệu theo lược đồ mẫu.
– SPSS không có công cụ quản lý dữ liệu thật mạnh
– SPSS xử lý mỗi file dữ liệu ở một thời điểm và không phải là rất mạnh khi thực hiện
các nhiệm vụ phân tích cần làm việc với nhiều file dữ liệu cùng một lúc. Các file dữ liệu
có thể có đến 4096 biến và số lượng bản ghi chỉ bị giới hạn trong dung lượng của đĩa cứng.
– Ngôn ngữ cú pháp của SPSS phức tạp hơn so với STATA, nhưng lại có phần đơn giản hơn, ít mạnh hơn SAS. 2.3. NVivo a) Tổng quan
NVivo là một phần mềm phân tích dữ liệu định tính phổ biến nhất trong nghiên cứu xã hội,
khoa học xã hội, và nhân khẩu học, tâm lý học và cũng được dùng ở một số lĩnh vực khác
như lĩnh vực y học, kinh doanh, và quản lý dự án. b) Chức năng
Phân tích dữ liệu định tính:
Thu thập, tổ chức và phân tích dữ liệu không phải là số liệu. 21 lOMoARcPSD|37752136
Nhập dữ liệu từ nhiều nguồn khác nhau vào NVivo.
Tạo biểu đồ, sơ đồ và báo cáo để phân tích dữ liệu.
Thử nghiệm thực tế, xác định xu hướng, thu thập bằng chứng, kiểm tra dữ liệu.
Đánh giá về tài liệu:
Nhập các tham khảo tài liệu
Gán mã cho tài liệu theo các chủ đề chính.
Thực hiện truy vấn văn bản và mã hóa để khám phá các chủ đề khác nhau.
Tạo hình ảnh trực quan để xem các mối liên hệ trong tài liệu của bạn. c) Đối tượng
NVivo thường được sử dụng bởi các nhà nghiên cứu, nhà phân tích dữ liệu, và những người
làm việc với dữ liệu định tính trong nhiều lĩnh vực nghiên cứu và quản lý dự án. d) Ưu điểm
- Tự động hóa mạnh mẽ: trong nhiều việc ví dụ khám phá thông tin phức tạp trong dữ
liệu, trích dẫn, tạo thư mục, tham chiếu . .
- Hỗ trợ nhiều định dạng dữ liệu định tính khác nhau, từ văn bản đến hình ảnh và video.
- Có khả năng xuất dữ liệu và báo cáo chất lượng cao. e) Nhược điểm
- Không phù hợp cho việc phân tích dữ liệu số học như SAS hoặc SPSS.
- Chi phí đắt đỏ, đặc biệt đối với cá nhân hoặc sinh viên.
- Chưa hỗ trợ nhiều ngôn ngữ
Phân tích định lượng: Là phương pháp phân tích từ dữ liệu do thống kê thu thập
mà có và xử lý nó thành dữ liệu số. Phương pháp này gắn liền với việc kiểm định lý
thuyết, phản ánh và diễn giải các mối quan hệ giữa các nhân tố (các biến) với nhau.
Bằng việc xác định cỡ mẫu, sử dụng một mẫu nhỏ từ một nhóm đại diện hướng
nghiên cứu tiến hành phân tích. Kết quả thu được coi như đại diện cho toàn bộ
nghiên cứu. Trong khoa học, phân tích định lượng được sử dụng nhiều trong tâm lý
học, kinh tế học, xã hội học, tiếp thị, y tế….
Phần mềm định lượng: STATA, R, EVIEWS, AMOS MATLAB, MICROSOFTEXCEL. 22 lOMoARcPSD|37752136 1. Stata a, Khái quát:
Stata là sự kết hợp của “statistics” và “data”, là một phần mềm được phát triển từ
năm 1985 và là một bộ chương trình sử dụng trong Kinh tế Lượng và thống kê. Stata cung
cấp một hệ thống quản lý dữ liệu và khả năng phân tích thống kê với giao diện đồ hoạ thân
thiện bao gồm trình đơn mô tả và các hộp thoại đơn giản. Stata cho phép: Quản lý dữ liệu Phân tích thống kê Đồ hoạ Mô phỏng Hiệu chỉnh chức năng
Stata là một bộ chương trình được sử dụng trong các phân tích định lượng và thống
kê. Nó sử dụng các lệnh trực tiếp, có thể nhập mỗi lệnh ở một thời điểm để thực hiện, hoặc
có thể soạn thảo nhiều lệnh thành một bộ chương trình cho một nhiệm vụ và thực hiện đồng thời chúng. b, Chức năng
Stata đang được ứng dụng rộng trong nhiều lĩnh vực để quản lý, phân tích dữ liệu.
Ngoài phần mềm Stata là gì, nhiều người cũng băn khoăn không biết phần mềm Stata được
ứng dụng trong những lĩnh vực nào. Theo đó, đây là một trong những phần mềm thống kê
được sử dụng phổ biến nhất. Nó được ứng dụng trong mọi lĩnh vực của nền kinh tế xã hội,
được sử dụng rộng rãi ở hơn 180 quốc gia trên thế giới để giúp người dùng dễ dàng phân
tích các mẫu dữ liệu. Có thể kể đến 3 nhóm ứng dụng cụ thể của phần mềm Stata là: quản
lý dữ liệu, phân tích thống kê, vẽ đồ thị
c, Đối tượng sử dụng:
Stata không chỉ được sử dụng phổ biến ở người đi làm, ở các chuyên gia trong lĩnh
vực thống kê mà học sinh, sinh viên, nhất là những du học sinh thường xuyên nghiên cứu
khoa học cũng sử dụng phần mềm này. d, Ưu điểm:
Cho phép thực hiện thao tác về dữ liệu một cách dễ dàng.
Có thế mạnh trong hồi quy, hồi quy logistic, bao gồm cả hồi quy mạnh và hồi quy
với sai số chuẩn mạnh, và nhiều lệnh ước lượng khác kèm theo sai số chuẩn mạnh.
Cú pháp các lệnh đồ thị dễ sử dụng.
STATA cũng trội hơn về lĩnh vực phân tích dữ liệu theo lược đồ mẫu, cho khả năng
áp dụng chúng trong phân tích số liệu điều tra bởi các công cụ hồi quy, hồi quy
logistic, hồi quy poisson, hồi quy probit,…
Đồ thị có chất lượng cao. e, Nhược điểm:
Tại mỗi thời điểm chỉ làm việc được một file. 23 lOMoARcPSD|37752136
Khả năng quản lý dữ liệu không bằng SAS.
Khả năng phân tích phương sai, phân tích nhiều chiều không cao.
Điểm yếu nhất là khả năng phân tích phương sai và phân tích nhiều chiều truyền
thống như phân tích phương sai nhiều chiều, phân tích nhóm tổ.
Các đồ thị của STATA không thể hiệu đính bằng bộ hiệu đính đồ thị. 2. R a, Khái quát:
R là một phần mềm, công cụ lập trình rất mạnh cho học máy, thống kê và phân
tích dữ liệu. Đây là một trong những ngôn ngữ phổ biến dùng cho thu thập, làm sạch,
phân tích, biểu đồ hóa và biểu diễn dữ liệu.
Nó mang rất nhiều những đặc điểm ưu việt và vô cùng mạnh mẽ cho việc phân
tích dữ liệu nên được dùng nhiều trong kinh doanh. Tại Việt Nam trong những năm trở
lại đây, R đã bắt đầu được sử dụng và đang phát triển rộng rãi trong trường học và giới
nghiên cứu. Trong tương lai, R hứa hẹn sẽ trở thành phần mềm được sử dụng phổ biến
trong các lĩnh vực nghiên cứu do tính chất bản quyền đang ngày càng được tôn trọng. b, Chức năng:
Dùng để thực hiện phân tích dữ liệu, tính toán, thống kê số liệu và thực hiện hỗ trợ
các ứng dụng tính toán xác suất thống kê, phân tích dữ liệu trong thời gian ngắn.
Được sử dụng ở rất nhiều lĩnh vực:
Data Science: Trong thời đại IoT, các thiết bị tạo ra hàng terabyte dữ liệu
có thể sử dụng để hỗ trợ ra quyết định, khoa học dữ liệu không có cách nào
khác là phải tiến lên. Ngôn ngữ R cho các nhà khoa học dữ liệu một công
cụ mạnh mẽ để thu thập dữ liệu thời gian thực, đồng thời thực hiện phân
tích thống kê và dự báo, tạo ra các kết quả trực quan dễ hiểu.
Tính toán thống kê: R là ngôn ngữ phổ biến nhất trong cộng đồng các nhà
thống kê, với một kho package khổng lồ chứa gần 10000 package đáp ứng
mọi phép tính thống kê bạn có thể nghĩ ra. Cú pháp đặc biệt của R cho phép
các nhà thống kê, kể cả những người không có nền tảng khoa học máy tính,
cũng có thể nhanh chóng import, làm sạch và phân tích dữ liệu từ nhiều
nguồn khác nhau, vẽ biểu đồ từ bất cứ dataset nào.
Học máy (Machine Learning): R cũng có nhiều package thực hiện các thao
tác machine learning như hồi quy tuyến tính, phi tuyến tính, cây quyết định,
… R còn được sử dụng để cài đặt các thuật toán trong lĩnh vực tài chính,
nghiên cứu di truyền, marketing hay chăm sóc sức khỏe.
Hoàn toàn có thể sử dụng R trong thống kê số liệu, phân tích dữ liệu trong
các phần mềm thương mại.
c, Đối tượng người dùng hướng tới: 24 lOMoARcPSD|37752136
Do các đặc điểm trên, nó sẽ phù hợp nhất với các nhà thống kê học, các nhà toán
học, khoa học, các nhà phân tích dữ liệu trong các lĩnh vực về kinh tế, khoa học,
truyền thông,….các doanh nghiệp, các lập trình viên, sinh viên các ngành điện tử, lập trình,….
Không phù hợp với những người mới tiếp cận và làm quen với các phần mềm
phân tích dữ liệu, các ngôn ngữ lập trình → cần có thời gian để làm quen, thích nghi. d, Ưu điểm:
Là phần mềm mã nguồn mở, nên mọi người có thể thoải mái đưa ra những ý tưởng
mới, góp ý sửa lỗi, phát triển các package thống kê mới. Điều này giúp cho phần
mềm ngày càng phát triển hơn và cũng xây dựng được một cộng đồng người dùng lớn mạnh.
R có 1 kho package thống kê phong phú, toàn diện với công nghệ mới nhất và hơn
15000 package trong mọi lĩnh vực nghiên cứu
Do là một mã nguồn mở nên nó có thể chạy được trên rất nhiều hệ điều hành
(Unix, Linux, Win, Mac,. ), phần cứng ( Intel, PowerPC, Alpha, Sparc,. )
Được tích hợp nhiều công cụ nên nó có thể hỗ trợ các ứng dụng tính toán xác suất
thống kê, phân tích dữ liệu trong thời gian ngắn. Khả năng lập trình cao cũng như kiểu dữ liệu phong phú.
R có thể tích hợp được với ngôn ngữ khác (C, C++) và tương tác với nhiều nguồn
dữ liệu và các gói thống kê (SAS, SPSS).
Hoàn toàn miễn phí (đây là một ưu điểm có thể nói là sẽ dễ tác động đến tâm lý
người sử dụng Việt nhiều nhất) e, Nhược điểm:
Do đây là một phần mềm lập trình cấp cao nên nó thực sự chỉ phù hợp với những
đối tượng có trình độ về tính toán, thống kê, kinh tế lượng cũng như lập trình.
(Nhược điểm lớn nhất)
Do có một kho lưu trữ package khổng lồ nên không thể tránh khỏi việc một vài
package của R có thể không hoàn hảo và còn lỗi.
R có thể chiếm dụng khá nhiều bộ nhớ khả dụng. 3. Eviews a, Khái quát:
EViews (Econometric Views) là phần mềm chuyên về kinh tế lượng, nghiên cứu
với dữ liệu chuỗi thời gian, dữ liệu chéo, dữ liệu mảng… b, Chức năng:
Ngoài những chức năng dùng mô hình kinh tế lượng để phân tích phương trình hồi
quy thì một số chức năng dùng cho phân tích dự báo nâng cao như:
Thống kê mô tả dữ liệu
Phân tích sự tác động của các yếu tố kinh tế vĩ mô lên biến cần nghiên cứu
Dự báo cho tương lai yếu tố cần nghiên cứu (ví dụ giá xăng dầu, dự báo nhu cầu
năng lượng, dự báo giá vàng. .) 25 lOMoARcPSD|37752136
Thực hiện xếp hạng tín dụng trong ngân hàng
Tính toán giá trị rủi ro cho mã cổ phiếu dựa trên tỷ suất sinh lời
Phân tích quan hệ tương quan giữa các yếu tố kinh tế vĩ mô. c, Ưu điểm:
Chuyên về kinh tế lượng.
Dự báo, mô phỏng hình và tạo các biểu đồ và bảng chất lượng cao.
Giao diện trực quan, dễ sử dụng. d, Nhược điểm:
Các mô hình định lượng được thiết lập sẵn khiến khả năng mở rộng mô hình bị giới hạn. 4. AMOS a, Khái quát:
Đây là một phần mềm dùng để thống kê, phân tích cấu trúc của thời gian và phân tích các
cấu trúc của sự quan hệ đến nó. Nó được dùng để phân tích các mô hình có cấu trúc dữ
liệu liên quan đến thời gian và phân tích mối liên hệ giữa các biến cần quan sát. b, Chức năng:
Xây dựng mô hình: Phần mềm Amos cung cấp hệ thống các giao diện đồ họa cao
nhất giúp người dùng xây dựng và thực nghiệm các mô hình, các phương trình cấu
trúc. Nó cho phép người dùng chỉ ra rõ và kiểm tra, đánh giá mối quan hệ giữa
các biến với nhau, bao gồm tất cả các biến ẩn một cách trực quan và khách quan.
Ước tính mô hình: Phần mềm sử dụng các tính năng thống kê nâng cao dùng để
ước tính chính xác các tham số của các mô hình phương trình cấu trúc, bao gồm
nhiều khả năng diễn ra cực đại và bình phương nhỏ nhất của tham số có trọng số.
Đánh giá mô hình: Phần mềm Amos cung cấp rất nhiều công cụ và kết quả giúp
đánh giá mức độ phù hợp của các mô hình phương trình cấu trúc, bao gồm tất cả
các chỉ số về mức độ phù hợp, các chỉ số thay đổi và đồ thị phần dư.
Diễn giải mô hình: Phần mềm Amos cung cấp cho người dùng rất nhiều đầu ra
kết quả và hình ảnh trực quan cao giúp người dùng diễn giải cụ thể, rõ ràng các kết
quả của mô hình phương trình cấu trúc, bao gồm nhiều sơ đồ đường dẫn, các hệ số
chuẩn hóa và các hệ số tải.
So sánh mô hình: Phần mềm Amos cung cấp tất cả các công cụ dùng để so sánh
các mô hình phương trình thay thế, bao gồm nhiều mô hình lồng ghép với nhau và
các mô hình có cấu trúc, hệ thống khác nhau.
Phân tích chuỗi thời gian: Phần mềm Amos cung cấp cho người dùng các tính
năng đặc biệt nhất dùng để phân tích chuỗi dữ liệu thời gian, bao gồm nhiều mô
hình tự hồi quy và các mô hình trễ chéo. c, Ưu điểm:
Dễ sử dụng: Phần mềm Amos cung cấp hệ thống giao diện người dùng đồ họa cao
giúp người dùng dễ dàng xây dựng và kiểm nghiệm các mô hình phương trình cấu 26 lOMoARcPSD|37752136
trúc, ngay cả khi người dùng chưa được đào tạo chuyên môn về chuyên ngành thống kê.
Tính linh hoạt: Phần mềm Amos có thể giúp người dùng xử lý nhiều loại mô hình
cấu trúc, bao gồm nhiều biến tiềm ẩn, các mô hình đo lường và các mô hình chuỗi
dữ liệu thời gian và giúp cho nó phù hợp trong việc ứng dụng nhiều nghiên cứu.
Đánh giá toàn diện: Phần mềm Amos cung cấp cho người dùng nhiều công cụ và
hệ thống đầu ra dùng để kiểm tra mức độ phù hợp của mô hình và diễn giải cụ thể,
chi tiết các kết quả, bao gồm các chỉ số mức độ phù hợp, các chỉ số sửa đổi và
nhiều đồ thị phần dư.
So sánh mô hình: Phần mềm Amos cung cấp chuỗi các công cụ dùng để so sánh
mô hình thay thế, bao gồm các mô hình lồng ghép vào nhau và các mô hình có cấu
trúc không gian khác nhau, nó giúp cho các nhà khoa học lựa chọn được mô hình
tốt nhất từ bộ dữ liệu của họ.
Phân tích chuỗi thời gian: Phần mềm Amos cung cấp nhiều tính năng đặc biệt
dùng để phân tích chuỗi thời gian, bao gồm tất cả các mô hình tự động hồi quy và
mô hình độ trễ chéo, đây là một công cụ rất hữu ích cho các nhà khoa học nghiên
cứu xu hướng và đánh giá theo thời gian.
Ứng dụng liên ngành: Phần mềm Amos được nhiều người dùng sử dụng rộng rãi
trong rất nhiều lĩnh vực, bao gồm tâm lý học con người, xã hội học, quản trị kinh
doanh và chuyên ngành giáo dục, đây là một công cụ linh hoạt giúp cho các
nhà khoa học nghiên cứu được nhiều lĩnh vực khác nhau.
→ Ưu điểm lớn nhất của AMOS là nó thể hiện các phân tích và chỉ số dưới dạng hình
ảnh đồ họa. Phần mềm này rất phù hợp cho các bài nghiên cứu có sử dụng dữ liệu khảo
sát thuộc ngành quản trị kinh doanh, kế toán, tài chính, ngân hàng, kinh tế phát triển, … 5. MATLAB a) Khái quát
MATLAB (Matrix Laboratory) là một môi trường tính toán và ngôn ngữ lập trình được
phát triển bởi MathWorks. Nó được sử dụng rộng rãi trong nhiều lĩnh vực, bao gồm khoa
học, kỹ thuật, y học, kinh tế và nghiên cứu. b, Chức năng
- Matlab là ngôn ngữ lập trình cao cấp, cho phép tính toán các con số và phát triển ứng dụng.
- Cung cấp môi trường tương tác để khảo sát, thiết kế và giải quyết các vấn đề.
- Cung cấp thư viện lớn các hàm toán học cho đại số tuyến tính, thống kê, phân tích
Fourier, bộ lọc, tối ưu hóa, tích phân và giải các phương trình vi phân bình thường.
- Matlab cung cấp các đồ thị được tích hợp sẵn để hiển thị hình ảnh dữ liệu và các công
cụ để tạo đồ thị tùy chỉnh.
- Giao diện lập trình của Matlab cung cấp các công cụ phát triển để nâng cao khả năng
bảo trì chất lượng mã và tối đa hóa hiệu suất. 27 lOMoARcPSD|37752136
- Cung cấp các công cụ để xây dựng các ứng dụng với các giao diện đồ họa tùy chỉnh.
- Cung cấp các hàm để tích hợp các thuật toán dựa trên Matlab với các ứng dụng
bênngoài và các ngôn ngữ khác như C, Java, NET và Microsoft Excel.
- Với những chức năng debug mạnh mẽ, mở file hàm bằng phím tắt, Debug là chức năng
tìm và gỡ rối ở các phần mềm IDE. Bạn có thể đánh dấu một chỗ nào đó trong đoạn code
rồi chạy từng bước một để biết lỗi xuất phát từ đâu.
- Vẽ đồ thị là một tính năng được trau chuốt trong MatLab; với rất nhiều kiểu đồ thị khác
nhau như biểu đồ dạng đường, biểu đồ chấm điểm, các lớp màu (patch) hai chiều, đường
đồng mức và các đường cong, mặt cong ba chiều. Ngoài ra MatLab còn cung cấp giao
diện để người dùng trực tiếp biên tập hình vẽ, điền vào các ghi chú theo ý muốn.
c) Đối tượng sử dụng: Matlab được sử dụng bởi kỹ sư, nhà khoa học, sinh viên, lập trình
viên, chuyên gia tài chính, và nhiều lĩnh vực khác để thực hiện tính toán, phân tích dữ
liệu và phát triển ứng dụng toán học và kỹ thuật. d) Ưu điểm
- Giải quyết các bài toán về giải tích số, xử lý tín hiệu số, xử lý đồ họa mà không phải lập trình cổ điển
- Dễ dàng tạo ra các ứng dụng có giao diện đồ họa tùy chỉnh.
- Hỗ trợ lượng lớn các hàm dùng trong đại số tuyến tính, thống kê, giải tích tối ưu hóa, phương trình vi phân. .
- Linh hoạt trong việc sử dụng, ngôn ngữ lập trình trực quan, dễ học và khả năng ứng dụng cao.
- Tốc độ xử lý các ma trận và tối ưu hóa nhanh
- MATLAB có giao diện ribbon đa nhiệm, các tùy chọn đã được để trong các tab riêng
biệt giống như trên Microsoft Office giúp bạn thao tác nhanh và dễ dùng hơn.
- Giúp hỗ trợ git và quản lý file dễ dàng, hỗ trợ file excel, hỗ trợ command lines tích hợp.
- Môi trường làm việc đa dạng, phần mềm sẽ giúp phát hiện lỗi cú pháp thời gian thực và
gợi ý sửa nhanh, gợi ý từ giống nhau e) Nhược điểm
- Chi phí cao, các bộ công cụ đi kèm viết riêng cho các nhu cầu nghiên cứu tính phí riêng. 2. EXCEL a, Khái quát
Microsoft Excel là một ứng dụng bảng tính thuộc bộ Microsoft Office, công dụng chính
của nó là giúp người dùng tính toán nhanh và chính xác với số lượng dữ liệu lớn. Excel là
một tập hợp các hàng và cột được kết hợp với nhau tạo ra một bảng tính lớn. Các hàng
thường được ký hiệu lần lượt bằng các chữ cái như: A, B, C, D, E, … còn các cột thì
được ký hiệu bằng các con số từ 1, 2, 3 cho đến n…. Một cột và một hàng gộp lại với 28 lOMoARcPSD|37752136
nhau sẽ trở thành một ô tính. Địa chỉ của ô sẽ được xác định bởi chữ cái đại diện cho cột
và số đại diện cho hàng. b) Chức năng
Excel là phần mềm dùng để nhập liệu, sao lưu, làm báo cáo, tính toán và phân tích dữ
liệu một cách nhanh và chính xác nhất. Không chỉ vậy, nhiều lập trình viên coi Excel là
một phương pháp tuyệt vời. Có nghĩa là không có tính năng nào của nó biết khi nào
chúng sẽ được sử dụng hoàn toàn. Excel cũng là tùy chọn đầu tiên khi xuất bất kỳ tệp nào
để đánh giá với bất kỳ chương trình nào khác vì tính hiệu quả của nó.
● Làm báo cáo, phân tích dữ liệu tình hình kinh doanh theo tháng, theo quý ● Tạo biểu đồ
● Giúp xác định xu hướng
● Mang dữ liệu lại với nhau ● Truy cập trực tuyến
● Sử dụng định dạng có điều kiện ● Quản lý nhân sự
● Nhập liệu hàng hóa, xuất kho, nhập kho
● Tính toán dữ liệu, tính tiền,. .
c) Đối tượng sử dụng
Ngày nay đa số ngành nghề đều cần bạn biết sử dụng Excel ít nhất là cần có các kỹ năng
cơ bản như nhập liệu, tính toán, vẽ biểu đồ. Trong thời đại dữ liệu trở thành công cụ quan
trọng trong chiến lược kinh doanh thì việc bạn có kiến thức Excel cơ bản đến nâng cao sẽ
dễ dàng làm việc ở nhiều công ty. Excel được sử dụng bởi doanh nghiệp, kế toán viên,
sinh viên, nhà nghiên cứu, quản lý dự án, giáo viên, . . để quản lý, tính toán và phân tích dữ liệu. d) Ưu điểm
- Lưu dữ liệu dưới dạng bảng tính: Excel có cấu trúc dạng bảng tính khoa học, cho phép
người dùng nhập và lưu dữ liệu nhanh chóng.
- Tích hợp nhiều công thức, hàm tính, hỗ trợ người dùng tính toán dữ liệu nhanh và chính xác.
- Dễ dàng vẽ biểu đồ dựa trên số liệu được cung cấp.
- Hỗ trợ nhiều hàm Excel từ cơ bản đến nâng cao. Khi dùng hàm thì sẽ có thêm phần chú thích bên dưới.
- Có rất nhiều dạng biểu đồ (chart) để làm báo cáo: biểu đồ cột, biểu đồ đường, biểu đồ hình bánh xe,. .
- VBA - một tính năng rất mạnh mẽ và mới lạ trong Excel, phù hợp cho các bạn đam mê công nghệ và lập trình. 29 lOMoARcPSD|37752136
- Tính năng liên kết giữa nhiều bảng tính: Giúp dữ liệu giữa các bảng tính liên kết chặt
chẽ hơn, hỗ trợ người dùng xử lý dữ liệu logic hơn.
- Đồng bộ hóa, làm việc trên nhiều thiết bị cùng một lúc.
- Cũng giống như bao phần mềm Office khác, Excel được rất nhiều nền tảng hỗ trợ. Từ
máy tính Windows (Điều đương nhiên) cho đến các dòng máy Mac (Tuy không được
tương thích tốt cho lắm). Rồi đến các dòng điện thoại hiện nay như iOS và Android. Đặt
biệt đối với các dòng Note của Samsung rất phù hợp nếu như bạn nào có nhu cầu sử dụng Excel trên điện thoại.
- Dự đoán dữ liệu thống kê, công cụ dịch nhanh, giao diện đẹp…
- Quen thuộc với mọi nhân viên văn phòng đặc biệt là kế toán viên. Do đó việc sử dụng
excel không mất quá nhiều thời gian để tìm hiểu và không đòi hỏi kế toán viên là người
có kiến thức chuyên sâu về cơ sở dữ liệu. Bên cạnh đó mô hình của excel cũng thuận tiện
cho việc tạo danh sách, hỗ trợ tối đa cho nhân viên kế toán.
- Phân phối rộng rãi, không mất phí sử dụng và được cài đặt sẵn trên máy tính, pc. Điều
này giúp người giảm bớt thời gian làm quen, cài đặt và giá rẻ khi sử dụng.
- Có nhiều tính năng phân tích, lập báo cáo nhanh chóng mà không cần bất kỳ phần mềm nào khác hỗ trợ. e) Nhược điểm
- Làm kế toán bằng excel phù hợp cho những công ty nhỏ, khi cơ sở dữ liệu không lớn,
kế toán viên có thể quản lý hết. Tuy nhiên, khi cơ sở dữ liệu lớn, kế toán viên không thể
kiểm soát hết thì excel lại trở nên bị động và gây nhiều khó khăn khi làm kế toán.
- Tính bảo mật thấp, có thể dễ dàng bị xóa file và không thể phục hồi lại dữ liệu.
- Làm kế toán bằng excel chỉ làm được 1 người tại 1 thời điểm do đó khó san sẻ công việc và khó bàn giao.
- File lưu riêng lẻ, khi làm báo cáo tài chính cuối năm thì vô cùng bất tiện và phải rà soát lại từ đầu.
- Tìm kiếm chứng từ, sổ sách, dữ liệu vô cùng khó khăn.
- Muốn tổng hợp dữ liệu thì phải tự thống kê và gõ lại từ đầu vô cùng mất thời gian.
- Cần thời gian sử dụng thành thục các tính năng, các hàm.
3. Lợi ích, vai trò của các kỹ thuật, phần mềm xử lý số liệu, dữ liệu nghiên cứu công chúng
Lợi ích, vai trò của các kỹ
Lợi ích, vai trò của các kỹ thuật,
thuật, phần mềm xử lý số liệu, phần mềm xử lý số liệu, dữ liệu
dữ liệu nghiên cứu công
nghiên cứu công chúng trong lĩnh chúng vực báo chí Thu thập dữ
- Giúp tổ chức thu thập dữ liệu
- Hỗ trợ trong việc thu thập thông
liệu/thông tin: từ nguồn đa dạng như khảo sát, tin và dữ liệu từ nhiều nguồn khác
nhau, bao gồm cơ sở dữ liệu trực 30 lOMoARcPSD|37752136
cuộc thăm dò, hoặc cơ sở dữ
tuyến, khảo sát, phân tích dữ liệu liệu lớn.
xã hội và nhiều nguồn thông tin
- Tạo ra khả năng tự động hóa khác.
việc thu thập dữ liệu, giảm công - Dễ dàng quản lý và tổ chức dữ
sức và thời gian cần thiết.
liệu để đảm bảo tính toàn vẹn, sẵn
sàng sử dụng cho công việc viết bài
báo hoặc sản xuất nội dung.
Xử lý và phân - Loại bỏ dữ liệu nhiễu và
- Giúp nhà báo và biên tập viên xác tích dữ liệu
không chính xác để đảm bảo
định xu hướng và mẫu thông tin
tính chuẩn xác và đáng tin cậy
quan trọng trong dữ liệu. của dữ liệu.
- Loại bỏ dữ liệu nhiễu và không
- Kết hợp và gộp dữ liệu từ
chính xác để đảm bảo thông tin
nhiều nguồn khác nhau để tạo
truyền tải chính xác và đáng tin
thành tập dữ liệu toàn diện hơn. cậy.
- Sử dụng các kỹ thuật phân
tích thống kê và máy học để tìm
ra mẫu, xu hướng và thông tin
quan trọng trong dữ liệu.
- Đánh giá tương quan và tương
tác giữa các biến để hiểu sâu
hơn về sự liên quan giữa chúng (các biến) Trực quan
- Biểu đồ và biểu đồ giúp hiển
- Tạo ra biểu đồ và đồ họa để phát hóa dữ liệu/
thị dữ liệu một cách trực quan,
hiện xu hướng, mẫu hình và các giá thông tin:
dễ hiểu hơn cho công chúng.
trị ngoại lệ, từ đó đúc kết nhanh
- Cung cấp cơ hội để trình bày
thông tin chuyên sâu và hỗ trợ
kết quả nghiên cứu một cách
trong việc ra quyết định tức thời, hấp dẫn và thú vị.
giúp độc giả dễ dàng tiếp cận, hiểu
thông tin và thông tin trở nên hấp dẫn hơn.
- Cung cấp cơ hội để trình bày dữ
liệu phức tạp một cách trực quan.
Dự đoán và kế - Sử dụng mô hình dự đoán để
- Sử dụng phân tích dữ liệu để dự hoạch
dự đoán sự kiện tương lai hoặc
đoán sự kiện tương lai.
đưa ra quyết định dựa trên dữ
Ví dụ: kết quả của một cuộc bầu cử liệu có sẵn.
hoặc xu hướng thị trường. 31 lOMoARcPSD|37752136
- Hỗ trợ quá trình ra quyết định - Cung cấp thông tin quan trọng để
và lập kế hoạch dựa trên thông chuẩn bị cho các sự kiện tương lai. tin dự báo.
Hỗ trợ đưa ra Cung cấp thông tin và dữ liệu
- Cung cấp thông tin dựa trên dữ quyết định
cơ sở để hỗ trợ quá trình ra
liệu giúp nhà báo và biên tập viên
quyết định trong doanh nghiệp, ra quyết định thông tin nào nên
chính phủ, và các tổ chức khác
được xuất bản và những tin tức nào
có giá trị cho độc giả.
- Hỗ trợ trong việc xác định ưu tiên
cho các sự kiện, câu chuyện hoặc chủ đề quan trọng. Tối ưu hoá
- Tự động hóa các công việc lặp Tự động hóa các công việc lặp đi
quá trình làm đi lặp lại, giúp tiết kiệm thời
lặp lại, giúp nhà báo tiết kiệm thời việc gian và tài nguyên.
gian và tập trung vào việc nghiên
- Nâng cao hiệu suất làm việc
cứu và sáng tạo nội dung. và giảm nguy cơ sai sót
Hỗ trợ nghiên - Trong lĩnh vực nghiên cứu
cứu khoa học khoa học, phần mềm xử lý số
liệu giúp phân tích và đánh giá dữ liệu thí nghiệm.
- Cung cấp phương tiện để chia
sẻ dữ liệu và kết quả với cộng đồng nghiên cứu. Tăng khả
Sử dụng phân tích dữ liệu và
năng dự đoán học máy để dự đoán xu hướng và dự báo
tương lai và tối ưu hóa chiến lược.
Đảm bảo tính Bảo vệ thông tin cá nhân của bảo mật và
khách hàng trong xuyên suốt quyền riêng
quá trình xử lý và lưu trữ dữ tư liệu. Tìm kiếm và
Sử dụng công cụ và phần mềm tìm phát hiện
kiếm để tìm kiếm thông tin nhanh thông tin 32 lOMoARcPSD|37752136
chóng từ hàng tỷ nguồn thông tin trên internet.
Giúp nhà báo tìm ra các tin tức
nóng hổi và tiềm năng cho các bài viết. Đảm bảo tính
Giúp kiểm tra và xác minh thông chính xác và
tin từ nhiều nguồn để đảm bảo tính tin cậy
chính xác và tin cậy của các bài viết báo chí. Tạo nội dung
Sử dụng dữ liệu và phân tích dữ độc đáo
liệu để tạo ra các bài viết và báo
cáo độc đáo và phong cách riêng biệt 33 lOMoARcPSD|37752136 TÀI LIỆU THAM KHẢO
1. Giáo trình Công chúng báo chí. TS. Lê Thu Hà
ht p:/ thuvien.ajc.edu.vn/ViewPDFOnline/document.php?loc=0&doc=118720875424158 509566095176942628088843 2.
Bộ Y Tế, cục Công Nghệ Thông Tin: “Tìm hiểu sự khác biệt giữa dữ liệu lớn với
dữ liệu truyền thống”
Tìm hiểu sự khác biệt giữa dữ liệu lớn và dữ liệu truyền thống 3.
TOPICA, Điều tra chọn mẫu
http://eldata9.topica.edu.vn/STA302/PDF/10-STA302-Bai%207-v1.0.pdf 4.
Giáo trình Thống kê doanh nghiệp, NXB Đại học Kinh tế quốc dân 5.
Phương pháp chọn mẫu và cỡ mẫu trong nghiên cứu khoa học sức khỏe
ht p:/ cphs.huph.edu.vn/uploads/tintuc/2020/Phuongphapchonmauvatinhtoancomau.pdf?f
bclid=IwAR0GJDZnDytDl4ZI9Jrs9W29TkLI1c13uhv7eZwR4o24yfpbZT8lzbS-_wA 6.
Lý luận chính trị và truyền thông, Một số vấn đề liên quan tới đạo đức trong các
nghiên cứu truyền thông trên không gian ảo
ht ps:/ lyluanchinhtrivatruyenthong.vn/mot-so-van-de-lien-quan-toi-dao-duc-trong-cac-
nghien-cuu-truyen-thong-tren-khong-gian-ao-p24961.html 7.
What Is Ethics in Research & Why Is It Important?
https://www.niehs.nih.gov/research/resources/bioethics/whatis/index.cfm
8. HKT Constant, Chọn mẫu xác suất
https://phuongphapnghiencuu.com/chon-mau-xac-suat/
9. Simple Psychology, Snowball Sampling: Definition, Method and Examples
https://www.simplypsychology.org/snowball-sampling.html
10. Simple Psychology, Cluster Sampling: Definition, Method and Examples
https://www.simplypsychology.org/cluster-sampling.html 34
Document Outline
- BÀI TẬP NHÓM
- CÁC PHƯƠNG PHÁP CHỌN MẪU TRONG NGHIÊN CỨU CÔNG CHÚ
- Hà Nội, tháng 09 năm 2023
- CÁC PHƯƠNG PHÁP CHỌN MẪU TRONG NGHIÊN CỨU CÔNG CHÚ
- NỘI DUNG
- I.CÁC PHƯƠNG PHÁP CHỌN MẪU TRONG NGHIÊN CỨU CÔNG CHÚ
- 2.Ưu - Nhược của điều tra chọn mẫu
- b.Nhược điểm:
- c.Các trường hợp vận dụng điều tra chọn mẫu
- 3.Các phương pháp chọn mẫu
- 4.Sai số trong điều tra chọn mẫu
- b.Các loại sai số
- Sai số do đăng ký, ghi chép
- Sai số do tính đại diện
- 5.Đạo đức trong việc chọn mẫu nghiên cứu
- a.Tầm quan trọng của đạo đức trong nghiên cứu
- b.Một số vấn đề đạo đức đáng chú ý trong các nghiên
- II.CÁC KỸ THUẬT, PHẦN MỀM XỬ LÝ SỐ LIỆU, DỮ LIỆU NGHI
- a.Dữ liệu
- ●Dữ liệu truyền thống
- ●Dữ liệu lớn (Big Data)
- b.Phân tích dữ liệu là gì?
- 2.Các kỹ thuật, phần mềm xử lý số liệu, dữ liệu nghi
- 2.1.SAS
- b)Chức năng
- c)Đối tượng
- d)Ưu điểm
- e)Nhược điểm
- 2.2.SPSS
- b)Chức năng
- c)Đối tượng
- d)Ưu điểm
- e)Nhược điểm
- 2.3.NVivo
- b)Chức năng
- Phân tích dữ liệu định tính:
- Đánh giá về tài liệu:
- c)Đối tượng
- d)Ưu điểm
- e)Nhược điểm
- 2.R
- c, Đối tượng người dùng hướng tới:
- d, Ưu điểm:
- e, Nhược điểm:
- 3.Eviews
- b, Chức năng:
- c, Ưu điểm:
- d, Nhược điểm:
- 4.AMOS
- 5.MATLAB
- b, Chức năng
- d)Ưu điểm
- e)Nhược điểm
- 2.EXCEL a, Khái quát
- 3.Lợi ích, vai trò của các kỹ thuật, phần mềm xử lý
- TÀI LIỆU THAM KHẢO