Lý thuyết môn học Phân tích dữ liệu xã hội nội dung "Tổng quan về khai phá website và phân tích mạng xã hội"

Lý thuyết môn học Phân tích dữ liệu xã hội nội dung "Tổng quan về khai phá website và phân tích mạng xã hội" giúp sinh viên ôn luyện và nắm vững kiến thức môn học liên quan đến khai phá website và phân tích mạng xã hội để đạt kết quả cao sau khi kết thúc học phần. Mời bạn đọc đón xem!

lOMoARcPSD|36667950
CHƯƠNG 1. TỔNG QUAN VỀ KHAI PHÁ WEBSITE VÀ PHÂN TÍCH MẠNG XÃ HỘI
1.1. Thế nào là khai phá web
Khai phá web có thể được coi là ứng dụng của các kỹ thuật Data mining được điều chỉnh cho
web. Khai phá web (Web Mining) là quá trình sử dụng các phương pháp và công cụ phân tích dữ
liệu để tìm kiếm, khám phá và trích xuất thông tin từ các nguồn dữ liệu trên World Wide Web.
Khai phá web giúp hiểu và tận dụng tri thức từ các trang web, cơ sở dữ liệu trực tuyến và các
nguồn thông tin khác trên Internet.
1.2. Phân loại khai phá web
Khai phá nội dung (Content Mining): Loại khai phá này tập trung vào việc trích xuất
thông tin từ các trang web, văn bản, hình ảnh, video và các nguồn dữ liệu khác trên web. Các kỹ
thuật trong khai phá nội dung bao gồm trích xuất thông tin, phân loại văn bản, trích xuất thực thể
(entity extraction), phân tích cảm xúc và trích xuất tri thức từ văn bản.
Khai phá cấu trúc (Structure Mining): Loại khai phá này tập trung vào việc phân tích cấu
trúc của các trang web và các liên kết giữa chúng. Phân loại và gom cụm trang web, phát hiện
mô hình liên kết, khám phá cấu trúc trang web và phân tích mạng lưới liên kết là những nhiệm
vụ phổ biến trong khai phá cấu trúc.
Khai phá sử dụng (Usage Mining): Loại khai phá này tập trung vào việc phân tích hành
vi và hoạt động của người dùng trên web. Điều này bao gồm phân tích dữ liệu log, theo dõi và
phân tích hành vi người dùng, phát hiện mẫu sử dụng và khám phá thông tin liên quan đến người
dùng.
1.3. Cấu trúc web
Cấu trúc web (Web Structure) đề cập đến cách mà các trang web và các liên kết giữa chúng
được tổ chức và xây dựng trên Internet. Cấu trúc web quyết định cách mà thông tin được tổ chức,
truy cập và liên kết với nhau trên các trang web.
1. Cấu trúc web bao gồm các yếu tố sau:
2. Trang web: Là các tài liệu HTML, CSS, hình ảnh, video và các thành phần khác được
hiển thị trên trình duyệt web. Mỗi trang web có một URL (Uniform Resource Locator) duy nhất
để truy cập và tham chiếu đến nó.
3. Liên kết: Là các đường dẫn hoặc hyperlinks được tạo thành từ văn bản, hình ảnh hoặc các
phần tử khác trên trang web, cho phép người dùng chuyển đến các trang web khác. Liên kết giúp
xác định mối quan hệ giữa các trang web và hướng dẫn người dùng điều hướng trên web.
4. Cấu trúc liên kết: Đây là sự tổ chức và cấu trúc các liên kết giữa các trang web. Cấu trúc
liên kết có thể được biểu diễn dưới dạng cây, đồ thị hoặc mạng lưới, tùy thuộc vào cách mà các
trang web được liên kết với nhau.
5. Trang gốc (Homepage): Là trang web chính của một trang web hoặc một trang web quốc
gia. Trang gốc thường là điểm khởi đầu cho việc duyệt web và thường có nhiều liên kết đến các
trang con khác.
1.4. Phân tích mạng xã hội
Phân tích mạng xã hội (Social Network Analysis - SNA) là một phương pháp nghiên cứu và
phân tích cấu trúc, mô hình và quan hệ giữa các thành viên trong một mạng xã hội. Nó tập trung
vào việc khám phá mối quan hệ xã hội, sự tương tác và sự lan truyền thông tin giữa các cá nhân,
tổ chức hoặc tài nguyên trong một mạng xã hội.
Phân tích mạng xã hội sử dụng các khái niệm và phương pháp từ lý thuyết đồ thị và khoa học
mạng để đo lường và hiểu về mối quan hệ giữa các đối tượng trong mạng xã hội. Các yếu tố
quan trọng trong phân tích mạng xã hội bao gồm:
1.4.1. Các lý thuyết nền tảng
thuyết đồ thị (Graph Theory): Lý thuyết đồ thị cung cấp cơ sở toán học cho phân tích
mạng xã hội. Nó nghiên cứu các khái niệm và thuật toán liên quan đến cấu trúc và tính chất của
các đồ thị. Các khái niệm như đỉnh (node), cạnh (edge), đường đi (path), mạng lưới (network) và
lOMoARcPSD|36667950
các thuật toán như tìm đường đi ngắn nhất, gom cụm, và phân tích cấu trúc đồ thị được áp dụng
trong phân tích mạng xã hội.
thuyết cấu trúc hóa xã hội (Social Structural Theory): Lý thuyết này nghiên cứu về cách
mà mạng xã hội được cấu trúc hóa và sự ảnh hưởng của cấu trúc đối với hành vi và quan hệ xã
hội. Nó quan tâm đến các khái niệm như vai trò, quan hệ xã hội, nhóm, mạng lưới xã hội, quyền
lực và các mô hình cấu trúc xã hội khác. Lý thuyết cấu trúc hóa xã hội giúp hiểu về mối quan hệ
giữa các thành viên trong mạng xã hội và vai trò của họ trong việc lan truyền thông tin và ảnh
hưởng xã hội.
thuyết lan truyền thông tin (Information Diffusion Theory): Lý thuyết này nghiên cứu về
quá trình lan truyền thông tin trong mạng xã hội. Nó xem xét cách thông tin được chia sẻ, tiếp
nhận và lan truyền qua các quan hệ xã hội. Các yếu tố như ngưỡng kích hoạt (activation
threshold), quyết định tiếp nhận thông tin và các mô hình lan truyền thông tin như mô hình lan
truyền SIR (Susceptible-Infectious-Recovered) được nghiên cứu trong lý thuyết lan truyền thông
tin.
1.4.2. Các giải thuật và kỹ thuật
Độ đo mạng xã hội (Social Network Metrics): Đây là các phép đo và chỉ số được sử dụng
để đo lường và mô tả các thuộc tính và tính chất của mạng xã hội. Các độ đo phổ biến bao gồm
số lượng liên kết (degree), trung tâm tâm của mạng (centrality measures) như trung tâm tiếp cận
(closeness centrality) và trung tâm trung gian (betweenness centrality), mật độ mạng (network
density), và chu trình (cycles) trong mạng xã hội. Các độ đo này giúp hiểu về sự phân bổ quan hệ
và vai trò của các thành viên trong mạng.
Phân cụm mạng xã hội (Social Network Clustering): Phân cụm mạng xã hội là quá trình
chia nhỏ mạng xã hội thành các nhóm con gắn kết mật thiết bên trong và thưa thớt với nhau. Các
thuật toán phân cụm như phân cụm Louvain, phân cụm Girvan-Newman và phân cụm gom cụm
cộng đồng (community detection) được sử dụng để tìm ra các cụm và tập hợp các thành viên
trong mạng xã hội có mối liên kết mạnh với nhau. Phân cụm mạng xã hội giúp xác định cấu trúc
và nhóm trong mạng xã hội.
Phân tích trực quan mạng xã hội (Social Network Visualization): Phân tích trực quan
mạng xã hội sử dụng các công cụ và kỹ thuật để hiển thị mạng xã hội dưới dạng biểu đồ hoặc đồ
thị. Các công cụ như Gephi, Cytoscape và NetworkX cho phép tạo biểu đồ và hiển thị mạng
hội theo cách trực quan và có thể tùy chỉnh. Phân tích trực quan mạng xã hội giúp hiểu rõ hơn về
mô hình kết nối và cấu trúc mạng xã hội.
Phân tích lan truyền thông tin (Information Diffusion Analysis): Phân tích lan truyền
thông tin nghiên cứu và mô phỏng quá trình lan truyền thông tin trong mạng xã hội. Các mô hình
như mô hình lan truyền SIR (Susceptible-Infectious-Recovered) và mô hình lan truyền thông tin
dựa trên ngưỡng kích hoạt (threshold-based models) được sử dụng để tìm hiểu về cách thông tin
và ý tưởng lan truyền qua mạng xã hội. Phân tích lan truyền thông tin giúp dự đoán và đo lường
sự ảnh hưởng và sự lan truyền của thông tin trong mạng.
1.4.3. Công cụ phân tích mạng xã hội
NodeXL: NodeXL là một ứng dụng mở rộng cho Microsoft Excel, giúp người dùng thu
thập và phân tích dữ liệu mạng xã hội. Nó cung cấp các tính năng như lấy dữ liệu từ các nguồn
mạng xã hội phổ biến, tính toán các độ đo mạng xã hội và tạo biểu đồ trực quan trong Excel.
UCINet: UCINet là một phần mềm chuyên dụng cho phân tích mạng xã hội và nghiên
cứu xã hội. Nó cung cấp các tính năng như thu thập dữ liệu mạng, tính toán độ đo mạng xã hội,
phân cụm mạng và trực quan hóa.
Ngoài ra còn có: NetMiner, GATE, NetworkX, Gephi, Cytoscape, Pajek..
1.4.4. Các chủ đề trong phân tích mạng xã hội
Cấu trúc mạng xã hội: Chủ đề này tập trung vào việc nghiên cứu cấu trúc và đặc điểm
của mạng xã hội. Điều này bao gồm việc xác định các thuộc tính mạng xã hội như độ dày, độ
phân cấp, độ liên kết, và trung tâm tâm của mạng.
lOMoARcPSD|36667950
Độ phân cụm và cộng đồng: Chủ đề này tập trung vào việc phân tích và phát hiện các
cụm và cộng đồng trong mạng xã hội. Nghiên cứu về độ phân cụm và cộng đồng giúp hiểu rõ
hơn về sự tổ chức và tương tác trong mạng xã hội.
Lan truyền thông tin và ảnh hưởng: Chủ đề này tập trung vào việc nghiên cứu quá trình
lan truyền thông tin và sự ảnh hưởng của thông tin trong mạng xã hội. Điều này bao gồm việc
khám phá các mô hình lan truyền thông tin, xác định các nhân tố ảnh hưởng và dự đoán sự lan
truyền thông tin trong mạng xã hội.
Phân tích tương tác xã hội: Chủ đề này tập trung vào việc phân tích và đo lường các
tương tác xã hội trong mạng. Nghiên cứu về tương tác xã hội giúp hiểu về quan hệ, tương tác
sự tương tác giữa các thành viên trong mạng xã hội.
Phân tích hành vi và sự lan truyền ý kiến: Chủ đề này tập trung vào việc nghiên cứu hành
vi của người dùng và quá trình lan truyền ý kiến trong mạng xã hội. Nghiên cứu này có thể liên
quan đến phân tích dữ liệu về hoạt động trên mạng xã hội, đánh giá ý kiến và tác động của người
dùng trong mạng.
Ứng dụng của phân tích mạng xã hội: Chủ đề này tập trung vào việc áp dụng phân tích
mạng xã hội vào các lĩnh vực cụ thể như marketing, quản lý dự án, y tế, và tình báo. Nghiên cứu
về ứng dụng của phân tích mạng xã hội giúp tìm hiểu cách áp dụng các kỹ thuật và công cụ phân
tích mạng xã hội vào các vấn đề thực tế.
CHƯƠNG 2. KHAI PHÁ DỮ LIỆU WEBSITE
2.1. Cơ bản về phân tích Website
2.1.1. Các tình huống phân tích Web
Phân tích nội dung: Đánh giá chất lượng, độ tương thích và cấu trúc của nội dung trên
trang web. Phân tích nội dung bao gồm việc kiểm tra từ khóa, xác định sự tương tác của người
dùng với nội dung, kiểm tra cấu trúc thông tin và đảm bảo tính tương thích với các chuẩn web.
Phân tích giao diện người dùng (UI): Xem xét thiết kế giao diện của trang web, kiểm tra
tính tương thích với các trình duyệt và các thiết bị khác nhau. Phân tích UI cũng bao gồm kiểm
tra sự dễ sử dụng, trải nghiệm người dùng và tuân thủ các nguyên tắc thiết kế tốt.
Phân tích trải nghiệm người dùng (UX): Đánh giá trải nghiệm của người dùng khi sử
dụng trang web. Phân tích UX tập trung vào khả năng tương tác, tốc độ tải trang, sự tiện lợi và
thỏa mãn của người dùng khi sử dụng trang web.
Phân tích hiệu suất: Đánh giá tốc độ tải trang, thời gian phản hồi, tải xuống và tương tác
của trang web. Phân tích hiệu suất giúp xác định các vấn đề liên quan đến tốc độ và hiệu suất của
trang web, từ đó tối ưu hóa trang web để cải thiện trải nghiệm người dùng.
Phân tích SEO: Đánh giá các yếu tố liên quan đến tối ưu hóa công cụ tìm kiếm (SEO).
Phân tích SEO giúp xác định từ khóa, tối ưu hóa các phần tử trên trang web để cải thiện thứ hạng
trang web trên các công cụ tìm kiếm.
Phân tích an ninh …
2.1.2. Tại sao cần phân tích dữ liệu Web
Phân tích dữ liệu web giúp hiểu rõ khách hàng hơn, đo lường hiệu quả các chiến dịch
mark, hiểu được người dùng như thế nào để tối ưu hoá trang web, tối ưu hoá công cụ tìm kiếm
2.2 Phát triển các công cụ phân tích Website
2.2.1 Năm bước trong quá trình phân tích Website
Xác định các mục tiêu kinh doanh khi bắt đầu đầu dự án.
Liên kết các mục đích cho từng mục tiêu kinh doanh
Đặt các chỉ số hiệu suất chính (KPI) liên quan đến mỗi mục tiêu kinh doanh.
Xác định giá trị mục tiêu cho mỗi KPI.
Xác định các nhóm người/ hành vi/ kết quả để phân tích tại sao dự án thành công hoặc
thất bại.
lOMoARcPSD|36667950
2.2.2 Chu kỳ cải tiến Website
Web 1
Ưeb 2
Web 3
Web 4
Ch đọc
Đọc viết
Cá nhân, di động, M
rng
Hi t
Tp trung vào
công ty doanh
nghip
Tp trung vào
cộng đồng, Xã
hi
Tp trung vào cá nhân
Tr lý cá nhân( Siri, GG hin
hành cortana)
Trang ch
Blog, wiki
Phương 琀椀 n truyn
trc 琀椀 ếp, phát trc
琀椀 ếp, sóng d liu
BOT/ Đặc v thong minh/ Máy
bay không người lái
S hu ni
dung ca bn
Chia s ni dung
ca bn
Thu nhp và ni dung
Ni dung có th lp trình và
ni dung theo yêu cu
Biu mu web
ng dng web
ng dng thông minh/
t động
Trí tu nhân to/ Thut toán
Thư mục và
thư mục web
gn th nôi dung
Hành vi người dùng/
Bản thân định lượng
Đám mây riêng tư, Internet
vn vt
lượt xem trang
Gía Mi nhp
chut(CPC)
Mức độ tương tác của
người dùng qua các ch
s đưc thu nhp
Đo kênh chéo
qung cáo
biu ng
quảng cáo tương
tác
qun cáo và nhm mc
琀椀 êu theo hành vi
Qung cáo có lp trình
Britannica trc
tuyến
wikipedia
web ng nghĩa
Minh bch WEB/ WikiLeaks
Cng thông
n
HTML và Web
XML/RSS
RDF/RDFS/OWL
máy nh lượng t, AI
2.2.3 Yêu cầu kinh doanh chính (KBR) so với chính các chỉ số hoạt động (KPI)
Yêu cầu kinh doanh chính (KBR): KBR là các mục tiêu và yêu cầu quan trọng từ góc
nhìn kinh doanh mà công cụ phân tích website cần đáp ứng. Đây là các yêu cầu tổng thể mà công
cụ phải đáp ứng để hỗ trợ các mục tiêu kinh doanh của tổ chức. Ví dụ, một KBR có thể là cung
cấp thông tin chi tiết về hành vi người dùng để tối ưu hóa trải nghiệm người dùng và tăng tỷ lệ
chuyển đổi trên trang web.
Chỉ số hoạt động (KPI): KPI là các chỉ số đo lường và đánh giá hiệu suất của công cụ
phân tích website. Chúng là các chỉ số cụ thể và định lượng để đo lường mức độ đạt được các
KBR. Ví dụ, một KPI có thể là tỷ lệ chuyển đổi, thời gian trung bình trên trang, số lần click vào
quảng cáo, v.v. Các KPI giúp đo lường hiệu quả và đưa ra thông tin quan trọng về hiệu suất của
công cụ phân tích website.
Vai trò:
KBR định hình các yêu cầu chính và mục tiêu cần đạt được của công cụ phân tích
website từ góc nhìn kinh doanh. Chúng định hướng và tạo nền tảng cho quá trình phát triển công
cụ.
KPI cung cấp các chỉ số đo lường và đánh giá để kiểm tra xem công cụ phân tích có đáp
ứng KBR hay không. Chúng giúp đo lường hiệu quả và hiệu suất của công cụ, đồng thời cung
cấp thông tin để điều chỉnh và cải thiện công cụ.
lOMoARcPSD|36667950
2.2.4 Các chỉ số phân tích Website
Lưu lượng trang web, tỷ lệ chuyển đổi, thời gian trung bình trên trang, tỷ lệ thoát, số lần
xem trang, nguồn lưu lượng, tỷ lể chuyển đổi theo từ khoá…
2.3 Chỉ số trung gian và phân tích Website
2.3.1 Các chỉ số trung gian trong phân tích Website
Tốc độ tải trang, tỷ lệ thoát trang, đường dẫn điều hướng, thời gian ở lại trang, thông tin
về thiết bị, trình duyệt
Chỉ số phân tích là các chỉ số tổng quát và cung cấp cái nhìn tổng quan về hiệu suất toàn
cầu của trang web, trong khi chỉ số trung gian tập trung vào các chỉ số chi tiết và phân tích sâu
hơn để hiểu rõ hơn về các yếu tố cụ thể và hoạt động trên trang web.
2.3.2 Thiết kế KPI tùy chỉnh?
2.4 Cách phân tích Website theo dõi dữ liệu duyệt web của người dùng
2.4.1 Web Beacon Tracking
Phân tích Website theo dõi dữ liệu duyệt web của người dùng thông qua Web Beacon
Tracking là một phương pháp được sử dụng để thu thập thông tin về hành vi người dùng trên
trang web. Web Beacon, hay còn gọi là pixel theo dõi (tracking pixel), là một hình ảnh nhỏ hoặc
một đoạn mã nhúng không thể nhìn thấy trực tiếp trên trang web. Khi trang web được tải, Web
Beacon sẽ gửi một yêu cầu tới máy chủ để ghi lại việc trang web đã được truy cập và các hoạt
động của người dùng.
Đặt web beacon -> WB gửi yêu cầu đến máy chủ -> WB ghi lại dữ liệu và lưu trữ -> phân tích
dữ liệu -> đánh giá và cải thiện
2.4.2 Mô hình thuộc tính (Attribution Models)
Mô hình thuộc tính (Attribution Models) là một khung làm việc được sử dụng trong phân tích
website để xác định và ghi nhận giá trị hoặc tác động của các touchpoint (điểm tiếp xúc) khác
nhau trên trang web đối với quyết định cuối cùng của người dùng. Nó giúp phân tích và hiểu rõ
hơn về cách các touchpoint góp phần vào quá trình chuyển đổi và hiệu quả của trang web.
Xác định mục tiêu -> thu thập dữ liệu -> lựa chọn mô hình thuộc tính -> phân tích dữ liệu ->
đánh giá và tối ưu hoá
2.4.3 Phân tích Site Pathing Analysis
Phân tích Site Pathing là quá trình nghiên cứu và phân tích các tuyến đường di chuyển của
người dùng trên trang web. Nó giúp bạn hiểu rõ hơn về hành vi và tương tác của người dùng trên
trang web của bạn, từ đó đưa ra những cải tiến và tối ưu hóa trang web để cung cấp trải nghiệm
tốt hơn cho người dùng và đạt được mục tiêu kinh doanh.
Thu thập dữ liệu -> xác định mục tiêu -> xem xét các tuyến đường -> xác định điểm yếu và
cải thiện -> theo dõi và đánh giá.
Chương 3: PH N TÍCH TRANG WEB N NG CAO VÀ WEB INTELLIGENCE
3.1 Hệ sinh thái các bên liên quan (trang 41 slide 1)
3.1.1 Loại thông tin mà các bên liên quan muốn
- Multi-channel campaign management / quản lý chiến dịch đa kênh
- Marketing automation/ tiếp thị tự động
- Customer scoring /phân loại, đánh giá khách hàng - Mobile optimization/ tối ưu hoá thiết
bị di động
Dữ liệu phi cấu trúc bên ngoài
Có cấu trúc bên ngoài
Nội bộ
lOMoARcPSD|36667950
Tiện ích sử dụng
Cụm từ tìm kiếm
Dữ liệu thị trường tài chính
Dữ liệu giao thông du lịch
Dữ liệu khí hậu
Dữ liệu địa lý
Bình Luận Blog
Dữ liệu truyền thông xã hội
Tin tức
dữ liệu điều tra dân số
Dữ liệu đối tác
Một số dữ liệu địa lý
Hồ sơ xã hội
Giao dịch bán hàng
Phân tích trang web
Sản phẩm Vận chuyển và Trả
lại
Dữ liệu hàng tồn kho
Dữ liệu trung tâm cuộc
gọi/liên hệ hóa đơn Dữ liệu
CRM
Dữ liệu nhân viên
Chiến Dịch Tiếp Thị
3.1.2 Vai trò của các bên liên quan
Là then chốt
lOMoARcPSD|36667950
3.2 Tăng cường báo cáo Phân tích Website với nguồn dữ liệu bên ngoài
3.2.1 Hệ sinh thái phân tích trang website
lOMoARcPSD|36667950
Các giai đoạn triển khai hệ sinh thái phân tích trang web :
3.2.2 Phân tích trang web thực dụng (Pragmatic Web Analytics)
Không biết huhu
**Đánh giá trang web: các nền tảng web Analytics đc thiết kế để đo lường hành vi của ng truy
cập với 1 trangweb và thiết kế của web (UX) với ng truy cập
3.3 Thiết lập các chỉ số đo lường nâng cao
3.3.1 Các chỉ số đo lường ngành
Các chỉ số hiệu suất chính( KPI)
Các chỉ số KPI thông thường được sử dụng trong các ngành công ty:
Bán lẻ: xem sản phẩm, thanh toán, mua hàng
Truyền thông: đăng ký theo dõi, đăng ký cuộc thi, xem trang, xem video
Tài chính: đệ trình đơn, đăng nhập, sử dụng công cụ tự phục vụ
Du lịch: đặt phòng (mua hàng), chiến dịch nội bộ (nhấp chuột), tìm kiếm (giá vé)
Viễn thông: mua hàng, khách hàng tiềm năng, sử dụng công cụ tự phục vụ
Công nghệ cao: tải xuống bài báo trắng, RFP (yêu cầu đề xuất), hoàn thành biểu mẫu, yêu cầu
hỗ trợ
Ô tô: đệ trình khách hàng tiềm năng, yêu cầu báo giá, tải xuống thông tin quảng cáo.
3.3.2 Các chỉ số theo phân đoạn (Segment)
Các nền tảng phân tích Web cung cấp phân đoạn tùy chỉnh (mảnh dữ liệu) có thể thông tin về
những quyết định kinh doanh - và trong khoản này, chúng vượt trội so với các loại nền tảng phân
tích khác.
lOMoARcPSD|36667950
Hình: kích thước và loại phân tích trang web
nhân khẩu học Các
mẫu tham quan
bỏ rơi
Tính cách và loại người dùng
mức độ hứng thú
Ngành công nghiệp
Dữ liệu chuyển đổi
Thay đổi hoạt động
Nguồn lưu lượng truy cập
Nội dung đã xem
Nền tảng/Thiết bị
Ngày và Giờ
3.3.3 Đo lường chuyển đổi của khách hàng
Khi một khách truy cập truy cập vào một trang web, họ tạo ra dữ liệu. Nhà tiếp thị có thể đo
lường tác động của các hoạt động của khách truy cập diễn ra trên trang web.
3.3.4 Thiết lập các chỉ số đo nguồn lưu lượng
Tìm kiếm Tự nhiên
Liên kết từ trang web khác
Lưu lượng Trực tiếp
Tìm kiếm Trả phí
Các loại lưu lượng từ các chiến dịch khác
Mạng xã hội
** Tính toán "Thời gian Sử dụng" trong Phân tích Web
Tính toán thời gian mà một lượt truy cập trang web kéo dài bao lâu (gọi là lượt xem trang); khi
một lượt truy cập chỉ đưa ra kết quả là một lượt xem trang duy nhất thì được gọi là "bounce (tỷ lệ
thoát trang)."
3.3.5 Các tính năng bổ sung của nền tảng phân tích trang website
CHƯƠNG 4: PH N TÍCH DỮ LIỆU MẠNG XÃ HỘI
4.1. Các thuật ngữ phổ biến trong phân tích mạng xã hội
4.1.1 Network mạng lưới
Mạng
Ở cấp độ rất cơ bản, mạng là một nhóm các nút được liên kết với nhau.
lOMoARcPSD|36667950
Các nút (còn được gọi là đỉnh) có thể đại diện cho bất kỳ thứ gì, bao gồm cá nhân, tổ chức,
quốc gia, máy tính, trang web hoặc bất kỳ thực thể nào khác.
Liên kết (còn được gọi là mối quan hệ, cạnh hoặc vòng cung) thể hiện mối quan hệ giữa các
nút trong mạng.
4.1.2 Social Networks Mạng xã hội
Mạng xã hội
Mạng xã hội là một nhóm các nút, đại diện cho các thực thể xã hội như con người hoặc tổ
chức và các liên kết được hình thành bởi các thực thể xã hội này. Ví dụ, các liên kết có thể đại
diện cho các mối quan hệ, tình bạn và quan hệ thương mại. Mạng xã hội có thể tồn tại cả trong
thế giới thực và trực tuyến và bổ sung cho nhau. Thế giới trực tuyến giúp tạo ra các kết nối tốt
hơn trong thế giới của chúng ta. Mạng giữa các bạn cùng lớp là một ví dụ về mạng xã hội trong
thế giới thực. Hơn nữa, mạng theo dõi Twitter là một ví dụ về mạng truyền thông xã hội trực
tuyến. Trong mạng theo dõi Twitter, các nút là người dùng Twitter và liên kết giữa các nút biểu
thị mối quan hệ theo dõi của người theo dõi (nghĩa là ai đang theo dõi ai) giữa những người
dùng.
4.1.3 Social Network Site Website mạng xã hội
Trang mạng xã hội
Trang mạng xã hội là một phần mềm có mục đích đặc biệt (hoặc công cụ truyền thông xã hội)
được thiết kế để tạo điều kiện thuận lợi cho các mối quan hệ xã hội hoặc nghề nghiệp. Facebook,
Google+ và LinkedIn là những ví dụ về các trang mạng xã hội.
4.1.4 Social Networking
Mạng xã hội
Hành động hình thành, mở rộng và duy trì các mối quan hệ xã hội được gọi là mạng xã hội. Ví
dụ, sử dụng các trang mạng xã hội, người dùng có thể hình thành, mở rộng và duy trì các mối
quan hệ xã hội trực tuyến với gia đình, bạn bè, đồng nghiệp và đôi khi là người lạ.
4.1.5 Social Network Analysis Phân tích mạng xã hội
Phân tích mạng xã hội
Phân tích mạng xã hội là khoa học nghiên cứu và hiểu về mạng xã hội¹2 và mạng xã hội. Đây
là một lĩnh vực lâu đời có nguồn gốc từ nhiều lĩnh vực khác nhau bao gồm lý thuyết đồ thị, xã
hội học, khoa học thông tin và khoa học truyền thông. 4.2 Các loại mạng xã hội phổ biến
4.2.1 Mạng lưới tình bạn - Friendship Networks
Mạng lưới tình bạn
Loại mạng truyền thông xã hội phổ biến nhất là mạng tình bạn, chẳng hạn như Instagram,
Twitter và Snapchat. Mạng lưới tình bạn cho phép mọi người duy trì các mối quan hệ xã hội và
chia sẻ nội dung với những người mà họ liên kết chặt chẽ, chẳng hạn như gia đình và bạn bè. Các
nút trong các mạng này là con người và các liên kết là các mối quan hệ xã hội (ví dụ: tình bạn,
gia đình và các hoạt động).
4.2.2 Mạng lưới Follower–Following
Mạng theo dõi người theo dõi
Trong mạng theo dõi người theo dõi, người dùng theo dõi (hoặc theo dõi) những người dùng
quan tâm khác. Twitter là một ví dụ tuyệt vời về mạng theo dõi nơi người dùng theo dõi những
người, thương hiệu và tổ chức có ảnh hưởng. Các nút trong các mạng này, chẳng hạn như con
người, thương hiệu và tổ chức, và các liên kết đại diện cho các mối quan hệ theo dõi (ví dụ: ai
đang theo dõi ai). Dưới đây là hai thuật ngữ Twitter phổ biến.
Sau đây là những người bạn theo dõi trên Twitter. Theo dõi ai đó trên Twitter
có nghĩa:
Bạn đang đăng ký Tweet của họ với tư cách là người theo dõi.
Cập nhật của họ sẽ xuất hiện trên màn hình chính hoặc trang tổng quan của bạn.
Người đó có thể gửi tin nhắn trực tiếp cho bạn.
lOMoARcPSD|36667950
Bạn có thể đăng ký các tweet để được thông báo khi tài khoản tweet (mặc dù bạn không thể
gửi tin nhắn trực tiếp trừ khi người đó theo dõi lại bạn).
Người theo dõi là những người theo dõi bạn trên Twitter. Nếu ai đó theo dõi bạn, điều đó có
nghĩa là:
Họ sẽ hiển thị trong danh sách "Người theo dõi" của bạn.
Họ sẽ thấy các tweet của bạn trong dòng thời gian trên trang chủ của họ bất cứ khi nào họ
đăng nhập vào Twitter.
Bạn có thể gửi tin nhắn trực tiếp cho họ.
4.2.3 Mạng lưới Fan Network
Mạng lưới người hâm mộ
Mạng lưới người hâm mộ được hình thành bởi những người hâm mộ trên mạng xã hội hoặc
những người ủng hộ ai đó hoặc điều gì đó, chẳng hạn như sản phẩm, dịch vụ, người, thương
hiệu, doanh nghiệp hoặc thực thể khác. Mạng được hình thành bởi những người dùng phương
tiện truyền thông xã hội đã đăng ký trang người hâm mộ trên Facebook của bạn là một ví dụ về
mạng người hâm mộ. Các nút trong các mạng này là người hâm mộ và liên kết đại diện cho đồng
thích, đồng nhận xét và đồng chia sẻ. Mạng người hâm mộ có thể thụ động (thông qua người
đăng ký đã mua) hoặc tích cực (người theo dõi được tạo tự nhiên tương tác tích cực với bài đăng
của bạn).
4.2.4 Mạng lưới nhóm - Group Network
Mạng nhóm
Mạng lưới nhóm được hình thành bởi những người có chung sở thích và chương trình nghị sự.
Hầu hết các nền tảng truyền thông xã hội đều cho phép tạo các nhóm nơi một thành viên có thể
đăng, nhận xét và quản lý các hoạt động trong nhóm. Ví dụ về các nhóm truyền thông xã hội là
nhóm chuyên nghiệp Twitter, nhóm Yahoo và nhóm Facebook. Các nút trong các mạng này là
thành viên nhóm và các liên kết có thể đại diện cho đồng nhận xét, đồng thích và đồng chia sẻ.
4.2.5 Mạng lưới chuyên gia - Professional Networks
Mạng chuyên nghiệp
LinkedIn là một ví dụ điển hình về mạng chuyên nghiệp nơi mọi người quản lý danh tính
nghề nghiệp của họ bằng cách tạo hồ sơ liệt kê thành tích, trình độ học vấn, quá trình làm việc và
sở thích của họ. Các thành viên của LinkedIn cũng có thể tìm kiếm hồ sơ hoặc công việc theo các
từ khóa cụ thể (ví dụ: "quản lý thể thao"). Các nút trong các mạng này có thể đại diện cho mọi
người, thương hiệu hoặc tổ chức. Liên kết là quan hệ nghề nghiệp và trong LinkedIn được gọi là
"kết nối" (chẳng hạn như đồng nghiệp, nhân viên hoặc cộng tác viên). Một tính năng quan trọng
của các mạng chuyên nghiệp là tính năng xác nhận, nơi những người biết bạn có thể xác nhận
các kỹ năng và trình độ của bạn. Ngoài ra, tính năng đề xuất, trong đó các thành viên không được
kết nối của mạng xã hội được đề xuất cho người dùng, là một đặc điểm quan trọng khác.
4.2.6 Các dạng mạng lưới khác
a) Content networks/ Mạng nội dung
Mạng nội dung
Mạng nội dung được hình thành bởi nội dung được đăng bởi người dùng phương tiện truyền
thông xã hội. Mạng video YouTube là một ví dụ về mạng nội dung. Trong một mạng như vậy,
các nút là nội dung truyền thông xã hội (chẳng hạn như video, thẻ và ảnh) và các liên kết có thể
biểu thị, chẳng hạn như tính tương đồng (nội dung thuộc cùng danh mục có thể được liên kết với
nhau).
b) Dating networks/ Mạng hẹn hò
Mạng hẹn hò
Các mạng hẹn hò (chẳng hạn như Match.com và Tinder) tập trung vào việc kết hợp và sắp xếp
đối tác hẹn hò dựa trên thông tin cá nhân (chẳng hạn như tuổi, giới tính, sở thích, mối quan tâm
chung và vị trí) do người dùng cung cấp. Các nút trong các mạng này là con người và các liên kết
đại diện cho các mối quan hệ xã hội (chẳng hạn như các mối quan hệ lãng mạn).
lOMoARcPSD|36667950
c) Co-Authorship Networks/ Mạng đồng tác giả
Mạng đồng tác giả
Mạng đồng tác giả là hai hoặc nhiều người làm việc cùng nhau để hợp tác trong một dự án.
Wikipedia (bách khoa toàn thư trực tuyến) là một ví dụ điển hình về mạng đồng tác giả dựa trên
phương tiện truyền thông xã hội được tạo bởi hàng triệu tác giả từ khắp nơi trên thế giới. 13 Một
ví dụ rõ ràng hơn về mạng đồng tác giả là nền tảng ResearchGate: một trang mạng xã hội để các
nhà nghiên cứu chia sẻ các bài báo, hỏi và trả lời các câu hỏi cũng như tìm cộng tác viên. Trong
các mạng này, các nút là, ví dụ, các nhà nghiên cứu và các liên kết đại diện cho mối quan hệ
đồng tác giả.
d) Co-Commenter Networks/ Mạng đồng bình luậnNode: users/ Links:
cùng nhau cmt.
Mạng đồng bình luận
Mạng đồng bình luận được hình thành khi hai hoặc nhiều người bình luận về nội dung truyền
thông xã hội (ví dụ: cập nhật trạng thái Facebook, bài đăng trên blog, đánh giá nhà hàng Yelp
hoặc video YouTube). Ví dụ, một mạng đồng bình luận có thể được xây dựng từ các bình luận
được đăng bởi người dùng để phản hồi một video được đăng trên YouTube hoặc một trang
Facebook dành cho người hâm mộ. Trong các mạng này, các nút đại diện cho người dùng và liên
kết đại diện cho mối quan hệ đồng nhận xét.
e) Co-Like Networks/ Mạng đồng thích.
Mạng đồng thích
Mạng đồng thích được hình thành khi hai hoặc nhiều người thích cùng một nội dung trên
mạng xã hội. Sử dụng NodeXL (một công cụ phân tích mạng xã hội), người ta có thể xây dựng
một mạng dựa trên lượt đồng thích (hai hoặc nhiều người thích một nội dung tương tự) của trang
Facebook dành cho người hâm mộ. Trong mạng như vậy, các nút sẽ là người dùng/người hâm
mộ Facebook và các liên kết sẽ là mối quan hệ đồng thích. Facebook cũng sử dụng đồng thích để
đề xuất các thành viên khác mà họ chưa kết nối với tư cách là một người bạn được đề xuất. Mối
quan hệ đồng thích có thể được nhìn thấy trên Facebook khi mọi người chia sẻ bài đăng của
người khác.
f) Co-Occurrrence/ Mạng cùng xuất hiện
Mạng cùng xuất hiện
Các mạng cùng xuất hiện được hình thành khi có thêm hai thực thể (ví dụ: từ khóa, con người,
ý tưởng và thương hiệu) cùng xuất hiện trên các phương tiện truyền thông xã hội. Ví dụ: người ta
có thể xây dựng một mạng lưới tên thương hiệu (hoặc người) cùng xuất hiện để điều tra tần suất
một số thương hiệu (hoặc người) nhất định cùng xuất hiện trên các phương tiện truyền thông xã
hội. Trong các mạng như vậy, các nút sẽ là tên thương hiệu và các liên kết sẽ đại diện cho mối
quan hệ cùng xuất hiện giữa các thương hiệu.
g) Geo Co-Existence Network/ Mạng cùng tồn tại địa lý
Mạng cùng tồn tại địa lý
Mạng cùng tồn tại địa lý được hình thành khi hai hoặc nhiều thực thể (ví dụ: người, thiết bị và
địa chỉ) cùng tồn tại ở một vị trí địa lý. Trong một mạng như vậy, nút đại diện cho các thực thể
(ví dụ: con người), trong khi các liên kết giữa chúng thể hiện sự cùng tồn tại. Ví dụ về mạng
cùng tồn tại địa lý:
Khách tham quan bảo tàng (hoặc bất kỳ địa điểm nào) sử dụng các ứng dụng truyền thông xã
hội trên thiết bị di động của họ để đăng ký bằng Facebook hoặc Swarm (Foursquare); các thành
viên khác đã đăng ký gần đây sẽ đến bảo tàng được hiển thị cho thành viên thông qua ứng dụng.
• Người mua sắm ghé thăm các cửa hàng truyền thống và mua sắm ở đó bằng ứng dụng hỗ trợ
Bluetooth kết nối với mạng iBeacon được cài đặt tại địa điểm.
h) Hyperlink Networks/ Mạng siêu liên kết
Mạng siêu liên kết
lOMoARcPSD|36667950
Nói một cách đơn giản, siêu liên kết là một cách để kết nối các tài liệu (chẳng hạn như các
trang web). Siêu liên kết có thể được coi là liên kết trong (nghĩa là siêu liên kết bắt nguồn từ các
trang web khác, 14 đưa lưu lượng truy cập/người dùng đến trang web của bạn) hoặc liên kết
ngoài (tức là liên kết bắt nguồn từ trang web của bạn và đi ra ngoài.
Các loại mạng
Từ quan điểm kỹ thuật, các mạng được đề cập ở trên có thể được phân loại theo nhiều
cách khác nhau, bao gồm:
1. Based on existence/ dựa trên sự tồn tại
Dựa trên cách các mạng tồn tại trực tuyến hoặc được xây dựng, chúng có thể được phân loại
thành:
+Thứ 1: Mạng ngầm
+Thứ 2: Mạng rõ ràng
Mạng ngầm
Các mạng ngầm không tồn tại theo mặc định và cần được xây dựng có chủ ý với sự trợ giúp
của các công cụ và kỹ thuật chuyên dụng. Ví dụ về các mạng như vậy bao gồm mạng cùng xuất
hiện từ khóa, mạng đồng trích dẫn, mạng đồng bình luận, mạng siêu liên kết, v.v. Việc xây
dựng và nghiên cứu các mạng ẩn có thể cung cấp thông tin và hiểu biết có giá trị. Ví dụ: một
nhóm Facebook có thể được coi là một mạng ngầm được hình thành có chủ ý. Một loại mạng
ngầm khác là khi một số người dùng Twitter đăng về một sự kiện đang diễn ra bằng cách sử
dụng thẻ bắt đầu bằng #hashtag cụ thể - các thành viên được kết nối với nhau thông qua các thẻ
bắt đầu bằng # và có thể xem các bài đăng của nhau có chứa cùng một thẻ bắt đầu bằng
hashtag. Mạng rõ ràng
Các mạng truyền thông xã hội rõ ràng tồn tại theo mặc định; nói cách khác, chúng được thiết
kế rõ ràng để người dùng mạng xã hội tham gia. Hầu hết các mạng truyền thông xã hội đều rõ
ràng về bản chất. Ví dụ về các mạng truyền thông xã hội rõ ràng bao gồm mạng tình bạn trên
Facebook, mạng theo dõi Twitter, mạng chuyên nghiệp LinkedIn, mạng người đăng ký YouTube
và mạng blogger. Trong chươngy, chúng ta sẽ tập trung vào các mạng truyền thông xã hội rõ
ràng.
2. Based on the direction ò links/ Dựa trên hướng liên kết
Dựa vào phương hướng
Dựa trên các hướng liên kết giữa các nút, các mạng có thể được phân loại thành:
+Thứ 1. Mạng định hướng
+ Thứ 2. Mạng vô hướng
Mạng được định hướng
Một mạng với các liên kết có hướng giữa các nút được gọi là mạng có hướng, như được minh
họa trong Hình 14.2. Thông thường, một kết nối với một mũi tên được vẽ để hiển thị hướng của
mối quan hệ giữa các nút. Ví dụ: mạng theo dõi người theo dõi Twitter là mạng được định hướng
trong đó hướng của mũi tên cho biết ai đang theo dõi ai.
Mạng vô hướng
Trong các mạng vô hướng, các liên kết giữa các nút không có bất kỳ hướng nào, như được
minh họa trong Hình 14.3. Mạng lưới tình bạn trên Facebook là một ví dụ về mạng vô hướng. Ví
dụ: Facebook gần đây đã thêm tùy chọn "theo dõi" bài đăng của một số người nhất định, tương tự
như Twitter. Hơn nữa, các thành viên Facebook có thể kết bạn trên Facebook, sau đó hủy theo
dõi một số bạn bè của họ, vì vậy họ không nhìn thấy bài đăng của bạn bè cũ trên dòng thời gian
của thành viên.
3. Based on mode/ Dựa trên chế độ
Dựa trên Chế độ
Dựa trên thành phần của các nút, các mạng có thể được phân loại thành:
Thứ 1. Mạng một chế độ
lOMoARcPSD|36667950
Mạng một chế độ, như trong Hình 14.4, được hình thành giữa một tập hợp các nút có cùng
bản chất. Mạng tình bạn trên Facebook là một ví dụ về mạng một chế độ trong đó các nút (mọi
người) hình thành các mối quan hệ mạng (tình bạn).
Thứ 2. Mạng hai chế độ
Mạng hai chế độ (còn được gọi là mạng lưỡng cực) là mạng có hai bộ nút thuộc các lớp khác
nhau. 16 Trong các mạng này, các liên kết mạng chỉ tồn tại giữa các nút thuộc các tập hợp khác
nhau. Ví dụ, hãy xem xét mạng hai chế độ, trong đó một tập hợp các nút (vòng tròn) có thể là
người dùng phương tiện truyền thông xã hội và một tập hợp các nút khác (hình vuông), như
trong Hình 14.5, có thể được liên kết để tham gia vào một loạt sự kiện. Người dùng được liên kết
với các sự kiện họ tham dự.
Thứ 3. Mạng đa chế độ
Mạng đa chế độ
Một mạng đa chế độ cũng có thể xảy ra khi nhiều nút không đồng nhất được kết nối. Nó có
thể được coi là sự kết hợp của mạng một chế độ và mạng hai chế độ.
4. Based on weights/ dựa trên trọng số
Dựa trên Trọng lượng
Các mạng cũng có thể được phân loại dựa trên trọng số được gán cho các liên kết giữa các
nút. Có hai loại mạng có trọng số:
Thứ 1. Mạng có trọng số
Mạng có trọng số
Trong các mạng có trọng số, như trong Hình 14.6, các liên kết giữa các nút mang các trọng số
nhất định để biểu thị cường độ liên kết giữa các nút. Ví dụ, liên kết (mối quan hệ) giữa hai người
bạn trên Facebook (các nút) sẽ dày hơn nếu họ giao tiếp thường xuyên hơn. Mặc dù các mạng có
trọng số cung cấp thông tin phong phú, nhưng chúng yêu cầu phải có đủ dữ liệu lịch sử để xây
dựng.
dụ: Facebook và LinkedIn sử dụng các thuật toán độc quyền với các mạng có trọng số để
cô đọng nguồn cấp tin tức của người dùng với ưu tiên đối với người dùng mà thành viên đó đã
tương tác gần đây. Instagram cũng đã thay đổi thuật toán của họ, vì vậy hình ảnh không còn xuất
hiện theo trình tự thời gian trên nguồn cấp tin tức của họ nữa mà dựa trên sở thích của người
dùng. Facebook gần đây đã thay đổi tab tìm kiếm của họ để hiển thị hình ảnh/video về những gì
người dùng thường nhấp vào/xem.
Thứ 2. Mạng không trọng số
Mạng không trọng số
Trong các mạng không trọng số, chẳng hạn như Hình 14.7, liên kết giữa các nút không chịu
trọng số. Các liên kết chỉ cho biết sự tồn tại của một mối quan hệ và không thể cung cấp manh
mối về sức mạnh của mối quan hệ. Mạng không trọng số dễ xây dựng nhưng có thể che giấu
thông tin hữu ích.
Hãy nhớ rằng các loại được phân loại ở trên không loại trừ lẫn nhau và có thể tồn tại trong
một mạng duy nhất. Ví dụ, có thể tồn tại một mạng một chế độ có trọng số trực tiếp. Ngoài ra,
người ta có thể xây dựng một mạng không trọng số hai chế độ vô hướng, v.v.
4.3.1 .4.3.2. Hãy xem xét một số thuật ngữ hoặc thuộc tính mạng phổ biến. Thuộc
tính mạng có thể được chia thành hai loại:
Thứ 1. Node-level/ Thuộc tính cấp nút
Degree Centrality/ Mức dộ trung tâm
Mức độ trung tâm của một nút đo lường số lượng liên kết mà một nút có với các nút khác
trong mạng. 17 Ví dụ, trong mạng Facebook, điều này sẽ đo lường số lượng bạn bè chung mà
một thành viên có.
Betweeness Centrality/ Trung tâm giữa
Tính trung tâm của tính trung gian có liên quan đến tính trung tâm (hoặc vị trí) của một nút
trong mạng, như trong Hình 14.9. Các nút có tính trung tâm giữa các nút cao có thể kiểm soát
lOMoARcPSD|36667950
luồng thông tin giữa các nút được kết nối do vị trí trung tâm của chúng trong mạng.18 Trong
mạng Facebook, những người dùng chiếm vị trí trung tâm (những người có nhiều kết nối trực
tiếp hơn với những người bạn có ảnh hưởng trong mạng) được định vị tốt hơn để kiểm soát luồng
nội dung truyền thông xã hội.
Higher betweeness = More importance in the Network
Eigenvector Centrality/ Tính trung tâm của vecto riêng
Tính trung tâm của vectơ riêng đo lường tầm quan trọng của một nút dựa trên các kết nối của
nó với các nút quan trọng khác trong mạng. Nó có thể cung cấp sự hiểu biết về khả năng kết nối
mạng của một nút so với các nút khác, 19 như trong Hình 14.10. Công cụ Tìm kiếm của Google
đã sử dụng các véc tơ riêng để xếp hạng các kết quả tìm kiếm theo mức độ liên quan của chúng
với kết quả truy vấn của người tìm kiếm ngay từ đầu.
Tính trung tâm của vectơ riêng = không phải tất cả các kết nối đều như nhau và các kết nối
đến các nút nhất định quan trọng hơn các nút khác.
Structural Holes/ Lỗ kết cấu
Lỗ hổng cấu trúc lần đầu tiên được đưa ra bởi Burt?", người đã gợi ý rằng một số nút nhất
định có lợi thế hoặc bất lợi dựa trên vị trí của chúng trong mạng
Trong mạng truyền thông xã hội, một số nút hoặc người dùng, do vị trí của họ trong mạng, có
thể có lợi thế hoặc bất lợi khi lan truyền thông tin đến các nút khác trong mạng.23 Hình 14.11
cho thấy một mạng xã hội đơn giản có bốn nút và ba lỗ cấu trúc; rõ ràng, nút một có lợi thế trong
việc nhận thông tin trong mạng đó, nút hai, ba và bốn thiếu.
Hố
Lỗ hổng cấu trúc = Có khoảng cách giữa các nút của mạng (chẳng hạn như giữa nút 2 và nút
3, hoặc nút 4 với nút 2 hoặc nút 4 với nút 2) - kết quả là thông tin mà mỗi nút nhận được có thể
khác nhau.
So sánh trung tâm gần gũi và trung tâm giữa
Trung tâm gần gũi
Định nghĩa: Mức độ gần gũi trung tâm cho
điểm từng nút dựa trên 'độ gần gũi' của chúng
với tất cả các nút khác trong mạng
Nó cho chúng ta biết điều gì: Biện pháp này
Trung tâm giữa
Định nghĩa: Tính trung tâm giữa các phép
đo số lần một nút nằm trên đường đi ngắn nhất
giữa các nút khác. trung tâm giữa
lOMoARcPSD|36667950
tính toán các đường đi ngắn nhất giữa tất cả
các nút, sau đó gán cho mỗi nút một số điểm
dựa trên tổng số đường đi ngắn nhất của nó.
Khi nào nên sử dụng: Để tìm kiếm những cá
nhân có vị trí tốt nhất để gây ảnh hưởng đến
toàn bộ mạng lưới một cách nhanh chóng nhất.
Chi tiết hơn một chút: Tính trung tâm của
sự gần gũi có thể giúp tìm ra 'máy phát sóng'
tốt, nhưng trong một mạng có tính kết nối cao,
bạn sẽ thường thấy tất cả các nút có điểm số
tương tự nhau. Điều có thể hữu ích hơn là sử
dụng Tính gần gũi để tìm những người có ảnh
hưởng trong một cụm duy nhất
Nó cho chúng ta biết điều gì: Phép đo này
cho biết các nút nào là 'cầu nối' giữa các nút
trong mạng. Nó thực hiện điều này bằng cách
xác định tất cả các đường đi ngắn nhất và sau
đó đếm xem mỗi nút rơi vào một nút bao nhiêu
lần.
Khi nào nên sử dụng nó: Để tìm những cá
nhân có ảnh hưởng đến dòng chảy xung quanh
một hệ thống.
Chi tiết hơn một chút: Độ trung bình hữu
ích để phân tích động lực giao tiếp, nhưng nên
cẩn thận khi sử dụng. Số lượng giữa các cụm
cao có thể cho thấy ai đó nắm quyền đối với
các cụm khác nhau trong mạng hoặc chỉ là họ
ở ngoại vi của cả hai cụm.
Thứ 2. Network-level/ Thuộc tính cấp mạng (trang 47)
Network-level properties/ Thuộc tính cấp mạng
Thuộc tính mạng cung cấp thông tin chi tiết về cấu trúc tổng thể và tình trạng của mạng. Các
thuộc tính cấp độ mạng quan trọng bao gồm hệ số phân cụm, mật độ, đường kính, mức độ trung
bình và các thành phần.
Clustering Coefficient/ Hệ số phân cụm
Hệ số phân cụm là thước đo mức độ các nút trong cụm mạng kết hợp với nhau. Trong các
mạng xã hội, các nút có hệ số phân cụm cao và có xu hướng hình thành với mật độ quan hệ cao;
trung bình điều này xảy ra thường xuyên hơn hai nút ngẫu nhiên hình thành các mối quan hệ
tương tự.
Density/ Tỉ trọng
Mật độ của một mạng liên quan đến một số liên kết trong mạng. Mật độ có thể được tính bằng
số lượng liên kết có trong mạng chia cho số lượng tất cả các liên kết có thể có giữa các cặp nút
trong mạng (đối với mạng vô hướng, số lượng tất cả các liên kết có thể được tính là n (n-1) /2);
trong đó n là số nút trong một mạng). Một mạng được kết nối đầy đủ, trong đó mỗi nút đang liên
kết trực tiếp với mọi nút khác, sẽ có mật độ là 1.
Components/ Các thành phần
Các thành phần của mạng là các mạng con bị cô lập kết nối bên trong (nhưng bị ngắt kết nối
giữa) các mạng con.25 Trong một thành phần được kết nối, tất cả các nút được kết nối và có thể
truy cập được, nhưng không có đường dẫn giữa một nút trong thành phần và bất k nút nào
không có trong thành phần.26 Thành phần chính hoặc lớn nhất của một mạng là thành phần có số
nút nhiều nhất.
| 1/16

Preview text:

lOMoARcPSD| 36667950
CHƯƠNG 1. TỔNG QUAN VỀ KHAI PHÁ WEBSITE VÀ PHÂN TÍCH MẠNG XÃ HỘI
1.1. Thế nào là khai phá web
Khai phá web có thể được coi là ứng dụng của các kỹ thuật Data mining được điều chỉnh cho
web. Khai phá web (Web Mining) là quá trình sử dụng các phương pháp và công cụ phân tích dữ
liệu để tìm kiếm, khám phá và trích xuất thông tin từ các nguồn dữ liệu trên World Wide Web.
Khai phá web giúp hiểu và tận dụng tri thức từ các trang web, cơ sở dữ liệu trực tuyến và các
nguồn thông tin khác trên Internet.
1.2. Phân loại khai phá web
Khai phá nội dung (Content Mining): Loại khai phá này tập trung vào việc trích xuất
thông tin từ các trang web, văn bản, hình ảnh, video và các nguồn dữ liệu khác trên web. Các kỹ
thuật trong khai phá nội dung bao gồm trích xuất thông tin, phân loại văn bản, trích xuất thực thể
(entity extraction), phân tích cảm xúc và trích xuất tri thức từ văn bản. •
Khai phá cấu trúc (Structure Mining): Loại khai phá này tập trung vào việc phân tích cấu
trúc của các trang web và các liên kết giữa chúng. Phân loại và gom cụm trang web, phát hiện
mô hình liên kết, khám phá cấu trúc trang web và phân tích mạng lưới liên kết là những nhiệm
vụ phổ biến trong khai phá cấu trúc. •
Khai phá sử dụng (Usage Mining): Loại khai phá này tập trung vào việc phân tích hành
vi và hoạt động của người dùng trên web. Điều này bao gồm phân tích dữ liệu log, theo dõi và
phân tích hành vi người dùng, phát hiện mẫu sử dụng và khám phá thông tin liên quan đến người dùng. 1.3. Cấu trúc web
Cấu trúc web (Web Structure) đề cập đến cách mà các trang web và các liên kết giữa chúng
được tổ chức và xây dựng trên Internet. Cấu trúc web quyết định cách mà thông tin được tổ chức,
truy cập và liên kết với nhau trên các trang web.
1. Cấu trúc web bao gồm các yếu tố sau:
2. Trang web: Là các tài liệu HTML, CSS, hình ảnh, video và các thành phần khác được
hiển thị trên trình duyệt web. Mỗi trang web có một URL (Uniform Resource Locator) duy nhất
để truy cập và tham chiếu đến nó.
3. Liên kết: Là các đường dẫn hoặc hyperlinks được tạo thành từ văn bản, hình ảnh hoặc các
phần tử khác trên trang web, cho phép người dùng chuyển đến các trang web khác. Liên kết giúp
xác định mối quan hệ giữa các trang web và hướng dẫn người dùng điều hướng trên web.
4. Cấu trúc liên kết: Đây là sự tổ chức và cấu trúc các liên kết giữa các trang web. Cấu trúc
liên kết có thể được biểu diễn dưới dạng cây, đồ thị hoặc mạng lưới, tùy thuộc vào cách mà các
trang web được liên kết với nhau.
5. Trang gốc (Homepage): Là trang web chính của một trang web hoặc một trang web quốc
gia. Trang gốc thường là điểm khởi đầu cho việc duyệt web và thường có nhiều liên kết đến các trang con khác.
1.4. Phân tích mạng xã hội
Phân tích mạng xã hội (Social Network Analysis - SNA) là một phương pháp nghiên cứu và
phân tích cấu trúc, mô hình và quan hệ giữa các thành viên trong một mạng xã hội. Nó tập trung
vào việc khám phá mối quan hệ xã hội, sự tương tác và sự lan truyền thông tin giữa các cá nhân,
tổ chức hoặc tài nguyên trong một mạng xã hội.
Phân tích mạng xã hội sử dụng các khái niệm và phương pháp từ lý thuyết đồ thị và khoa học
mạng để đo lường và hiểu về mối quan hệ giữa các đối tượng trong mạng xã hội. Các yếu tố
quan trọng trong phân tích mạng xã hội bao gồm: 1.4.1.
Các lý thuyết nền tảng
Lý thuyết đồ thị (Graph Theory): Lý thuyết đồ thị cung cấp cơ sở toán học cho phân tích
mạng xã hội. Nó nghiên cứu các khái niệm và thuật toán liên quan đến cấu trúc và tính chất của
các đồ thị. Các khái niệm như đỉnh (node), cạnh (edge), đường đi (path), mạng lưới (network) và lOMoARcPSD| 36667950
các thuật toán như tìm đường đi ngắn nhất, gom cụm, và phân tích cấu trúc đồ thị được áp dụng
trong phân tích mạng xã hội.
Lý thuyết cấu trúc hóa xã hội (Social Structural Theory): Lý thuyết này nghiên cứu về cách
mà mạng xã hội được cấu trúc hóa và sự ảnh hưởng của cấu trúc đối với hành vi và quan hệ xã
hội. Nó quan tâm đến các khái niệm như vai trò, quan hệ xã hội, nhóm, mạng lưới xã hội, quyền
lực và các mô hình cấu trúc xã hội khác. Lý thuyết cấu trúc hóa xã hội giúp hiểu về mối quan hệ
giữa các thành viên trong mạng xã hội và vai trò của họ trong việc lan truyền thông tin và ảnh hưởng xã hội.
Lý thuyết lan truyền thông tin (Information Diffusion Theory): Lý thuyết này nghiên cứu về
quá trình lan truyền thông tin trong mạng xã hội. Nó xem xét cách thông tin được chia sẻ, tiếp
nhận và lan truyền qua các quan hệ xã hội. Các yếu tố như ngưỡng kích hoạt (activation
threshold), quyết định tiếp nhận thông tin và các mô hình lan truyền thông tin như mô hình lan
truyền SIR (Susceptible-Infectious-Recovered) được nghiên cứu trong lý thuyết lan truyền thông tin. 1.4.2.
Các giải thuật và kỹ thuật
Độ đo mạng xã hội (Social Network Metrics): Đây là các phép đo và chỉ số được sử dụng
để đo lường và mô tả các thuộc tính và tính chất của mạng xã hội. Các độ đo phổ biến bao gồm
số lượng liên kết (degree), trung tâm tâm của mạng (centrality measures) như trung tâm tiếp cận
(closeness centrality) và trung tâm trung gian (betweenness centrality), mật độ mạng (network
density), và chu trình (cycles) trong mạng xã hội. Các độ đo này giúp hiểu về sự phân bổ quan hệ
và vai trò của các thành viên trong mạng. •
Phân cụm mạng xã hội (Social Network Clustering): Phân cụm mạng xã hội là quá trình
chia nhỏ mạng xã hội thành các nhóm con gắn kết mật thiết bên trong và thưa thớt với nhau. Các
thuật toán phân cụm như phân cụm Louvain, phân cụm Girvan-Newman và phân cụm gom cụm
cộng đồng (community detection) được sử dụng để tìm ra các cụm và tập hợp các thành viên
trong mạng xã hội có mối liên kết mạnh với nhau. Phân cụm mạng xã hội giúp xác định cấu trúc
và nhóm trong mạng xã hội. •
Phân tích trực quan mạng xã hội (Social Network Visualization): Phân tích trực quan
mạng xã hội sử dụng các công cụ và kỹ thuật để hiển thị mạng xã hội dưới dạng biểu đồ hoặc đồ
thị. Các công cụ như Gephi, Cytoscape và NetworkX cho phép tạo biểu đồ và hiển thị mạng xã
hội theo cách trực quan và có thể tùy chỉnh. Phân tích trực quan mạng xã hội giúp hiểu rõ hơn về
mô hình kết nối và cấu trúc mạng xã hội. •
Phân tích lan truyền thông tin (Information Diffusion Analysis): Phân tích lan truyền
thông tin nghiên cứu và mô phỏng quá trình lan truyền thông tin trong mạng xã hội. Các mô hình
như mô hình lan truyền SIR (Susceptible-Infectious-Recovered) và mô hình lan truyền thông tin
dựa trên ngưỡng kích hoạt (threshold-based models) được sử dụng để tìm hiểu về cách thông tin
và ý tưởng lan truyền qua mạng xã hội. Phân tích lan truyền thông tin giúp dự đoán và đo lường
sự ảnh hưởng và sự lan truyền của thông tin trong mạng. 1.4.3.
Công cụ phân tích mạng xã hội
NodeXL: NodeXL là một ứng dụng mở rộng cho Microsoft Excel, giúp người dùng thu
thập và phân tích dữ liệu mạng xã hội. Nó cung cấp các tính năng như lấy dữ liệu từ các nguồn
mạng xã hội phổ biến, tính toán các độ đo mạng xã hội và tạo biểu đồ trực quan trong Excel. •
UCINet: UCINet là một phần mềm chuyên dụng cho phân tích mạng xã hội và nghiên
cứu xã hội. Nó cung cấp các tính năng như thu thập dữ liệu mạng, tính toán độ đo mạng xã hội,
phân cụm mạng và trực quan hóa. •
Ngoài ra còn có: NetMiner, GATE, NetworkX, Gephi, Cytoscape, Pajek.. 1.4.4.
Các chủ đề trong phân tích mạng xã hội
Cấu trúc mạng xã hội: Chủ đề này tập trung vào việc nghiên cứu cấu trúc và đặc điểm
của mạng xã hội. Điều này bao gồm việc xác định các thuộc tính mạng xã hội như độ dày, độ
phân cấp, độ liên kết, và trung tâm tâm của mạng. lOMoARcPSD| 36667950 •
Độ phân cụm và cộng đồng: Chủ đề này tập trung vào việc phân tích và phát hiện các
cụm và cộng đồng trong mạng xã hội. Nghiên cứu về độ phân cụm và cộng đồng giúp hiểu rõ
hơn về sự tổ chức và tương tác trong mạng xã hội. •
Lan truyền thông tin và ảnh hưởng: Chủ đề này tập trung vào việc nghiên cứu quá trình
lan truyền thông tin và sự ảnh hưởng của thông tin trong mạng xã hội. Điều này bao gồm việc
khám phá các mô hình lan truyền thông tin, xác định các nhân tố ảnh hưởng và dự đoán sự lan
truyền thông tin trong mạng xã hội. •
Phân tích tương tác xã hội: Chủ đề này tập trung vào việc phân tích và đo lường các
tương tác xã hội trong mạng. Nghiên cứu về tương tác xã hội giúp hiểu về quan hệ, tương tác và
sự tương tác giữa các thành viên trong mạng xã hội. •
Phân tích hành vi và sự lan truyền ý kiến: Chủ đề này tập trung vào việc nghiên cứu hành
vi của người dùng và quá trình lan truyền ý kiến trong mạng xã hội. Nghiên cứu này có thể liên
quan đến phân tích dữ liệu về hoạt động trên mạng xã hội, đánh giá ý kiến và tác động của người dùng trong mạng. •
Ứng dụng của phân tích mạng xã hội: Chủ đề này tập trung vào việc áp dụng phân tích
mạng xã hội vào các lĩnh vực cụ thể như marketing, quản lý dự án, y tế, và tình báo. Nghiên cứu
về ứng dụng của phân tích mạng xã hội giúp tìm hiểu cách áp dụng các kỹ thuật và công cụ phân
tích mạng xã hội vào các vấn đề thực tế.
CHƯƠNG 2. KHAI PHÁ DỮ LIỆU WEBSITE
2.1. Cơ bản về phân tích Website
2.1.1. Các tình huống phân tích Web

Phân tích nội dung: Đánh giá chất lượng, độ tương thích và cấu trúc của nội dung trên
trang web. Phân tích nội dung bao gồm việc kiểm tra từ khóa, xác định sự tương tác của người
dùng với nội dung, kiểm tra cấu trúc thông tin và đảm bảo tính tương thích với các chuẩn web. •
Phân tích giao diện người dùng (UI): Xem xét thiết kế giao diện của trang web, kiểm tra
tính tương thích với các trình duyệt và các thiết bị khác nhau. Phân tích UI cũng bao gồm kiểm
tra sự dễ sử dụng, trải nghiệm người dùng và tuân thủ các nguyên tắc thiết kế tốt. •
Phân tích trải nghiệm người dùng (UX): Đánh giá trải nghiệm của người dùng khi sử
dụng trang web. Phân tích UX tập trung vào khả năng tương tác, tốc độ tải trang, sự tiện lợi và
thỏa mãn của người dùng khi sử dụng trang web. •
Phân tích hiệu suất: Đánh giá tốc độ tải trang, thời gian phản hồi, tải xuống và tương tác
của trang web. Phân tích hiệu suất giúp xác định các vấn đề liên quan đến tốc độ và hiệu suất của
trang web, từ đó tối ưu hóa trang web để cải thiện trải nghiệm người dùng. •
Phân tích SEO: Đánh giá các yếu tố liên quan đến tối ưu hóa công cụ tìm kiếm (SEO).
Phân tích SEO giúp xác định từ khóa, tối ưu hóa các phần tử trên trang web để cải thiện thứ hạng
trang web trên các công cụ tìm kiếm. • Phân tích an ninh …
2.1.2. Tại sao cần phân tích dữ liệu Web
Phân tích dữ liệu web giúp hiểu rõ khách hàng hơn, đo lường hiệu quả các chiến dịch
mark, hiểu được người dùng như thế nào để tối ưu hoá trang web, tối ưu hoá công cụ tìm kiếm
2.2 Phát triển các công cụ phân tích Website
2.2.1 Năm bước trong quá trình phân tích Website

• Xác định các mục tiêu kinh doanh khi bắt đầu đầu dự án.
• Liên kết các mục đích cho từng mục tiêu kinh doanh
• Đặt các chỉ số hiệu suất chính (KPI) liên quan đến mỗi mục tiêu kinh doanh.
• Xác định giá trị mục tiêu cho mỗi KPI.
• Xác định các nhóm người/ hành vi/ kết quả để phân tích tại sao dự án thành công hoặc thất bại. lOMoARcPSD| 36667950
2.2.2 Chu kỳ cải tiến Website Web 1 Ưeb 2 Web 3 Web 4 Cá nhân, di động, Mở Chỉ đọc Đọc viết rộng Hội tụ Tập trung vào Tập trung vào công ty doanh cộng đồng, Xã
Trợ lý cá nhân( Siri, GG hiện nghiệp hội Tập trung vào cá nhân hành cortana) Phương 琀椀 ện truyền
trực 琀椀 ếp, phát trực
BOT/ Đặc vụ thong minh/ Máy Trang chủ Blog, wiki
琀椀 ếp, sóng dữ liệu bay không người lái Sở hữu nội Chia sẻ nội dung
Nội dung có thể lập trình và dung của bạn của bạn Thu nhập và nội dung nội dung theo yêu cầu Ứng dụng thông minh/ Biểu mẫu web Ứng dụng web tự động
Trí tuệ nhân tạo/ Thuật toán Thư mục và Hành vi người dùng/
Đám mây riêng tư, Internet thư mục web
gắn thẻ nôi dung Bản thân định lượng vạn vật
Mức độ tương tác của Gía Mỗi nhấp người dùng qua các chỉ
lượt xem trang chuột(CPC) số được thu nhập Đo kênh chéo quảng cáo
quảng cáo tương quản cáo và nhắm mục biểu ngữ tác 琀椀 êu theo hành vi Quảng cáo có lập trình Britannica trực tuyến wikipedia web ngữ nghĩa Minh bạch WEB/ WikiLeaks Cổng thông 琀 椀 n HTML và Web XML/RSS RDF/RDFS/OWL máy 琀 nh lượng tử, AI
2.2.3 Yêu cầu kinh doanh chính (KBR) so với chính các chỉ số hoạt động (KPI)
Yêu cầu kinh doanh chính (KBR): KBR là các mục tiêu và yêu cầu quan trọng từ góc
nhìn kinh doanh mà công cụ phân tích website cần đáp ứng. Đây là các yêu cầu tổng thể mà công
cụ phải đáp ứng để hỗ trợ các mục tiêu kinh doanh của tổ chức. Ví dụ, một KBR có thể là cung
cấp thông tin chi tiết về hành vi người dùng để tối ưu hóa trải nghiệm người dùng và tăng tỷ lệ
chuyển đổi trên trang web. •
Chỉ số hoạt động (KPI): KPI là các chỉ số đo lường và đánh giá hiệu suất của công cụ
phân tích website. Chúng là các chỉ số cụ thể và định lượng để đo lường mức độ đạt được các
KBR. Ví dụ, một KPI có thể là tỷ lệ chuyển đổi, thời gian trung bình trên trang, số lần click vào
quảng cáo, v.v. Các KPI giúp đo lường hiệu quả và đưa ra thông tin quan trọng về hiệu suất của
công cụ phân tích website. Vai trò: •
KBR định hình các yêu cầu chính và mục tiêu cần đạt được của công cụ phân tích
website từ góc nhìn kinh doanh. Chúng định hướng và tạo nền tảng cho quá trình phát triển công cụ. •
KPI cung cấp các chỉ số đo lường và đánh giá để kiểm tra xem công cụ phân tích có đáp
ứng KBR hay không. Chúng giúp đo lường hiệu quả và hiệu suất của công cụ, đồng thời cung
cấp thông tin để điều chỉnh và cải thiện công cụ. lOMoARcPSD| 36667950
2.2.4 Các chỉ số phân tích Website
Lưu lượng trang web, tỷ lệ chuyển đổi, thời gian trung bình trên trang, tỷ lệ thoát, số lần
xem trang, nguồn lưu lượng, tỷ lể chuyển đổi theo từ khoá…
2.3 Chỉ số trung gian và phân tích Website
2.3.1 Các chỉ số trung gian trong phân tích Website

Tốc độ tải trang, tỷ lệ thoát trang, đường dẫn điều hướng, thời gian ở lại trang, thông tin
về thiết bị, trình duyệt
Chỉ số phân tích là các chỉ số tổng quát và cung cấp cái nhìn tổng quan về hiệu suất toàn
cầu của trang web, trong khi chỉ số trung gian tập trung vào các chỉ số chi tiết và phân tích sâu
hơn để hiểu rõ hơn về các yếu tố cụ thể và hoạt động trên trang web.
2.3.2 Thiết kế KPI tùy chỉnh?
2.4 Cách phân tích Website theo dõi dữ liệu duyệt web của người dùng 2.4.1 Web Beacon Tracking
Phân tích Website theo dõi dữ liệu duyệt web của người dùng thông qua Web Beacon
Tracking là một phương pháp được sử dụng để thu thập thông tin về hành vi người dùng trên
trang web. Web Beacon, hay còn gọi là pixel theo dõi (tracking pixel), là một hình ảnh nhỏ hoặc
một đoạn mã nhúng không thể nhìn thấy trực tiếp trên trang web. Khi trang web được tải, Web
Beacon sẽ gửi một yêu cầu tới máy chủ để ghi lại việc trang web đã được truy cập và các hoạt động của người dùng.
Đặt web beacon -> WB gửi yêu cầu đến máy chủ -> WB ghi lại dữ liệu và lưu trữ -> phân tích
dữ liệu -> đánh giá và cải thiện
2.4.2 Mô hình thuộc tính (Attribution Models)
Mô hình thuộc tính (Attribution Models) là một khung làm việc được sử dụng trong phân tích
website để xác định và ghi nhận giá trị hoặc tác động của các touchpoint (điểm tiếp xúc) khác
nhau trên trang web đối với quyết định cuối cùng của người dùng. Nó giúp phân tích và hiểu rõ
hơn về cách các touchpoint góp phần vào quá trình chuyển đổi và hiệu quả của trang web.
Xác định mục tiêu -> thu thập dữ liệu -> lựa chọn mô hình thuộc tính -> phân tích dữ liệu ->
đánh giá và tối ưu hoá
2.4.3 Phân tích Site Pathing Analysis
Phân tích Site Pathing là quá trình nghiên cứu và phân tích các tuyến đường di chuyển của
người dùng trên trang web. Nó giúp bạn hiểu rõ hơn về hành vi và tương tác của người dùng trên
trang web của bạn, từ đó đưa ra những cải tiến và tối ưu hóa trang web để cung cấp trải nghiệm
tốt hơn cho người dùng và đạt được mục tiêu kinh doanh.
Thu thập dữ liệu -> xác định mục tiêu -> xem xét các tuyến đường -> xác định điểm yếu và
cải thiện -> theo dõi và đánh giá.
Chương 3: PH N TÍCH TRANG WEB N NG CAO VÀ WEB INTELLIGENCE
3.1 Hệ sinh thái các bên liên quan (trang 41 slide 1)
3.1.1 Loại thông tin mà các bên liên quan muốn

- Multi-channel campaign management / quản lý chiến dịch đa kênh
- Marketing automation/ tiếp thị tự động
- Customer scoring /phân loại, đánh giá khách hàng - Mobile optimization/ tối ưu hoá thiết bị di động
Dữ liệu phi cấu trúc bên ngoài Có cấu trúc bên ngoài Nội bộ lOMoARcPSD| 36667950 Tiện ích sử dụng
dữ liệu điều tra dân số Giao dịch bán hàng Cụm từ tìm kiếm Dữ liệu đối tác Phân tích trang web
Dữ liệu thị trường tài chính
Một số dữ liệu địa lý
Sản phẩm Vận chuyển và Trả
Dữ liệu giao thông du lịch Hồ sơ xã hội lại Dữ liệu khí hậu Dữ liệu hàng tồn kho Dữ liệu địa lý Dữ liệu trung tâm cuộc Bình Luận Blog
gọi/liên hệ hóa đơn Dữ liệu
Dữ liệu truyền thông xã hội CRM Tin tức Dữ liệu nhân viên Chiến Dịch Tiếp Thị
3.1.2 Vai trò của các bên liên quan Là then chốt lOMoARcPSD| 36667950
3.2 Tăng cường báo cáo Phân tích Website với nguồn dữ liệu bên ngoài
3.2.1 Hệ sinh thái phân tích trang website
lOMoARcPSD| 36667950
Các giai đoạn triển khai hệ sinh thái phân tích trang web :
3.2.2 Phân tích trang web thực dụng (Pragmatic Web Analytics) Không biết huhu
**Đánh giá trang web: các nền tảng web Analytics đc thiết kế để đo lường hành vi của ng truy
cập với 1 trangweb và thiết kế của web (UX) với ng truy cập
3.3 Thiết lập các chỉ số đo lường nâng cao
3.3.1 Các chỉ số đo lường ngành
Các chỉ số hiệu suất chính( KPI)
Các chỉ số KPI thông thường được sử dụng trong các ngành công ty:
• Bán lẻ: xem sản phẩm, thanh toán, mua hàng
• Truyền thông: đăng ký theo dõi, đăng ký cuộc thi, xem trang, xem video
• Tài chính: đệ trình đơn, đăng nhập, sử dụng công cụ tự phục vụ
• Du lịch: đặt phòng (mua hàng), chiến dịch nội bộ (nhấp chuột), tìm kiếm (giá vé)
• Viễn thông: mua hàng, khách hàng tiềm năng, sử dụng công cụ tự phục vụ
• Công nghệ cao: tải xuống bài báo trắng, RFP (yêu cầu đề xuất), hoàn thành biểu mẫu, yêu cầu hỗ trợ
• Ô tô: đệ trình khách hàng tiềm năng, yêu cầu báo giá, tải xuống thông tin quảng cáo.
3.3.2 Các chỉ số theo phân đoạn (Segment)
Các nền tảng phân tích Web cung cấp phân đoạn tùy chỉnh (mảnh dữ liệu) có thể thông tin về
những quyết định kinh doanh - và trong khoản này, chúng vượt trội so với các loại nền tảng phân tích khác. lOMoARcPSD| 36667950
Hình: kích thước và loại phân tích trang web nhân khẩu học Các mẫu tham quan bỏ rơi
Tính cách và loại người dùng mức độ hứng thú Ngành công nghiệp Dữ liệu chuyển đổi Thay đổi hoạt động
Nguồn lưu lượng truy cập Nội dung đã xem Nền tảng/Thiết bị Ngày và Giờ
3.3.3 Đo lường chuyển đổi của khách hàng
Khi một khách truy cập truy cập vào một trang web, họ tạo ra dữ liệu. Nhà tiếp thị có thể đo
lường tác động của các hoạt động của khách truy cập diễn ra trên trang web.
3.3.4 Thiết lập các chỉ số đo nguồn lưu lượng Tìm kiếm Tự nhiên
Liên kết từ trang web khác Lưu lượng Trực tiếp Tìm kiếm Trả phí
Các loại lưu lượng từ các chiến dịch khác Mạng xã hội
** Tính toán "Thời gian Sử dụng" trong Phân tích Web
Tính toán thời gian mà một lượt truy cập trang web kéo dài bao lâu (gọi là lượt xem trang); khi
một lượt truy cập chỉ đưa ra kết quả là một lượt xem trang duy nhất thì được gọi là "bounce (tỷ lệ thoát trang)."
3.3.5 Các tính năng bổ sung của nền tảng phân tích trang website
CHƯƠNG 4: PH N TÍCH DỮ LIỆU MẠNG XÃ HỘI
4.1. Các thuật ngữ phổ biến trong phân tích mạng xã hội
4.1.1 Network – mạng lưới Mạng
Ở cấp độ rất cơ bản, mạng là một nhóm các nút được liên kết với nhau. lOMoARcPSD| 36667950
Các nút (còn được gọi là đỉnh) có thể đại diện cho bất kỳ thứ gì, bao gồm cá nhân, tổ chức,
quốc gia, máy tính, trang web hoặc bất kỳ thực thể nào khác.
Liên kết (còn được gọi là mối quan hệ, cạnh hoặc vòng cung) thể hiện mối quan hệ giữa các nút trong mạng.
4.1.2 Social Networks – Mạng xã hội Mạng xã hội
Mạng xã hội là một nhóm các nút, đại diện cho các thực thể xã hội như con người hoặc tổ
chức và các liên kết được hình thành bởi các thực thể xã hội này. Ví dụ, các liên kết có thể đại
diện cho các mối quan hệ, tình bạn và quan hệ thương mại. Mạng xã hội có thể tồn tại cả trong
thế giới thực và trực tuyến và bổ sung cho nhau. Thế giới trực tuyến giúp tạo ra các kết nối tốt
hơn trong thế giới của chúng ta. Mạng giữa các bạn cùng lớp là một ví dụ về mạng xã hội trong
thế giới thực. Hơn nữa, mạng theo dõi Twitter là một ví dụ về mạng truyền thông xã hội trực
tuyến. Trong mạng theo dõi Twitter, các nút là người dùng Twitter và liên kết giữa các nút biểu
thị mối quan hệ theo dõi của người theo dõi (nghĩa là ai đang theo dõi ai) giữa những người dùng.
4.1.3 Social Network Site – Website mạng xã hội Trang mạng xã hội
Trang mạng xã hội là một phần mềm có mục đích đặc biệt (hoặc công cụ truyền thông xã hội)
được thiết kế để tạo điều kiện thuận lợi cho các mối quan hệ xã hội hoặc nghề nghiệp. Facebook,
Google+ và LinkedIn là những ví dụ về các trang mạng xã hội.
4.1.4 Social Networking Mạng xã hội
Hành động hình thành, mở rộng và duy trì các mối quan hệ xã hội được gọi là mạng xã hội. Ví
dụ, sử dụng các trang mạng xã hội, người dùng có thể hình thành, mở rộng và duy trì các mối
quan hệ xã hội trực tuyến với gia đình, bạn bè, đồng nghiệp và đôi khi là người lạ.
4.1.5 Social Network Analysis – Phân tích mạng xã hội Phân tích mạng xã hội
Phân tích mạng xã hội là khoa học nghiên cứu và hiểu về mạng xã hội¹2 và mạng xã hội. Đây
là một lĩnh vực lâu đời có nguồn gốc từ nhiều lĩnh vực khác nhau bao gồm lý thuyết đồ thị, xã
hội học, khoa học thông tin và khoa học truyền thông. 4.2 Các loại mạng xã hội phổ biến
4.2.1 Mạng lưới tình bạn - Friendship Networks Mạng lưới tình bạn
Loại mạng truyền thông xã hội phổ biến nhất là mạng tình bạn, chẳng hạn như Instagram,
Twitter và Snapchat. Mạng lưới tình bạn cho phép mọi người duy trì các mối quan hệ xã hội và
chia sẻ nội dung với những người mà họ liên kết chặt chẽ, chẳng hạn như gia đình và bạn bè. Các
nút trong các mạng này là con người và các liên kết là các mối quan hệ xã hội (ví dụ: tình bạn,
gia đình và các hoạt động).
4.2.2 Mạng lưới Follower–Following
Mạng theo dõi người theo dõi
Trong mạng theo dõi người theo dõi, người dùng theo dõi (hoặc theo dõi) những người dùng
quan tâm khác. Twitter là một ví dụ tuyệt vời về mạng theo dõi nơi người dùng theo dõi những
người, thương hiệu và tổ chức có ảnh hưởng. Các nút trong các mạng này, chẳng hạn như con
người, thương hiệu và tổ chức, và các liên kết đại diện cho các mối quan hệ theo dõi (ví dụ: ai
đang theo dõi ai). Dưới đây là hai thuật ngữ Twitter phổ biến.
Sau đây là những người bạn theo dõi trên Twitter. Theo dõi ai đó trên Twitter có nghĩa:
Bạn đang đăng ký Tweet của họ với tư cách là người theo dõi.
Cập nhật của họ sẽ xuất hiện trên màn hình chính hoặc trang tổng quan của bạn.
Người đó có thể gửi tin nhắn trực tiếp cho bạn. lOMoARcPSD| 36667950
Bạn có thể đăng ký các tweet để được thông báo khi tài khoản tweet (mặc dù bạn không thể
gửi tin nhắn trực tiếp trừ khi người đó theo dõi lại bạn).
Người theo dõi là những người theo dõi bạn trên Twitter. Nếu ai đó theo dõi bạn, điều đó có nghĩa là:
• Họ sẽ hiển thị trong danh sách "Người theo dõi" của bạn.
Họ sẽ thấy các tweet của bạn trong dòng thời gian trên trang chủ của họ bất cứ khi nào họ đăng nhập vào Twitter.
• Bạn có thể gửi tin nhắn trực tiếp cho họ.
4.2.3 Mạng lưới Fan Network
Mạng lưới người hâm mộ
Mạng lưới người hâm mộ được hình thành bởi những người hâm mộ trên mạng xã hội hoặc
những người ủng hộ ai đó hoặc điều gì đó, chẳng hạn như sản phẩm, dịch vụ, người, thương
hiệu, doanh nghiệp hoặc thực thể khác. Mạng được hình thành bởi những người dùng phương
tiện truyền thông xã hội đã đăng ký trang người hâm mộ trên Facebook của bạn là một ví dụ về
mạng người hâm mộ. Các nút trong các mạng này là người hâm mộ và liên kết đại diện cho đồng
thích, đồng nhận xét và đồng chia sẻ. Mạng người hâm mộ có thể thụ động (thông qua người
đăng ký đã mua) hoặc tích cực (người theo dõi được tạo tự nhiên tương tác tích cực với bài đăng của bạn).
4.2.4 Mạng lưới nhóm - Group Network Mạng nhóm
Mạng lưới nhóm được hình thành bởi những người có chung sở thích và chương trình nghị sự.
Hầu hết các nền tảng truyền thông xã hội đều cho phép tạo các nhóm nơi một thành viên có thể
đăng, nhận xét và quản lý các hoạt động trong nhóm. Ví dụ về các nhóm truyền thông xã hội là
nhóm chuyên nghiệp Twitter, nhóm Yahoo và nhóm Facebook. Các nút trong các mạng này là
thành viên nhóm và các liên kết có thể đại diện cho đồng nhận xét, đồng thích và đồng chia sẻ.
4.2.5 Mạng lưới chuyên gia - Professional Networks Mạng chuyên nghiệp
LinkedIn là một ví dụ điển hình về mạng chuyên nghiệp nơi mọi người quản lý danh tính
nghề nghiệp của họ bằng cách tạo hồ sơ liệt kê thành tích, trình độ học vấn, quá trình làm việc và
sở thích của họ. Các thành viên của LinkedIn cũng có thể tìm kiếm hồ sơ hoặc công việc theo các
từ khóa cụ thể (ví dụ: "quản lý thể thao"). Các nút trong các mạng này có thể đại diện cho mọi
người, thương hiệu hoặc tổ chức. Liên kết là quan hệ nghề nghiệp và trong LinkedIn được gọi là
"kết nối" (chẳng hạn như đồng nghiệp, nhân viên hoặc cộng tác viên). Một tính năng quan trọng
của các mạng chuyên nghiệp là tính năng xác nhận, nơi những người biết bạn có thể xác nhận
các kỹ năng và trình độ của bạn. Ngoài ra, tính năng đề xuất, trong đó các thành viên không được
kết nối của mạng xã hội được đề xuất cho người dùng, là một đặc điểm quan trọng khác.
4.2.6 Các dạng mạng lưới khác
a) Content networks/ Mạng nội dung Mạng nội dung
Mạng nội dung được hình thành bởi nội dung được đăng bởi người dùng phương tiện truyền
thông xã hội. Mạng video YouTube là một ví dụ về mạng nội dung. Trong một mạng như vậy,
các nút là nội dung truyền thông xã hội (chẳng hạn như video, thẻ và ảnh) và các liên kết có thể
biểu thị, chẳng hạn như tính tương đồng (nội dung thuộc cùng danh mục có thể được liên kết với nhau).
b) Dating networks/ Mạng hẹn hò Mạng hẹn hò
Các mạng hẹn hò (chẳng hạn như Match.com và Tinder) tập trung vào việc kết hợp và sắp xếp
đối tác hẹn hò dựa trên thông tin cá nhân (chẳng hạn như tuổi, giới tính, sở thích, mối quan tâm
chung và vị trí) do người dùng cung cấp. Các nút trong các mạng này là con người và các liên kết
đại diện cho các mối quan hệ xã hội (chẳng hạn như các mối quan hệ lãng mạn). lOMoARcPSD| 36667950
c) Co-Authorship Networks/ Mạng đồng tác giả Mạng đồng tác giả
Mạng đồng tác giả là hai hoặc nhiều người làm việc cùng nhau để hợp tác trong một dự án.
Wikipedia (bách khoa toàn thư trực tuyến) là một ví dụ điển hình về mạng đồng tác giả dựa trên
phương tiện truyền thông xã hội được tạo bởi hàng triệu tác giả từ khắp nơi trên thế giới. 13 Một
ví dụ rõ ràng hơn về mạng đồng tác giả là nền tảng ResearchGate: một trang mạng xã hội để các
nhà nghiên cứu chia sẻ các bài báo, hỏi và trả lời các câu hỏi cũng như tìm cộng tác viên. Trong
các mạng này, các nút là, ví dụ, các nhà nghiên cứu và các liên kết đại diện cho mối quan hệ đồng tác giả.
d) Co-Commenter Networks/ Mạng đồng bình luậnNode: users/ Links: cùng nhau cmt. Mạng đồng bình luận
Mạng đồng bình luận được hình thành khi hai hoặc nhiều người bình luận về nội dung truyền
thông xã hội (ví dụ: cập nhật trạng thái Facebook, bài đăng trên blog, đánh giá nhà hàng Yelp
hoặc video YouTube). Ví dụ, một mạng đồng bình luận có thể được xây dựng từ các bình luận
được đăng bởi người dùng để phản hồi một video được đăng trên YouTube hoặc một trang
Facebook dành cho người hâm mộ. Trong các mạng này, các nút đại diện cho người dùng và liên
kết đại diện cho mối quan hệ đồng nhận xét.
e) Co-Like Networks/ Mạng đồng thích. Mạng đồng thích
Mạng đồng thích được hình thành khi hai hoặc nhiều người thích cùng một nội dung trên
mạng xã hội. Sử dụng NodeXL (một công cụ phân tích mạng xã hội), người ta có thể xây dựng
một mạng dựa trên lượt đồng thích (hai hoặc nhiều người thích một nội dung tương tự) của trang
Facebook dành cho người hâm mộ. Trong mạng như vậy, các nút sẽ là người dùng/người hâm
mộ Facebook và các liên kết sẽ là mối quan hệ đồng thích. Facebook cũng sử dụng đồng thích để
đề xuất các thành viên khác mà họ chưa kết nối với tư cách là một người bạn được đề xuất. Mối
quan hệ đồng thích có thể được nhìn thấy trên Facebook khi mọi người chia sẻ bài đăng của người khác.
f) Co-Occurrrence/ Mạng cùng xuất hiện Mạng cùng xuất hiện
Các mạng cùng xuất hiện được hình thành khi có thêm hai thực thể (ví dụ: từ khóa, con người,
ý tưởng và thương hiệu) cùng xuất hiện trên các phương tiện truyền thông xã hội. Ví dụ: người ta
có thể xây dựng một mạng lưới tên thương hiệu (hoặc người) cùng xuất hiện để điều tra tần suất
một số thương hiệu (hoặc người) nhất định cùng xuất hiện trên các phương tiện truyền thông xã
hội. Trong các mạng như vậy, các nút sẽ là tên thương hiệu và các liên kết sẽ đại diện cho mối
quan hệ cùng xuất hiện giữa các thương hiệu.
g) Geo Co-Existence Network/ Mạng cùng tồn tại địa lý
Mạng cùng tồn tại địa lý
Mạng cùng tồn tại địa lý được hình thành khi hai hoặc nhiều thực thể (ví dụ: người, thiết bị và
địa chỉ) cùng tồn tại ở một vị trí địa lý. Trong một mạng như vậy, nút đại diện cho các thực thể
(ví dụ: con người), trong khi các liên kết giữa chúng thể hiện sự cùng tồn tại. Ví dụ về mạng cùng tồn tại địa lý:
Khách tham quan bảo tàng (hoặc bất kỳ địa điểm nào) sử dụng các ứng dụng truyền thông xã
hội trên thiết bị di động của họ để đăng ký bằng Facebook hoặc Swarm (Foursquare); các thành
viên khác đã đăng ký gần đây sẽ đến bảo tàng được hiển thị cho thành viên thông qua ứng dụng.
• Người mua sắm ghé thăm các cửa hàng truyền thống và mua sắm ở đó bằng ứng dụng hỗ trợ
Bluetooth kết nối với mạng iBeacon được cài đặt tại địa điểm.
h) Hyperlink Networks/ Mạng siêu liên kết Mạng siêu liên kết lOMoARcPSD| 36667950
Nói một cách đơn giản, siêu liên kết là một cách để kết nối các tài liệu (chẳng hạn như các
trang web). Siêu liên kết có thể được coi là liên kết trong (nghĩa là siêu liên kết bắt nguồn từ các
trang web khác, 14 đưa lưu lượng truy cập/người dùng đến trang web của bạn) hoặc liên kết
ngoài (tức là liên kết bắt nguồn từ trang web của bạn và đi ra ngoài. Các loại mạng
Từ quan điểm kỹ thuật, các mạng được đề cập ở trên có thể được phân loại theo nhiều
cách khác nhau, bao gồm:
1. Based on existence/ dựa trên sự tồn tại
Dựa trên cách các mạng tồn tại trực tuyến hoặc được xây dựng, chúng có thể được phân loại thành: +Thứ 1: Mạng ngầm +Thứ 2: Mạng rõ ràng Mạng ngầm
Các mạng ngầm không tồn tại theo mặc định và cần được xây dựng có chủ ý với sự trợ giúp
của các công cụ và kỹ thuật chuyên dụng. Ví dụ về các mạng như vậy bao gồm mạng cùng xuất
hiện từ khóa, mạng đồng trích dẫn, mạng đồng bình luận, mạng siêu liên kết, v.v. Việc xây
dựng và nghiên cứu các mạng ẩn có thể cung cấp thông tin và hiểu biết có giá trị. Ví dụ: một
nhóm Facebook có thể được coi là một mạng ngầm được hình thành có chủ ý. Một loại mạng
ngầm khác là khi một số người dùng Twitter đăng về một sự kiện đang diễn ra bằng cách sử
dụng thẻ bắt đầu bằng #hashtag cụ thể - các thành viên được kết nối với nhau thông qua các thẻ
bắt đầu bằng # và có thể xem các bài đăng của nhau có chứa cùng một thẻ bắt đầu bằng hashtag. Mạng rõ ràng
Các mạng truyền thông xã hội rõ ràng tồn tại theo mặc định; nói cách khác, chúng được thiết
kế rõ ràng để người dùng mạng xã hội tham gia. Hầu hết các mạng truyền thông xã hội đều rõ
ràng về bản chất. Ví dụ về các mạng truyền thông xã hội rõ ràng bao gồm mạng tình bạn trên
Facebook, mạng theo dõi Twitter, mạng chuyên nghiệp LinkedIn, mạng người đăng ký YouTube
và mạng blogger. Trong chương này, chúng ta sẽ tập trung vào các mạng truyền thông xã hội rõ ràng.
2. Based on the direction ò links/ Dựa trên hướng liên kết Dựa vào phương hướng
Dựa trên các hướng liên kết giữa các nút, các mạng có thể được phân loại thành:
+Thứ 1. Mạng định hướng
+ Thứ 2. Mạng vô hướng
Mạng được định hướng
Một mạng với các liên kết có hướng giữa các nút được gọi là mạng có hướng, như được minh
họa trong Hình 14.2. Thông thường, một kết nối với một mũi tên được vẽ để hiển thị hướng của
mối quan hệ giữa các nút. Ví dụ: mạng theo dõi người theo dõi Twitter là mạng được định hướng
trong đó hướng của mũi tên cho biết ai đang theo dõi ai. Mạng vô hướng
Trong các mạng vô hướng, các liên kết giữa các nút không có bất kỳ hướng nào, như được
minh họa trong Hình 14.3. Mạng lưới tình bạn trên Facebook là một ví dụ về mạng vô hướng. Ví
dụ: Facebook gần đây đã thêm tùy chọn "theo dõi" bài đăng của một số người nhất định, tương tự
như Twitter. Hơn nữa, các thành viên Facebook có thể kết bạn trên Facebook, sau đó hủy theo
dõi một số bạn bè của họ, vì vậy họ không nhìn thấy bài đăng của bạn bè cũ trên dòng thời gian của thành viên.
3. Based on mode/ Dựa trên chế độ Dựa trên Chế độ
Dựa trên thành phần của các nút, các mạng có thể được phân loại thành:
Thứ 1. Mạng một chế độ lOMoARcPSD| 36667950
Mạng một chế độ, như trong Hình 14.4, được hình thành giữa một tập hợp các nút có cùng
bản chất. Mạng tình bạn trên Facebook là một ví dụ về mạng một chế độ trong đó các nút (mọi
người) hình thành các mối quan hệ mạng (tình bạn).
Thứ 2. Mạng hai chế độ
Mạng hai chế độ (còn được gọi là mạng lưỡng cực) là mạng có hai bộ nút thuộc các lớp khác
nhau. 16 Trong các mạng này, các liên kết mạng chỉ tồn tại giữa các nút thuộc các tập hợp khác
nhau. Ví dụ, hãy xem xét mạng hai chế độ, trong đó một tập hợp các nút (vòng tròn) có thể là
người dùng phương tiện truyền thông xã hội và một tập hợp các nút khác (hình vuông), như
trong Hình 14.5, có thể được liên kết để tham gia vào một loạt sự kiện. Người dùng được liên kết
với các sự kiện họ tham dự.
Thứ 3. Mạng đa chế độ Mạng đa chế độ
Một mạng đa chế độ cũng có thể xảy ra khi nhiều nút không đồng nhất được kết nối. Nó có
thể được coi là sự kết hợp của mạng một chế độ và mạng hai chế độ.
4. Based on weights/ dựa trên trọng số Dựa trên Trọng lượng
Các mạng cũng có thể được phân loại dựa trên trọng số được gán cho các liên kết giữa các
nút. Có hai loại mạng có trọng số:
Thứ 1. Mạng có trọng số Mạng có trọng số
Trong các mạng có trọng số, như trong Hình 14.6, các liên kết giữa các nút mang các trọng số
nhất định để biểu thị cường độ liên kết giữa các nút. Ví dụ, liên kết (mối quan hệ) giữa hai người
bạn trên Facebook (các nút) sẽ dày hơn nếu họ giao tiếp thường xuyên hơn. Mặc dù các mạng có
trọng số cung cấp thông tin phong phú, nhưng chúng yêu cầu phải có đủ dữ liệu lịch sử để xây dựng.
Ví dụ: Facebook và LinkedIn sử dụng các thuật toán độc quyền với các mạng có trọng số để
cô đọng nguồn cấp tin tức của người dùng với ưu tiên đối với người dùng mà thành viên đó đã
tương tác gần đây. Instagram cũng đã thay đổi thuật toán của họ, vì vậy hình ảnh không còn xuất
hiện theo trình tự thời gian trên nguồn cấp tin tức của họ nữa mà dựa trên sở thích của người
dùng. Facebook gần đây đã thay đổi tab tìm kiếm của họ để hiển thị hình ảnh/video về những gì
người dùng thường nhấp vào/xem.
Thứ 2. Mạng không trọng số Mạng không trọng số
Trong các mạng không trọng số, chẳng hạn như Hình 14.7, liên kết giữa các nút không chịu
trọng số. Các liên kết chỉ cho biết sự tồn tại của một mối quan hệ và không thể cung cấp manh
mối về sức mạnh của mối quan hệ. Mạng không trọng số dễ xây dựng nhưng có thể che giấu thông tin hữu ích.
Hãy nhớ rằng các loại được phân loại ở trên không loại trừ lẫn nhau và có thể tồn tại trong
một mạng duy nhất. Ví dụ, có thể tồn tại một mạng một chế độ có trọng số trực tiếp. Ngoài ra,
người ta có thể xây dựng một mạng không trọng số hai chế độ vô hướng, v.v.
4.3.1 .4.3.2. Hãy xem xét một số thuật ngữ hoặc thuộc tính mạng phổ biến. Thuộc
tính mạng có thể được chia thành hai loại:
Thứ 1. Node-level/ Thuộc tính cấp nút •
Degree Centrality/ Mức dộ trung tâm
Mức độ trung tâm của một nút đo lường số lượng liên kết mà một nút có với các nút khác
trong mạng. 17 Ví dụ, trong mạng Facebook, điều này sẽ đo lường số lượng bạn bè chung mà một thành viên có. •
Betweeness Centrality/ Trung tâm giữa
Tính trung tâm của tính trung gian có liên quan đến tính trung tâm (hoặc vị trí) của một nút
trong mạng, như trong Hình 14.9. Các nút có tính trung tâm giữa các nút cao có thể kiểm soát lOMoARcPSD| 36667950
luồng thông tin giữa các nút được kết nối do vị trí trung tâm của chúng trong mạng.18 Trong
mạng Facebook, những người dùng chiếm vị trí trung tâm (những người có nhiều kết nối trực
tiếp hơn với những người bạn có ảnh hưởng trong mạng) được định vị tốt hơn để kiểm soát luồng
nội dung truyền thông xã hội.
Higher betweeness = More importance in the Network •
Eigenvector Centrality/ Tính trung tâm của vecto riêng
Tính trung tâm của vectơ riêng đo lường tầm quan trọng của một nút dựa trên các kết nối của
nó với các nút quan trọng khác trong mạng. Nó có thể cung cấp sự hiểu biết về khả năng kết nối
mạng của một nút so với các nút khác, 19 như trong Hình 14.10. Công cụ Tìm kiếm của Google
đã sử dụng các véc tơ riêng để xếp hạng các kết quả tìm kiếm theo mức độ liên quan của chúng
với kết quả truy vấn của người tìm kiếm ngay từ đầu.
Tính trung tâm của vectơ riêng = không phải tất cả các kết nối đều như nhau và các kết nối
đến các nút nhất định quan trọng hơn các nút khác. •
Structural Holes/ Lỗ kết cấu
Lỗ hổng cấu trúc lần đầu tiên được đưa ra bởi Burt?", người đã gợi ý rằng một số nút nhất
định có lợi thế hoặc bất lợi dựa trên vị trí của chúng trong mạng
Trong mạng truyền thông xã hội, một số nút hoặc người dùng, do vị trí của họ trong mạng, có
thể có lợi thế hoặc bất lợi khi lan truyền thông tin đến các nút khác trong mạng.23 Hình 14.11
cho thấy một mạng xã hội đơn giản có bốn nút và ba lỗ cấu trúc; rõ ràng, nút một có lợi thế trong
việc nhận thông tin trong mạng đó, nút hai, ba và bốn thiếu. Hố
Lỗ hổng cấu trúc = Có khoảng cách giữa các nút của mạng (chẳng hạn như giữa nút 2 và nút
3, hoặc nút 4 với nút 2 hoặc nút 4 với nút 2) - kết quả là thông tin mà mỗi nút nhận được có thể khác nhau. •
So sánh trung tâm gần gũi và trung tâm giữa Trung tâm gần gũi Trung tâm giữa
Định nghĩa: Mức độ gần gũi trung tâm cho
Định nghĩa: Tính trung tâm giữa các phép
điểm từng nút dựa trên 'độ gần gũi' của chúng
đo số lần một nút nằm trên đường đi ngắn nhất
với tất cả các nút khác trong mạng
giữa các nút khác. trung tâm giữa
Nó cho chúng ta biết điều gì: Biện pháp này lOMoARcPSD| 36667950
tính toán các đường đi ngắn nhất giữa tất cả
Nó cho chúng ta biết điều gì: Phép đo này
các nút, sau đó gán cho mỗi nút một số điểm
cho biết các nút nào là 'cầu nối' giữa các nút
dựa trên tổng số đường đi ngắn nhất của nó.
trong mạng. Nó thực hiện điều này bằng cách
Khi nào nên sử dụng: Để tìm kiếm những cá xác định tất cả các đường đi ngắn nhất và sau
nhân có vị trí tốt nhất để gây ảnh hưởng đến
đó đếm xem mỗi nút rơi vào một nút bao nhiêu
toàn bộ mạng lưới một cách nhanh chóng nhất. lần.
Chi tiết hơn một chút: Tính trung tâm của
Khi nào nên sử dụng nó: Để tìm những cá
sự gần gũi có thể giúp tìm ra 'máy phát sóng'
nhân có ảnh hưởng đến dòng chảy xung quanh
tốt, nhưng trong một mạng có tính kết nối cao, một hệ thống.
bạn sẽ thường thấy tất cả các nút có điểm số
Chi tiết hơn một chút: Độ trung bình hữu
tương tự nhau. Điều có thể hữu ích hơn là sử
ích để phân tích động lực giao tiếp, nhưng nên
dụng Tính gần gũi để tìm những người có ảnh
cẩn thận khi sử dụng. Số lượng giữa các cụm
hưởng trong một cụm duy nhất
cao có thể cho thấy ai đó nắm quyền đối với
các cụm khác nhau trong mạng hoặc chỉ là họ
ở ngoại vi của cả hai cụm.
Thứ 2. Network-level/ Thuộc tính cấp mạng (trang 47) •
Network-level properties/ Thuộc tính cấp mạng
Thuộc tính mạng cung cấp thông tin chi tiết về cấu trúc tổng thể và tình trạng của mạng. Các
thuộc tính cấp độ mạng quan trọng bao gồm hệ số phân cụm, mật độ, đường kính, mức độ trung bình và các thành phần. •
Clustering Coefficient/ Hệ số phân cụm
Hệ số phân cụm là thước đo mức độ các nút trong cụm mạng kết hợp với nhau. Trong các
mạng xã hội, các nút có hệ số phân cụm cao và có xu hướng hình thành với mật độ quan hệ cao;
trung bình điều này xảy ra thường xuyên hơn hai nút ngẫu nhiên hình thành các mối quan hệ tương tự. • Density/ Tỉ trọng
Mật độ của một mạng liên quan đến một số liên kết trong mạng. Mật độ có thể được tính bằng
số lượng liên kết có trong mạng chia cho số lượng tất cả các liên kết có thể có giữa các cặp nút
trong mạng (đối với mạng vô hướng, số lượng tất cả các liên kết có thể được tính là n (n-1) /2);
trong đó n là số nút trong một mạng). Một mạng được kết nối đầy đủ, trong đó mỗi nút đang liên
kết trực tiếp với mọi nút khác, sẽ có mật độ là 1. •
Components/ Các thành phần
Các thành phần của mạng là các mạng con bị cô lập kết nối bên trong (nhưng bị ngắt kết nối
giữa) các mạng con.25 Trong một thành phần được kết nối, tất cả các nút được kết nối và có thể
truy cập được, nhưng không có đường dẫn giữa một nút trong thành phần và bất kỳ nút nào
không có trong thành phần.26 Thành phần chính hoặc lớn nhất của một mạng là thành phần có số nút nhiều nhất.