lOMoARcPSD|27790909
Downloaded by M? M? (nguyenmo081102@gmail.com)
ĐẠ
I H
TRƯỜNG Đ
Đề
tài: S
TR
I D
GVHD: ThS. VÕ TH
Thành ph
lOMoARcPSD|27790909

MỤC LỤC
CHƯƠNG 1: SƠ LƯỢC VỀ BIG DATA.......................................................................5
1.1. Khái niệm...............................................................................................................5
1.2. Phân loại.................................................................................................................6
1.3. Các giả ịnh của Big Data.......................................................................................7
1.4. Thách thức khi sử dụng Big Data.........................................................................9
CHƯƠNG 2: BIG DATA TRONG NGHIÊN CỨU MARKETING..........................11
2.1. Khái niệm nghiên cứu Marketing.......................................................................11
2.2. Nghiên cứu Marketing truyền thống và Nghiên cứu Marketing sử dụng Big
Data..............................................................................................................................11
2.3. Mô hình trích xuất thông tin từ Big Data cho nghiên cứu marketing..............12
2.3.1. Thu thập và lưu trữ dữ liệu...........................................................................13
2.3.2. Xử lý làm sạch dữ liệu...................................................................................13
2.3.3. Tổng hợp, ối chiếu dữ liệu.............................................................................14
2.3.4. Mô hình hóa và phân tích dữ liệu.................................................................14
2.3.5. Trình bày, diễn giải dữ liệu...........................................................................15
2.4. Phân tích Big Data và mô hình 5Ps....................................................................15
2.4.1. Phân tích kết hợp (Association analysis)......................................................16
2.4.2. Phân tích gộp nhóm (Clustering analysis)...................................................17
2.4.3. Phương pháp phân loại (Classification analysis).........................................17
2.4.4. Mô hình chủ ề (Topic modelling)..................................................................18
2.4.5. Lọc tương tác (Collaborative filtering)........................................................18
2.4.6. Phân tích hồi quy (regression analysis)........................................................18
CHƯƠNG 3: ỨNG DỤNG CỦA BIG DATA TRONG NGHIÊN..............................20
CỨU MARKETING CỦA AMAZON..........................................................................20
3.1. Hệ thống giới thiệu cá nhân.................................................................................20
3.1.1. Nguồn thông tin cần thu thập.......................................................................20
3.1.2. Cách xử lý nguồn thông tin...........................................................................20
3.1.3. Vận dụng những thông tin ã xử lý................................................................21
3.2. Mô hình giao hàng dự oán...................................................................................22
3.2.1. Nguồn thông tin cần thu thập.......................................................................22
3.2.2. Cách xử lý nguồn thông tin...........................................................................22
3.2.3. Vận dụng những thông tin ã xử lý................................................................22
3.3. Tối ưu giá..............................................................................................................23
3.3.1. Nguồn thông tin cần thu thập.......................................................................23
3.3.2. Cách xử lý nguồn thông tin...........................................................................23
3.3.3. Vận dụng những thông tin ã xử lý................................................................23
lOMoARcPSD|27790909

3.4. Dịch vụ khách hàng Alexa...................................................................................24
3.4.1. Nguồn thông tin cần thu thập.......................................................................24
3.4.2. Cách xử lý nguồn thông tin...........................................................................24
3.4.3. Vận dụng những thông tin ã xử lý................................................................24
CHƯƠNG 4: NHỮNG CƠ HỘI VIỆC LÀM MỞ RA ĐỐI VỚI MẢNG DATA
LĨNH VỰC MARKETING...........................................................................................26
4.1. Marketing Insight and Analysis. (1000 - 3000 USD).........................................26
4.2. Chuyên viên phân tích chỉ số Marketing (1000 - 2500 USD)............................26
4.3 Social Data Analysis (700 - 2000 USD)................................................................27
KẾT LUẬN.....................................................................................................................28
TÀI LIỆU THAM KHẢO.............................................................................................29
DANH MỤC BẢNG
Bảng 1.1. So sánh Dữ liệu cấu trúc và Dữ liệu phi cấu trúc................................................
4
Bảng 2.1. So sánh nguyên cứu Marketing truyền thống và nghiên cứu Marketing sử dụng
Big Data ................................................................................................................................
9
Bảng 2.2. 5Ps and Big Data Analytics ...............................................................................
12
Bảng 3.1. Tóm tắt các ứng dụng Big Data trong nghiên cứu Marketing của Amazon ......
21
DANH MỤC HÌNH
Hình 2.1. Process for Extracting Insights From Big Data .................................................
10
lOMoARcPSD|27790909

DANH SÁCH THÀNH VIÊN
STT Họ tên MSSV Nhiệm vụ cụ thể Mức ộ hoàn
thành
    ! "
 #$%&'()'*
+,- $./
  ! "
 0&'1'2   ! "
 3'()4 5 678 "
LỜI MỞ ĐẦU
lOMoARcPSD|27790909

99:-*;2<7=$>?$@-4<ABCDEFG
4<-)H$I?$@$=-? JK)7@L-),-7*7)
MA;NO>PQRSA;<I7)-A:2--T$(*)C
T-TUVUAVUFSWXABYZPZ#N2
K DX-! (-J7[KU\CK0;CVI]GC)A;C)LC
^)C2_CI LCPPP9,NGCE727)K`ALV? JCa-$@
;C$b,VcK$@7Yd=K)Fe]EOXD7*P
4K4C (T<f$2CK2a-Fa^-7gK))KX
A:)`))A,A%P#(2<-OFaA&<]$T
K)<: NFMKE=4< K)(NWVOC=$K)(;2CRF27)
 (7[KUQ A8Ph-GNA:)C*( I2--)O
GP@<KTZ#C(2<Vca-$@M;%CGN
A:)%C\, I2-A:)K)H<(2<a-$@7@
* V(KT:OXP,`L7)7g(,-H8-JM)i6U
FSWXZ (YQ A8jN)!-NK)YP
9H8-]I-%9;3&J >(,-EAFWL
`$%N)M))P
TbK)7UD*VcA;N :EVV,P9H8-
G-(;;I-K)$@4E4]kC,<g\;P
Q7=EH8-^)I-%P
lOMoARcPSD|27790909
5
CHƯƠNG 1: SƠ LƯỢC VỀ BIG DATA
1.1. Khái niệm
Z#$@]8-7)]$T;2]G2 (b*9:-*;
2<PK)l7)7bI( GMF)(:A(,FHA;mO
KT:(2< YT-)DIKT:(2<2- (FO
I4<V^K) K)(MA?OP9:W)=NW$
XJKME72C\K2(E72$-<L(*=$@I-N
V;$nE72$-)VI7$@=$@-7*C7)-V*C$@
NWC7)-)K)<^LN-7*;ELP
4C Dữ liệu lớn (Big data) một thuật ngữ về việc xử một tập dữ liệu rất
lớn phức tạp khác với cách truyền thống. Dữ liệu này bao gồm các hoạt ộng khác
nhau như: thu thập, tìm kiếm, giám sát, dự báo, phân tích hành vi người dùng, hoặc
một số phương pháp phân tích dữ liệu tiên tiến khác nhằm trích xuất những giá trị từ
dữ liệu ít khi cập ến kích thước dữ liệu này.9oNC,,N KGE4<
<G H+V  8p78V/$K8(Aq4VOC!ICE72I-FC4<
7$4AgCUVUFGE72)(A;, (1V%KT:<*-K!-A-
A:P
-Cr 8 $-A:2--TKMZ#KT-;!i5Vj
$%KT-LG? JC$Vs
Volume: 7)VU $.KM-RAO7$@P#E72 (:2O;
7;7;K)A;\7YKM-RAL$T+AO7$@/P9H,N
!-GE72 (:&*K8(C-VC-87T Y:AY M;]>
PO7$@E72X-2O;,N7Y)8 F8K)
8F8P8()72Xt871:uC-v^CZE72$@*(
 Y()TC$%$%KT-(*K8('#)-Pw8F((A<I]_7g
A(I5ZE72-v)P
Velocity: 7)VU $.KM-RO]_7gPZY*VU $.KMAO
7$@CO $.XE72`7Y-:,-RP9:o
$@V_o<WF Y:7[KUt8 8C)LC^)C)A;C?^
VUCxVAe8)<=7TM$@]_7g (bU;?2
lOMoARcPSD|27790909

OZ#P%_C Y:-*]>C;A:;F:(:,K)^
+y88CVVzP/>7)`K)A;$@$bS?^-P$bS$b7(*Fe
:a`K)mHg:4<4=GP6UNXE72b^
=$7)b+ 87-8/CK)O4<4;>I-]O%K&)-7
^P
Variety: 7)VU7YKML*XE72P#E72A;m.*,G
 HC-)DF(1- GMANE72<G HE+$K8(C!ICE72
I-FCJ,CF7(CPPP/PZ#(<k<H<^LK)7YA*
:X7(*E72KTKLo$:F!74CF)X-,-$b
S)(, Yw8F((AKT;:K8(>$@V{\:AY]>A:
$|(F8Cy8 P
Veracity: 7)L]:UXE72PT]$Ti6(7j)K)VU
-*-cL$%:K)V{X$bS>7)-(AI]:
&KM4K)LL]:XE72)-A,A%PZ)(:<^L
K)7(*FeE72L]:K)^07)- (ELG?
 JXZP
Value: r: &;-LG? JGX]$T;2
Z#P4K4C(2<<I(*&$@E: &;ELX
Z#-:<S@<h-I?(EKGMCF)(:-)(2<
R<<I(R-;!(*A(X-!P9,N,K2=Y:
(2<=7)- $TAFaK)(U2Z#7)<I7)-V(]:&
$@LGi78jX,P
1.2. Phân loại
#E72\M1K):&*A:YH G*P
9LK!K4CK2<^7(*E72`,M:P)- (E:%FI
GK)N2$@VUA:F2E:7(*E727)<^7(*UK)(G HX
Hs#E72,G HK)#E72<G HP
Dữ liệu có cấu trúc 7)E;$@N2 (:K)),YMC
,N0)R)K)]_7gFh:;o!-A-E72P9H,N]8-
lOMoARcPSD|27790909

H$-X1V%$@W()I(C:E72$@]:&C:>K)0
) 4<P
Dữ liệu phi cấu trúc 7)E;A;$@W;?:-;!
(R7$@1E72$@]:& $TP
Bảng 1.1. So sánh Dữ liệu cấu trúc và Dữ liệu phi cấu trúc
Dữ liệu có cấu trúc Dữ liệu phi cấu trúc
Ví dụ
x ):
x 6C6O{Lo
x YA:)C&m
x YVI<}-CVO7$@
x 9:;(&
x 9:p78KFI+8]/Cp78
#w
x Z:(:(
x aC~-7
x w78•(C8(CI
x 9: M;
 Y-*]>
Đặc trưng xQ;!E72$@]:
&  $T +$b m ,
* K FI/ x #0 !-
A-
x ; , -; ! E 72
$@]:& $T
x 9,N7)*KFIC!
ICK8(C^-(R&*
A:
x ,!-A-
Ứng dụng chính x N-V(:)1A(
x '2O9€QC~€
x '2ORKk-:F
x •_7gKFI
x =-M- !
x ~-7
x 9:;oN&K)m
V_ M;
Được tạo bởi 9($bK)-:-, 9($bK)-:-,
(Nguồn: Internet)
1.3. Các giả ịnh của Big Data
N = All
lOMoARcPSD|27790909

4<;U Y-deC4-LEA?I$@4<
i-:A(Jj!;,`A;:4+<$%V( Y:-d
7R<7*/CA;-L*2K)A;XV-*KM-ROAY+7)C:V
74@<7gF&*/PQVO)Y( hZ#,NAa<o
E*)K)V‚V)G<:F)AN- KM:;VO^VOK!,
$%O {C$%O*2C$@FWV7YoK)0)V(k<PYC-
7$g? J7Y?I&)sZ#7(* \E$bA;V_o
8 8(R;2]_7g;Aq4VOP2-K)(MI U
C(S$%-*A;C!`,VUA:F2:AN8(K& L&7gCW
:CTLCXK):O]>JA:
+yyyPVVP(-/P
Today = Tomorrow
Z.K!,K),-RAa<%CVOAq4VO%MV(
KTVOUP$bYS7YoNWC_K)\FeVU22Aq4
VOXJP9:GKX)K,,N .)O$@XM PZ=C
w8F((AT*)KY($bS ():(oƒ(,Cm=Ag
-)A(I8-78Pw8F((A-. C,>$@-.(IE$bS
<:(oP
Online behavior = Offline behavior
$bYS,N2:-;!)KOI Y UK)
(*A;M) G<*<K):)<&<I!-N:$b
YSFN2 (I-;!)K-)OKT:VI<}-oNP
Behavior of all today = Behavior of all tomorrow
rI&)W@<FI&, YPZ#7)VU<I:VO,A;
()I(KMVO UK)(*X($bP9:-;!-;I)
KX$bYSWNIL(I$.X;2K)
8 8P
EI&)H<AN-V(:E;,$@\K2<^LZ
lOMoARcPSD|27790909

#PM)<& hGI$bYSXJM,-R UK)Vc
$]_O(S U(*PYCK2A;R^e
(RA;?^-:I&, Y,NI .AI1*X:<^L
Z#OKT(2<P
1.4. Thách thức khi sử dụng Big Data
Z#7)F$T(R:GVU<: NX9:-*9;2<PC
K2o;2)-7*M-<: N2Kb((2<P
YK2oZ#-:2?I!A;<I7)M0)K)
D GM:-):(2<=<IO-RP
Sự a dạng thông tin:  $TA)<^LE72C(2<=I-
FI(1E727)L]:K),&*<S@<(K2<^LP YU
!VU1*X-E721GK),G HOKTSAL$TK)G H
7) G=P9LK!K4CK27)-V*K)]_7g:7v\:1E72A;
=X:E72^07)O? JK)A;NPYCM,D
e(2<==$-A(I<L+bC^V:/7TN,$@A?I
-: &(P
Quy mô:U(G hAO7$@E72A:7TK)=
$>K$@?AIV-*]_7gK)7$ EX-:LPZY*,CK2 M
E727T$b<I:&<L(P^7)iHWjXK2L
(:Z#P
Yếu tố thời gian: VO7$@E72,C:A?I<^L!
=<I$@$-:![7) (bUY=<I,VU<:
 N:? !]_7gUK)(VUX:G HE72h-*$@-oL
OS,7):<Y= 4<;-:!X$bV_oP
Tính nhân Bảo mật dữ liệu:9:O74<:<7Y?:*
KM?M:^2 .)--O8JK!,,N*:L7@M-
P9LK!7g(,-):LV:-*oN7);
V{:E727Y?$bS:^=<I$@]8-]k-:4
lOMoARcPSD|27790909

 JK)Y-HPZY*,C-VOKLo (U(GCA;m;
:^$bYSC;-4X:W-)IFL-4?O
`,NF&]^-<*-P#(,CI?:KGME72Fh:;o
Aq4K):LV: .YK;SG<F:P
Thiếu chuyên gia công nghệ: #S7)b*;2PC(*Fh-:
-,-$C$A;,($bK4)C?I7g!S-:-,,
2*^`A,,N-2?IOGP9;2Z#`K4P
9:::XY7)V=N,NN:1E72K)NA
:-:O$:M-X,DeVU<O@<&<)K)=
0E-:-,K)($bP
Đòi hỏi thay ổi văn hóa doanh nghiệp:,(2<$@]^UK)
<: NA;<Im ()-)P9LK!K4CN-(2<
WK,7)-K2X-!CRF27)\ MOV2*CA;<I7)
M%IP8(AI(V:X8y8Cm,P"(2<);
 (K2WK,(2<8($T2*-TP

lOMoARcPSD|27790909

CHƯƠNG 2: BIG DATA TRONG NGHIÊN CỨU MARKETING
2.1. Khái niệm nghiên cứu Marketing
8(7<(78 +/iY- A87)]:&-:,2O
E$72=(!O- A8R (-;C4<C<^L
HK)F:(:(A?IjP
8('2<Q A8Qq+•Q•/sY- A87)?: !4<K)
<^L,2OEE72KM:KGM7Y?:(*- A8X
(2<P
$$.X*(XQ A87)iQJ?&A(M]G<:\&
 $bjPQOU2$@$$.X*()!<I,=X;KM& $bC
KM-; $bA(P9K)(:;$@?YQ A8C
:)?I7gVcK*7$@CLV:A(<S@<a-K)(&
 $b-oYP
2.2. Nghiên cứu Marketing truyền thống và Nghiên cứu Marketing sử dụng Big
Data
!-oLXY- A87)NNWE724<$@
);,: &K)NFEL(K2 ?&PQRSA:2-K)
-oYXY- A8KdA;W (FOIZ#C$KT
7@L))7TXK2<^LF$2!De=,-?
N-Y- A8 %P
,-H;$-VON-A:F2EYQ A8 M
OK)YQ A8V_oZ#C:YLV(V:X7)KM
4<K)<^LE72PYQ A8 MO8(,-7)Y
$bU YVUI&E72dYK)V_o:<$%<:<OAY
 MOCDYQ A8V_oZ#I&E72,<*<
(K)V_oY-:<$%<:<OAY^(FY*:<$%<:<
OAY MO>$@IPRF2C (?:A$,VUFSWX
FA(JAq4$2P
lOMoARcPSD|27790909

Bảng 2.1. So sánh nguyên cứu Marketing truyền thống và nghiên cứu Marketing sử
dụng Big Data
YL
YQ A8 M
O
YQ A8V_oZ#
O
7$@E
72
9m$@E72*
-;I8(A(Ib
G&P
4<$@7$@E72AW71-;I
8(bU<(<H%P
1E
72
9X7)AI(V: U<
A:)?<eKGC
FI^ezK): 
G<E72G<P
\:F&7$ EE72$bS
$2(*;-C<$%2 M
;]>C:F&I-FCz
…$  E
K) ?I
7gE72
F& 7$ EC?I7g,
7$@7$eP
9;2 2(: :--^G< Aq
47$ EC?I7gKT7$7$@7TK)
2?IPQVOMI7$ E:--^
2  1-s r((78 6( 8C •-†(C
Q (V(p•† 8CtZQZ7897(P
$%
<:<<^
LE
72
$% <:< <^ L E
72 MOFa1
\OAYK)A(J-:
L$<^Lo-C<^
L^OC<^L$%
?C<^L1?z
$%<:<<^LF7):-;
!4(:`U YOAYK)
A(J-:L2*%(<k< L
]G;K)*(:-;!U(:
2?I(PKLo$-;!4(:
Q<€88(r((78M]GCAq4<^
LK)I->…z
(Nguồn: Nhóm tự tổng hợp)
U2$,M<$%<:<<^LE72F$@<: NK!
AO7$@K)OX,?:7TPY (b*;2<P$2C
K2(2<F:<^LE72FVc7)-7@ G7TP
2.3. Mô hình trích xuất thông tin từ Big Data cho nghiên cứu marketing
MUVU-7*: &(K2V_oF7)phân tích dữ liệuPA;
,<^LCFm7)-4<E72KTK2V_o*P
lOMoARcPSD|27790909

-)VU]G2XF=&!7*?: !Y- A8P
Q;!$T^ !F)-(*LXY- A8V_oF
P (,C-(*)$@,-)quản dữ liệu (data management) K)
phân tích+7V/PQuản lý dữ liệu7)E? !K);2v @$@A
K)V_oN4<C7$ EK) L]GE72(K2<^L.(*VP9D
Phân tích7)4<@<:Aq4$@V_oN<^LC<:JK)*(E
;,: &\1E72FP
Hình 2.1. Process for Extracting Insights From Big Data
(Nguồn:Gandomi & Haider, 2015; Japkowicz & Stefanowski, 2016; Labrinidis &
Jagadish, 2012)
2.3.1. Thu thập và lưu trữ dữ liệu
N,E72!=Y=<I4<CKGML^A,A(K24<
E72\F,7)VU<^:XE72.M1A:P9:;o
4<E72\F&I-F$bS+I-F7)VU(7$bK)FW*7$@
K47g)L2VO,NJ$@CE72I-F,N7)V,^-CJ
,C z/CF&,&K&K& LC:<$%2 M;]>C(&
)LC2(*;-Cz
#E72Vc$@7*K)7$ E YMF&7$ E$A(E72 MOC
7A8V2(::--^P
#E72$@4<K)7$ E.(*)7)E72;C$,: &V_o(P
2.3.2. Xử lý làm sạch dữ liệu
;$bE72\:1;A$bA;=XCA;,G HG
?:+E72.MANA:$sKFIC^-CK8(z/CF&7v&*
%I7)VPLoCE$b-AI(V:,N I7bVE72
$@\:F&8(3 Y2(*;-+:<<$@v @r6/,NV
lOMoARcPSD|27790909

(F&,F&ezPNFEE72;))E72,: &H
=)]_7gE72P
•_7gE727)?: !]:&K)V_7vE72NI-FI(G7$@XE72Fh
:4(:PLoA]:&$@KTE72F&7v&*!)WKM
&*<S@<C)],FeEE72F&VP
^7)F$T? J=NI-FI(:2<E72:<:Y}KMG
7$@K),: &V_oP
2.3.3. Tổng hợp, ối chiếu dữ liệu
N)<^LE72=@<G:2<E72A;1GKTAL
$T*.F$T Y)-4<E72L@<<S@<KT=YPP
6,C)OE72C!-EE72OCF& S7R<N7(*FeP6U
 S7R<E727) G<WF (:2<E72\:1A:CK27(*Fe
EE72F&7R<h- :7><LA;7$ E`$N,%V.<^
LL]:PLo$-;{LoK)-)F:7{,N7*:
(&OX-A:)P
2.3.4. Mô hình hóa và phân tích dữ liệu
9, GM7(*<^L$@V_oN!-:-d;,g[ (
1E72FP^LKFI,NNWKFI$:y88::
$%2X$bYS)FI,-a:gL,g[P^L^-
N L]G;\^-A;,G HCf*$2<^-
J<))XA:)P$%UC<^LK8(N L]G;
\K8(CKLo$:F(]K8(($bYS*(P^L
!I(<k<:)Y L]GEE72\E\$@ (
-FIX$bYSCf* Yy8 F&T*5AgUY
$bYS$bNE72KFIK)(IP$%2 M;]>
K)<^L-*NA:-<:-)$bYS*( Y:MI M
;]>K)N:,)^-CK8(:
<^LA:P
6A<^L:ANE72 Y!)Y>,N]^U--;!
KM)KC:K)!I-XA:)P
lOMoARcPSD|27790909
5
2.3.5. Trình bày, diễn giải dữ liệu
E)Y- A8<I,AINK)0IA?I\F$T
<^LK)-;!,E72P9oN7)<IF: !F)C M*A?I
Y(E$b?&NJa-KE!OK)$?&
<S@<CL X (GP
2.4. Phân tích Big Data và mô hình 5Ps
#UK)(7$@;,$@VA<^LZ#C(2<,N
]^U$@-;!5V$FI$T+8(wC…8‡ˆ8(C5/P
Bảng 2.2. 5Ps and Big Data Analytics
^
LZ
#
8(<78  (  (-((  8 78
1
; 
4<
x^ A} x
•>
x€8K8yX
A:)
x#E72AI(V:
xRN-
x^7(*
x€8K8yX
A:)
xI(V:
x#E 72
<&
x#E 72
AI(V:
x #E
72 (
&
x #E
72 AI(
V:
x 9: M I
AO-*]>

x#E72AI(
V:
$%
<:<
<^
L
x6_o<$%
<:<<^7(*
+7VVp(/
x^L<
,-
x ^L<
,-
x Q;!XM
+(<
-(877/
x ^LA
@<
x ^
L1?
x …J
$%:
x ^
LA@<
x^
LA
@<x
^L
1?
x^L1
? x6_
o
<$%
<:< <^
7(*
lOMoARcPSD|27790909

‰
o
x^ AH
A:)
x^LU
(:)KX
A:)
xr@gVI
<}-
x(7$bVU
<WFF
XXVI
x '2 O
@g
x ^ L
2 ?I
<&
x 9
7$@KM:
x ^
LOX
* 
x!- : M
I *
- A82
?I
x^LU
(:$Y
A:)M-

<}-
x^LU
(:N
G<VI<}-
<S@<(
\& $b
x^L
%1
(Nguồn: Fan, Leu & Zheo, 2015)
8(,CU YE;=(-v7$@A:SKT
K2o:4(:OAYK)A(J-:L>( :U(:KM$%
7KT]:VG(PRF2C<^LU(:U YE72$@:<o  >
 (YQ A8P (,C,:*<^L<WFVPPhân tích dự
oán hành vi khách hàng.$:-;!$%? ()KXA:)C
\,U(:]$T-) ($%7P
Phân tích dự oán ưu tiên khách hàng tiềm năngPŠ^C:;2< M;Vc$@
O$,(\,-A:)M-CK)$ 77x(x(L]:(JP
Phân tích dự oán ể cung cấp sản phẩm phù hợp cho từng thị trườngP ( $b
@<)C U?,E72H<,-<&$?&HaKMVI<}-
(R&Ko)(Y$@<^<O & $bP
Phân tích dự oán ể nhắm mục tiêu khách hàngP9:-;!$@V_oN]:&
,-A:))(,: &(GC\,G<(JE$><S@< $T
bN-J ?&-)P
2.4.1. Phân tích kết hợp (Association analysis)
^LA@<7)-Aq4(<k<!-G:-d (FV$4<E
727TP^LA@<H<*(:;,: &Fh:A:-<::
-O?2,7Y?E:FA: (%V.E72?-;7TP2
lOMoARcPSD|27790909

IL:-O?2E:-dA;0)K!VO7$@-d$b G7T
(R:-O?2A!-$bK;[PY<$%<:<<^L)
H<I-NOi0jE72MG,NP
9:v_)F:7{K)VY&$bV_o<^LA@<N*(1V%
KM)K-Va-XA:)P#U Y,C$b?I7g_),NM
:7$@Va<]<:VI<}-8( !UoNh- $.(VOP
2.4.2. Phân tích gộp nhóm (Clustering analysis)
^L<,-<^Lo-7)-Aq4N-;IE72K)!- 
:-dP‹,C4<E72Vc$@<^)M,-A:C (-v
,-!:N-E72:?V:VcOCK)E:,-!,VUA:
F2P
q4<^o-$@o GM (<&%-)Aq4)$@V_
oNA:-<::,-A:),=$%UCN\,]^U:
7$@<&(VI<}-(R&Koa-K)(,-A:)-oY2?IP
2.4.3. Phương pháp phân loại (Classification analysis)
$%<:<<^7(*7)- (E<$%<:<A(JE72$@:<
oMGK)WGP (<$%<:<)CHVcU(::?
V:-T+E72-T/4<VcKM7(*)(PM)$@U2Fh:
<^L:?V::-o7&V_>FP9:-;!A:,N$@V_
oN<^7(*E72K)- (E-;!$@FMG,7)i^
?&j+8V( 88/C$b$@V_oKT:4<E727TP9^?&7)
-?: !-)M^e,(RA;$@ I7bN]:&-o-)E72
-TVcKMP
$%<:<<^7(*$b$@V_oA@<KT<$%<:<1?NI2
2VGU(:X-;!OAYP
QKLoKM:<^7(*$@V_o (-V,VAe8C%E727&V_
XF2^$@V_oN<^L: 2h-]:&+<^7(*/!
 *F2^-T,N-a<IPM)>$@V_oNU(:$K)]:
&:,-%(P
lOMoARcPSD|27790909

2.4.4. Mô hình chủ ề (Topic modelling)
Q;!XM7)-;!N<^L:E72Z#=K)():7(*
XMA:PQ;!XM1-,-;!,:-V:K)A;:-V:P
 (-;!XM,:-V:C$bS,Nm&-VORN-( $TX
XMN2O7J8(ERN-,P9D-;!A;:-V:!:;
KFI\Z#$@4<UK)U<^XM;-P
8(-R&CQ;!XMU7(*Fe:\\K):\=VO(]G2
 (=:)72K!H$bA;H<]:& TE:XMP
$K4C (7$@ (X- A8C-;!XM$@K4oN
<^L:Z#KFIP\,,N<^7(*:VI<}-8(EXM
A:Pb,C(2<,NF:7(*VI<}--)A:)?
^-N\,M 7$@VI<}-<S@<P
2.4.5. Lọc tương tác (Collaborative filtering)
'DJ7)7J$%:CV_oVU$%:?7* ()K-Va-
E:A:)N!-V.LX-A:)OKT-VI<}-P'=
:)K(RV.LX-J$bM,ERN-K),N,-7*
):,-$%1PQ<oEVY&-=$b-Y-
$T$%K)$T-a-P')K)7R<7*OKT7$@-Va-7)7=!AI
(-<oEZ-=`Vc-Y-$T$%K)$T-a-P\
,VcA&VI<}-(A:)U Y)KX:A:)A:
7Y?GP
2.4.6. Phân tích hồi quy (regression analysis)
^L1?7)Aq4OAYSN$T7$@<$% !<S@<
GKT:4<@<A?I?V:XF<oK)F74<P (- A8C
<^L1?$@V_o G<WFP
lOMoARcPSD|27790909

 (7$@ (-((C<^L1?$@V_oNY=
X$bYSW8(\F74<A:P
 (7$@ 8C$b,NU2:; !YKM:
OI$.:VI<}-XJP,:Vc7)F<oK)-VOO
$7$@)D7*C=VI<}-COX* z::L7)
F74<P;?,C:)?I &Q A8,NF$@-:<S@<
(VI<}-&KoX-!-)MmNO$:P
 (7$@78C$b,N)<^L:OX-
AYF:),I$.VUG<d-)X$bYSPZ#=
4<(:F74<,N7):F) LC^-*C^KYz\,C$b
,NU2:;:IC()2:AYF:)X-!
lOMoARcPSD|27790909

CHƯƠNG 3: ỨNG DỤNG CỦA BIG DATA TRONG NGHIÊN
CỨU MARKETING CỦA AMAZON
•-†(7)- (E;KM$%-*2_7T)=TP9;>
K4oO$1)YE72AW71-)-!4<$@N8-7*7@
* P9oNCL-5C•-†(\V.E%V.E72…]7T
GTKT7$@PZCP5ZK)PZP8(YXt#9Cb
Z#C-•-†(*(TBŒ6#PZhK2V_oE727T
-)•-†())]% Y($bGNA:)K)8- I
2--)2Kb($bSX-!P•-†(>K4o;2
Z#K)(-VOU:WF4$T^P
3.1. Hệ thống giới thiệu cá nhân
3.1.1. Nguồn thông tin cần thu thập
N<: N2OT2:^X-!C•-†(>4<:; U
<\$bSKM:VI<}--)A:)>-C:-,$@Y-K)( $T
^C:-o-(@C:7(*VI<}-$@]8-]kK):::VI
<}-$@!-A-MGP
3.1.2. Cách xử lý nguồn thông tin
^L$b+<7V/s•-†(,N7GE72\?: !N
:(: Y $%-*2_X-!N]:&]8-N-LKM7(*VI
<}-OS-)A:)UVU=7)-!P…GKLoCAA:)N
?:V(<F:S))K)Y-MVI<}-K)(e)X-!$
Kd$U2(:R)P$K4C•-†(,N<^L$@LO
SXA:)7)EVI<}- (e)P\,,N@g:VI<}-
$%U(A:)P
^LKFI+8]7V/sFhK24<:\A,!-A-X
A:)*:bN-=C•-†(,NN$@=2*XA:
)P^LKFI.^7)K2<^LG H\A,K)I->g[N
N,):;<oKo(K2<^LYV^C]:&$@VI
lOMoARcPSD|27790909

<}--)A:)-O-Pq4<^LK)I-><WF$@V_o,7)
Aq4…+ 7…8 (8VV/Pq4<^L)$@7)-G<
<^L\%FIYV^P9,NKLoKM-\A,!-A-%I7)s
i•(V%-aE: {jPV_oAq4…!Vc$@<^L$Vs
…8]77Vs7)AN- :L YF2X\A,!-A-)$
XECK&ECFWEP$K4 (\A,),N<^L$@XE
L7)i•(V%-jCA\K)K&EK),N]8-o-\<LViaE
: {j7)FW[(XEP
67Vs7)F$T<^LA@<\EKTEINI[P (
\A,)M)<=X-^K)A;,^I-:)(YA;
=F$T<^L)P
68-7Vs<^L:g[,N]I C<^LE\O[C
<:2EogV_o\X$bSN<^LI[PNgGo-
\i: {j (\A,P9,NN7)A:)Vc$YJEVI<}-
I-:P
#V( V8Ž78K877Vsa[^KNN$@=X$b!-A-P
 (o-\),N<^LKM7(*VI<}--)A:)!-A-7):(C
G72V%-CAN:aCO$@V_o7)EP
9OSCVA<^LK)I->:\A,!-A-XA:)C•-†(
,NNA:)=!N\,$:@gVI<}-KMAN:C-)Va
$%PM),<<=daA:)!-$@VI<}-<S@<GKT
-!P
3.1.3. Vận dụng những thông tin ã xử lý
9:;$@]_7gH<(•-†(! 3%^A:)X
-!PZ$@=UVUXA:)*-bN-N:^, I
2--)XA:)PQvA:),--(-OA:OKT
VI<}-X-!P#(,C•-†(>:<o)7(*;2<^LZ#N
$E7b@gVI<}-<S@<G$bSP;?K2O$,
 I2--))C•-†(>i-,HjA:)X-!A;LP'2O
lOMoARcPSD|27790909

T2:^)>8-7*1(AW71(•-†(P,H<*(
A(I5"(F:)-v-X;P
3.2. Mô hình giao hàng dự oán
3.2.1. Nguồn thông tin cần thu thập
N())-;!)C•-†(=<I,-Z#KM:\A,A:
)!-A-CVI<}- (e)C:V(<>k?C:%)R=^C:
%)RK)(SbN- (?:AP()D,:RN-A:KM^
A}C&7gCL &X\AKUP
3.2.2. Cách xử lý nguồn thông tin
^LUF:(+ 8K87V/sA@<E;$@\Z
#-)XA:) (7&V_ 1)<^LUF:(($%7P
8(~A8 V(C<^LEF:(AN•-†( (-;!)7(*-;!J
,:-V:+:-V:E727&V_NUF:(($%7/K)V_o<$%<:<
<^7(*+7VVp(/PZh<$%<:<)C•-†(Vc<^:O$@
A:)X-!8(\AKU&7gC%=:A()X•-†(P6A
<^$K^C•-†()<^LV^=XA:)K)UF:(
E-R))(-)A:),N- (AKU,P
3.2.3. Vận dụng những thông tin ã xử lý
6A,$@E72A:)X:AKUb<$%<:<<^LUF:(C
•-†(Vc)4<:-R))K)(A(N42()(A:
)PA:) (AKUR)C;V‚V))N((A:
)*A()X•-†(=GPZh:)C;7;I-FI(ON
,b()(A:)P$K4C•-†(A;EA2-$@
<LK4N-)D*($@2I-V^VaK!b()VY
X-!P
lOMoARcPSD|27790909

3.3. Tối ưu giá
3.3.1. Nguồn thông tin cần thu thập
NU2O$KM:C•-†(>)4<-A(E72AW71KM:
(*XA:) Yy8FC7$@XOXCVUV‚,XVI<}-C-
$LVI<}-C7&V_%)C7@4A•KJPPP9:1;)<I
7;$@4<47YoN•-†(O$,:7YoP;$b:VI<}-
$@•-†(4<47Yo-v<HK!EE72Z#)$@4<4
=$7)7YoP
3.3.2. Cách xử lý nguồn thông tin
•-†(,NU2<^LUF:(8(-;!JA;:-V:P:KT
-;!J:-V:7GE72?:ANUF:($%7S-VOO$@!-;
!)A;SEE727&V_-)7GEE72-T$@4<4P
Q;!)H<!-$@-O7Y2E:O?V:P6_oAq4<^
L1?FC(•-†(F$@-O$%?X:VI<}-KT:
OD7*PŠ^C;,NU2-VO<^L1?KTF:7)F
<oK):F$7$@OXC-V‚,XVI<}-C-$
LPPP7)EF74<P$K4C•-†(,N]:&$@-:@<7gA:
F74<)W-vA$@4<4P
3.3.3. Vận dụng những thông tin ã xử lý
6A]:&-:@<7g*-bN-bK)(:Aq4UF:(C•-†(Vc
)4<4$b]Y-: Y: $%-*2_X-!P
9;7;7;<IE-:G<dOKTA:)PbK4C•-†()
)H$@M%)%CH<( F!5"-v-PO
KT:VI<}-F:*C;VcG<M&KoI-:NAL=P\,
A-$@7@4\VO7$@MPOKT:VI<}-F:4-C•-†(U
2LV::m%OX-LN$@M7@4% Y-vVI
<}-F: P
lOMoARcPSD|27790909

3.4. Dịch vụ khách hàng Alexa
3.4.1. Nguồn thông tin cần thu thập
•-†(>V_oFE72<(<H4<$@\K2A:)$%:KT
: @7gI(7)•78]P9:E72)$@7$):FIK)V)$@V_o
(-oL<^LCI2P
3.4.2. Cách xử lý nguồn thông tin
'2O…96€+… 8xK(F7 9((V6<88€8((/s1-
 !7)74<FIm-oK)!-A-P9:(*^-X•78]KTA:)X
•-†($@U2<Y^-)b;242J,U
+•6€/P9;2)V(V::\<Y^- ((*KT:\ (\NP
9OSC2OVc]G p78FIm(<k<!-A-:;\E$@
, (FI^-P
(8xFV8VV8-Vs$@7*KT2O…96€C2O))
&()F7b, (v(*):%K&^-P6,C!-A-
E%K&^-,$@\FI& YP
3.4.3. Vận dụng những thông tin ã xử lý
•-†(>N,E72FI\&Ko-V,A:)X•78]
):%K&^-,N!-A-$@P I?:F$T<^L]_7gA:
C•-†(,NN$@E-(-OXA:)P\,C;,N
I2G7$@ I2--Va-XA:)CI?E<))(
A:)P1b,<<=I( @7gI(•78]));-
%P
Bảng 3.1. Tóm tắt các ứng dụng Big Data trong nghiên cứu Marketing của Amazon
#U:
1;=
4<
9:]_7g;
4oE
;>]_7g
'2O
T
2 :
^
x 9: VI <}- -)
A:)>- x
9: -, $@ Y-
K)( e ) x 9:
x ^L$b+<
7V/
x ^LKFI
+8]7V/s…8]7
7VC
x Z $@ 
=UVUXA:
)
x $ E
7b@gVI<}-
lOMoARcPSD|27790909
5
VI<}-$@!-
A-MGP
67VC
68-7VC
#V( V8Ž78K877V
Q;!
()
x9:\A,A:
)!-A-
x^LUF:(
+ 8K87V/s-;
x #U F:(  =
A:)8(\
U(: x 6I <}-  (
e
)
x 9: % ) R
K)( S b N-
 (?:A
x 9:RN-A:
KM ^ A}C & 7gC
L &X\A
KU
!J,:-V:
x6_o<$%<:<<^
7(*+7VVp(/
AKU
x#U EK)()
\ A( ) X
•-†(=G
O$:
x 9:(*X
A:) Yy8Fx
97$@XOX
x 6UV‚,XVI
<}-
x Q$L
VI<}-
x …&V_%)
x …@4A•
KJ
x^LUF:(8(-;
!JA;:-V:x
^L1?
x94<4$b
]Y-:x
U2
7$@:(E
7(*VI<}-A:

#&Ko
A:
)
•78]
x9:FIAA:
)$%:KT:
 @7gI(•78]
x '2O…96€
+… 8K(F7 
9((V6<88
€8((/
x (8xFV8
VV8-V
x 'N $@
E -( -O
X A: ) x
rI ? E
<))XA:
)
x 9I 2
G 7$@  I
2- - Va- x
9I  (  @ 7g
I(•78]
(Nguồn: Nhóm nghiên cứu tự tổng hợp)
lOMoARcPSD|27790909

CHƯƠNG 4: NHỮNG CƠ HỘI VIỆC LÀM MỞ RA ĐỐI VỚI
MẢNG DATA LĨNH VỰC MARKETING
9YKY<^LE72+#•7V/7)- (E;K2
,=No(G.bN-2*P;A,N4GK D
XJ (=:)MC:W(2<PRF2*7[
KUQ A8oNs
4.1. Marketing Insight and Analysis. (1000 - 3000 USD)
Mô tả công việc:
I-4K2<^LK)0IE72CI-FI(-L]:CA&<
bK)ELXE72$@ !F)P
9G<:M]GU Y;8($TE72C,N
)KT-oY 3 )7)I22VGA(P
)::&A•2O7$ EE72K)%V.E72CU2
M_2-K)<^LA?I $TA$I<:<-T(R
!-:^(I<:<?I7gE72P
4.2. Chuyên viên phân tích chỉ số Marketing (1000 - 2500 USD)
Mô tả công việc:
: N2OOAYC4<mVOQ A8P
U,2OOAYC4<mVOQ A8P
•^U2OF:(:(mVOW@<X:F<4 (AO
Q A8P
•^U2OIF:(mVO(\F<4P
lOMoARcPSD|27790909

^LE72:mVOK)$ <$%:M]GAa<oP
O@<RcKT:,-- A8CVI<}-C;2N<: N
K)H}:U:P
4.3 Social Data Analysis (700 - 2000 USD)
Mô tả công việc:
U2:YKMV(7-8Fh:FYV(*C<^LC
0IE72YC7)-F:(:(K) !F:(:(P
$:A74CM]G)-:aJC<S@<KT\
 $b@<XA:)UK)(E72>YP
6_o:;oNU2? !Y$@(s4<E
72C]_7gE72C<^LA?IYC U?(:E72K)
V(*I(F:(:(P
lOMoARcPSD|27790909

KẾT LUẬN
9,N,E727)KO?gXFGA•(2<)(RF27) (FOI
:-*;2<7=$FSW$2P#E72,.Aa<-J%C
-JbbN-K!K44<$@ME72!Vc,$@7@P‹E
o\K2<^LE72$> !F) (F)C,7c^7)7H:(
2<=,VU!4HaKM=-? JXZ#`$,:
NW-!N,NA:H(?: ! ?&A(,
K)Q A8, YP
lOMoARcPSD|27790909

TÀI LIỆU THAM KHẢO
NNHKM=-? JXE72K)F:V_o:7(*FN1N
FN0E72P-AI(Y-V:Data Visualization - bản về minh họa
dữ liệu và thiết kế biểu ồP…As
<Vsuu K8P((78P(-up78uuK•5’V~€‹py•t7?w8ˆ7“<uK8y„p
F7”ty•€••-• Z98†“–pA#•F8…Q’Qˆ“–7K'wŒ-•Œ
•8•7A—
NNV^%KM4EZ#K):NFa=V_oHP-
AI(Y-s
P Z)KBig Datax#V7†(‹K8€8V8 
•<<VCV…A(˜VQ87€P'-+/P…A
<VsuuyyyP 8V8 8P8u<F7(u5•Z•••- A8
• 8V8 
P 6:The Big Data-Driven Business: How to Use Big Data to Win
Customers Beat competitors and Boots profits,€VV877r7VV68
977+5/P…A
<VsuuF((AVP((78P(-PKuF((AV„7”K‡7 ”‡”…9•x
Z‹••‹Z•“‡(”p‡<”€‡?”(-<"V8"F""
"- A8‡(V”t‹…‹€K‡V”9•“ZFŒ(F]wˆ#A“~‹’
Q-9A‡ 8 •8V”‡pF7”ty•€rr’?y<A<™Q5~5 ‹5•t
]Z9‹ˆr…™K|]•VŒ•|“6Q~tšK”(8<8‡?”(-<"V8
"F"""- A8‡p”p7V8—
P 6:Big Data in MarketingC#88K+/P…A
<VsuuyyyP8V8VPpuFV 8-u78uu5uZ"#"
"- A8P<p„V8?88”‡V•77(y8”
P …4KTools and Methods for Big Data Analysis +/P…A
<VsuuV<85P†P†uFV 8-u5uuuQV8 •8VV•Q (V7K•
(†F7P<p—
5P Z)K Big Data in Market Research: Why More Data Does Not
Automatically Mean Better InformationC(7A8 Z(V+/Crp
Q A8t87788€8K8yC(7PC(P+(K8-F8 /P…A
lOMoARcPSD|27790909

<VsuuyyyP-P( u8u<F7(VupAx- A8x87788  8K8yu
77xVV8Vu- A8xxxV88uFxx- A8x 8V8  yx-( 8x
x(8Vx(x(-77x-8xF88 xp( -(—
P ’8FV8KM:<$%<:<<^LE72CZ#K)o (
:)A:zCBig Data UniC‘<VsuuFP(-u—
NFM%KM:Z#$@o (A($)(P
-AI(Y-s
P 6:Big Data và ứng dụng trong kinh doanhC…Y'()6_+/C•Z
'‹rP'9Q+2, Y$K2 ^-'‹rP'9Q/P
P Dữ liệu lớn: Cách thức khai thác cơ hội từ dữ liệu?, 0•#‡
0H‹•$+/C*<L: NK)'4< $b
*J)LŽQ A8P'9QP…A
<VsuuV8 P8pP8PKu8yV-u<xx8pux5xxuP<p
QVO)72-AI(A:
P …P’Pˆ+5/CModeling and Analysis in Marine Big Data: Advances
and ChallengesC‘<VsuuyyyPyP(-u™( 7Vu-<8u5uu—
P ’78 +/CAmazon and Big Data
<Vsuu7PFVP8u<7p( -uVF-VV(u-†(xxFxu—
P *-2•+/CNghiên cứu một số vấn ề về Big Data và ứng dụng
trong phân tích kinh doanh,*J9;2;K) M;P
P Các ứng dụng của Data Science trong ngành Marketing,
<Vsuu-8PuuuuxxxxxV88x (x
 - A8u
5P 0•#‡0H‹•$+/PDữ liệu lớn: Cách
thức khai thác cơ hội từ dữ liệu? Trường hợp Amazon. *<L: N
K)'4< $b*J)LŽQ A8P'9Q
P ’78 +/PAmazon and Big Data
<Vsuu7PFVP8u<7p( -uVF-VV(u-†(xxFxu
P €(FK#™AC5 Advanced Data Analysis Techniques Applied to People
Analytics,‘<VsuuyyyP P(-uF7(uK8xx7VVx
8?8V <<78x(x<8(<78x7Vu
lOMoARcPSD|27790909

P w88 (V7+/CTopic Modeling: An Introduction,
<<Vsuu-(A878 P(-uF7(u ((x(x(<x-(87u

Preview text:

ĐẠ

I H

C QU

C GIA THÀNH PH

H

CHÍ MINH

TRƯỜNG ĐẠ

I H

C KINH T

- LU

T

KHOA QU

N TR

KINH DOANH

NGHIÊN C

U MARKETING

Đề

tài:

S

TR

I D

Y C

A BIG DATA TRONG NGHIÊN C

U

MARKETING

GVHD: ThS. VÕ TH

NG

C TRINH

Thành ph

H

Chí Minh, tháng 11

năm

2021

MỤC LỤC

CHƯƠNG 1: SƠ LƯỢC VỀ BIG DATA 2

1.1. Khái niệm 2

1.2. Phân loại 3

1.3. Các giả ịnh của Big Data 4

1.4. Thách thức khi sử dụng Big Data 6

CHƯƠNG 2: BIG DATA TRONG NGHIÊN CỨU MARKETING 8

2.1. Khái niệm nghiên cứu Marketing 8

2.2. Nghiên cứu Marketing truyền thống và Nghiên cứu Marketing sử dụng Big Data 8

2.3. Mô hình trích xuất thông tin từ Big Data cho nghiên cứu marketing 9

2.3.1. Thu thập và lưu trữ dữ liệu 10

2.3.2. Xử lý làm sạch dữ liệu 10

2.3.3. Tổng hợp, ối chiếu dữ liệu 11

2.3.4. Mô hình hóa và phân tích dữ liệu 11

2.3.5. Trình bày, diễn giải dữ liệu 12

2.4. Phân tích Big Data và mô hình 5Ps 12

2.4.1. Phân tích kết hợp (Association analysis) 13

2.4.2. Phân tích gộp nhóm (Clustering analysis) 14

2.4.3. Phương pháp phân loại (Classification analysis) 14

2.4.4. Mô hình chủ ề (Topic modelling) 14

2.4.5. Lọc tương tác (Collaborative filtering) 15

2.4.6. Phân tích hồi quy (regression analysis) 15

CHƯƠNG 3: ỨNG DỤNG CỦA BIG DATA TRONG NGHIÊN CỨU

MARKETING CỦA AMAZON 17

3.1. Hệ thống giới thiệu cá nhân 17

3.1.1. Nguồn thông tin cần thu thập 17

3.1.2. Cách xử lý nguồn thông tin 17

3.1.3. Vận dụng những thông tin ã xử lý 18

3.2. Mô hình giao hàng dự oán 19

3.2.1. Nguồn thông tin cần thu thập 19

3.2.2. Cách xử lý nguồn thông tin 19

3.2.3. Vận dụng những thông tin ã xử lý 19

3.3. Tối ưu giá 19

3.3.1. Nguồn thông tin cần thu thập 19

3.3.2. Cách xử lý nguồn thông tin 20

3.3.3. Vận dụng những thông tin ã xử lý 20

3.4. Dịch vụ khách hàng Alexa 20

3.4.1. Nguồn thông tin cần thu thập 20

3.4.2. Cách xử lý nguồn thông tin 21

3.4.3. Vận dụng những thông tin ã xử lý 21

CHƯƠNG 4: NHỮNG CƠ HỘI VIỆC LÀM MỞ RA ĐỐI VỚI MẢNG DATA LĨNH VỰC MARKETING 23

4.1. Marketing Insight and Analysis. (1000 - 3000 USD) 23

4.2. Chuyên viên phân tích chỉ số Marketing (1000 - 2500 USD) 23

4.3 Social Data Analysis (700 - 2000 USD) 23

KẾT LUẬN 25

TÀI LIỆU THAM KHẢO 26

DANH MỤC BẢNG

Bảng 1.1. So sánh Dữ liệu cấu trúc và Dữ liệu phi cấu trúc................................................ 4

Bảng 2.1. So sánh nguyên cứu Marketing truyền thống và nghiên cứu Marketing sử dụng

Big Data ................................................................................................................................ 9

Bảng 2.2. 5Ps and Big Data Analytics ............................................................................... 12

Bảng 3.1. Tóm tắt các ứng dụng Big Data trong nghiên cứu Marketing của Amazon ...... 21

DANH MỤC HÌNH

Hình 2.1. Process for Extracting Insights From Big Data ................................................. 10

DANH SÁCH THÀNH VIÊN

STT

Họ tên

MSSV

Nhiệm vụ cụ thể

Mức ộ hoàn thành

1

Phan Văn Đức

K194070896

Nội dung + Thuyết trình

100%

2

Dương Thị Hoàng Hạ

(Nhóm trưởng)

K194070898

Nội dung + Thuyết trình

100%

3

Nguyễn Thị Hồng Huệ

K194070904

Nội dung + Thuyết trình

100%

4

Võ Hoàng Nhật Vy

K194070957

Nội dung + Slide

100%

LỜI MỞ ĐẦU

Cuộc Cách mạng công nghiệp lần thứ tư ã i qua ược một thập kỷ, tuy còn những bất cập mà chúng ta chưa giải quyết ược nhưng tầm quan trọng và lợi ích mà nó mang lại là iều không thể chối cãi. Mặc dù không phải là một khái niệm mới nhưng ến giai oạn này, thế giới mới thực sự chứng kiến sự bùng nổ của kỷ nguyên Big data. Big Data thể hiện vai trò của mình trong mọi lĩnh vực từ y tế, viễn thông, sản xuất, hàng không, tài chính, ngân hàng, iện tử, giải trí, ... Có thể thấy, dữ liệu là vũ khí hết sức quan trọng, ai nắm ược thông tin, người ó sẽ vượt lên dẫn ầu và bỏ xa những ối thủ còn lại.

Thật vậy, trong thế giới phẳng như hiện nay, việc nắm bắt tâm lý và hành vi của khách hàng cũng ngày càng khó khăn hơn. Doanh nghiệp muốn bắt kịp xu hướng chung và phát triển bền vững cần tập trung vào chuyển ổi số, ầu tư vào công nghệ, ặc biệt là trong lĩnh vực Marketing. Nhằm thấu hiểu khách hàng, tạo ra trải nghiệm mua hàng tốt nhất. Kết hợp với Big Data, doanh nghiệp sẽ nắm ược nhiều thông tin hơn, thấu hiểu khách hàng hơn, từ ó gia tăng trải nghiệm khách hàng và giúp doanh nghiệp nắm ược lợi thế cạnh tranh so với các ối thủ. Đó cũng chính là lý do nhóm chúng em chọn ề tài “Sự bùng nổ của Big data trong Nghiên cứu Marketing” ể tiến hành tìm hiểu và nghiên cứu.

Chúng em xin cảm ơn Cô Võ Thị Ngọc Trinh ã cho nhóm những kiến thức bổ ích cũng như cơ hội ể tiến hành ề tài này.

Với thời gian và năng lực còn hạn chế sẽ không thể tránh những sai sót. Chúng em rất mong cô thông cảm và ược nhận những nhận xét, góp ý từ cô.

Một lần nữa chúng em chân thành cảm ơn.

CHƯƠNG 1: SƠ LƯỢC VỀ BIG DATA

1.1. Khái niệm

Big Data ược xem là xu hướng công nghệ xuất hiện trong thời ại Cách mạng công nghiệp 4.0 và hứa hẹn là lời giải cho rất nhiều bài toán kinh doanh hóc búa không chỉ ối với các doanh nghiệp trên thế giới mà còn cả với các doanh nghiệp Việt Nam trong bối cảnh hội nhập sâu và rộng vào nền kinh tế quốc tế. Các tổ chức hàng ầu ang chuyển ổi tư duy của họ về dữ liệu, từ việc coi dữ liệu như một chi phí hoạt ộng cần ược giảm thiểu sang nuôi dưỡng dữ liệu như một tài sản chiến lược cần ược mua lại, làm sạch, ược chuyển ổi, làm giàu và phân tích ể mang lại thông tin chi tiết hữu ích.

Vậy, Dữ liệu lớn (Big data) là một thuật ngữ về việc xử lý một tập dữ liệu rất lớn và phức tạp khác với cách truyền thống. Dữ liệu này bao gồm các hoạt ộng khác nhau như: thu thập, tìm kiếm, giám sát, dự báo, phân tích hành vi người dùng, hoặc một số phương pháp phân tích dữ liệu tiên tiến khác nhằm trích xuất những giá trị từ dữ liệu mà ít khi ề cập ến kích thước dữ liệu này. Cụ thể, nó có thể truy vấn những tập tin phi cấu trúc (unstructured files) như video kỹ thuật số, hình ảnh, dữ liệu cảm biến, tập tin lưu nhật ký, thực sự bất cứ dữ liệu nào không có trong hồ sơ với các phạm vi tìm kiếm khác.

Năm 2014, Gartner ưa ra một khái niệm mới về Big Data với mô hình “5Vs” tương ứng với năm tính chất quan trọng, như sau:

Volume: là sự tăng trưởng về mặt khối lượng. Dữ liệu trong các hệ thống thông tin luôn luôn và không ngừng tăng lên về mặt kích thước (khối lượng). Chúng ta có thể tìm thấy dữ liệu trong các ịnh dạng video, music, image lớn trên các kênh truyền thông xã hội. Khối lượng dữ liệu của một hệ thống thông tin có thể lên ến hàng Terabyte và Petabyte. Theo tài liệu của Intel hồi tháng 9/2013, cứ mỗi 11 giây, 1 PB1 dữ liệu ược tạo ra trên toàn thế giới, tương ương với một oạn video HD dài 13 năm. Facebook phải xử lý khoảng 500 TB2 dữ liệu mỗi ngày.

Velocity: là sự tăng trưởng về mặt tốc ộ xử lý. Bên cạnh sự tăng trưởng về khối lượng, tốc ộ tăng trưởng của dữ liệu cũng tăng lên một cách chóng mặt. Các ứng dụng ược sử dụng phổ biến trên các lĩnh vực Internet, tài chính, ngân hàng, hàng không, quân sự, y tế - sức khỏe ngày nay phần lớn ều ược xử lý trong thời gian thực thông qua hệ thống Big Data. Đơn cử, trên các mạng xã hội, ôi khi các thông báo cách ó vài giây (tweet, status….) ã là cũ và không ược người dùng quan tâm. Người dùng thường loại bỏ các tin nhắn cũ và chỉ chú ý ến các cập nhật gần nhất. Sự chuyển ộng của dữ liệu giờ ây hầu như là tức thời (real time), và tốc ộ cập nhật thông tin ã giảm xuống ơn vị hàng mili giây.

Variety: là sự tăng lên về tính a dạng của dữ liệu. Dữ liệu không chỉ ở dạng có cấu trúc, mà còn bao gồm rất nhiều kiểu dữ liệu phi cấu trúc nữa (như video, hình ảnh, dữ liệu cảm biến, giọng nói, blog, ...). Big Data cho phép chúng ta phân tích và liên kết a dạng các chủng loại dữ liệu với nhau ví dụ như các bình luận, bài ăng của một nhóm người dùng nào ó trên Facebook với thông tin các video ã ược chia sẻ từ các kênh xã hội khác nhau như YouTube, Twitter.

Veracity: là tính xác thực của dữ liệu. Với xu hướng “Social” ngày nay và sự gia tăng mạnh mẽ tính tương tác và chia sẻ của người dùng di ộng ã làm cho khả năng xác ịnh về ộ tin cậy và tính chính xác của dữ liệu ngày một khó khăn hơn. Bài toán phân tích và loại bỏ dữ liệu thiếu chính xác và gây nhiễu ang là một trong những tính chất quan trọng của Big data.

Value: Giá trị thông tin mang tính chất quan trọng nhất của xu hướng công nghệ Big Data. Thật vậy, doanh nghiệp phải hoạch ịnh ược những giá trị thông tin hữu ích của Big Data một cách phù hợp nhằm giải quyết cho những vấn ề, bài toán mà doanh nghiệp ang gặp phải hoặc mô hình hoạt ộng kinh doanh của mình. Có thể nói việc ầu tiên các doanh nghiệp cần làm trước khi bắt tay vào thực hiện Big Data là phải làm sao xác ịnh ược tính chất “Value” của nó.

1.2. Phân loại

Dữ liệu ến từ nhiều nguồn và thuộc các ịnh dạng khác nhau nên chúng rất a dạng. Chính vì vậy, việc phân loại dữ liệu cũng có nhiều cách. Và một trong những cách cơ bản nhất và thể hiện ược sự khác biệt giữa các loại dữ liệu là phân loại dựa vào cấu trúc của chúng: Dữ liệu có cấu trúc và Dữ liệu phi cấu trúc.

Dữ liệu có cấu trúc là những thông tin ược thể hiện trong các cột và hàng có tiêu ề, có thể dễ dàng ặt hàng và xử lý bằng các công cụ tìm kiếm dữ liệu. Chúng ta có thể xem chúng như một tủ hồ sơ ược tổ chức hoàn hảo, các dữ liệu ược xác ịnh, dán nhãn và dễ dàng truy cập.

Dữ liệu phi cấu trúc là những thông tin không ược tổ chức thông qua các mô hình hoặc lược ồ dữ liệu ược xác ịnh trước.

Bảng 1.1. So sánh Dữ liệu cấu trúc và Dữ liệu phi cấu trúc

Dữ liệu có cấu trúc

Dữ liệu phi cấu trúc

Ví dụ

  • Ngày tháng
  • SĐT, Số thẻ tín dụng
  • Tên khách hàng, ịa chỉ
  • Tên sản phẩm, số lượng
  • Các thông tin giao dịch
  • Các file văn bản (text), file PDF
  • Báo cáo
  • Tin nhắn, Email
  • File Audio, Video, ảnh
  • Các nội dung truyền thông trên mạng xã hội

Đặc trưng

- Mô hình dữ liệu ược xác ịnh trước (thường chỉ có dạng văn bản) - Dễ tìm kiếm

  • Không có mô hình dữ liệu ược xác ịnh trước
  • Có thể là dạng văn bản, hình ảnh, video, âm thanh hoặc ịnh dạng khác
  • Khó tìm kiếm

Ứng dụng chính

  • Kiểm soát hàng tồn kho
  • Hệ thống CRM, ERP
  • Hệ thống ặt vé máy bay
  • Xử lý văn bản
  • Phần mềm trình chiếu
  • Email
  • Các công cụ hiển thị và chỉnh sửa truyền thông

Được tạo bởi

Con người và máy móc

Con người và máy móc

(Nguồn: Internet)

1.3. Các giả ịnh của Big Data

N = All

Nếu thu thập thông tin dựa trên mẫu nhỏ, thậm chí những kết quả ược thu thập “một cách khoa học” thì thông tin ó cũng không áng tin cậy (phương sai cao trên các mẫu lặp lại), không mang tính ại diện và không ủ sức mạnh về mặt thống kê (tức là, các suy luận hợp lý bị hạn chế). Một số nhà nghiên cứu cho rằng Big Data có thể khắc phục những hạn chế này và sẵn sàng cung cấp các bài kiểm tra về các thông số dân số vì nó tương ối rẻ, tương ối ại diện, ược bổ sung liên tục và dễ dàng sao chép. Tuy nhiên, một lưu ý quan trọng liên quan ến giả ịnh này: Big Data loại trừ những người không sử dụng internet hoặc công nghệ xử lý thông tin kỹ thuật số. Việc tham gia vào nền tảng trực tuyến, cho dù thương mại hay không, thì cũng có sự khác biệt áng kể theo vị trí ịa lý, tuổi tác, giới tính, chủng tộc và các yếu tố xã hội học khác

(www.statista.com).

Today = Tomorrow

Bởi vì nó di ộng và có mặt khắp nơi, cuộc sống kỹ thuật số năng ộng hơn nhiều so với cuộc sống thực. Người tiêu dùng liên tục chuyển ổi, thử và từ bỏ sự hiện diện kỹ thuật số của họ. Các dấu vết của hành vi ó có thể trở thành ối tượng của cuộc iều tra. Ban ầu, Facebook giới hạn thành viên cho người dùng trong ngành giáo dục; do ó, chỉ cần ăng ký một tài khoản email edu. Khi Facebook mở rộng, nó ã ược mở cho cả những người dùng phi giáo dục.

Online behavior = Offline behavior

Người tiêu dùng có thể hiện các mô hình hành vi giống nhau cả trên trực tuyến và ngoại tuyến không? Điều này rất phức tạp và các nhà tiếp thị phải tìm hiểu cách người tiêu dùng biểu hiện trong cả hai mô hình hành vi mua hàng ối với các sản phẩm cụ thể.

Behavior of all today = Behavior of all tomorrow

Giả ịnh này tổng hợp ba giả ịnh nói trên. Big Data là sự phản ánh số hóa không hoàn hảo về cuộc sống trực tuyến và ngoại tuyến của con người. Các mô hình mô tả hành vi của người tiêu dùng ang thay ổi ể giải thích cho ảnh hưởng của công nghệ và

internet.

Những giả ịnh này giúp kiểm soát những thông tin có ược từ việc phân tích Big

Data. Nhiều nhà tiếp thị tin rằng tất cả người tiêu dùng của họ ều có mặt trực tuyến và sẽ cư xử giống nhau cho dù trực tuyến hay ngoại tuyến. Tuy nhiên, việc không ặt câu hỏi hoặc không quan tâm các giả ịnh nói trên có thể cản trở khả năng tồn tại của các phân tích Big Data ối với doanh nghiệp.

1.4. Thách thức khi sử dụng Big Data

Big Data là bước ngoặt ánh dấu sự phát triển của Cách mạng Công nghiệp 4.0, việc ứng dụng công nghệ này mang lại tiềm năng phát triển tuyệt vời cho doanh nghiệp. Tuy nhiên việc ứng dụng Big Data một cách hiệu quả thì không phải là iều dễ dàng và còn rất nhiều thách thức mà các doanh nghiệp cần phải ối mặt.

Sự a dạng thông tin: Trước khi tiến hành phân tích dữ liệu, doanh nghiệp cần ảm bảo nguồn dữ liệu là chính xác và có ịnh dạng phù hợp cho việc phân tích. Trên thực tế thì sự tồn tại của một dữ liệu ồng nhất và có cấu trúc tốt với cùng kích thước và cấu trúc là rất cần thiết. Chính vì vậy, việc làm sạch và xử lý các lỗi từ các nguồn dữ liệu không ầy ủ hay các dữ liệu gây nhiễu là tối quan trọng và không thể thiếu. Tuy nhiên, iều ó òi hỏi doanh nghiệp cần ầu tư một khoản chi phí (thời gian, ngân sách) lớn ể có ược kết quả mang giá trị cao.

Quy mô: Thực tế cho thấy rằng khối lượng dữ liệu ang gia tăng khá lớn và gần như ã vượt qua khả năng sức mạnh xử lý và lưu trữ của máy tính. Bên cạnh ó, việc truyền dữ liệu lớn thường phải gánh chịu chi phí cao. Đây là “nút cổ chai” của việc tính

toán Big Data.

Yếu tố thời gian: Khi số lượng dữ liệu tăng nhanh chóng, các kết quả phân tích thì cần phải ược ưa ra một cách tức thì nghĩa là trong thời gian thực nên cần phải có sự phát triển các quy trình xử lý dựa vào sự gia tăng của các cấu trúc dữ liệu nhằm ạt ược mục ích cuối cùng ó là áp ứng yêu cầu truy cập thông tin một cách tức thì của người sử dụng.

Tính cá nhân và Bảo mật dữ liệu: Các yếu tố luật pháp liên quan ến các hạn chế về quyền cá nhân hiện ang trở thành một mối e dọa vì nó có thể hạn chế các ích lợi tiềm năng. Chính vì lý do ó mà các chính sách an ninh mạng hay cụ thể là an ninh thông tin chia sẻ các dữ liệu liên quan ến người dùng cá nhân cần phải ược xem xét một cách thận trọng và nghiêm túc. Bên cạnh ó, một số ví dụ trong thực tế cho thấy, không chỉ thông tin cá nhân người tiêu dùng, thông tin mật của các tổ chức mà ngay cả bí mật an ninh quốc gia cũng có thể bị xâm phạm. Do ó, giải quyết các vấn ề an ninh dữ liệu bằng các công cụ kỹ thuật và các chính sách trở nên vô cùng cấp bách.

Thiếu chuyên gia công nghệ: Dù là thời ại công nghệ 4.0, hoạt ộng bằng máy móc chiếm ưu thế, nhưng nếu không có con người vận hành, quản lý thì dù máy móc có hiện ại ến âu cũng khó có thể mang ến hiệu quả tốt nhất. Công nghệ Big Data cũng vậy. Các ánh giá của chuyên gia là hết sức cần thiết ể có thể hiểu các nguồn dữ liệu và ể khai thác một cách tối ưu các tiềm năng của nó òi hỏi sự phối hợp nhịp nhàng và nhuần nhuyễn giữa máy móc và con người.

Đòi hỏi thay ổi văn hóa doanh nghiệp: Văn hóa doanh nghiệp ược xây dựng và phát triển không phải chỉ trong ngày một ngày hai. Chính vì vậy, ể một doanh nghiệp thay ổi văn hóa làm việc của mình, ặc biệt là từ truyền thống sang hiện ại, không phải là iều ơn giản. Theo khảo sát của New Vantage, chỉ có 32.4% doanh nghiệp thành công trong việc thay ổi văn hóa doanh nghiệp theo hướng hiện ại mới.

CHƯƠNG 2: BIG DATA TRONG NGHIÊN CỨU MARKETING

2.1. Khái niệm nghiên cứu Marketing

Theo Philip Kotler (2003) “Nghiên cứu marketing là xác ịnh một cách có hệ thống những tư liệu cần thiết do tình huống marketing ặt ra cho một công ty, thu thập, phân tích chúng và báo cáo kết quả”.

Theo Hiệp hội Marketing Mỹ (AMA): Nghiên cứu marketing là quá trình thu thập và phân tích có hệ thống những dữ liệu về các vấn ề liên quan ến các hoạt ộng marketing của doanh nghiệp.

Tư tưởng chủ ạo của Marketing là “Mọi quyết ịnh kinh doanh ều xuất phát từ thị trường”. Muốn thực hiện ược tư tưởng chủ ạo này thì phải có ầy ủ thông tin về thị trường, về môi trường kinh doanh. Căn cứ vào các thông tin thu ược qua nghiên cứu Marketing, các nhà quản lý sẽ vạch ra chiến lược, chính sách kinh doanh phù hợp nhắm vào thị trường mục tiêu.

2.2. Nghiên cứu Marketing truyền thống và Nghiên cứu Marketing sử dụng Big Data

Nhìn chung mục ích của nghiên cứu marketing là ể chuyển ổi dữ liệu thu thập ược thành thông tin có giá trị và hiểu biết hữu ích cho việc ra quyết ịnh. Mặc dù khái niệm và mục tiêu của nghiên cứu marketing vẫn không thay ổi trong bối cảnh Big Data, nhưng với lợi ích ngày càng lớn của việc phân tích big data như hiện nay thì òi hỏi cần có một quan iểm nghiên cứu marketing rộng hơn.

Nhóm chúng tôi ưa ra một số iểm khác biệt giữa nghiên cứu Marketing truyền thống và nghiên cứu Marketing sử dụng Big Data, các tiêu chí so sánh chủ yếu là về thu thập và phân tích dữ liệu. Nghiên cứu Marketing truyền thống theo nhóm là nghiên cứu thường dựa trên sự giả ịnh dữ liệu ngẫu nhiên và sử dụng các phương pháp thống kê truyền thống, còn Nghiên cứu Marketing sử dụng Big Data giả ịnh dữ liệu có ộ phức tạp cao và sử dụng thêm các phương pháp thống kê nâng cao bên cạnh các phương pháp thống kê truyền thống ã ược cải tiến. Đặc biệt, trong quá khứ chưa có sự bùng nổ của tiến bộ khoa học kỹ thuật như hiện nay.

Bảng 2.1. So sánh nguyên cứu Marketing truyền thống và nghiên cứu Marketing sử

dụng Big Data

Tiêu chí

Nghiên cứu Marketing truyền thống

Nghiên cứu Marketing sử dụng Big Data

Khối lượng dữ liệu

Chỉ thu ược dữ liệu hạn chế mô tả theo khoảng thời gian nhất ịnh.

Thu thập ược lượng dữ liệu khổng lồ mô tả theo thời gian thực phong phú hơn.

Nguồn dữ

liệu

Chủ yếu là khảo sát trực tiếp khách hàng qua phỏng vấn, bảng câu hỏi… và các trang cung cấp dữ liệu thứ cấp.

Từ các thiết bị lưu trữ dữ liệu người dùng như iện thoại thông minh, phương tiện truyền thông xã hội, các thiết bị cảm biến,…

Lưu trữ và quản lý dữ liệu

Thiết bị lưu trữ, quản lý có dung lượng lưu nhỏ.

Công nghệ iện toán ám mây cung cấp kỹ thuật lưu trữ, quản lý với lưu lượng lớn và hiệu quả. Một số nền tảng lưu trữ ám mây hiện nay gồm: Google Store, Amazon, Microsoft Azure, IBM Blue Cloud.

Phương pháp phân tích dữ liệu

Phương pháp phân tích dữ liệu truyền thống bắt nguồn từ thống kê và khoa học máy tính như phân tích cụm, phân tích nhân tố, phân tích tương quan, phân tích hồi quy…

Phương pháp phân tích big data là các mô hình thuật toán cũng dựa trên thống kê và khoa học máy tính hiện ại hơn cho phép trích xuất thông tin và tạo ra các mô hình dự oán hiệu quả cao. ví dụ như mô hình thuật toán MapReduce do Google ề xuất, kỹ thuật phân tích và giải mã NLP…

(Nguồn: Nhóm tự tổng hợp)

Thực tế hiện nay chưa có nhiều phương pháp phân tích dữ liệu big data ược phát triển vì khối lượng và tốc ộ của nó quá lớn. Tuy nhiên trong thời ại công nghiệp 4.0 như hiện nay, việc doanh nghiệp biết cách phân tích dữ liệu big data sẽ là một lợi thế rất lớn.

2.3. Mô hình trích xuất thông tin từ Big Data cho nghiên cứu marketing

Điều thực sự mang lại giá trị cho việc sử dụng big data là phân tích dữ liệu. Nếu không có phân tích, big data chỉ là một tập dữ liệu với việc sử dụng hạn chế.

Khi mà sự xuất hiện của big data ang dần ịnh hình lại quá trình nghiên cứu marketing. Mô hình dưới ây trình bày năm giai oạn chính của nghiên cứu marketing sử dụng big data. Trong ó, năm giai oạn này ược nhóm thành quản lý dữ liệu (data management) phân tích (analytics). Quản lý dữ liệu là những quy trình và công nghệ hỗ trợ ược thiết kế và sử dụng ể thu thập, lưu trữ và trích xuất dữ liệu cho việc phân tích ở giai oạn sau. Còn Phân tích là tập hợp các kỹ thuật ược sử dụng ể phân tích, phác họa và tạo ra những thông tin có giá trị từ nguồn dữ liệu big data.

Hình 2.1. Process for Extracting Insights From Big Data

(Nguồn: Gandomi & Haider, 2015; Japkowicz & Stefanowski, 2016; Labrinidis & Jagadish, 2012)

2.3.1. Thu thập và lưu trữ dữ liệu

Để có dữ liệu thì ầu tiên cần phải thu thập, vấn ề chính gây khó khăn cho việc thu thập dữ liệu từ big data ó là sự phân tán của dữ liệu ở nhiều nguồn khác nhau. Các công cụ thu thập dữ liệu từ thiết bị cảm biến người dùng (cảm biến là sự o lường và biến ổi ại lượng vật lý thành tín hiệu số có thể ọc ược, dữ liệu cảm biến có thể là sóng âm thanh, giọng nói, rung ộng…), thiết bị có ịnh vị vị trí, các phương tiện truyền thông xã hội, giao dịch tài chính, iện thoại thông minh,…

Dữ liệu sẽ ược ghi lại và lưu trữ trên nhiều thiết bị lưu trữ như kho dữ liệu truyền thống, data lakes hay iện toán ám mây.

Dữ liệu ược thu thập và lưu trữ ở giai oạn này là dữ liệu thô, chưa có giá trị sử dụng cao.

2.3.2. Xử lý làm sạch dữ liệu

Thông thường dữ liệu từ các nguồn công khai thường không ầy ủ, không có cấu trúc nhất quán (dữ liệu ở nhiều kiểu khác nhau như: văn bản, âm thanh, video…), bị lỗi ịnh dạng hay ơn giản là sai. Ví dụ, những người tham gia khảo sát có thể trả lời sai hay dữ liệu thu ược từ các thiết bị theo dõi trên iện thoại thông minh (các app ược hỗ trợ GPS) có thể sai do thiết bị ó bị hỏng…. Để biến những dữ liệu thô này thành dữ liệu có giá trị chúng ta cần tiến hành xử lý dữ liệu.

Xử lý dữ liệu là quá trình xác ịnh và sửa lỗi dữ liệu ể ảm bảo chất lượng của dữ liệu bằng các thuật toán. Ví dụ khi xác ịnh ược với dữ liệu bị lỗi ịnh dạng thì tiến hành thay ổi về ịnh dạng phù hợp, hay tiến hành xóa bỏ những dữ liệu bị sai.

Đây là bước quan trọng cần thiết ể ảm bảo các tệp dữ liệu áp ứng các tiêu chuẩn về chất lượng và có giá trị sử dụng.

2.3.3. Tổng hợp, ối chiếu dữ liệu

Để tiến hành phân tích dữ liệu cần hợp nhất các tệp dữ liệu không ồng nhất với kích thước a dạng ở bước trên thành một tập dữ liệu tích hợp phù hợp với nhu cầu nghiên cứu.. Sau ó, tiến hành ối chiếu dữ liệu, tìm những dữ liệu giống nhau, bị trùng lặp ể loại bỏ. Sự trùng lặp dữ liệu là rất phổ biến trong các tệp dữ liệu từ các nguồn khác nhau, việc loại bỏ những dữ liệu bị lặp nhằm tránh lãng phí không gian lưu trữ cũng như ể có cơ sở phân tích chính xác. Ví dụ như một công ty thẻ tín dụng và một nhà bán lẻ có thể ghi lại các giao dịch giống nhau của một khách hàng.

2.3.4. Mô hình hóa và phân tích dữ liệu

Có rất nhiều loại phân tích ược sử dụng ể tìm ra các mẫu thông tin có ý nghĩa trong nguồn dữ liệu big data. Phân tích văn bản có thể chuyển ổi văn bản như các tweet ánh giá thương hiệu của người tiêu dùng thành bản tóm tắt các ý chính có ý nghĩa. Phân tích âm thanh ể trích xuất thông tin từ âm thanh không có cấu trúc, chẳng hạn như tệp âm thanh cuộc gọi phàn nàn của khách hàng. Tương tự, phân tích nội dung video ể trích xuất thông tin từ video, ví dụ như các unboxing video do người tiêu dùng tạo. Phân tích nội dung hình ảnh cho phép các nhà nghiên cứu trích xuất những dữ liệu từ những từ ược in trong một bức ảnh của người tiêu dùng, chẳng hạn trên Twitter bị giới hạn 5000 ký tự nên người tiêu dùng thường chuyển dữ liệu văn bản vào ảnh. Phương tiện truyền thông xã hội và phân tích mạng ể khám phá nội dung mà người tiêu dùng tạo trên các nền tảng truyền thông xã hội và chuyển các nội dung ó thành âm thanh, video hay các

phân tích khác.

Sau khi phân tích các kiểu dữ liệu trên thì nhà nghiên cứu ã có thể xây dựng một mô hình về hành vi, thái ộ và tình cảm của khách hàng.

2.3.5. Trình bày, diễn giải dữ liệu

Những nhà nghiên cứu marketing phải có khả năng hiểu và diễn giải kết quả từ bước phân tích và mô hình hóa dữ liệu. Cụ thể là phải biết cách trình bày, truyền ạt kết quả nghiên cứu cho những người ra quyết ịnh ể họ nắm vững tình huống và ưa ra quyết ịnh phù hợp, ít rủi ro nhất.

2.4. Phân tích Big Data và mô hình 5Ps

Dựa vào lượng thông tin có ược sau khi phân tích Big Data, doanh nghiệp có thể xây dựng ược mô hình 5Ps như bảng dưới (theo Fan, Leu & Zheo, 2015).

Bảng 2.2. 5Ps and Big Data Analytics

Phân tích Big

Data

People

Product

Promotion

Price

Place

Nguồn

thông tin thu thập

-Nhân khẩu -Xã hội

-Review của

khách hàng

-Dữ liệu khảo sát

-Đặc iểm

-Phân loại

-Review của

khách hàng

-Khảo sát

  • Dữ liệu tiếp thị
  • Dữ liệu khảo sát
  • Dữ liệu giao dịch
  • Dữ liệu khảo sát

- Các nền tảng kết nối mạng xã

hội

-Dữ liệu khảo sát

Phương pháp phân tích

-Sử dụng phương pháp phân loại

(classification)

-Phân tích gộp nhóm

  • Phân tích gộp

nhóm

  • Mô hình chủ ề (topic

modelling)

  • Phân tích kết hợp
  • Phân tích hồi quy
  • Lọc tương tác
  • Phân tích kết hợp

- Phân tích kết hợp - Phân tích hồi quy

- Phân tích hồi

quy -Sử dụng phương pháp phân loại

Ứng dụng

-Phân khúc khách hàng

-Phân tích dự oán hành vi của khách hàng

-Gợi ý sản phẩm

- Đo lường sự phổ biến biến của của sản

  • Hệ thống gợi ý
  • Phân tích hiệu quả tiếp thị
  • Chiến lược về giá
  • Phân tích ối thủ cạnh tranh

-Tìm các nền tảng chạy marketing hiệu quả

-Phân tích dự

oán ưu tiên

khách hàng tiềm năng

phẩm

- Phân tích dự oán ể cung

cấp sản phẩm phù hợp cho từng thị trường

- Phân tích ộng cơ cộng ồng

(Nguồn: Fan, Leu & Zheo, 2015)

Theo ó, dựa trên những thông tin cần cho mỗi chiếc lược P khác nhau cùng với việc ứng dụng các thuật toán thống kê và khoa học máy tính ã cho ra các dự oán về tương lai với xác suất cao. Đặc biệt, phân tích dự oán dựa trên dữ liệu ang ược áp dụng rộng rãi trong nghiên cứu Marketing. Trong ó, có các dạng phân tích phổ biến sau. Phân tích dự oán hành vi khách hàng. Đưa ra các mô hình tương quan trong hành vi của khách hàng, từ ó dự oán xu hướng mua hàng trong tương lai.

Phân tích dự oán ưu tiên khách hàng tiềm năng. Ở ây, các thông iệp truyền thông sẽ ược tối ưu hóa cho từng nhóm khách hàng tiềm năng, và ưa ra call-to-action chính xác cho họ.

Phân tích dự oán ể cung cấp sản phẩm phù hợp cho từng thị trường. Trong trường hợp này, trực quan hóa dữ liệu giúp nhóm tiếp thị ưa ra quyết ịnh úng ắn về sản phẩm hoặc dịch vụ nào nên ược phân phối ra thị trường.

Phân tích dự oán ể nhắm mục tiêu khách hàng. Các mô hình ược sử dụng ể xác ịnh nhóm khách hàng nào có giá trị cao nhất, từ ó cung cấp cho họ những ưu ãi phù hợp trước thời iểm họ ra quyết ịnh mua hàng.

2.4.1. Phân tích kết hợp (Association analysis)

Phân tích kết hợp là một kỹ thuật cho phép tìm thấy các mẫu trong bộ sưu tập dữ liệu lớn. Phân tích kết hợp giúp tạo ra các thông tin có giá trị bằng cách khám phá các mối quan hệ có liên quan giữa các biến khác nhau trong cơ sở dữ liệu quy mô lớn. Việc giải thích các mối quan hệ giữa các mẫu không dễ dàng vì số lượng mẫu thường rất lớn hoặc các mối quan hệ khi tìm ra thường vô nghĩa. Tuy nhiên phương pháp phân tích này giúp giảm thiểu yếu tố “nhiễu” dữ liệu nhiều nhất có thể.

Các chuỗi cửa hàng bán lẻ và siêu thị thường sử dụng phân tích kết hợp ể tạo hồ sơ về hành vi mua sắm chung của khách hàng. Dựa trên ó, người quản lý cửa hàng có thể ề ra các chiến lược sắp xếp các sản phẩm theo trình tự cụ thể nhằm tăng trưởng doanh số.

2.4.2. Phân tích gộp nhóm (Clustering analysis)

Phân tích gộp nhóm hay phân tích cụm là một kỹ thuật ể mô tả dữ liệu và tìm ra các mẫu chung. Qua ó, tập dữ liệu sẽ ược phân thành nhiều nhóm khác nhau, trong mỗi nhóm thì các iểm dữ liệu hay các quan sát sẽ giống nhau, và giữa các nhóm thì có sự khác biệt.

Kỹ thuật phân cụm ược ứng dụng rất nhiều trong tiếp thị nơi mà kỹ thuật này ược sử dụng ể khám phá các nhóm khách hàng có nhu cầu tương tự, ể từ ó xây dựng các chiến lược tiếp thị cho sản phẩm hoặc dịch vụ nhắm vào nhóm khách hàng mục tiêu hiệu quả.

2.4.3. Phương pháp phân loại (Classification analysis)

Phương pháp phân loại là một trong những phương pháp khoa học dữ liệu ược áp dụng nhiều nhất và nổi tiếng nhất. Trong phương pháp này, chúng ta sẽ dự oán các quan sát mới (dữ liệu mới) thu thập sẽ thuộc về loại nào. Điều này ược thực hiện bằng cách phân tích các quan sát các danh mục lịch sử ã biết. Các mô hình khác nhau có thể ược sử dụng ể phân loại dữ liệu và một trong những mô hình ược biết ến nhiều nhất ó là “cây quyết ịnh” (decision tree), thường ược sử dụng với các tập dữ liệu lớn. Cây quyết ịnh là một quá trình mà nhiều câu hỏi có hoặc không ược trả lời ể xác ịnh danh mục mà dữ liệu mới sẽ thuộc về.

Phương pháp phân loại thường ược sử dụng kết hợp với phương pháp hồi quy ể cải thiện hiệu suất dự oán của mô hình thống kê.

Một ví dụ về cách phân loại ược sử dụng trong chăm sóc sức khỏe, nơi dữ liệu lịch sử của bệnh nhân ược sử dụng ể phân tích các triệu chứng nhằm xác ịnh (phân loại) tình trạng bệnh nhân mới có thể mắc phải. Điều này ã ược sử dụng ể dự oán ung thư và xác ịnh các nhóm nguy cơ cao.

2.4.4. Mô hình chủ ề (Topic modelling)

Mô hình chủ ề là mô hình ể phân tích các dữ liệu Big Data ầu vào thành các loại chủ ề khác nhau. Mô hình chủ ề gồm có mô hình có giám sát và không giám sát.

Trong mô hình chủ ề có giám sát, người dùng có thể chỉ ịnh một số ặc iểm cho trước của chủ ề ể hệ thống lọc theo những ặc iểm ó. Còn mô hình không giám sát thì các thông tin văn bản từ Big Data ược thu thập tự ộng và tự phân chia chủ ề thông minh.

Theo mặc ịnh, Mô hình chủ ề tự ộng loại bỏ các từ dừng và các từ tần số cao xuất hiện trong hầu hết các tài liệu vì chúng thường không giúp xác ịnh ranh giới giữa các chủ ề.

Như vậy, trong chiến lược Product của marketing, mô hình chủ ề ược vận dụng ể phân tích các Big Data văn bản. Từ ó có thể phân loại các sản phẩm theo những chủ ề khác nhau. Nhờ ó, doanh nghiệp có thể biết ến các loại sản phẩm mà khách hàng quan tâm ể từ ó ề ra chiến lược sản phẩm phù hợp.

2.4.5. Lọc tương tác (Collaborative filtering)

Hay còn gọi là lọc tương tác, sử dụng sự tương tác qua lại trong hành vi mua sắm giữa các khách hàng ể tìm ra sở thích của một khách hàng ối với một sản phẩm. Hầu hết các hành vi hoặc sở thích của mọi người ều có những ặc iểm chung và có thể nhóm lại thành các nhóm tương ồng. Một phụ nữ A nếu ến siêu thị mua dầu ăn thường mua thêm nước tương và nước mắm. Hành vi này lặp lại ối với 100 lượt mua sắm là 90 lần thì khả năng cao một phụ nữ B nếu mua dầu ăn cũng sẽ mua thêm nước tương và nước mắm. Từ ó sẽ khuyến nghị sản phẩm cho khách hàng dựa trên hành vi của các khách hàng khác liên quan nhất.

2.4.6. Phân tích hồi quy (regression analysis)

Phân tích hồi quy là kỹ thuật thống kê dùng ể ước lượng phương trình phù hợp nhất với các tập hợp kết quả quan sát của biến phụ thuộc và biến ộc lập.Trong marketing, phân tích hồi quy ược sử dụng rất phổ biến.

Trong chiến lược Promotion, phân tích hồi quy ược sử dụng ể nghiên cứu nhu cầu của người tiêu dùng thay ổi theo từng biến ộc lập khác nhau.

Trong chiến lược Price, người ta có thể thực hiện các công trình nghiên cứu về các yếu tố ảnh hưởng ến giá sản phẩm của họ. Khi ó giá sẽ là biến phụ thuộc và một số yếu tố như lượng hàng còn lại, nhu cầu sản phẩm, ối thủ cạnh tranh… tác ộng ến giá chính là biến ộc lập. Thông qua ó, các nhà quản trị Marketing có thể biết ược mức giá phù hợp cho sản phẩm dịch vụ của mình mà iều chỉnh ể tối ưu giá.

Trong chiến lược Place, người ta có thể tiến hành phân tích các yếu tố của một kênh bán hàng có ảnh hưởng ến sự hấp dẫn mua hàng của người tiêu dùng. Big Data cần thu thập cho các biến ộc lập có thể là cách bày trí, âm nhạc, nhân viên… Từ ó, người ta có thể thực hiện các công tác cải tiến, hoàn thiện các kênh bán hàng của mình

CHƯƠNG 3: ỨNG DỤNG CỦA BIG DATA TRONG NGHIÊN

CỨU MARKETING CỦA AMAZON

Amazon là một trong những công ty về thương mại iện tử lớn hàng ầu thế giới. Công ty ã vận dụng tối ưu nguồn tài nguyên dữ liệu khổng lồ mà mình thu thập ược ể em lại lợi thế cạnh tranh. Cụ thể, tính ến năm 2005, Amazon từng sở hữu 3 cơ sở dữ liệu Linux lớn nhất thế giới với dung lượng 7.8TB, 18.5TB và 24.7TB. Theo nghiên cứu của IDC, nhờ Big Data, năm 2013 Amazon ạt doanh thu tới 74 tỷ USD. Bằng việc sử dụng dữ liệu lớn mà Amazon ang ngày càng tiến xa hơn trên con ường thấu hiểu khách hàng và em ến trải nghiệm mua hàng tuyệt vời cho người dùng của mình. Amazon ã vận dụng công nghệ Big Data vào một số dự án nổi bật dưới ây.

3.1. Hệ thống giới thiệu cá nhân

3.1.1. Nguồn thông tin cần thu thập

Để phát triển hệ thống giới thiệu cá nhân của mình, Amazon ã thu thập các thông tin trực tiếp từ người dùng về các sản phẩm mà khách hàng ã mua, các món ược thêm vào trước ây, các danh mục mong ợi, các loại sản phẩm ang ược xem xét và ánh giá hay các sản phẩm ang ược tìm kiếm nhiều nhất.

3.1.2. Cách xử lý nguồn thông tin

Phân tích ường i (path analytics): Amazon có thể lấy dữ liệu từ quá trình di chuyển các thao tác trên trang thương mại iện tử của mình ể xác ịnh xem iểm ích về loại sản phẩm cuối cùng mà khách hàng thực sự cần làm gì. Lấy ví dụ, khi khách hàng di chuyển qua các shop bán cùng ngành hàng và thêm nhiều sản phẩm vào giỏ hàng của mình nhưng vẫn chưa thực hiện thao tác ặt hàng. Như vậy, Amazon có thể phân tích ược ích ến cuối cùng của khách hàng là những sản phẩm trong giỏ hàng. Từ ó có thể gợi ý các sản phẩm tương tự cho khách hàng.

Phân tích văn bản (text analytics): bằng việc thu thập các từ khóa tìm kiếm của khách hàng tại các thời iểm gần nhau, Amazon có thể hiểu ược nhu cầu hiện tại của khách hàng. Phân tích văn bản ở ây là việc phân tích cấu trúc từ khóa và giải mã ý nghĩa ể chuyển hóa thành các thông tin phục vụ cho việc phân tích chuyên sâu, xác ịnh ược sản phẩm mà khách hàng muốn mua. Kỹ thuật phân tích và giải mã phổ biến ược sử dụng ó là kỹ thuật NLP (Natural Language Processing). Kỹ thuật phân tích này ược chia làm 4 cấp ộ phân tích từ cơ bản ến chuyên sâu. Có thể ví dụ về một từ khóa tìm kiếm ơn giản là: “Áo sơ mi tay ngắn nữ giá rẻ”. Nếu sử dụng kỹ thuật NLP thì sẽ ược phân tích như sau:

+ Lexical analytics: là kiểm tra các thuộc tính riêng biệt của từ khóa tìm kiếm này như chủ ngữ, vị ngữ, bổ ngữ. Như vậy trong từ khóa này ta có thể phân tích ược chủ ngữ chính là “Áo sơ mi”, khuyết ộng từ và vị ngữ và có thể xem cụm từ phía sau “tay ngắn nữ giá rẻ” là bổ nghĩa cho chủ ngữ.

+ Syntactic analytics: là bước phân tích kết hợp từ ngữ với ngữ cảnh ể giải nghĩa. Trong từ khóa này thiếu nhiều thành phần của một câu và không có câu cảm thán nào nên không cần bước phân tích này.

+ Semantic analytics: phân tích các ý nghĩa có thể xảy ra, phân tích những từ tối nghĩa, phát hiện những ngụ ý sử dụng từ của người dùng ể phân tích giải nghĩa. Để ý thấy cụm từ “giá rẻ” trong từ khóa. Có thể hiểu là khách hàng sẽ ưu tiên chọn những sản phẩm ang giảm giá.

+ Discourse – level analytics: cắt nghĩa câu văn ể hiểu ược nhu cầu của người tìm kiếm. Trong cụm từ này ta có thể phân tích về loại sản phẩm mà khách hàng tìm kiếm là áo, chất liệu sơ mi, kiểu dáng tay ngắn, ối tượng sử dụng là nữ.

Cuối cùng, sau khi phân tích và giải mã các từ khóa tìm kiếm của khách hàng, Amazon có thể hiểu khách hàng ang cần gì ể từ ó ưa ra các gợi ý sản phẩm về kiểu dáng, màu sắc tương ứng. Điều này góp phần dẫn dắt khách hàng tìm ược sản phẩm phù hợp nhất với mình.

3.1.3. Vận dụng những thông tin ã xử lý

Các thông tin ược xử lý giúp cho Amazon hình dung rõ hơn chân dung khách hàng của mình. Biết ược nhu cầu thực sự của khách hàng tại một thời iểm ể cá nhân hóa trải nghiệm mua hàng của khách hàng. Mỗi khách hàng có một mong muốn khác nhau ối với sản phẩm của mình. Do ó, Amazon ã áp dụng hàng loạt công nghệ phân tích Big Data ể ưa ra những lời gợi ý sản phẩm phù hợp nhất ến người dùng. Thông qua việc tối ưu hóa trải nghiệm mua hàng này, Amazon ã “móc túi” khách hàng của mình không ít. Hệ thống giới thiệu cá nhân này ã em lại nguồn doanh thu khổng lồ cho Amazon. Nó giúp tạo ra khoảng 35% doanh thu bán hàng mỗi năm của công ty.

3.2. Mô hình giao hàng dự oán

3.2.1. Nguồn thông tin cần thu thập

Để hoàn thành mô hình này, Amazon cần phải có một Big Data về các từ khóa khách hàng tìm kiếm, sản phẩm trong giỏ hàng, các shop ã ghé qua, các ơn hàng ặt gần ây, các ơn hàng ặt vào cùng thời iểm trong quá khứ. Ngoài ra còn có các ặc iểm khác về nhân khẩu, ịa lý, chính trị của từng khu vực.

3.2.2. Cách xử lý nguồn thông tin

Phân tích dự báo (Predictive analytics): kết hợp những thông tin thu ược từ Big Data mua hàng của khách hàng trong lịch sử rồi tiến hành phân tích dự báo cho tương lai. Theo Eckerson, phân tích dữ báo kiểu Amazon trong mô hình này thuộc loại mô hình học có giám sát (giám sát dữ liệu lịch sử ể dự báo cho tương lai) và sử dụng phương pháp phân loại (classification). Bằng phương pháp này, Amazon sẽ phân chia các ối tượng khách hàng của mình theo từng khu vực ịa lý, nơi gần các kho hàng của Amazon. Sau khi phân chia như vây, Amazon tiến hành phân tích sâu nhu cầu của khách hàng và dự báo những mặt hàng nào mà khách hàng có thể mua trong khu vực ó.

3.2.3. Vận dụng những thông tin ã xử lý

Sau khi có ược dữ liệu khách hàng của các khu vực nhờ phương pháp phân tích dự báo, Amazon sẽ tiến hành nhập các mặt hàng này vào kho ể thuận tiện giao hàng cho khách hàng. Khi khách hàng trong khu vực ặt hàng, công ty sẵn sàng hàng ể giao cho khách hàng tại kho hàng của Amazon gần nhất. Bằng cách này, công ty luôn ảm bảo tối thiểu hóa thời gian giao hàng cho khách hàng. Như vậy, Amazon không những tiết kiệm ược chi phí vận chuyển mà còn tạo ược thiện cảm sâu sắc vì thời gian giao hàng siêu nhanh của mình.

3.3. Tối ưu giá

3.3.1. Nguồn thông tin cần thu thập

Để thực hiện tối ưu về giá, Amazon ã tiến hành thu thập một kho dữ liệu khổng lồ về các hoạt ộng của khách hàng trên web, chiến lược của ối thủ, sự sẵn có của sản phẩm, mức ộ ưa thích sản phẩm, lịch sử ơn hàng, lợi nhuận kỳ vọng...Các nguồn thông tin này phải luôn ược cập nhật liên tục ể Amazon tối ưu hóa giá liên tục. Thông thường giá sản phẩm ược Amazon cập nhật liên tục mỗi 10 phút vì những dữ liệu Big Data này ược cập nhật gần như là liên tục.

3.3.2. Cách xử lý nguồn thông tin

Amazon có thể thực hiện phân tích dự báo theo mô hình học không giám sát. Khác với mô hình học giám sát lấy dữ liệu quá khứ ể dự báo tương lai cùng một số ối tượng thì mô hình này không dùng những dữ liệu lịch sử mà lấy ngay những dữ liệu mới ược cập nhật. Mô hình này giúp tìm ược mối liên hệ giữa các yếu tố quan sát. Sử dụng kỹ thuật phân tích hồi quy a biến, cho Amazon biết ược mối tương quan của giá sản phẩm với các yếu tố còn lại. Ở ây, công ty có thể thực hiện một số phân tích hồi quy với biến giá là biến phụ thuộc và các biến như chiến lược ối thủ, mức ộ sẵn có của sản phẩm, mức ộ ưa thích... là những biến ộc lập. Như vậy, Amazon có thể xác ịnh ược mức giá hợp lý khi các biến ộc lập này thay ổi mỗi khi ược cập nhật.

3.3.3. Vận dụng những thông tin ã xử lý

Sau khi xác ịnh mức giá hợp lý tại một thời iểm nhờ vào các kỹ thuật dự báo, Amazon sẽ tiến hành cập nhật thường xuyên mức giá trên các trang thương mại iện tử của mình. Công ty luôn luôn phải giữ mức giá hấp dẫn ối với khách hàng. Nhờ vậy, Amazon ngày càng thu hút ược nhiều ơn hàng hơn, giúp doanh thu tăng trung bình 25% mỗi năm. Đối với các sản phẩm bán chạy, công ty sẽ cung cấp nhiều dịch vụ giảm giá ể kích cầu. Từ ó kiếm ược lợi nhuận từ số lượng nhiều. Đối với các sản phẩm bán chậm, Amazon thực hiện chính sách giá nhỉnh hơn ối thủ một ít ể thu ược nhiều lợi nhuận hơn trên mỗi sản phẩm bán ra.

3.4. Dịch vụ khách hàng Alexa

3.4.1. Nguồn thông tin cần thu thập

Amazon ã sử dụng bộ dữ liệu phong phú thu thập ược từ việc khách hàng tương tác với các trợ lý ảo là Alexa. Các dữ liệu này ược lưu thành các bản ghi và sau này ược sử dụng cho mục ích phân tích, cải thiện.

3.4.2. Cách xử lý nguồn thông tin

Hệ thống LVCSR (Large-vocabulary Continuous Speech Recognition): gồm 2 tiến trình là lập bảng chỉ mục và tìm kiếm. Các oạn ghi âm của Alexa với khách hàng của Amazon ược thực hiện phiên âm thành nội dung nhờ công nghệ nhận diện giọng nói tự ộng (ASR). Công nghệ này so sánh các từ phiên âm trong oạn ghi với các từ trong từ iển. Cuối cùng, hệ thống sẽ xuất ra file bảng chỉ cho phép tìm kiếm các thông tin từ ngữ ược nói trong bản ghi âm.

Phonetic-based systems: ngược lại với hệ thống LVCSR, hệ thống này tiến hành dịch toàn bộ lời nói trong chuỗi hội thoại thành các ơn vị âm thanh. Sau ó, tìm kiếm những ơn vị âm thanh có ược từ bản dịch trên.

3.4.3. Vận dụng những thông tin ã xử lý

Amazon ã chuyển hóa dữ liệu bản ghi từ dịch vụ chăm sóc khách hàng của Alexa thành các ơn vị âm thanh có thể tìm kiếm ược. Trải qua các bước phân tích xử lý khác nhau, Amazon có thể hiểu ược những mong muốn của khách hàng. Từ ó, công ty có thể cải thiện chất lượng trải nghiệm mua sắm của khách hàng, giải quyết những phàn nàn cho khách hàng. Đồng thời góp phần cải tiến cho hai trợ lý ảo Alexa ngày càng thông minh hơn.

Bảng 3.1. Tóm tắt các ứng dụng Big Data trong nghiên cứu Marketing của Amazon

Dự án

Nguồn thông tin cần thu thập

Cách xử lý thông tin

Vận dụng những thông tin ã xử lý

Hệ thống giới thiệu cá nhân

- Các sản phẩm mà khách hàng ã mua - Các món ược thêm vào giỏ hàng - Các sản phẩm ang ược tìm kiếm nhiều nhất.

  • Phân tích ường i (path analytics)
  • Phân tích văn bản (text analytics): Lexical analytics,

Syntactic analytics, Semantic analytics,

Discourse – level analytics

  • Biết ược nhu cầu thực sự của khách

hàng

  • Đưa ra những lời gợi ý sản phẩm

Mô hình giao hàng

- Các từ khóa khách hàng tìm kiếm

- Phân tích dự báo

(Predictive analytics): mô

- Dự báo nhu cầu khách hàng theo từng

dự oán

  • Sản phẩm trong giỏ

hàng

  • Các ơn hàng ặt vào cùng thời iểm trong quá khứ
  • Các ặc iểm khác về nhân khẩu, ịa lý, chính trị của từng khu vực

hình học có giám sát

- Sử dụng phương pháp phân

loại (classification)

khu vực

- Dự trữ và giao hàng từ kho hàng của Amazon gần nhất

Tối ưu giá

  • Các hoạt ộng của khách hàng trên web - Chiến lược của ối thủ
  • Sự sẵn có của sản phẩm
  • Mức ộ ưa thích sản phẩm
  • Lịch sử ơn hàng
  • Lợi nhuận kỳ vọng

- Phân tích dự báo theo mô hình học không giám sát - Phân tích hồi quy

- Cập nhật thường xuyên mức giá - Thực hiện chiến lược giá cho những loại sản phẩm khác nhau

Dịch vụ khách hàng

Alexa

- Các bản ghi khi khách hàng tương tác với các trợ lý ảo Alexa

  • Hệ thống LVCSR (Largevocabulary Continuous Speech Recognition)
  • Phonetic-based systems

  • Hiểu ược những mong muốn của khách hàng - Giải quyết những phàn nàn của khách

hàng

  • Cải thiện chất lượng trải nghiệm mua sắm - Cải tiến cho trợ lý ảo Alexa

(Nguồn: Nhóm nghiên cứu tự tổng hợp)

CHƯƠNG 4: NHỮNG CƠ HỘI VIỆC LÀM MỞ RA ĐỐI VỚI MẢNG DATA LĨNH VỰC MARKETING

Chuyên viên phân tích dữ liệu (Data Analyst) là một trong những công việc có nhu cầu tuyển dụng cao nhất ở thời iểm hiện tại. Không khó ể nhận thấy vai trò của họ trong hầu hết các ngành nghề, các tổ chức doanh nghiệp. Đặc biệt tại lĩnh vực Marketing cụ thể:

4.1. Marketing Insight and Analysis. (1000 - 3000 USD)

Mô tả công việc:

+ Đảm nhận việc phân tích và diễn giải dữ liệu, ảm bảo mức ộ chính xác, kịp thời và hữu ích của dữ liệu ược trình bày.

+ Cung cấp các ề xuất dựa trên thông tin chi tiết theo hướng dữ liệu, có thể hành ộng với mục tiêu rõ ràng là cải thiện hiệu suất kinh doanh.

+ Tiến hành ánh giá ịnh kỳ hệ thống lưu trữ dữ liệu và cơ sở dữ liệu, thực hiện nhiều thử nghiệm và phân tích kết quả trước khi ưa ra giải pháp mới hoặc tìm cách nâng cao giải pháp quản lý dữ liệu.

4.2. Chuyên viên phân tích chỉ số Marketing (1000 - 2500 USD)

Mô tả công việc:

+ Phát triển hệ thống thống kê, thu thập chỉ số Marketing.

+ Tự ộng hóa hệ thống thống kê, thu nhập chỉ số Marketing.

+ Xây dựng hệ thống báo cáo chỉ số tổng hợp của các bộ phận trong khối

Marketing.

+ Xây dựng hệ thống cảnh báo chỉ số cho từng bộ phận.

+ Phân tích dữ liệu các chỉ số và ưa ra phương án ề xuất khắc phục.

+ Phối hợp chặt chẽ với các nhóm marketing, sản phẩm, công nghệ ể phát triển và thúc ẩy các dự án.

4.3 Social Data Analysis (700 - 2000 USD)

Mô tả công việc:

+ Thực hiện các nghiên cứu về social media bằng cách biên soạn, phân tích, diễn giải dữ liệu nghiên cứu, làm báo cáo và thuyết trình báo cáo.

+ Đưa ra các kết luận, ề xuất hành ộng một cách ngắn gọn, phù hợp với từng trường hợp của khách hàng dựa vào dữ liệu ã nghiên cứu.

+ Sử dụng các công cụ ể thực hiện quy trình nghiên cứu ược giao: Thu thập dữ liệu, xử lý dữ liệu, phân tích kết quả nghiên cứu, trực quan hoá dữ liệu và soạn thảo báo cáo.

KẾT LUẬN

Có thể nói dữ liệu là vốn quý của bất kỳ doanh nghiệp nào ặc biệt là trong bối cảnh cuộc cách mạng công nghiệp lần thứ tư bùng nổ như hiện nay. Dữ liệu có ở khắp mọi nơi, mọi thời thời iểm vì vậy ai thu thập ược nhiều dữ liệu thì sẽ có ược lợi thế. Qua những ứng dụng từ việc phân tích dữ liệu như ã trình bày trong bài, có lẽ ây là lúc các doanh nghiệp cần có sự nhìn nhận úng ắn về tầm quan trọng của Big Data cũng như có ộng thái chuyển ổi mình ể có thể khai thác chúng cho quá trình ra quyết ịnh kinh doanh nói chung và Marketing nói riêng.

TÀI LIỆU THAM KHẢO

  • Để hiểu úng về tầm quan trọng của dữ liệu và biết cách sử dụng các loại biểu ồ ể biểu diễn dữ liệu. Tham khảo thêm sách Data Visualization - Cơ bản về minh họa dữ liệu và thiết kế biểu ồ. Link:

<https://drive.google.com/file/d/1vA5WNsERQ9fgwAIl4qFeZtlK0gJ18hpi/view?f bclid=IwAR3i_2AmhA88i1raBCezJ4Ofk9D3Xbe2cLPMWMZ3gJOlvHFUm_dU

P_eP_lk>

  • Để hiểu sâu hơn về thuật ngữ Big Data và cách ể bắt ầu sử dụng chúng. Tham khảo thêm:
    1. Bài viết Big Data - Data Visualization and Quantitative Research

Apps,Vaidas Lukošius and Michael R. Hyman (2018). Link

<https://www.researchgate.net/publication/323664305_Big_data_in_market ing_research>

    1. Sách The Big Data-Driven Business: How to Use Big Data to Win Customers Beat competitors and Boots profits, Russell Glass and Sean

Callahan (2015). Link

<https://books.google.com.vn/books?hl=vi&lr=&id=LCA-

BQAAQBAJ&oi=fnd&pg=PR3&dq=company%20use%20big%20data%2

0in%20marketing&ots=IQLQ7R6hKv&sig=1CtXhJBbUtocbxFZDkJEQW Mm4Ck&redir_esc=y&fbclid=IwAR0G0g8idGW0qwpkpjM5hE5VrQ5AcI xiBTCQZ0GLjvY1x_s0UKAYyJSTMEI#v=onepage&q=company%20use

%20big%20data%20in%20marketing&f=false>

    1. Sách Big Data in Marketing, Danii Ty Kheev (2018). Link

<https://www.theseus.fi/bitstream/handle/10024/145613/Big%20Data%20i n%20marketing.pdf?sequence=1&isAllowed=y>

    1. Luận văn Tools and Methods for Big Data Analysis (2016). Link

<https://dspace5.zcu.cz/bitstream/11025/23681/1/Master_Thesis_Miroslav_ Vozabal.pdf>

    1. Bài viết Big Data in Market Research: Why More Data Does Not

Automatically Mean Better Information, Volker Bosch (2016), GfK

Marketing Intelligence Review, Vol. 8, No. 2 (November). Link

<https://www.nim.org/en/publications/gfk-marketing-intelligencereview/all-issues/marketing-and-data-science/big-data-market-researchwhy-more-data-does-not-automatically-mean-better-information>

    1. Website về các phương pháp phân tích dữ liệu, Big Data và ứng dụng trong các ngành khác nhau… , Big Data Uni, <https://bigdatauni.com/>
  • Để biết nhiều hơn về cách Big Data ược ứng dụng trong kinh doanh như thế nào.

Tham khảo thêm:

      1. Sách Big Data và ứng dụng trong kinh doanh, Lê Hoành Sử (2017), NXB ĐHQG TP.HCM (hiện có trên Thư viện trung tâm ĐHQG TP.HCM).
      2. Dữ liệu lớn: Cách thức khai thác cơ hội từ dữ liệu?, Nguyễn Anh Duy & Nguyễn Phúc Quỳnh Như (2019), Tạp chí Phát triển và Hội nhập Trường

Đại học Tài chính – Marketing TP.HCM. Link <https://usercdn.uef.edu.vn/newsimg/tap-chi-uef/2019-05-06-46/9.pdf>

  • Một số tài liệu tham khảo khác
      1. L. W. Zhang (2015), Modeling and Analysis in Marine Big Data: Advances and Challenges, <https://www.hindawi.com/journals/mpe/2015/384742/>
      2. Walter (2018), Amazon and Big Data <https://digital.hbs.edu/platformdigit/submission/amazon-and-big-data/>
      3. Phạm Việt Anh (2019), Nghiên cứu một số vấn ề về Big Data và ứng dụng trong phân tích kinh doanh, Đại học Công nghệ thông tin và Truyền thông.
      4. Các ứng dụng của Data Science trong ngành Marketing,

<https://miedu.ai/2021/08/13/cac-ung-dung-cua-data-science-trong-nganhmarketing/>

      1. Nguyễn Anh Duy & Nguyễn Phúc Quỳnh Như (2019). Dữ liệu lớn: Cách thức khai thác cơ hội từ dữ liệu? Trường hợp Amazon. Tạp chí Phát triển và Hội nhập Trường Đại học Tài chính – Marketing TP.HCM
      2. Walter (2018). Amazon and Big Data <https://digital.hbs.edu/platformdigit/submission/amazon-and-big-data/>
      3. Rob van Dijk, 5 Advanced Data Analysis Techniques Applied to People Analytics, <https://www.aihr.com/blog/advanced-data-analysis-techniquesapplied-to-people-analytics/>
      4. Federico Pascual (2019), Topic Modeling: An Introduction,

<https://monkeylearn.com/blog/introduction-to-topic-modeling/>