I. Giới thiệu đề tài
1.1. Tổng quan về đề tài
Dịch vụ chuyển đổi văn bản thành giọng nói (Text-to-Speech - TTS) quan
trọng trong nhiều lĩnh vực như trợ ảo, tổng đài tự động, sách nói, hỗ trợ
người khiếm thị, v.v. Viettel AI một trong những đơn vtiên phong tại Việt
Nam trong việc phát triển công nghệ này.
Việc nghiên cứu xây dựng trải nghiệm người dùng (UX) cho một
website giới thiệu bán dịch vụ TTS của Viettel AI không chỉ giúp tối ưu hóa
hành trình khách hàng còn tăng tỷ lệ chuyển đổi, nâng cao sự hài lòng của
1.2. do chọn đề tài:
1.2.1. Xu hướng phát triển mạnh mẽ của công nghệ Chuyển đổi văn bản
thành giọng nói (TTS)
Công nghệ TTS ngày càng phổ biến trong nhiều lĩnh vực như tổng đài tự
động, giáo dục, giải trí, trợ ảo, nội dung số (YouTube, TikTok,
Podcast)...
Tại Việt Nam, các doanh nghiệp lớn như Viettel AI, FPT.AI, Zalo AI
đang đầu mạnh vào công nghệ này, tạo ra sự cạnh tranh hội phát
triển lớn.
Người dùng ngày càng quan tâm đến các giải pháp AI giúp tự động hóa
nhân hóa nội dung, đặc biệt trong thời đại số hóa hiện nay.
1.2.2. Nhu cầu cấp thiết về trải nghiệm người dùng tối ưu cho dịch vụ
TTS
Hiện nay, nhiều website cung cấp dịch vụ TTS nhưng chưa tối ưu trải
nghiệm người dùng, dẫn đến khó khăn trong quá trình tìm hiểu, dùng thử
mua dịch vụ.
Người dùng mong muốn một giao diện thân thiện, dễ sử dụng, hỗ trợ
thử nghiệm nhanh không cần quy trình phức tạp.
Một website UX tốt sẽ giúp Viettel AI thu hút thêm khách hàng, tăng
khả năng chuyển đổi từ khách truy cập thành người dùng thực sự.
1.2.3. hội cải thiện quy trình mua hàng tích hợp API
Khách hàng doanh nghiệp nhà phát triển phần mềm cần một quy trình
mua dịch vụ tích hợp API đơn giản, ràng.
Nếu Viettel AI một hệ thống website dễ sử dụng, hỗ trợ đăng nhanh
chóng thanh toán thuận tiện, khả năng mở rộng thị trường sẽ cao hơn.
Tạo sự khác biệt so với đối thủ bằng trải nghiệm mua hàng chuyên
nghiệp, hiện đại.
1.2.4. Góp phần nâng cao khả năng tiếp cận dịch vụ AI của Viettel AI
Viettel AI một trong những đơn vị tiên phong trong lĩnh vực AI tại
Việt Nam, nhưng vẫn cần cải thiện khả năng tiếp cận người dùng thông
qua nền tảng trực tuyến.
Một website trải nghiệm tốt sẽ giúp khách hàng nhanh chóng tìm hiểu
sử dụng dịch vụ, từ đó thúc đẩy sự phát triển của AI "Made in
Vietnam".
1.2.5. Kết hợp nghiên cứu UX/UI với chiến lược marketing số
Website không chỉ cần giao diện đẹp còn phải tối ưu SEO, quảng
tốt trên các nền tảng tìm kiếm như Google để thu hút khách hàng.
Xây dựng nội dung hấp dẫn như blog, case study, hướng dẫn sử dụng sẽ
giúp tăng mức độ nhận diện thương hiệu Viettel AI trong lĩnh vực TTS.
1.3. tả sản phẩm
1.3.1 Tổng quan:
Dịch vụ Chuyển đổi văn bản thành giọng nói của Viettel AI một giải
pháp công nghệ tiên tiến, cho phép chuyển đổi văn bản viết thành giọng nói một
cách tự nhiên chân thực. Dịch vụ này được xây dựng trên nền tảng trí tuệ
nhân tạo (AI) mạnh mẽ của Viettel, đảm bảo chất lượng độ tin cậy cao.
1.3.2. Các tính năng lợi ích chính:
Chất lượng giọng nói tự nhiên chân thực:
Sử dụng công nghệ tổng hợp giọng nói tiên tiến, tạo ra âm thanh
gần gũi với giọng nói con người, ngữ điệu, nhịp điệu cảm
xúc phù hợp với ngữ cảnh.
Giảm thiểu tối đa các âm thanh robot hoặc cứng nhắc thường thấy
các dịch vụ chuyển đổi văn bản thành giọng nói truyền thống.
Đa dạng giọng đọc:
Cung cấp nhiều lựa chọn giọng đọc khác nhau, bao gồm giọng
nam, giọng nữ, giọng theo vùng miền (Bắc, Trung, Nam) các
giọng đọc đặc biệt khác.
Cho phép người dùng lựa chọn giọng đọc phù hợp với mục đích sử
dụng đối tượng người nghe.
Khả năng tùy chỉnh:
Cho phép người dùng điều chỉnh tốc độ đọc, âm lượng, cao độ
các thông số khác của giọng nói.
Hỗ trợ thêm các hiệu ứng âm thanh (nếu có) để tăng tính sinh động
hấp dẫn.
Tốc độ xử nhanh chóng:
Chuyển đổi văn bản thành giọng nói trong thời gian ngắn, đáp ứng
nhu cầu sử dụng nhanh chóng hiệu quả.
Tối ưu hóa hiệu suất để xử lượng lớn văn bản một cách mượt
mà.
Hỗ trợ nhiều định dạng đầu ra:
Cung cấp các định dạng âm thanh đầu ra phổ biến như MP3,
WAV, v.v.
Cho phép người dùng dễ dàng sử dụng file âm thanh đã chuyển đổi
trên nhiều thiết bị nền tảng khác nhau.
Khả năng tích hợp:
Cung cấp API (Application Programming Interface) để tích hợp
dịch vụ vào các ứng dụng nền tảng khác.
Cho phép các nhà phát triển dễ dàng nhúng tính năng chuyển đổi
văn bản thành giọng nói vào sản phẩm của mình.
1.3.3. Các điểm khác biệt so với đối thủ cạnh tranh:
Công nghệ AI tiên tiến của Viettel:
Sử dụng các thuật toán hình AI được phát triển bởi đội ngũ
chuyên gia hàng đầu của Viettel.
Liên tục cập nhật cải tiến công nghệ để nâng cao chất lượng
hiệu suất của dịch vụ.
Độ chính xác độ tin cậy cao:
Đảm bảo độ chính xác cao trong việc chuyển đổi văn bản, kể cả
với các văn bản phức tạp hoặc nhiều thuật ngữ chuyên ngành.
Hoạt động ổn định tin cậy, giảm thiểu tối đa các lỗi sự cố.
Giá cả cạnh tranh:
Cung cấp các gói dịch vụ với mức giá linh hoạt cạnh tranh, phù
hợp với nhiều đối tượng khách hàng.
thể các chương trình khuyến mãi hoặc ưu đãi đặc biệt.
Dịch vụ hỗ trợ khách hàng chuyên nghiệp:
Cung cấp các kênh hỗ trợ khách hàng đa dạng (trò chuyện trực
tiếp, email, điện thoại) để giải đáp thắc mắc hỗ trợ kỹ thuật.
Đội ngũ nhân viên hỗ trợ nhiệt tình chu đáo.
1.3.4. Các trường hợp sử dụng thực tế:
Tạo sách nói podcast:
Chuyển đổi sách, truyện, bài viết thành định dạng âm thanh để
người dùng thể nghe khi di chuyển, tập thể dục hoặc thư giãn.
Tạo podcast với giọng đọc chuyên nghiệp hấp dẫn.
Lồng tiếng cho video quảng cáo:
Tạo giọng thuyết minh cho video, quảng cáo, phim hoạt hình, v.v.
Tiết kiệm chi phí thời gian so với việc thuê diễn viên lồng tiếng.
Tạo nội dung cho các ứng dụng giáo dục giải trí:
Tạo giọng đọc cho các bài giảng, hướng dẫn, trò chơi, ứng dụng
học ngôn ngữ, v.v.
Tăng tính tương tác hấp dẫn cho người dùng.
Tự động hóa dịch vụ khách hàng:
Sử dụng giọng nói tự động để trả lời các câu hỏi thường gặp, cung
cấp thông tin sản phẩm, thông báo lịch hẹn, v.v.
Giảm tải cho nhân viên chăm sóc khách hàng nâng cao hiệu quả
hoạt động.
Hỗ trợ người khiếm thị tiếp cận thông tin:
Chuyển đổi văn bản trên website, tài liệu, sách báo thành giọng nói
để người khiếm thị thể dễ dàng tiếp cận thông tin.
Tạo điều kiện cho người khiếm thị hòa nhập hội học tập.
1.3.5. Các gói dịch vụ giá cả:
Cung cấp các gói dùng thử miễn phí để người dùng trải nghiệm dịch vụ.
Các gói dịch vụ thể được tính theo:
Số lượng tự hoặc từ cần chuyển đổi.
Thời gian sử dụng dịch vụ.
Các tính năng bổ sung (ví dụ: tùy chỉnh giọng đọc nâng cao).
Giá cả linh hoạt cạnh tranh, phù hợp với nhu cầu ngân sách của
từng đối tượng khách hàng.
1.3.6. Thu thập phản hồi từ người dùng:
Tạo các kênh để người dùng gửi phản hồi, đánh giá góp ý về dịch vụ.
Lắng nghe tiếp thu ý kiến của người dùng để liên tục cải thiện nâng
cao chất lượng dịch vụ.
1.4. Mục tiêu đề tài
Mục tiêu của đề tài hướng đến việc tối ưu hóa giao diện, chức năng
quy trình sử dụng dịch vụ trên website, nhằm nâng cao trải nghiệm khách
hàng gia tăng tỷ lệ chuyển đổi. Cụ thể, các mục tiêu chính bao gồm:
1. Nghiên cứu nhu cầu hành vi người dùng Xác định nhóm khách hàng
mục tiêu: nhân, doanh nghiệp, nhà phát triển phần mềm. Tìm hiểu
hành vi, nhu cầu kỳ vọng của người dùng khi sử dụng dịch vụ TTS.
Phân tích khó khăn hiện tại của khách hàng trong quá trình tìm hiểu
mua dịch vụ.
2. Thiết kế tối ưu trải nghiệm người dùng (UX/UI) trên website Xây
dựng giao diện thân thiện, trực quan, dễ sử dụng. Cải thiện quy trình điều
hướng giúp khách hàng nhanh chóng tiếp cận thông tin cần thiết. Tích
hợp tính năng dùng thử trực tiếp trên website để tăng trải nghiệm thực tế.
3. Đơn giản hóa quy trình đăng mua dịch vụ Tạo hệ thống đăng
nhanh chóng, không rườm rà. Hỗ trợ nhiều phương thức thanh toán thuận
tiện (thẻ ngân hàng, điện tử, chuyển khoản, v.v.). Cung cấp hướng dẫn
tích hợp API dễ hiểu cho nhà phát triển phần mềm.
4. Nâng cao hiệu quả marketing khả năng tiếp cận khách hàng Tối ưu
SEO để website dễ dàng xuất hiện trên Google khi khách hàng tìm kiếm.
Xây dựng nội dung thu hút như blog, case study, hướng dẫn sử dụng.
Tích hợp các công cụ quảng cáo, remarketing để tăng hội chuyển đổi
khách hàng.
5. Đánh giá hiệu quả đề xuất cải tiến Thu thập phản hồi từ người dùng về
trải nghiệm website. Đánh giá mức độ hài lòng, tỷ lệ chuyển đổi đề
xuất cải tiến phù hợp. So sánh với các đối thủ để liên tục tối ưu sản phẩm.
II. sở thuyết
2.1. UX ?
2.1.1. Lịch sử ra đời UX:
Năm 1993 thuật ngữ “User Experience” đã được Don Norman đưa ra
Khoảng 4000 năm TCN - Phong thủy UX cổ đại
Năm 1945, John E. Karlin được thuê thiết kế hệ thống điện thoại tại Bell
labs
Năm 1950, Bell labs đã thiết kế ra Telephone Keypad.
Năm 1955, Henry Dreyfuss cho ra đời cuốn sách “Designing for people”:
“Khi điểm tiếp xúc giữa sản phẩm con người trở thành một điểm ma
sát thì thiết kế đó thất bại. Mặt khác nếu con người cảm thấy thoải mái
hơn, háo hức hơn, an toàn hơn, hay đơn giản hạnh phúc hơn khi tiếp
xúc với sản phẩm thì thiết kế đã thành công”
Những năm 80 cuộc cách mạng ngành công nghiệp máy tính
Máy tính nhân được dùng cho mọi người đòi hỏi sự cải thiện về khả
năng sử dụng giao diện sử dụng
Sự phát triển của ngành internet website
Năm 2007 iphone ra đời Thay đổi hành vi sử dụng điện thoại của
người dùng Bắt đầu cho sự phát triển của ứng dụng di động
Từ năm 1950 đến năm 1983 tăng từ 10 người lên tới 1000 người
Từ năm 1983 đến 2017 tăng từ 1000 đến 1 triệu người
Từ năm 2017 đến năm 2050 sẽ tăng từ 1 triệu đến 100 triệu người
2.1.2. Khái niệm:
- UX(viết tắt của User Experience) - Trải nghiệm người dùng: nhận
thức phản ứng của một người với kết quả từ việc sử dụng hoặc dự kiến
sử dụng sản phẩm, hệ thống hoặc dịch vụ
- UX Research được hiểu nghiên cứu trải nghiệm người dùng, quá
trình nghiên cứu hệ thống về trải nghiệm người dùng thông qua
phương pháp quan sát (Observation techniques) phương pháp phản hồi
(Feedback methodologies) để từ đó, tìm ra “insight” “pain point” u
bên trong tâm trí người dùng (về mong muốn, hành vi, nhu cầu, điểm
chạm).
- Mục tiêu cuối cùng của UX Research tìm kiếm được những dữ liệu giá
trị giúp đưa ra những ý tưởng, giải pháp gần với insight khách hàng nhất
dựa trên thực tế áp dụng chúng vào quy trình thiết kế.
2.1.3. Các thiết kế khác trong UX design
- Một số phong cách nguyên tắc thiết kế trong UX design bao gồm:
Thiết kế Hướng dẫn (Guided Design),
Thiết kế Dựa trên Ngữ cảnh (Contextual Design),
Thiết kế Đáp ứng (Responsive Design),
Thiết kế Tương tác (Interactive Design),
Mỗi phong cách thiết kế này đều mục tiêu riêng nhằm cải thiện trải
nghiệm người dùng đảm bảo rằng sản phẩm đáp ứng được nhu cầu
mong muốn của họ một cách tốt nhất.
- Một số sản phẩm áp dụng các phong cách nguyên tắc thiết kế đã nêu:
Facebook: Ứng dụng di động trang web mạng hội lớn nhất thế giới,
được thiết kế để kết nối chia sẻ thông tin với bạn gia đình.
Amazon: Trang web ứng dụng di động của Amazon cung cấp trải
nghiệm mua sắm trực tuyến, cho phép người dùng tìm kiếm, so sánh
mua hàng từ một loạt các danh mục sản phẩm.
Google Maps: Ứng dụng di động cung cấp dịch vụ bản đồ, chỉ đường
thông tin về giao thông cho người dùng trên toàn thế giới.
Duolingo: Ứng dụng học ngoại ngữ miễn phí, với giao diện người dùng
đơn giản trực quan giúp người dùng học một cách hiệu quả thú vị.
Adobe Photoshop: Phần mềm chỉnh sửa ảnh thiết kế đồ họa chuyên
nghiệp, với giao diện công cụ được thiết kế để hỗ trợ người dùng trong
quá trình sáng tạo.
2.2. Phương pháp nghiên cứu người dùng:
- 2 phương pháp nghiên cứu người dùng được dùng trong bài
2.2.1. Phương pháp Phỏng vấn người dùng:
Khái niệm:
Phỏng vấn giúp bạn hiểu sâu hơn về giá trị, nhận thức trải
nghiệm với người dùng
Cho phép đặt câu hỏi cụ thể, trong khi vẫn để mở để khám phá
quan điểm của người tham gia
Áp dụng tốt nhất khi người dùng đang sử dụng sản phẩm
Sử dụng để khám phá ý tưởng.
Ưu, nhược điểm:
thể hiểu thấu cảm người dùng, khám phá được những mong
muốn từ người dùng
Người dùng thường nói khác so với họ hành động
Không tiếp cận được số lượng lớn, mất nhiều thời gian
3 loại chính của 1 cuộc phỏng vấn:
thể hiểu thấu cảm người dùng, khám phá được những mong
muốn từ người dùng
Người dùng thường nói khác so với họ hành động
Không tiếp cận được số lượng lớn, mất nhiều thời gian
Không cấu trúc: các câu hỏi đặt ra những câu hỏi mở
Cấu trúc: đặt ra những câu hỏi đóng, xác định trước các câu trả lời
Bán cấu trúc: sự kết hợp của không cấu trúc cấu trúc
Một số lưu ý khi đặt câu hỏi phỏng vấn:
Tránh câu hỏi dài, họ rất khó nhớ
Tránh sử dụng câu ghép, nên tách chúng thành hai câu hỏi.
Tránh sử dụng thuật ngữ, ngôn ngữ người được phỏng vấn
không thể hiểu. thể họ sẽ ngại hỏi lại.
Tránh những thành kiến trong tiềm thức, luôn đặt ý kiến trung tập
cho câu hỏi của bạn.
Hãy đặt câu hỏi “What” “How” trước khi hỏi “Why”
2.2.2. Phương pháp Bảng hỏi
Khái niệm
phương pháp thu thập dữ liệu ý kiến người dùng tốt
thể sử dụng câu hỏi đóng mở
thể sử dụng internet (website, email) hoặc in trên giấy
thể phân phối tới số lượng lớn người dùng
Dùng bảng hỏi trong trường hợp muốn nhận định phương án, ý
tưởng
Ưu nhược điểm
Tiếp cận được số lượng lớn người dùng
Kết quả nghiên cứu thể hiện dạng định lượng
Không khám phá được những ý tưởng mới, thấu hiểu được về
người dùng
Câu trả lời của người được hỏi thể không chính xác
Người trả lời không được hỗ trợ, gợi ý trả lời câu hỏi
Các dạng câu hỏi
Câu hỏi dạng Checkbox phạm vi: cho phép người trả lời lựa
chọn một trong số kết quả: Thu nhập trong khoảng nào, giới tính,..
Câu hỏi dạng Likert: lấy ý kiến qua 5 thang điểm
Hoàn toàn đồng ý
Đồng ý
Trung lập
Không đồng ý
Hoàn toàn không đồng ý
Câu hỏi thang đối lập: sử dụng các cặp thái độ đối lập yêu cầu
người được hỏi xác định vị trí trên thanh.
2.3. Quy trình thiết kế
2.3.1. Design Thinking
Khái niệm: Design thinking hay duy thiết kế một quy trình
sáng tạo giải quyết vấn đề dựa trên sự hiểu biết sâu sắc về người dùng, khách
hàng thị trường. Phương pháp này thể giải quyết tất cả những vấn đề từ
đơn giản đến phức tạp, đặc biệt các vấn đề trừu tượng, khó dự tính trong
tương lai.
Mục tiêu: Mục tiêu của design thinking tạo ra các giải pháp phù
hợp với nhu cầu, mong muốn hành vi của người dùng, đồng thời cân nhắc
các yếu tố kỹ thuật, kinh doanh hội. Đây một kỹ năng quan trọng cho
các nhà lãnh đạo, quản trong thời đại số hóa.
Các bước xây dựng quy trình Design thinking
Bước 1: Empathize (Đồng cảm, thấu hiểu)
Bước 2: Define (Xác định vấn đề)
Bước 3: Ideate (Sáng tạo)
Bước 4: Prototype (Xây dựng bản mẫu)
Bước 5: Test (Kiểm tra, thử nghiệm)
Lợi ích của Design thinking
Tập trung vào các vấn đề trọng tâm
Tận dụng duy nhóm
Đẩy mạnh tinh thần sáng tạo
2.4. Phương pháp đánh giá
2.4.1. Usability Testing
Phương pháp này thường được sử dụng trong tất cả các giai đoạn
của việc phát triển sản phẩm được ưu tiên do độ hiệu quả cao của nó. Đây
một phương pháp đạt hiệu quả cao trong việc tiến hành đánh giá Usability của
sản phẩm. Phương pháp này bản chất việc mời người dùng đến một môi
trường trung tính, trong đó đã được chuẩn bị sẵn thiết bị ghi hình ghi âm, sau
đó 2-3 người quan sát ghi chép, 1 người phỏng vấn người dùng sẽ tiến
hành sử dụng sản phẩm theo yêu cầu của người phỏng vấn đồng thời trả lời các
câu hỏi người phỏng vấn đưa ra.
Quy trình thực hiện phương pháp này bao gồm các bước sau:
1. Lên kế hoạch
2. Xây dựng tiêu chuẩn người dùng mục tiêu ( personal )
3. Lên kịch bản test
4. Tiến hành Pilot Test (chạy thử)
5. Mời người dùng
6. Tiến hành test thật
7. Tổng hợp báo cáo kết quả
2.4.2. A/B Testing
A/B Testing một phương pháp UX Research phổ biến. Khi triển
khai phương pháp này, bạn sẽ đưa ra hai phiên bản cho một nhóm người dùng
trải nghiệm trong đó, phiên bản gốc (A) phiên bản đã cải thiện UX (B)
để nhận về những lời phản hồi của họ với mỗi phiên bản tìm ra cách cải thiện
giúp phiên bản sản phẩm tốt hơn.
Khi thực hiện phương pháp A/B testing, bạn chỉ nên kiểm tra s
khác biệt của một yếu tố để đem lại kết quả thử nghiệm tốt nhất.
dụ:
Thử nghiệm kích thước nút lớn hoặc nút nhỏ đem lại trải
nghiệm tốt hơn
Thử nghiệm thanh điều hướng trên top hoặc đặt dưới bottom
Thử nghiệm đặt nút cancel bên trái hoặc bên phải
Thử nghiệm nút “Thử ngay” bằng màu đỏ hoặc màu xanh
III. Phân tích thiết kế ứng dụng
Giai đoạn 1: Empathize
3.1. Nghiên cứu người dùng
3.1.1. Xác định đối tượng nghiên cứu:
Khách hàng nhân:
Tổng quan: Khách hàng nhân chủ yếu người sáng tạo nội dung
(Content Creator), giáo viên, người khiếm thị, người làm công việc tự do
(freelancer). Họ tìm kiếm một công cụ giúp chuyển đổi văn bản thành
giọng nói nhanh chóng, dễ sử dụng, với chi phí hợp lý.
Nhu cầu chính:
Tạo nội dung số chuyên nghiệp không cần thu âm thủ công
YouTuber, TikToker, Podcaster cần giọng nói nhân tạo để làm
video, podcast không cần thu âm. Tiết kiệm thời gian, công
sức, giảm chi phí thuê người lồng tiếng. Giọng đọc tự nhiên,
cảm xúc giúp nội dung thu hút hơn.
Hỗ trợ học tập & giáo dục Giáo viên, giảng viên cần tạo nội dung
giảng dạy bằng âm thanh để hỗ trợ bài giảng trực tuyến. Học sinh,
sinh viên thể sử dụng để nghe tài liệu học tập dưới dạng âm
thanh thay đọc.
Hỗ trợ người khiếm thị người bận rộn Người khiếm thị sử dụng
công nghệ TTS để tiếp cận nội dung văn bản bằng âm thanh.
Người bận rộn thể dùng TTS để chuyển tài liệu, sách báo thành
âm thanh để nghe khi di chuyển.
Dùng thử miễn phí & trải nghiệm dễ dàng Cần giao diện trực quan,
dễ thao tác không cần hiểu biết kỹ thuật. Muốn tùy chọn
dùng thử miễn phí trước khi quyết định mua dịch vụ. Hỗ trợ nhiều
ngôn ngữ giọng đọc khác nhau.
Khách hàng các doanh nghiệp:
Tổng quan: Doanh nghiệp sử dụng TTS để tự động hóa dịch vụ khách
hàng, tối ưu quy trình vận hành tăng hiệu suất nội dung số. Nhóm
khách hàng này gồm công ty viễn thông, ngân hàng, giáo dục, thương
mại điện tử, truyền thông, phát thanh,…
Nhu cầu chính :
Tích hợp API vào hệ thống tổng đài, chatbot, trợ ảo Các công ty
viễn thông, ngân hàng, dịch vụ cần tổng đài tự động để hỗ trợ
khách hàng 24/7. Doanh nghiệp muốn tích hợp TTS vào chatbot,
trợ ảo để cung cấp dịch vụ thông minh. Yêu cầu tài liệu API
ràng, dễ tích hợp.
Tạo nội dung quảng cáo, tiếp thị tự động Doanh nghiệp truyền
thông, quảng cáo cần giọng đọc tự nhiên để tạo nội dung marketing
(quảng cáo radio, video). Cần nhiều giọng đọc, khả năng điều
chỉnh ngữ điệu theo ngữ cảnh.
Ứng dụng trong giáo dục đào tạo Công ty cung cấp nền tảng
học trực tuyến muốn chuyển đổi giáo trình thành giọng nói để tạo
khóa học audio. Tích hợp giọng đọc AI vào ứng dụng học ngôn
ngữ hoặc sách nói.
Tối ưu chi phí, giảm phụ thuộc vào nhân sự Doanh nghiệp muốn
giảm chi phí thuê MC, người lồng tiếng chuyên nghiệp. TTS giúp
tự động hóa nhiều quy trình, giảm thời gian sản xuất nội dung.
Bảo mật & hỗ trợ đa nền tảng Doanh nghiệp cần hệ thống bảo mật
dữ liệu cao khi sử dụng giọng nói AI. Hỗ trợ trên nhiều nền tảng:
website, ứng dụng di động, thiết bị IoT.
3.1.2. Chuẩn bị trước nghiên cứu:
a) Kế hoạch nghiên cứu:
Đề ra các giai đoạn nghiên cứu bao gồm nghiên cứu định lượng (khảo
sát) định tính (phỏng vấn, nhóm tập trung).
· Mục tiêu:
Hiểu sâu hơn về nhu cầu, kỳ vọng khó khăn người
dùng gặp phải khi sử dụng dịch vụ.
Xác định các yếu tố tác động (cả tích cực tiêu cực) đến
trải nghiệm của người dùng.
Đưa ra các đề xuất cải tiến về tính năng, quy trình sử dụng
giao diện người dùng
· Thời gian nghiên cứu: Dự kiến kéo dài 2-3 tuần, với từng giai đoạn
ràng.
o Tuần 1: Thu thập dữ liệu định lượng thông qua khảo sát.
o Tuần 2: Thực hiện các cuộc phỏng vấn nhân.
o Tuần 3: Tổ chức các buổi nghiên cứu nhóm tập trung.
b) Chuẩn bị công cụ, dụng cụ:
· Khảo sát trực tuyến: Sử dụng các nền tảng như Google Forms,
Typeform, SurveyMonkey để dễ dàng thu thập thông tin từ nhiều người dùng.
· Phỏng vấn nhân: Ghi âm hoặc sử dụng các công cụ trực tuyến
(Zoom, Google Meet) để thực hiện cuộc phỏng vấn từ xa. Các công cụ ghi âm
như Otter.ai cũng giúp ghi lại chuyển đổi lời nói thành văn bản dễ dàng.
· Nhóm tập trung: Sử dụng phòng họp hoặc môi trường trực tuyến để
tổ chức các cuộc thảo luận nhóm. Zoom hoặc Microsoft Teams thể được sử
dụng cho việc này.
c) Hẹn người dùng:
· Tìm kiếm người dùng tiềm năng: Liên hệ qua email, mạng hội,
hoặc từ các khách hàng đã từng đặt bàn tại nhà hàng.
· Lịch hẹn: Xác nhận lịch phù hợp cho từng nhóm đối tượng, đảm
bảo đủ thời gian cho các phiên phỏng vấn hoặc thảo luận nhóm (30-60 phút
mỗi phiên).
3.1.3. Câu hỏi khảo sát
- Phạm vi khảo sát: Lứa tuổi từ 18-65 tuổi Việt Nam
- Công cụ sử dụng: Google Forms
- Mục tiêu khảo sát:
Tìm ra điểm người dùng thích không thích ứng dụng
Thu được thêm dữ liệu để thiết kế chức năng của ứng dụng phù hợp với
người dùng
- Thời gian khảo sát: 3 ngày
- Link khảo sát:
- Kết quả khảo sát

Preview text:

I. Giới thiệu đề tài
1.1. Tổng quan về đề tài
Dịch vụ chuyển đổi văn bản thành giọng nói (Text-to-Speech - TTS) quan
trọng trong nhiều lĩnh vực như trợ lý ảo, tổng đài tự động, sách nói, hỗ trợ
người khiếm thị, v.v. Viettel AI là một trong những đơn vị tiên phong tại Việt
Nam trong việc phát triển công nghệ này.
Việc nghiên cứu và xây dựng trải nghiệm người dùng (UX) cho một
website giới thiệu và bán dịch vụ TTS của Viettel AI không chỉ giúp tối ưu hóa
hành trình khách hàng mà còn tăng tỷ lệ chuyển đổi, nâng cao sự hài lòng của người dùng. 1.2. Lý do chọn đề tài:
1.2.1. Xu hướng phát triển mạnh mẽ của công nghệ Chuyển đổi văn bản thành giọng nói (TTS)
● Công nghệ TTS ngày càng phổ biến trong nhiều lĩnh vực như tổng đài tự
động, giáo dục, giải trí, trợ lý ảo, nội dung số (YouTube, TikTok, Podcast)...
● Tại Việt Nam, các doanh nghiệp lớn như Viettel AI, FPT.AI, Zalo AI
đang đầu tư mạnh vào công nghệ này, tạo ra sự cạnh tranh và cơ hội phát triển lớn.
● Người dùng ngày càng quan tâm đến các giải pháp AI giúp tự động hóa
và cá nhân hóa nội dung, đặc biệt là trong thời đại số hóa hiện nay.
1.2.2. Nhu cầu cấp thiết về trải nghiệm người dùng tối ưu cho dịch vụ TTS
● Hiện nay, nhiều website cung cấp dịch vụ TTS nhưng chưa tối ưu trải
nghiệm người dùng, dẫn đến khó khăn trong quá trình tìm hiểu, dùng thử và mua dịch vụ.
● Người dùng mong muốn có một giao diện thân thiện, dễ sử dụng, hỗ trợ
thử nghiệm nhanh mà không cần quy trình phức tạp.
● Một website có UX tốt sẽ giúp Viettel AI thu hút thêm khách hàng, tăng
khả năng chuyển đổi từ khách truy cập thành người dùng thực sự.
1.2.3. Cơ hội cải thiện quy trình mua hàng và tích hợp API
● Khách hàng doanh nghiệp và nhà phát triển phần mềm cần một quy trình
mua dịch vụ và tích hợp API đơn giản, rõ ràng.
● Nếu Viettel AI có một hệ thống website dễ sử dụng, hỗ trợ đăng ký nhanh
chóng và thanh toán thuận tiện, khả năng mở rộng thị trường sẽ cao hơn.
● Tạo sự khác biệt so với đối thủ bằng trải nghiệm mua hàng chuyên nghiệp, hiện đại.
1.2.4. Góp phần nâng cao khả năng tiếp cận dịch vụ AI của Viettel AI
● Viettel AI là một trong những đơn vị tiên phong trong lĩnh vực AI tại
Việt Nam, nhưng vẫn cần cải thiện khả năng tiếp cận người dùng thông
qua nền tảng trực tuyến.
● Một website có trải nghiệm tốt sẽ giúp khách hàng nhanh chóng tìm hiểu
và sử dụng dịch vụ, từ đó thúc đẩy sự phát triển của AI "Made in Vietnam".
1.2.5. Kết hợp nghiên cứu UX/UI với chiến lược marketing số
● Website không chỉ cần có giao diện đẹp mà còn phải tối ưu SEO, quảng
bá tốt trên các nền tảng tìm kiếm như Google để thu hút khách hàng.
● Xây dựng nội dung hấp dẫn như blog, case study, hướng dẫn sử dụng sẽ
giúp tăng mức độ nhận diện thương hiệu Viettel AI trong lĩnh vực TTS. 1.3. Mô tả sản phẩm 1.3.1 Tổng quan:
Dịch vụ Chuyển đổi văn bản thành giọng nói của Viettel AI là một giải
pháp công nghệ tiên tiến, cho phép chuyển đổi văn bản viết thành giọng nói một
cách tự nhiên và chân thực. Dịch vụ này được xây dựng trên nền tảng trí tuệ
nhân tạo (AI) mạnh mẽ của Viettel, đảm bảo chất lượng và độ tin cậy cao.
1.3.2. Các tính năng và lợi ích chính:
● Chất lượng giọng nói tự nhiên và chân thực:
○ Sử dụng công nghệ tổng hợp giọng nói tiên tiến, tạo ra âm thanh
gần gũi với giọng nói con người, có ngữ điệu, nhịp điệu và cảm
xúc phù hợp với ngữ cảnh.
○ Giảm thiểu tối đa các âm thanh robot hoặc cứng nhắc thường thấy
ở các dịch vụ chuyển đổi văn bản thành giọng nói truyền thống. ● Đa dạng giọng đọc:
○ Cung cấp nhiều lựa chọn giọng đọc khác nhau, bao gồm giọng
nam, giọng nữ, giọng theo vùng miền (Bắc, Trung, Nam) và các
giọng đọc đặc biệt khác.
○ Cho phép người dùng lựa chọn giọng đọc phù hợp với mục đích sử
dụng và đối tượng người nghe. ● Khả năng tùy chỉnh:
○ Cho phép người dùng điều chỉnh tốc độ đọc, âm lượng, cao độ và
các thông số khác của giọng nói.
○ Hỗ trợ thêm các hiệu ứng âm thanh (nếu có) để tăng tính sinh động và hấp dẫn.
● Tốc độ xử lý nhanh chóng:
○ Chuyển đổi văn bản thành giọng nói trong thời gian ngắn, đáp ứng
nhu cầu sử dụng nhanh chóng và hiệu quả.
○ Tối ưu hóa hiệu suất để xử lý lượng lớn văn bản một cách mượt mà.
● Hỗ trợ nhiều định dạng đầu ra:
○ Cung cấp các định dạng âm thanh đầu ra phổ biến như MP3, WAV, v.v.
○ Cho phép người dùng dễ dàng sử dụng file âm thanh đã chuyển đổi
trên nhiều thiết bị và nền tảng khác nhau. ● Khả năng tích hợp:
○ Cung cấp API (Application Programming Interface) để tích hợp
dịch vụ vào các ứng dụng và nền tảng khác.
○ Cho phép các nhà phát triển dễ dàng nhúng tính năng chuyển đổi
văn bản thành giọng nói vào sản phẩm của mình.
1.3.3. Các điểm khác biệt so với đối thủ cạnh tranh:
● Công nghệ AI tiên tiến của Viettel:
○ Sử dụng các thuật toán và mô hình AI được phát triển bởi đội ngũ
chuyên gia hàng đầu của Viettel.
○ Liên tục cập nhật và cải tiến công nghệ để nâng cao chất lượng và
hiệu suất của dịch vụ.
● Độ chính xác và độ tin cậy cao:
○ Đảm bảo độ chính xác cao trong việc chuyển đổi văn bản, kể cả
với các văn bản phức tạp hoặc có nhiều thuật ngữ chuyên ngành.
○ Hoạt động ổn định và tin cậy, giảm thiểu tối đa các lỗi và sự cố. ● Giá cả cạnh tranh:
○ Cung cấp các gói dịch vụ với mức giá linh hoạt và cạnh tranh, phù
hợp với nhiều đối tượng khách hàng.
○ Có thể có các chương trình khuyến mãi hoặc ưu đãi đặc biệt.
● Dịch vụ hỗ trợ khách hàng chuyên nghiệp:
○ Cung cấp các kênh hỗ trợ khách hàng đa dạng (trò chuyện trực
tiếp, email, điện thoại) để giải đáp thắc mắc và hỗ trợ kỹ thuật.
○ Đội ngũ nhân viên hỗ trợ nhiệt tình và chu đáo.
1.3.4. Các trường hợp sử dụng thực tế:
● Tạo sách nói và podcast:
○ Chuyển đổi sách, truyện, bài viết thành định dạng âm thanh để
người dùng có thể nghe khi di chuyển, tập thể dục hoặc thư giãn.
○ Tạo podcast với giọng đọc chuyên nghiệp và hấp dẫn.
● Lồng tiếng cho video và quảng cáo:
○ Tạo giọng thuyết minh cho video, quảng cáo, phim hoạt hình, v.v.
○ Tiết kiệm chi phí và thời gian so với việc thuê diễn viên lồng tiếng.
● Tạo nội dung cho các ứng dụng giáo dục và giải trí:
○ Tạo giọng đọc cho các bài giảng, hướng dẫn, trò chơi, ứng dụng học ngôn ngữ, v.v.
○ Tăng tính tương tác và hấp dẫn cho người dùng.
● Tự động hóa dịch vụ khách hàng:
○ Sử dụng giọng nói tự động để trả lời các câu hỏi thường gặp, cung
cấp thông tin sản phẩm, thông báo lịch hẹn, v.v.
○ Giảm tải cho nhân viên chăm sóc khách hàng và nâng cao hiệu quả hoạt động.
● Hỗ trợ người khiếm thị tiếp cận thông tin:
○ Chuyển đổi văn bản trên website, tài liệu, sách báo thành giọng nói
để người khiếm thị có thể dễ dàng tiếp cận thông tin.
○ Tạo điều kiện cho người khiếm thị hòa nhập xã hội và học tập.
1.3.5. Các gói dịch vụ và giá cả:
● Cung cấp các gói dùng thử miễn phí để người dùng trải nghiệm dịch vụ.
● Các gói dịch vụ có thể được tính theo:
○ Số lượng ký tự hoặc từ cần chuyển đổi.
○ Thời gian sử dụng dịch vụ.
○ Các tính năng bổ sung (ví dụ: tùy chỉnh giọng đọc nâng cao).
● Giá cả linh hoạt và cạnh tranh, phù hợp với nhu cầu và ngân sách của
từng đối tượng khách hàng.
1.3.6. Thu thập phản hồi từ người dùng:
● Tạo các kênh để người dùng gửi phản hồi, đánh giá và góp ý về dịch vụ.
● Lắng nghe và tiếp thu ý kiến của người dùng để liên tục cải thiện và nâng
cao chất lượng dịch vụ. 1.4. Mục tiêu đề tài
● Mục tiêu của đề tài hướng đến việc tối ưu hóa giao diện, chức năng và
quy trình sử dụng dịch vụ trên website, nhằm nâng cao trải nghiệm khách
hàng và gia tăng tỷ lệ chuyển đổi. Cụ thể, các mục tiêu chính bao gồm:
1. Nghiên cứu nhu cầu và hành vi người dùng Xác định nhóm khách hàng
mục tiêu: cá nhân, doanh nghiệp, nhà phát triển phần mềm. Tìm hiểu
hành vi, nhu cầu và kỳ vọng của người dùng khi sử dụng dịch vụ TTS.
Phân tích khó khăn hiện tại của khách hàng trong quá trình tìm hiểu và mua dịch vụ.
2. Thiết kế và tối ưu trải nghiệm người dùng (UX/UI) trên website Xây
dựng giao diện thân thiện, trực quan, dễ sử dụng. Cải thiện quy trình điều
hướng giúp khách hàng nhanh chóng tiếp cận thông tin cần thiết. Tích
hợp tính năng dùng thử trực tiếp trên website để tăng trải nghiệm thực tế.
3. Đơn giản hóa quy trình đăng ký và mua dịch vụ Tạo hệ thống đăng ký
nhanh chóng, không rườm rà. Hỗ trợ nhiều phương thức thanh toán thuận
tiện (thẻ ngân hàng, ví điện tử, chuyển khoản, v.v.). Cung cấp hướng dẫn
tích hợp API dễ hiểu cho nhà phát triển phần mềm.
4. Nâng cao hiệu quả marketing và khả năng tiếp cận khách hàng Tối ưu
SEO để website dễ dàng xuất hiện trên Google khi khách hàng tìm kiếm.
Xây dựng nội dung thu hút như blog, case study, hướng dẫn sử dụng.
Tích hợp các công cụ quảng cáo, remarketing để tăng cơ hội chuyển đổi khách hàng.
5. Đánh giá hiệu quả và đề xuất cải tiến Thu thập phản hồi từ người dùng về
trải nghiệm website. Đánh giá mức độ hài lòng, tỷ lệ chuyển đổi và đề
xuất cải tiến phù hợp. So sánh với các đối thủ để liên tục tối ưu sản phẩm. II. Cơ sở lý thuyết 2.1. UX là gì ?
2.1.1. Lịch sử ra đời UX:
● Năm 1993 thuật ngữ “User Experience” đã được Don Norman đưa ra
● Khoảng 4000 năm TCN - Phong thủy là UX cổ đại
● Năm 1945, John E. Karlin được thuê thiết kế hệ thống điện thoại tại Bell labs
● Năm 1950, Bell labs đã thiết kế ra Telephone Keypad.
● Năm 1955, Henry Dreyfuss cho ra đời cuốn sách “Designing for people”:
“Khi điểm tiếp xúc giữa sản phẩm và con người trở thành một điểm ma
sát thì thiết kế đó thất bại. Mặt khác nếu con người cảm thấy thoải mái
hơn, háo hức hơn, an toàn hơn, hay đơn giản là hạnh phúc hơn khi tiếp
xúc với sản phẩm thì thiết kế đã thành công”
● Những năm 80 cuộc cách mạng ngành công nghiệp máy tính
● Máy tính cá nhân được dùng cho mọi người đòi hỏi sự cải thiện về khả
năng sử dụng và giao diện sử dụng
● Sự phát triển của ngành internet và website
● Năm 2007 iphone ra đời Thay đổi hành vi sử dụng điện thoại của ➢
người dùng Bắt đầu cho sự phát triển của ứng dụng di động ➢
● Từ năm 1950 đến năm 1983 tăng từ 10 người lên tới 1000 người
● Từ năm 1983 đến 2017 tăng từ 1000 đến 1 triệu người
● Từ năm 2017 đến năm 2050 sẽ tăng từ 1 triệu đến 100 triệu người 2.1.2. Khái niệm:
- UX(viết tắt của User Experience) - Trải nghiệm người dùng: Là nhận
thức và phản ứng của một người với kết quả từ việc sử dụng hoặc dự kiến
sử dụng sản phẩm, hệ thống hoặc dịch vụ
- UX Research được hiểu là nghiên cứu trải nghiệm người dùng, là quá
trình nghiên cứu có hệ thống về trải nghiệm người dùng thông qua
phương pháp quan sát (Observation techniques) và phương pháp phản hồi
(Feedback methodologies) để từ đó, tìm ra “insight” và “pain point” sâu
bên trong tâm trí người dùng (về mong muốn, hành vi, nhu cầu, điểm chạm).
- Mục tiêu cuối cùng của UX Research là tìm kiếm được những dữ liệu giá
trị giúp đưa ra những ý tưởng, giải pháp gần với insight khách hàng nhất
dựa trên thực tế và áp dụng chúng vào quy trình thiết kế.
2.1.3. Các thiết kế khác trong UX design
- Một số phong cách và nguyên tắc thiết kế trong UX design bao gồm:
● Thiết kế Hướng dẫn (Guided Design),
● Thiết kế Dựa trên Ngữ cảnh (Contextual Design),
● Thiết kế Đáp ứng (Responsive Design),
● Thiết kế Tương tác (Interactive Design), …
➔ Mỗi phong cách thiết kế này đều có mục tiêu riêng nhằm cải thiện trải
nghiệm người dùng và đảm bảo rằng sản phẩm đáp ứng được nhu cầu và
mong muốn của họ một cách tốt nhất.
- Một số sản phẩm áp dụng các phong cách và nguyên tắc thiết kế đã nêu:
● Facebook: Ứng dụng di động và trang web mạng xã hội lớn nhất thế giới,
được thiết kế để kết nối và chia sẻ thông tin với bạn bè và gia đình.
● Amazon: Trang web và ứng dụng di động của Amazon cung cấp trải
nghiệm mua sắm trực tuyến, cho phép người dùng tìm kiếm, so sánh và
mua hàng từ một loạt các danh mục sản phẩm.
● Google Maps: Ứng dụng di động cung cấp dịch vụ bản đồ, chỉ đường và
thông tin về giao thông cho người dùng trên toàn thế giới.
● Duolingo: Ứng dụng học ngoại ngữ miễn phí, với giao diện người dùng
đơn giản và trực quan giúp người dùng học một cách hiệu quả và thú vị.
● Adobe Photoshop: Phần mềm chỉnh sửa ảnh và thiết kế đồ họa chuyên
nghiệp, với giao diện và công cụ được thiết kế để hỗ trợ người dùng trong quá trình sáng tạo.
2.2. Phương pháp nghiên cứu người dùng:
- Có 2 phương pháp nghiên cứu người dùng được dùng trong bài
2.2.1. Phương pháp Phỏng vấn người dùng: ● Khái niệm:
○ Phỏng vấn giúp bạn hiểu sâu hơn về giá trị, nhận thức và trải nghiệm với người dùng
○ Cho phép đặt câu hỏi cụ thể, trong khi vẫn để mở để khám phá
quan điểm của người tham gia
○ Áp dụng tốt nhất khi người dùng đang sử dụng sản phẩm
○ Sử dụng để khám phá ý tưởng. ● Ưu, nhược điểm:
○ Có thể hiểu và thấu cảm người dùng, khám phá được những mong muốn từ người dùng
○ Người dùng thường nói khác so với họ hành động
○ Không tiếp cận được số lượng lớn, và mất nhiều thời gian
● Có 3 loại chính của 1 cuộc phỏng vấn:
○ Có thể hiểu và thấu cảm người dùng, khám phá được những mong muốn từ người dùng
○ Người dùng thường nói khác so với họ hành động
○ Không tiếp cận được số lượng lớn, và mất nhiều thời gian
○ Không cấu trúc: các câu hỏi đặt ra là những câu hỏi mở
○ Cấu trúc: đặt ra những câu hỏi đóng, xác định trước các câu trả lời
○ Bán cấu trúc: là sự kết hợp của không cấu trúc và cấu trúc
● Một số lưu ý khi đặt câu hỏi phỏng vấn:
○ Tránh câu hỏi dài, vì họ rất khó nhớ
○ Tránh sử dụng câu ghép, nên tách chúng thành hai câu hỏi.
○ Tránh sử dụng thuật ngữ, ngôn ngữ mà người được phỏng vấn
không thể hiểu. Vì có thể họ sẽ ngại hỏi lại.
○ Tránh những thành kiến trong tiềm thức, luôn đặt ý kiến trung tập cho câu hỏi của bạn.
○ Hãy đặt câu hỏi “What” và “How” trước khi hỏi “Why”
2.2.2. Phương pháp Bảng hỏi ● Khái niệm
○ Là phương pháp thu thập dữ liệu và ý kiến người dùng tốt
○ Có thể sử dụng câu hỏi đóng và mở
○ Có thể sử dụng internet (website, email) hoặc in trên giấy
○ Có thể phân phối tới số lượng lớn người dùng
○ Dùng bảng hỏi trong trường hợp muốn nhận định phương án, ý tưởng ● Ưu nhược điểm
○ Tiếp cận được số lượng lớn người dùng
○ Kết quả nghiên cứu có thể hiện ở dạng định lượng
○ Không khám phá được những ý tưởng mới, thấu hiểu được về người dùng
○ Câu trả lời của người được hỏi có thể không chính xác
○ Người trả lời không được hỗ trợ, gợi ý trả lời câu hỏi ● Các dạng câu hỏi
○ Câu hỏi dạng Checkbox và phạm vi: cho phép người trả lời lựa
chọn một trong số kết quả: Thu nhập trong khoảng nào, giới tính,..
○ Câu hỏi dạng Likert: lấy ý kiến qua 5 thang điểm ■ Hoàn toàn đồng ý ■ Đồng ý ■ Trung lập ■ Không đồng ý
■ Hoàn toàn không đồng ý
○ Câu hỏi thang đối lập: sử dụng các cặp thái độ đối lập và yêu cầu
người được hỏi xác định vị trí trên thanh. 2.3. Quy trình thiết kế 2.3.1. Design Thinking
● Khái niệm: Design thinking hay tư duy thiết kế là một quy trình
sáng tạo giải quyết vấn đề dựa trên sự hiểu biết sâu sắc về người dùng, khách
hàng và thị trường. Phương pháp này có thể giải quyết tất cả những vấn đề từ
đơn giản đến phức tạp, đặc biệt là các vấn đề trừu tượng, khó dự tính trong tương lai.
● Mục tiêu: Mục tiêu của design thinking là tạo ra các giải pháp phù
hợp với nhu cầu, mong muốn và hành vi của người dùng, đồng thời cân nhắc
các yếu tố kỹ thuật, kinh doanh và xã hội. Đây là một kỹ năng quan trọng cho
các nhà lãnh đạo, quản lý trong thời đại số hóa.
● Các bước xây dựng quy trình Design thinking
○ Bước 1: Empathize (Đồng cảm, thấu hiểu)
○ Bước 2: Define (Xác định vấn đề)
○ Bước 3: Ideate (Sáng tạo)
○ Bước 4: Prototype (Xây dựng bản mẫu)
○ Bước 5: Test (Kiểm tra, thử nghiệm)
● Lợi ích của Design thinking
○ Tập trung vào các vấn đề trọng tâm ○ Tận dụng tư duy nhóm
○ Đẩy mạnh tinh thần sáng tạo
2.4. Phương pháp đánh giá 2.4.1. Usability Testing
● Phương pháp này thường được sử dụng trong tất cả các giai đoạn
của việc phát triển sản phẩm và được ưu tiên do độ hiệu quả cao của nó. Đây là
một phương pháp đạt hiệu quả cao trong việc tiến hành đánh giá Usability của
sản phẩm. Phương pháp này bản chất là việc mời người dùng đến một môi
trường trung tính, trong đó đã được chuẩn bị sẵn thiết bị ghi hình và ghi âm, sau
đó có 2-3 người quan sát và ghi chép, 1 người phỏng vấn và người dùng sẽ tiến
hành sử dụng sản phẩm theo yêu cầu của người phỏng vấn đồng thời trả lời các
câu hỏi mà người phỏng vấn đưa ra.
● Quy trình thực hiện phương pháp này bao gồm các bước sau: 1. Lên kế hoạch
2. Xây dựng tiêu chuẩn người dùng mục tiêu ( personal ) 3. Lên kịch bản test
4. Tiến hành Pilot Test (chạy thử) 5. Mời người dùng 6. Tiến hành test thật
7. Tổng hợp và báo cáo kết quả 2.4.2. A/B Testing
● A/B Testing là một phương pháp UX Research phổ biến. Khi triển
khai phương pháp này, bạn sẽ đưa ra hai phiên bản cho một nhóm người dùng
trải nghiệm trong đó, phiên bản gốc là (A) và phiên bản đã cải thiện UX là (B)
để nhận về những lời phản hồi của họ với mỗi phiên bản và tìm ra cách cải thiện
giúp phiên bản sản phẩm tốt hơn.
● Khi thực hiện phương pháp A/B testing, bạn chỉ nên kiểm tra sự
khác biệt của một yếu tố để đem lại kết quả thử nghiệm tốt nhất. ● Ví dụ:
○ Thử nghiệm kích thước nút lớn hoặc nút nhỏ đem lại trải nghiệm tốt hơn
○ Thử nghiệm thanh điều hướng trên top hoặc đặt dưới bottom
○ Thử nghiệm đặt nút cancel ở bên trái hoặc bên phải
○ Thử nghiệm nút “Thử ngay” bằng màu đỏ hoặc màu xanh
III. Phân tích và thiết kế ứng dụng Giai đoạn 1: Empathize
3.1. Nghiên cứu người dùng
3.1.1. Xác định đối tượng nghiên cứu: Khách hàng là cá nhân:
● Tổng quan: Khách hàng cá nhân chủ yếu là người sáng tạo nội dung
(Content Creator), giáo viên, người khiếm thị, người làm công việc tự do
(freelancer). Họ tìm kiếm một công cụ giúp chuyển đổi văn bản thành
giọng nói nhanh chóng, dễ sử dụng, với chi phí hợp lý. ● Nhu cầu chính:
○ Tạo nội dung số chuyên nghiệp mà không cần thu âm thủ công
YouTuber, TikToker, Podcaster cần giọng nói nhân tạo để làm
video, podcast mà không cần thu âm. Tiết kiệm thời gian, công
sức, giảm chi phí thuê người lồng tiếng. Giọng đọc tự nhiên, có
cảm xúc giúp nội dung thu hút hơn.
○ Hỗ trợ học tập & giáo dục Giáo viên, giảng viên cần tạo nội dung
giảng dạy bằng âm thanh để hỗ trợ bài giảng trực tuyến. Học sinh,
sinh viên có thể sử dụng để nghe tài liệu học tập dưới dạng âm thanh thay vì đọc.
○ Hỗ trợ người khiếm thị và người bận rộn Người khiếm thị sử dụng
công nghệ TTS để tiếp cận nội dung văn bản bằng âm thanh.
Người bận rộn có thể dùng TTS để chuyển tài liệu, sách báo thành
âm thanh để nghe khi di chuyển.
○ Dùng thử miễn phí & trải nghiệm dễ dàng Cần giao diện trực quan,
dễ thao tác mà không cần hiểu biết kỹ thuật. Muốn có tùy chọn
dùng thử miễn phí trước khi quyết định mua dịch vụ. Hỗ trợ nhiều
ngôn ngữ và giọng đọc khác nhau.
Khách hàng là các doanh nghiệp:
● Tổng quan: Doanh nghiệp sử dụng TTS để tự động hóa dịch vụ khách
hàng, tối ưu quy trình vận hành và tăng hiệu suất nội dung số. Nhóm
khách hàng này gồm công ty viễn thông, ngân hàng, giáo dục, thương
mại điện tử, truyền thông, phát thanh,… ● Nhu cầu chính :
○ Tích hợp API vào hệ thống tổng đài, chatbot, trợ lý ảo Các công ty
viễn thông, ngân hàng, dịch vụ cần tổng đài tự động để hỗ trợ
khách hàng 24/7. Doanh nghiệp muốn tích hợp TTS vào chatbot,
trợ lý ảo để cung cấp dịch vụ thông minh. Yêu cầu tài liệu API rõ ràng, dễ tích hợp.
○ Tạo nội dung quảng cáo, tiếp thị tự động Doanh nghiệp truyền
thông, quảng cáo cần giọng đọc tự nhiên để tạo nội dung marketing
(quảng cáo radio, video). Cần nhiều giọng đọc, khả năng điều
chỉnh ngữ điệu theo ngữ cảnh.
○ Ứng dụng trong giáo dục và đào tạo Công ty cung cấp nền tảng
học trực tuyến muốn chuyển đổi giáo trình thành giọng nói để tạo
khóa học audio. Tích hợp giọng đọc AI vào ứng dụng học ngôn ngữ hoặc sách nói.
○ Tối ưu chi phí, giảm phụ thuộc vào nhân sự Doanh nghiệp muốn
giảm chi phí thuê MC, người lồng tiếng chuyên nghiệp. TTS giúp
tự động hóa nhiều quy trình, giảm thời gian sản xuất nội dung.
○ Bảo mật & hỗ trợ đa nền tảng Doanh nghiệp cần hệ thống bảo mật
dữ liệu cao khi sử dụng giọng nói AI. Hỗ trợ trên nhiều nền tảng:
website, ứng dụng di động, thiết bị IoT.
3.1.2. Chuẩn bị trước nghiên cứu: a) Kế hoạch nghiên cứu:
Đề ra các giai đoạn nghiên cứu bao gồm nghiên cứu định lượng (khảo
sát) và định tính (phỏng vấn, nhóm tập trung). · Mục tiêu:
● Hiểu sâu hơn về nhu cầu, kỳ vọng và khó khăn mà người
dùng gặp phải khi sử dụng dịch vụ.
● Xác định các yếu tố tác động (cả tích cực và tiêu cực) đến
trải nghiệm của người dùng.
● Đưa ra các đề xuất cải tiến về tính năng, quy trình sử dụng và giao diện người dùng
· Thời gian nghiên cứu: Dự kiến kéo dài 2-3 tuần, với từng giai đoạn rõ ràng. o
Tuần 1: Thu thập dữ liệu định lượng thông qua khảo sát. o
Tuần 2: Thực hiện các cuộc phỏng vấn cá nhân. o
Tuần 3: Tổ chức các buổi nghiên cứu nhóm tập trung.
b) Chuẩn bị công cụ, dụng cụ:
· Khảo sát trực tuyến: Sử dụng các nền tảng như Google Forms,
Typeform, SurveyMonkey để dễ dàng thu thập thông tin từ nhiều người dùng.
· Phỏng vấn cá nhân: Ghi âm hoặc sử dụng các công cụ trực tuyến
(Zoom, Google Meet) để thực hiện cuộc phỏng vấn từ xa. Các công cụ ghi âm
như Otter.ai cũng giúp ghi lại và chuyển đổi lời nói thành văn bản dễ dàng.
· Nhóm tập trung: Sử dụng phòng họp hoặc môi trường trực tuyến để
tổ chức các cuộc thảo luận nhóm. Zoom hoặc Microsoft Teams có thể được sử dụng cho việc này. c) Hẹn người dùng:
· Tìm kiếm người dùng tiềm năng: Liên hệ qua email, mạng xã hội,
hoặc từ các khách hàng đã từng đặt bàn tại nhà hàng.
· Lịch hẹn: Xác nhận lịch phù hợp cho từng nhóm đối tượng, đảm
bảo có đủ thời gian cho các phiên phỏng vấn hoặc thảo luận nhóm (30-60 phút mỗi phiên). 3.1.3. Câu hỏi khảo sát
- Phạm vi khảo sát: Lứa tuổi từ 18-65 tuổi ở Việt Nam
- Công cụ sử dụng: Google Forms - Mục tiêu khảo sát:
● Tìm ra điểm mà người dùng thích và không thích ở ứng dụng
● Thu được thêm dữ liệu để thiết kế chức năng của ứng dụng phù hợp với người dùng
- Thời gian khảo sát: 3 ngày - Link khảo sát: - Kết quả khảo sát