













Preview text:
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐÔNG Á
KHOA CÔNG NGHỆ THÔNG TIN
BÀI TẬP LỚN
HỌC PHẦN: CÔNG NGHỆ ĐA PHƯƠNG TIỆN
NHÓM ĐỀ TÀI: 2. HÌNH ẢNH VÀ KỸ THUẬT XỬ LÝ HÌNH ẢNH
Đề tài: 2.49: Phát triển sản phẩm Multimedia –
TVC Quảng Cáo Bia Heineken Bằng AI
Sinh viên thực hiện | Lớp | Khóa |
Vũ Văn Huy | DCCNTT13.10.14 | K13 |
Nguyễn Hữu Thành Long | DCCNTT13.10.14 | K13 |
Hoàng Tô Thành | DCCNTT13.10.14 | K13 |
Hoàng Nguyễn Tuấn | DCCNTT13.10.14 | K13 |
Giảng viên giảng dạy: .................................................................
Bắc Ninh, ngày ........ tháng ........ năm 2024
MỤC LỤC
(Trình bày trong trang riêng)
DANH MỤC CÁC TỪ VIẾT TẮT...............................................................4
DANH MỤC BẢNG BIỂU VÀ SƠ ĐỒ.........................................................5
CHƯƠNG 1. TỔNG QUAN VỀ ĐỀ TÀI.......................................................7
1.1 Giới thiệu về Công nghệ Đa phương tiện (Multimedia).......................7
1.2 Lý do chọn đề tài................................................................................7
1.3 Mục tiêu nghiên cứu.............................................................................7
1.4 Phạm vi nghiên cứu..............................................................................8
1.5 Ý nghĩa thực tiễn..................................................................................8
CHƯƠNG 2. GIỚI THIỆU VỀ CÔNG CỤ, PHẦN MỀM AI.......................8
2.1 Giới thiệu về TVC và AI tạo sinh video.............................................8
2.2 Chức năng các công cụ AI..................................................................9
2.3 Xử lý dữ liệu và quy trình sản xuất..................................................12
CHƯƠNG 3. CÀI ĐẶT / THIẾT KẾ.............................................................13
Module 1: Tạo kịch bản và hình ảnh......................................................13
Module 2: Tạo video và hậu kỳ...............................................................15
CHƯƠNG 4. KẾT LUẬN.................................................................................17
4.1 Kết quả đạt được.................................................................................17
4.2 Hạn chế...............................................................................................17
4.3 Kiến nghị và hướng phát triển...........................................................18
DANH MỤC SÁCH THAM KHẢO..............................................................19
DANH MỤC CÁC TỪ VIẾT TẮT (Nếu có)
(trình bày trong trang riêng)
STT | Chữ viết tắt | Giải thích |
1 | AI | Artificial Intelligence (Trí tuệ nhân tạo) |
2 | TVC | Television Commercial (Quảng cáo truyền hình) |
3 | LLM | Large Language Model (Mô hình ngôn ngữ lớn) |
4 | FPS | Frames Per Second (Khung hình trên giây) |
5 | UHD | Ultra High Definition (Độ phân giải siêu cao) |
DANH MỤC BẢNG BIỂU VÀ SƠ ĐỒ (Nếu có)
(trình bày trong trang riêng)
Số hiệu | Tên | Trang |
Hình 2.1 | Giao diện công cụ Kling AI | 9 |
Hình 2.2 | Giao diện MidJourney trên Discord | 11 |
Hình 2.3 | Quy trình tạo video với Runway Gen-2 | 12 |
Hình 3.1 | Storyboard TVC Heineken được tạo bằng AI | 18 |
Hình 3.2 | Kết quả frame ảnh từ MidJourney | 19 |
Hình 3.3 | Video clip hoàn chỉnh xuất từ Kling AI | 20 |
Lưu ý
- Các sơ đồ, hình vẽ, bảng biểu phải có tên và số thứ tự được sắp xếp theo chương.
- Đối với sơ đồ, hình vẽ, đồ thị thì tên được đặt ở dưới.
- Đối với bảng số liệu thì tên đặt ở trên.
CHƯƠNG 1. TỔNG QUAN VỀ ĐỀ TÀI
1.1 Giới thiệu.
Multimedia (Đa phương tiện) là sự kết hợp của nhiều dạng phương tiện như văn bản (text), hình ảnh (image), âm thanh (audio), video và tương tác (interactive) trong một sản phẩm thống nhất. Sản phẩm Multimedia phổ biến gồm: trang web, ứng dụng di động, phim hoạt hình, game, TVC quảng cáo, thực tế ảo (VR/AR).
Bài tập lớn này thực hiện một sản phẩm Multimedia thực tiễn: TVC quảng cáo bia Heineken 30 giây được tạo hoàn toàn bằng công cụ AI tạo sinh (Generative AI), thể hiện sự giao thoa giữa Công nghệ đa phương tiện và Trí tuệ nhân tạo trong thời đại số.
1.2 Lý do chọn đề tài.
- AI đang cách mạng hóa ngành sản xuất nội dung quảng cáo – nắm bắt xu hướng này là kỹ năng thiết yếu cho sinh viên CNTT.
- TVC Heineken là case study lý tưởng: thương hiệu toàn cầu, phong cách điện ảnh đặc trưng, thông điệp cảm xúc mạnh mẽ.
- Tổng hợp toàn diện kiến thức môn học: xử lý ảnh, âm thanh, video, đồ họa và kỹ thuật AI tạo sinh.
- Chi phí gần bằng 0, thời gian rút ngắn từ vài tuần còn 1-2 ngày – chứng minh sức mạnh dân chủ hóa của AI.
CHƯƠNG 2. GIỚI THIỆU VỀ CÔNG CỤ, PHẦN MỀM
2.1 Giới thiệu.
2.1.1 TVC là gì?
TVC (Television Commercial) là đoạn phim ngắn 15 giây đến vài phút quảng bá sản phẩm/thương hiệu qua TV, YouTube, mạng xã hội. Một TVC hiệu quả cần kết hợp hình ảnh, âm thanh, kịch bản và thông điệp thương hiệu nhất quán.
2.1.2 AI tạo sinh (Generative AI) là gì?
AI tạo sinh là nhóm mô hình AI có khả năng tạo nội dung mới (hình ảnh, video, âm thanh) từ văn bản mô tả (prompt), dựa trên kiến trúc Diffusion Model và Transformer. Trong sản xuất TVC, AI đảm nhận toàn bộ pipeline: kịch bản (ChatGPT) → hình ảnh (MidJourney) → video (Kling AI) → nhạc (Suno AI) → dựng phim (CapCut).
2.2 Chức năng.
2.2.1 Kling AI – Tạo video từ hình ảnh.
Kling AI (Kuaishou) tạo video đến 2 phút, độ phân giải 1080p từ hình ảnh + mô tả chuyển động. Nổi bật với mô phỏng vật lý chân thực (bọt bia, chất lỏng), Camera Control (zoom, pan, tilt) và Motion Brush – vẽ vùng chuyển động trực tiếp trên ảnh.
2.2.2 MidJourney – Tạo hình ảnh AI.
MidJourney v6.1 tạo hình ảnh điện ảnh chất lượng cao qua Discord. Các tính năng chính: Text-to-Image (tạo ảnh từ prompt), Vary Region (chỉnh sửa vùng cụ thể), Upscale 4x và Style Reference (giữ nhất quán phong cách toàn TVC).
2.2.3 Suno AI – Tạo nhạc nền.
Suno AI tạo nhạc nền bản quyền riêng từ mô tả văn bản – không cần mua license. Hỗ trợ đa dạng thể loại, xuất file MP3 chất lượng cao, phù hợp đồng bộ với nhịp TVC.
2.2.4 CapCut / Adobe Premiere – Dựng phim.
CapCut (miễn phí, AI tích hợp) và Adobe Premiere Pro (chuyên nghiệp, tích hợp Adobe Firefly) được dùng để ghép clip, thêm chuyển cảnh, đồng bộ âm nhạc và xuất TVC hoàn chỉnh.
2.3 Xử lý dữ liệu.
2.3.1 Quy trình pipeline tổng thể.
Quy trình sản xuất TVC theo mô hình pipeline tuyến tính 5 bước:
- Bước 1 – Kịch bản: ý tưởng → script 5 cảnh (ChatGPT)
- Bước 2 – Hình ảnh: script → 15 key frames JPG/PNG 2048x1152px (MidJourney)
- Bước 3 – Video: key frames → 5 clips MP4 3-5s/clip (Kling AI)
- Bước 4 – Âm nhạc: mô tả phong cách → nhạc nền MP3 30s (Suno AI)
- Bước 5 – Dựng phim: clips + audio → TVC MP4 Full HD hoàn chỉnh (CapCut)
2.3.2 Định dạng dữ liệu.
Hình ảnh: JPG/PNG 1024–2048px. Video: MP4 H.264, 1920×1080, 24fps. Âm thanh: MP3 320kbps, 30s. Sản phẩm cuối: MP4 H.264, 1920×1080 Full HD, 30fps, AAC 192kbps, ~30MB.
CHƯƠNG 3. CÀI ĐẶT / THIẾT KẾ
Module 1: Tạo kịch bản và hình ảnh.
Bước 1 – Viết kịch bản bằng ChatGPT.
Prompt: "Viết kịch bản TVC 30 giây cho Heineken, chủ đề Kết nối bạn bè – Sống trọn khoảnh khắc, 5 cảnh, phong cách điện ảnh sang trọng."
Kết quả – 5 cảnh: (1) Mở nắp chai Heineken; (2) Nhóm bạn tại quán bar; (3) Cận cảnh rót bia; (4) Chạm ly; (5) Logo + tagline Open Your World.
Bước 2 – Tạo key frames bằng MidJourney.
Prompt mẫu: "/imagine cinematic close-up Heineken beer poured into crystal glass, golden foam, studio lighting, 8K ultra realistic --ar 16:9 --v 6.1"
Kết quả: 15 key frames 2048×1152px, chọn frame đẹp nhất cho mỗi cảnh.

Hình 3.1: Cảnh mở đầu TVC – Chai Heineken dưới ánh đèn xanh điện ảnh

Hình 3.2: Cảnh cận cảnh chai bia Heineken đọng sương – tạo bằng Kling AI
Module 2: Tạo video và hậu kỳ.
Bước 3 – Tạo video clips bằng Kling AI.
Prompt mẫu: "Camera slowly zooms in, beer foam rises with realistic physics, condensation forming, warm light, 5 seconds, cinematic quality."
Kết quả: 5 clips MP4, 1920×1080, 24fps, mỗi clip 3-5 giây.
Bước 4 – Tạo nhạc nền bằng Suno AI.
Prompt: "Upbeat electronic jazz, premium beer commercial, no vocals, 30 seconds, cinematic advertising music."
Kết quả: Chọn 1 trong 4 bản nhạc phù hợp nhất với cảm xúc TVC.
Bước 5 – Dựng phim và xuất sản phẩm trong CapCut.
- Import 5 clips, sắp xếp theo kịch bản, chuyển cảnh cross dissolve 0.5s.
- Ghép nhạc nền, chỉnh âm lượng, thêm text tagline cuối.
- Color grading: tăng warm tones, contrast để đạt màu điện ảnh.
- Xuất: MP4 H.264, 1920×1080, 30fps – file ~30MB, Full HD.
CHƯƠNG 4. KẾT LUẬN
4.1 Kết quả đạt được.
- TVC Heineken 30 giây hoàn chỉnh: hình ảnh điện ảnh, âm thanh chuyên nghiệp, thông điệp rõ ràng – toàn bộ bằng AI.
- Quy trình 5 bước chuẩn hóa, tái sử dụng được cho nhiều dự án quảng cáo khác.
- Chi phí gần bằng 0, thời gian sản xuất 1-2 ngày thay vì vài tuần theo phương pháp truyền thống.

Hình 4.1: Cảnh bọt bia vàng óng trong TVC Heineken – kết quả từ Kling AI
4.2 Hạn chế.
- AI khó duy trì ngoại hình nhân vật nhất quán xuyên suốt nhiều cảnh quay.
- Không kiểm soát 100% đầu ra – một số chi tiết cần xử lý thủ công sau.
- Vấn đề bản quyền nội dung AI tạo ra chưa được giải quyết rõ ràng về mặt pháp lý.
4.3 Kiến nghị và hướng phát triển.
- Áp dụng IP-Adapter, ControlNet để duy trì nhất quán nhân vật trong TVC dài hơn.
- Cá nhân hóa nội dung: AI tự động tạo nhiều phiên bản TVC cho từng nhóm khán giả.
- Xây dựng framework pháp lý rõ ràng về bản quyền AI tại Việt Nam cho sử dụng thương mại.
Danh mục sách tham khảo
[1]. Trang web https://klingai.com [tham khảo tháng 1 năm 2024]
[2]. Trang web https://midjourney.com [tham khảo tháng 12 năm 2023]
[3]. Trang web https://runwayml.com [tham khảo tháng 1 năm 2024]
[4]. Trang web https://suno.ai [tham khảo tháng 1 năm 2024]
[5]. Trang web https://openai.com/sora [tham khảo tháng 1 năm 2024]
[6]. Tài liệu bài giảng môn Công nghệ Đa phương tiện – Trường ĐH Công nghệ Đông Á, năm 2024.
[7]. Ho, J., Jain, A., & Abbeel, P., Denoising Diffusion Probabilistic Models, NeurIPS 2020, Curran Associates.