


Preview text:
Đề tài 1:
Đọc hiểu ontology CHeVIE (Xem file ontology CHeVIE.owl và file PDF CHeVIE.pdf) Yêu cầu cơ bản:
1. Cho biết đây là loại ontology OWL nào, OWL Lite, DL, Hay Ful . Giải thích?
2. Theo bạn, với yêu cầu là một ontology xoay quanh 6 chủ đề: 1-historical figures,
2historical sites, 3-historical events, 4-cultural festivals, 5-administrative divisions, và
6-dynasties, nên sử dụng loại OWL nào là phù hợp, vì sao?
3. Bổ sung thêm các label, comment cho các thuật ngữ (lớp, thuộc tính, …) 4. Bổ sung
thêm ngữ nghĩa, thêm luật cho ontology. Giải thích tại sao phải bổ sung?
5. Đề xuất xóa, thêm, sửa, … ontology như thế nào cho phù hợp? Giải thích?
Đề tài 1A. Yêu cầu:
1. Thu thập dữ liệu cấu trúc từ các kho dữ liệu Linked Open Data, DBPedia, Wikidata,
hoặc từ các trang web khác để tạo dữ liệu cho ontology.
2. Sử dụng LLM với mô hình Multi-Agent (xem file Multi-Agent Model.pdf) thực hiện
xử lý ngôn ngữ tự nhiên cho các nội dung văn bản lấy được từ các websites về 6
chủ đề nói trên, để trích xuất dữ liệu
3. Tích hợp các dữ liệu thu thập được và đưa vào ontology
4. Đưa ra một số truy vấn minh họa
Đề tài 1B. Yêu cầu:
1. Khảo sát các phương pháp cho phép người dùng cuối (không có kiến thức về công
nghệ thông tin) có thể truy vấn dữ liệu ngữ nghĩa.
2. Khảo sát các phương pháp chuyển đổi từ truy vấn bằng ngôn ngữ tự nhiên sang truy vấn SPARQL
3. Khảo sát khả năng của LLM trong việc chuyển đổi từ truy vấn ngôn ngữ tự nhiên sang truy vấn SPARQL
4. Sử dụng LLM với mô hình Multi-Agent (xem file Multi-Agent Model.pdf) để giải
quyết bài toán chuyển đổi từ truy vấn ngôn ngữ tự nhiên sang truy vấn SPARQL.
Thực nghiệm với ontology CHeVIE.
5. Lưu ý: Với các yêu cầu khảo sát, cần tìm các bài báo khoa học và các ứng dụng
phần mềm. Phân tích chuyên sâu cách tiếp cận, ưu nhược điểm của từng phương pháp
Đề tài 2: Hỏi đáp tư vấn sản phẩm cho các trang thương mại điện tử Yêu cầu:
1. Chọn một hoặc một vài loại mặt hàng (điện thoại, máy tính, máy tính bảng, quạt, điều
hòa, máy hút ẩm, máy rửa bát, …)
2. Thu thập dữ liệu ở nhiều website khác nhau
a. Dữ liệu có cấu trúc
b. Review, đánh giá của khách hàng
c. Dữ liệu văn bản mô tả sản phẩm. Có thể sử dụng LLM với mô hình
MultiAgent (xem file Multi-Agent Model.pdf) thực hiện xử lý ngôn ngữ tự
nhiên cho các nội dung văn bản này, để trích xuất dữ liệu đưa vào ontology d. …
3. Xây dựng ontology mô tả nhiều nhất có thể các thông tin về mặt hàng đã chọn, sao
cho phục vụ tư vấn được đa dạng các câu hỏi của khách hàng
4. Thêm ràng buộc ngữ nghĩa, luật suy diễn vào ontology
5. Sử dụng LLM với mô hình Multi-Agent (xem file Multi-Agent Model.pdf) để giải
quyết bài toán chuyển đổi từ câu hỏi bằng ngôn ngữ tự nhiên sang truy vấn
SPARQL. Thực hiện truy vấn dữ liệu trên ontology và tổng hợp dữ liệu trả về cho
người dùng. Có thể kết hợp với các mô hình RAG (Retrieval-Augmented Generation) là để lấy dữ liệu .
Đề tài 3: Tự đề xuất
Lưu ý: Đề tài cần có ý nghĩa nếu muốn được đánh giá cao Cách thức nộp Project Các yêu cầu:
• Tạo thư mục nhóm (Group 01, Group 07, Group 12, …) trên
https://drive.google.com/drive/folders/1Oqi83xNqcACyeojzirLreNdFE-Uf1iXa? usp=sharing
• Sản phẩm cần nộp (lưu ý, nộp các file riêng lẻ, không nộp file zip o Báo cáo: trình
bày chi tiết, văn phong khoa học, tương tự như khi viết publication/viết sách. Không
gạch đầu dòng, phải triển khai thành các đoạn văn. Mỗi đoạn một ý. Các câu đúng
ngữ pháp, đầy đủ thành phần câu.
o Slide trình bày o Video demo o
Mã nguồn chương trình o Các file
tài nguyên (dữ liệu, …)
• Báo cáo cần có các nội dung sau:
o Phân công công việc các thành viên trong nhóm o % đóng góp (con số
lượng hóa cụ thể) của từng thành viên
o Thống kê chi tiết dữ liệu thu thập được (Với đề tài 1A). Giải thích chi tiết
cách thức thu thập, xử lý dữ liệu.
o Chi tiết các ứng dụng kiến trúc LLM-based Multi Agents, tại sao lại có các
thành phần như thế, vai trò của từng thành phần, các thành phần kết hợp
với nhau như thế nào, … o Giải thích chi tiết công nghệ sử dụng, thuật toán hay (nếu có)
o Hướng dẫn sử dụng ngắn gọn + 1 số ảnh quan trọng demo chương trình
• Tiêu chí đánh giá: o Đề tài o Sản phẩm đạt được o Báo cáo o Slide o
Kỹ năng thuyết trình o Đóng góp của thành viên
trong nhóm Thời gian bảo vệ?