Bài tiểu luận môn Kỹ thuật lập trình đề tài "Tìm hiểu Amazon translate và viết ứng dụng minh họa"

Bài tiểu luận môn Kỹ thuật lập trình đề tài "Tìm hiểu Amazon translate và viết ứng dụng minh họa" của Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh với những kiến thức và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả cao cũng như có thể vận dụng tốt những kiến thức mình đã học vào thực tiễn cuộc sống. Mời bạn đọc đón xem!

 

lOMoARcPSD|36991220
.
TRƯỜNGĐẠIHỌCSƯPHẠMKỸTHUẬTTP.HỒCHÍMINH
KHOAĐÀOTẠOCHẤTLƯỢNGCAO
BỘMÔNĐIỆNTOÁNĐÁMMÂY
-----
-----
TÊNĐỀTÀI:
TÌM HIỂU AMAZON TRANSLATE
GVDH:TS.HunhXnPhụng
SVTH:
NgôHngDuy
19145166
BùingDanh
19110008
TP.HCM,tháng12năm2022
lOMoARcPSD|36991220
MỤC LỤC
LỜI CẢM ƠN .............................................................. Error! Bookmark not defined.
1. Tính cấp thiết của ề tài ........................................................................................ 2
2. Đối tượng nghiên cứu ......................................................................................... 3
3. Phạm vi nghiên cứu ............................................................................................. 3
4. Bố cục ề tài .......................................................................................................... 3
5. Kết quả dự kiến ạt ược ........................................................................................ 3
PHẦN NỘI DUNG .................................................................................................... 5
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ AMAZON TRANSLATE ..................... 5
1. Tổng quan về Amazon Translate ........................................................................ 5
2. Các bước sử dụng dịch vụ Amazon Translate .................................................... 9
3. So sánh và phân tích dịch vụ Amazon Translate và Google Translate ............ 11
4. Tìm hiểu một số dịch vụ kết hợp vào ề tài ........................................................ 13
CHƯƠNG 2: XÂY DỰNG ỨNG DỤNG MINH HỌA ........................................ 14
PHẦN KẾT LUẬN .................................................................................................. 32
1. Kết quả ạt ược ................................................................................................... 32
1.1. Nền tảng kiến thức ..................................................................................... 32
1.2. Vận dụng .................................................................................................... 32
2. Ưu iểm ............................................................................................................... 32
3. Nhược iểm ......................................................................................................... 32
4. Hướng phát triển ............................................................................................... 32
TÀI LIỆU THAM KHẢO ...................................................................................... 34
PHẦN MỞ ĐẦU
1. Tính cấp thiết của ề tài
Ngày nay, vấn ngôn ngữ luôn mi quan tâm lớn nhất trong cuộc sống bởi
ngôn ngữ kết nối con người với con người, kể cả với công nghệ. Bạn không nên ể
ngôn ngữ trở thành rào cản trong thời ại công nghệ 4.0, nhưng không phải ai cũng
có thể học một ngôn ngữ nào ó trước cần sử dụng nó.
lOMoARcPSD|36991220
Nhận thấy vấn này, người ta không ngừng tìm kiếm và sáng tạo ra những
công cụ dịch thuật giúp mọi người kết nối với nhau, vượt qua mọi rào cản và xóa
bỏ mọi khoảng cách ngôn ngữ một cách hiệu quả, chẳng hạn như:
Google Translate,...
Khi ược học về iện toán ám mây, chúng em hội tiếp cận với nền tảng
hệ sinh thái Amazon Web Services (AWS) hoàn toàn mới, sau khi tìm hiểu,
chúng em nhận ra rằng dịch vụ htrợ dịch thuật chính là Amazon Translate.
vậy, với mong muốn học ngoại ngữ trong thời ại chuyển ổi số, chúng em quyết
ịnh áp dụng chủ ề: “Tìm hiểu Amazon Translate và viết ứng dụng minh họa”.
2. Đối tượng nghiên cứu
Đối với ề tài này, chúng em tập trung nghiên cứu các ối tượng sau:
- Dịch vụ Amazon Translate
- Dịch vụ Amazon Polly
- Dịch vụ Amazon EC2
- Dịch vụ Amazon S3
3. Phạm vi nghiên cứu
Chúng em sẽ nghiên cứu các kiến thức bản về Amazon Translate, các tính
năng của nó, cách thức hoạt ộng, chi phí vận hành và cách ưa ứng dụng Amazon
Translate vào thực tế. So sánh Amazon Translate và Google Translate.
Ngoài ra, chúng em cũng sẽ tìm hiểu thêm về Amazon Polly, S3 mở rộng
chủ ề thêm mt phần nào ó và sử dụng EC2 ể deploy web app.
4. Bố cục ề tài
Chương 1: Cơ sở thuyết về Amazon Translate.
Chương 2: Xây dựng ứng dụng minh họa.
5. Kết quả dự kiến ạt ược
Với ề tài nghiên cứu này, chúng em dự ịnh thực hiện các nhiệm vụ sau:
- Tìm hiểu tổng quan về Amazon Translate, cách thức hoạt ộng, tính năng,
lợi ích ặc iểm của nó.
- Xây dựng một trang web dịch các từ tài liệu sang nhiều ngôn ngữ bằng
dịch vụ Amazon Translate.
lOMoARcPSD| 36991220
- Tính năng chuyển văn bản thành giọng nói giúp người dùng giao tiếp trực
quan hơn với người khác bằng cách tìm hiểu thêm về Amazon Polly.
- Ứng dụng ược deploy lên AWS.
lOMoARcPSD|36991220
PHẦN NỘI DUNG
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ AMAZON TRANSLATE
1. Tổng quan về Amazon Translate
1.1. Khái niệm
Amazon Translate dịch vụ máy dịch ứng dụng mạng nơron cung cấp
bản dịch ngôn ngữ nhanh chóng, chất lượng cao, giá cả phải chăng và có thể tùy
chỉnh. Dịch máy sdụng mạng nơ-ron hình thức tự ộng hóa công việc dịch
thuật sử dụng hình deep learning ưa ra bản dịch chính xác hơn và văn
phong tự nhiên hơn các thuật toán dịch thuật theo quy tắc thống truyền
thống.
Với Amazon Translate, bạn thể bản ịa hóa các nội dung như trang web
ứng dụng cho bộ phận người dùng a dạng, dễ dàng dịch khối lượng lớn văn bản
phân tích, và cho phép giao tiếp a ngôn ngữ mt cách hiệu quả giữa nhiều người
dùng.
Gần ây, Intento ã xếp hạng Amazon Translate nhà cung cấp dịch máy
hàng ầu trong năm 2020 với 14 cặp ngôn ngữ, 16 lĩnh vực công nghiệp và 8 loại
nội dung.
Công nghệ sử dụng: API deep learning dựa trên ám mây.
1.2. Lợi ích mà Amazon Translate em lại
- Độ chính xác cao và khả năng cải thiện liên tục
Amazon Translate dịch vụ dịch máy sử dụng mạng nơron. Công cụ dịch
thuật này liên tục cải thiện từ các bộ dữ liệu mới và mở rộng nhm ưa ra bản dịch
chính xác hơn cho nhiều trường hợp sử dụng a dạng.
- Dễ dàng tích hợp vào ứng dụng
Amazon Translate loại bỏ i sự phức tạp của việc phải xây dựng các khả năng
dịch thuật thời gian thực và dịch thuật hàng loạt trong ứng dụng của chúng ta chỉ
bằng một lệnh gọi API ơn giản. Việc này khiến công tác bản ịa hóa ứng dụng hoặc
trang web, hoặc xử dữ liệu a ngôn ngữ trong quy trình công việc hiện tại trở
nên dễ dàng.
lOMoARcPSD| 36991220
- Có thể tùy chỉnh
Với tính năng Custom Terminology Active Custom Translate, Amazon
Translate cho phép chúng ta tùy chính ầu ra máy dịch. Dùng Custom Terminology
xác ịnh cách dịch tên thương hiệu, tên mẫu các thuật ngữ ặc biệt khác.
Dùng Active Custom Translation ể tạo ầu ra máy dịch tùy chỉnh sao cho phù hợp
với các nhu cầu cụ thể mà miền ó ặt ra. Chúng ta không cần xây dựng hình
dịch tùy chỉnh, có thể cập nhật mô hình bất cứ khi nào chúng ta muốn và chỉ phải
trả cho số lượngtự cần dịch.
- Tiết kiệm chi phí
Với sức mạnh của dịch máy, Amazon Translate có giá rẻ hơn 1000 lần so với
việc sử dụng thông dịch viên chuyên nghiệp ể dịch một cách thủ công.
- Có khả năng mở rộng
chỉ vài từ hay khối lượng văn bản lớn, Amazon Translate ều dễ dàng
thay ổi quy mô theo nhu cầu dịch thuật với quá trình dịch nhanh chóng và áng tin
cậy.
- Linh hoạt
Amazon Translate thể dịch nhiều ịnh dạng nội dung khác nhau, bao gồm
văn bản Word, bài thuyết trình Powerpoint và bảng tính Excel.
1.3. Trường hợp sử dụng
- Bản ịa hóa ngôn ngữ
Các ội ngũ dịch giả rất khó thể bắt kịp nội dung ộng hoặc thời gian thực.
Tuy nhiên với Amazon Translate, chúng ta thể dễ dàng dịch thuật khối lượng
nội dung khổng lồ do người dùng tạo theo thời gian thực. Các trang web ứng
dụng có thể tự ộng sáng tạo nội dung như câu chuyện trên nguồn cấp tin, mô tả hồ
và bình luận bằng ngôn ngữ mà người dùng muốn chỉ bằng một lần nhấp chuột
vào nút “dịch”.
- Phân tích văn bản
Với Amazon Translate, chúng ta không còn vướng phải rào cản ngôn ngữ.
thể vừa nắm bắt ược “tình cảm hội” của thương hiệu, sản phẩm hoặc dịch vụ
của chúng ta, vừa theo dõi các cuộc hội thoại trực tuyển bằng nhiều ngôn ngữ khác
nhau.
lOMoARcPSD|36991220
- Giao tiếp
Amazon Translate thể cung cấp bản dịch tự ộng tạo iều kiện giao tiếp a
ngôn ngữ giữa các người dùng. Bằng cách bổ sung khả năng dịch thuật thời gian
thực vào tính năng trò chuyện, email, tổng ài hỗ trợ và ứng dụng nhận yêu cầu, ơn
vị hoặc nhân viên nói tiếng Anh có thể giao tiếp với khách hàng bằng nhiều ngôn
ngữ khác nhau.
Có thể sử dụng Amazon Translate ể thực hiện những việc sau:
- Kích hoạt trải nghiệm người dùng a ngôn ngữ trong các ứng dụng của bạn
bằng cách tích hợp Amazon Translate:
+ Dịch nội dung do công ty soạn thảo, chẳng hạn như biên bản cuộc họp,
báo cáo kỹ thuật viên, bài báo cơ sở kiến thức, bài ăng, v.v.
+ Dịch thông tin liên lạc giữa các nhân, chẳng hạn như email, trò
chuyện trong trò chơi, trò chuyện dịch vụ khách hàng, ể khách hàng và nhân
viên có thể kết nối bằng ngôn ngữ ưa thích của họ.
- Xử lý và quản lý dữ liệu ến của công ty bạn:
+ Phân tích văn bản, chẳng hạn nmạng hội nguồn cấp tin tức,
bằng nhiều ngôn ngữ.
+ Tìm kiếm thông tin, chẳng hạn như các trường hợp khám phá iện tử,
bằng nhiều ngôn ngữ.
- Cho phép xử lý không phụ thuộc vào ngôn ngữ bằng cách tích hợp Amazon
Translate với các dịch vụ AWS khác:
Trích xuất các thực thể, tình cảm và cụm từ khóa ược ặt n từ văn bản không
cấu trúc, chẳng hạn như các luồng truyền thông hội với Amazon
Comprehend .
Cung cấp phụ ề và phụ trực tiếp bằng nhiều ngôn ngữ với
Amazon
Transcribe .
Đọc nội dung ã dịch với Amazon Polly .
Dịch kho tài liệu ược lưu trữ trong Amazon S3 .
Dịch văn bản ượcu trữ trong các cơ sở dữ liệu sau: Amazon DynamoDB
, Amazon Aurora và Amazon Redshift .
lOMoARcPSD|36991220
Tích hợp liền mạch quy trình công việc với AWS Lambda hoặc AWS Glue.
1.4. Các tính năng của Amazon Translate
- Broad Language Coverage
Amazon Translate hỗ trợ dịch trên 75 ngôn ngữ: Afrikaans, Albanian,
Amharic, Arabic, Giữa các cặp ngôn ngữ này, dịch vụ hỗ trợ khoảng 5550 tổ
hợp dịch khác nhau.
- Neural Network-Based
Amazon Translate sử dụng Deep Learning ể tạo ra bản dịch chính xác và trôi
chảy hơn so với các mô hình dịch dựa trên quy tắc thống kê truyền thống. Hệ
thống máy dịch -ron ược xây dựng dựa trên mạng -ron chứa toàn bộ ngữ cảnh
của ngôn ngữ nguồn các bản dịch ã tạo ra cho ến nay. Trong khi ó các
máy dịch truyền thống chỉ dịch ngữ cảnh của một vài từ trước và sau từ ược dịch.
- Customized Machine Translation
Sử dụng Active Custom Translation (ACT), Amazon Translate cho phép
chúng ta kiểm soát ầu ra tốt hơn. Chúng ta thể ưa dữ liệu của mình lên Amazon
Translate y chỉnh ầu ra ã dịch cho phù hợp với nhu cầu. thể cập nhật dữ
liệu của mình thường xuyên nếu cần ể bản dịch tùy chỉnh ược cập nhật mà không
phải trả phí.
- Named Entity Translation Customization
Sử dụng Custom Terminology, Amazon Translate cho phép chúng ta ịnh
nghĩa các thuật ngữ hoặc tên tổ chức, vùng miền ược dịch. Điều này giúp Giảm
số lượng bản dịch cần ược chỉnh sửa bởi các dch giả chuyên nghiệp, tiết kiệm chi
phí và dịch nhanh hơn.
- Language Identification
Amazon Translate chế xác ịnh ngôn ngữ nguồn khi không ược người
dùng chỉ ịnh với ộ chính xác cao.
- Batch and Real-Time Translations
lOMoARcPSD|36991220
Amazon Translate lựa chọn tuyệt vời thực hiện bản dịch hàng loạt khi
số lượng lớn văn bản sẵn có ể dịch và bản dịch thời gian thực khi chúng ta muốn
cung cấp bản dịch với nội dung theo yêu cầu.
- Secure Machine Translation
Giao tiếp giữa trang web hoặc ứng dụng của chúng ta tới Amazon Translate
ược bảo vệ bằng mã hóa SSL. Bất kỳ nội dung nào do Amazon Translate xử lý ều
ược mã hóa và lưu trữ tại Amazon Region nơi mà chúng ta ang sử dụng dịch vụ.
Quản trị viên cũng có thể kiểm soát quyền truy cập vào Amazon Translate thông
qua chính sách cấp phép AWS Identity and Access Management (IAM) - ảm bảo
rằng thông tin nhạy cảm ược giữ an toàn và bảo mật.
- Pay-Per-Use
Với Amazon Translate, chỉ cần trả tiền cho những gì chúng ta sử dụng, giúp
dễ dàng tiết kiệm chi phí ể mở rộng nhu cầu dịch của mình. Chi phí ược tính dựa
trên tổng số ký tự ược gửi ến API ể dch.
2. Các bước sử dụng dịch vụ Amazon Translate
- Bước 1: Đăng nhập vào tài khoản AWS.
lOMoARcPSD|36991220
- Bước 2: Tại ô tìm kiếm nhập từ khóa “Amazon Translate truy cập vào
dịch vụ dịch thuật của Amazon.
- Bước 3: Để bắt ầu sử dụng dịch v chọn “Launch real-time translation.
- Bước 4: Gõ hoặc dán văn bản cần dịch vào, Amazon Translate sẽ tự ộng phát
hiện ngôn ngữ ầu vào và bạn có thể tùy chỉnh kết quả ầu ra.
lOMoARcPSD|36991220
3. So sánh và phân tích dịch vụ Amazon Translate và Google Translate
thể nói ược ngôn ngữ chìa khóa của sự kết ni thành công, nhưng thật
khó ể chọn công cụ dịch áng tin cậy nhất khi tất cả ều tnhận là tốt nhất. So sánh
Google Translate Amazon Translate sẽ giúp chúng ra công cụ dịch hoàn hảo
cho nhu cầu của mình.
Phân tích
Google Translate
Amazon Translate
Logo nhận diện
thương hiệu
Khái niệm
Google Translate một dịch
vụ dịch máy miễn phí do
Google phát triển giúp
người dùng internet hàng ngày
dịch văn bản, tài liệu nhỏ hơn
và trang web từ ngôn ngữ này
sang ngôn ngữ khác.
Amazon Translate một
dịch vụ dịch thuật do
Amazon.com, Inc. cung
cấp, sử dụng công nghệ máy
học tiên tiến cung cấp bản
dịch chất lượng cao theo yêu
cầu.
lOMoARcPSD| 36991220
Dùng thử miễn
phí
Thanh toán
Miễn phí
Dùng bao nhiêu trả bấy
nhiêu
Số loại tệp ược hỗ
trợ
11
(.doc, .docx, .odf, .pdf, .ppt,
.pptx, .ps, .rtf, .txt, .xls, .xlsx)
2
(.dox .pdf nhưng phải kết
hợp thêm với các dịch vụ
khác như: Amazon S3,
Amazon Textract. AWS
Lambda)
Giới hạn tải lên
tài liệu
150MB
20MB
Tích hợp dịch
máy
Số lượng ngôn
ngữ ược hỗ trợ
108 ngôn ngữ
71 ngôn ngữ
Công cụ trực
tuyến
Bộ nhớ dữ liệu ã
dịch
Lưu trữ trên
ám mây
Duy trình ịnh
dạng thiết kế
tài liệu
lOMoARcPSD|36991220
Tích hợp ứng
dụng
Tiện ích dịch
trang web
Chỉnh sửa trong
ngữ cảnh
Amazon Dịch có tốt hơn Google Dịch không?
So sánh Google Dịch Amazon Dịch cho thấy cả hai ều sử dụng công nghệ dịch
máy. Google Dịch chính xác hơn một chút theo các so sánh khác nhau, nhưng sự khác
biệt không áng kể. Tuy nhiên, các dịch giả chuyên nghiệp không tham gia vào quá
trình dịch thuật. Điều y nghĩa không có công cụ dịch nào chỉ chính xác một phần
và không phải là lựa chọn tốt nhất ể dịch nội dung nhạy cảm.
4. Tìm hiểu mt số dịch vụ kết hợp vào ề tài
4.1. Dịch vụ Amazon Polly
Amazon Polly là dịch vụ chuyển i văn bản thành giọng nói chân thực, cho
phép bạn tạo các ứng dụng thể nói chuyện phát triển những thloại sản
phẩm ược trang bị khả năng nói hoàn toàn mới.
Polly dịch vụ Text-to-Speech (TTS) (chuyển văn bản thành lời nói) sử
dụng công nghệ deep learning tiên tiến ể tổng hợp thành lời nói tự nhiên của con
người.
Với hàng chục giọng nói chân thực theo 31 ngôn ng, bạn có thể xây dựng
ứng dụng giọng nói hoạt ộng nhiều nước khác nhau. Tuy nhiên, Amazon
Polly vẫn chưa h trợ ngôn ngữ Việt Nam.
Ứng dụng vào tài nhằm giúp chuyển ổi văn bản thành giọng nói ọc
những ngôn ngữ ặc trưng theo từng quốc gia ể trang web dịch thuật trở
n tiện lợi hơn.
4.2. Dịch vụ Amazon S3
lOMoARcPSD|36991220
Amazon S3 là dịch vụ lưu trữ ối tượng ược xây dựng ể lưu trữ và
truy xuất bất kỳ lượng dữ liệu nào từ bất cứ nơi nào. Đây là dịch vụ lưu
trữ ơn giản có ộ bền, ộ sẵn có, hiệu suất, tính bảo mật dẫn ầu ngành và khả
năng thay ổi quy mô gần như không giới hạn với chi phí cực kỳ thấp.
CHƯƠNG 2: XÂY DỰNG ỨNG DỤNG MINH HỌA
1. Giới thiệu sn phẩm ề tài
1.1. Giới thiệu
Trong cuộc sống hiện ại ngày nay, việc phiên dịch ngôn ngữ mọi người
có thể hiểu và giao tiếp dễ dàng là vô cùng quan trọng và cần thiết. Công cụ dịch
thuật càng quan trọng hơn ối với sinh viên, những người thường xuyên phải tiếp
cận với học tập, nghiên cứu và tham khảo tài liệu bằng nhiều ngôn ngữ.
vậy, ứng dụng "AWS TRANSLATE WEB" ược phát triển với mục ích
xóa bỏ mi rào cản ngôn ngữ và cho phép người dùng dịch, nghe và gửi hình ảnh
văn bản dựa trên các dịch vụ của AWS như: Ví dụ: Amazon Translate,
Amazon Polly,…
1.2. Nền tảng công nghệ
Ứng dụng ược viết dựa trên các công nghệ như:
Công nghệ
Mô tả
NodeJS
NodeJS là một trình biên dịch ngôn ngữ javascript
runtime.
ExpressJS
Framework
Framework hỗ trợ tạo server s dụng ngôn ngữ
javascript, typescript chạy trên nền nodejs runtime.
HTML, CSS, JS
Dùng tạo giao diện website
Amazon Translate
Giúp dịch các văn bản sang nhiều ngôn ngữ khác nhau.
Amazon Polly
Chuyển văn bản thành giọng nói với nhiều giọng c
ngôn ngữ khác nhau.
lOMoARcPSD|36991220
Amazon S3
Dùng ể lưu trữ
Amazon EC2
Dùng ể deploy và chạy server
Amazon IAM
Dùng ể cấp quyền sử dụng các dịch vụ AWS.
1.3. Chức năng
- Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác (với 71
ngôn ngữ ược hỗ trợ).
- Chuyển văn bản thành giọng nói với nhiều ngôn ngữ (với 11
ngôn ngữ ược hỗ trợ).
2. Cài ặt ứng dụng
Setup AWS
Tạo EC2 Instance
Bước 1: Launch Instance
Bước 2: Điền tên Phiên bản EC2 và chọn loại Máy ảo hệ iều hành (tôi ã chọn
cái ầu tiên này ược ề xuất bởi người ủ iều kiện bậc miễn phí của AWS).
lOMoARcPSD|36991220
Bước 3: Chọn Instance type (mình chọn micro type vì nó miễn phí).
Bước 4: Tạo keypair.
lOMoARcPSD|36991220
Điền thông tin cho cặp khóa bạn muốn tạo (!QUAN TRỌNG: LƯU CẶP KHÓA
CỦA BẠN VÀ KHÔNG BAO GIỜ QUÊN NÓ).
Bước 5: Cấu hình cài ặt Network (có thể bỏ qua bước này và chỉnh sửa sau)
lOMoARcPSD|36991220
Bước 6: Sau khi iền tất cả các cài ặt, nhấp vào “Launch Instance”.
Tạo IAM User.
Bước 1: Thêm người dùng.
Bước 2: Nhập tên người dùng.
lOMoARcPSD|36991220
Bước 3: Tiếp theo tất cả các bước sau khi nhìn thấy CREATE USER.
Bước 4: Click CREAT USER.
Bước 5: Tạo thành công, bạn cần save (lưu trữ) access_key_id
secret_access_key_id của mình.
lOMoARcPSD|36991220
Cấp quyền cho người dùng IAM.
Bước 1: Chọn người dùng bạn muốn cấp quyền.
Bước 2: Click Add Permission.
Bước 3: Chọn Attach existing policies directly.
Bước 4: Tìm kiếm các chính sách và thêm vào (Ví dụ: TranslateFullAccess).
Bước 5: Sau khi thêm xong nhấn Next Review.
Bước 6: Xem lại chính sách của bạn rồi nhấp vào Add Permission.
lOMoARcPSD|36991220
Tạo S3 Bucket.
Bước 1: Tạo bucket.
Bước 2: Nhập tên bucket (!QUAN TRỌNG).
Bước 3: chọn Object Ownership.
lOMoARcPSD|36991220
Bước 4: Unblock public access.
Bước 5: Các thiết lập còn lại ể mặc ịnh và nhấn CREATE BUCKET.
Configuration Service.
Config Security Group EC2.
Bước 1: Mở chế ộ xem Phiên bản EC2 và chọn phiên bản bạn muốn cấu hình.
lOMoARcPSD|36991220
Bước 2: Chọn Security tab.
Bước 3: Bấm vào tên nhóm bảo mật ể mở.
Bước 4: Sau khi mở nhóm bảo mật và Click vào nút Edit inbound rules.
Bước 5: Bạn cần cấu hình bảo mật như vậy và click Save rules.
Deploy website HTML, CSS, JS to S3 Bucket.
Bước 1: Clone project này bằng command line.
git clone https://github.com/congdanh0101/final-aws-translate.git --branch
master --single-branch
Bước 2: Mở Phiên bản EC2 và chọn phiên bản bạn muốn kết nối
lOMoARcPSD|36991220
Bước 3: Copy URL Public IPv4 address in Details tab.
Bước 4: Sau khi clone dự án, hãy mở tệp final-awstranslate/src/template/index.js
và chỉnh sửa.
const URL_SERVER = `https://3.92.237.4:3000`.
Bước 5: Sau khi chỉnh sửa, lưu file index.js.
Bước 6: Mở S3 bucket ược tạo trong S3 Bucket.
Bước 7: Chọn bucket muốn deploy.
Bước 8: Bấm Tạo thư mục ể sử dụng AWS Polly (thư mc mp3).
lOMoARcPSD|36991220
Bước 9: Click Upload ể deploy website.
Bước 10: Click Add files hoặc Add folder muốn deploy.
Bước 11: Mở Permission setting và config như vậy.
lOMoARcPSD|36991220
Bước 12: Sau bước 10 và bước 11, click Upload.
Bước 13: Mở tệp index.html
Bước 14: Mở URL tại Object URL.
Kết nối EC2.
Bước 1: Cài ặt ứng dụng PuTTY ể kết nối máy ảo EC2.
Bước 2: Mở chế ộ xem Phiên bản EC2, chọn phiên bản bạn muốn kết nối
nhấp vào nút Connect.
lOMoARcPSD|36991220
Bước 3: Chọn tab SSH Client ể lấy thông tin kết ni
Bước 4: Mở ứng dụng PuTTY
Kết nối EC2 bằng PuTTY
Hostname: ec2-user@ec2-3-94-92-56.compute-1.amazonaws.com
Username: ec2-user
Key: your keypair after you create when launched instance
lOMoARcPSD|36991220
lOMoARcPSD|36991220
Bước 5: Nhấn Open trong ứng dụng PuTTY.
Bước 6: Click Accept ể hoàn thành kết nối.
Bước 7: Kết nối thành công
lOMoARcPSD|36991220
Cài ặt gói
sudo yum update sudo yum install curl curl -sL
https://rpm.nodesource.com/setup_10.x | sudo bash sudo yum
install nodejs
sudo yum install git
Execute
Bước 1: clone dự án về máy ảo EC2 và thiết lập thư viện
git clone https://github.com/congdanh0101/final-aws-translate.git --branch
master --single-branch cd final-aws-translate npm install
Bước 2: Chỉnh sửa khóa IAM (access_key_id secret_access_key_id) Bước
3: Mở file final-aws-translate/src/app/controller.js và chỉnh sửa
cd src/app vi
controller.js
Chỉnh sửa tệp cấu hình nếu bạn config.json hoặc cf.json Bước
4: Run server
lOMoARcPSD|36991220
npm start
3. Kết quả thực nghiệm
- Giao diện trang web
.
- Có thể chọn nhiều nn ngữ khác nhau
- Dịch ngôn ngữ và chuyển văn bn thành giọng nói.
lOMoARcPSD|36991220
PHẦN KẾT LUẬN
1. Kết quả ạt ược
Sau một thời gian học tập, nghiên cứu và thực hiện ề tài “Tìm hiểu
Amazon Translate và xây dựng ứng dụng minh hoa”, nhóm chúng em ã
bản ạt ược những kết quả sau:
1.1. Nền tảng kiến thức
Thu thập kiến thức các chủ liên quan về khái niệm, lợi ích, cách sử
dụng, tính năng, iểm mạnh và khả năng của dịch vụ Amazon Translate.
1.2. Vận dụng
Xây dựng hoàn chỉnh bản một trang web dịch thuật ứng dụng dịch vụ
Amazon Translate, Amazon Polly, Amazon EC2, Amazon S3 với các chức năng
cơ bản như:
- Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác (với 71 ngôn ngữ ược
hỗ trợ).
- Chuyển văn bản thành giọng nói với nhiều ngôn ngữ (với 11 ngôn ngữ
ược hỗ trợ).
- Chuyển hình ảnh file .png, .jpeg chữ viết tay hoặc ánh máy sang dạng văn
bản tiến hành việc dịch thuật (với số lượng ngôn ngữ truy xuất hạn chế như:
Tiếng Anh, Pháp, Đức, Ý, Bồ Đào Nha và Tây Ban Nha).
2. Ưu iểm
- Có tính năng chuyển văn bản thành giọng nói giúp thuận tiện trong giao tiếp
với người bản ịa.
- Dịch ược các từ vựng oạn văn bản trên nhiều ngôn ngữ, chính xác cao
và văn phong trôi chảy nhờ dịch vụ Amazon Translate.
3. Nhược iểm
- Amazon Polly chỉ hỗ trợ cho 11 ngôn ngữ nên việc ọc các văn bản còn hạn
chế.
4. Hướng phát triển
- Mở rộng dữ liệu ầu vào có thể thể là dạng file .txt, .pdf và giọng nói.
lOMoARcPSD|36991220
- Mở rộng cho nhiều ngôn ngữ.
lOMoARcPSD|36991220
TÀI LIỆU THAM KHẢO
[1]. Amazon Translate - Dịch máy chính xác và thông thạo
Link: https://aws.amazon.com/vi/translate/
https://docs.aws.amazon.com/translate/latest/dg/what-is.html
[2]. Amazon Polly
Link: https://aws.amazon.com/vi/polly/
[3]. Amazon Translate And Google dch
Link: https://taia.io/google-translate-vs-amazon-translate/
| 1/34

Preview text:

lOMoARcPSD| 36991220 .
TRƯỜNGĐẠIHỌCSƯPHẠMKỸTHUẬTTP.HỒCHÍMINH
KHOAĐÀOTẠOCHẤTLƯỢNGCAO
BỘMÔNĐIỆNTOÁNĐÁMMÂY ----- ----- TÊNĐỀTÀI:
TÌM HIỂU AMAZON TRANSLATE VÀ
VIẾT ỨNG DỤNG MINH HỌA
GVDH:TS.HuỳnhXuânPhụng SVTH: NgôHoàngDuy 19145166 BùiCôngDanh 19110008
TP.HCM,tháng12năm2022 lOMoARcPSD| 36991220 MỤC LỤC
LỜI CẢM ƠN .............................................................. Error! Bookmark not defined.
1. Tính cấp thiết của ề tài ........................................................................................ 2
2. Đối tượng nghiên cứu ......................................................................................... 3
3. Phạm vi nghiên cứu ............................................................................................. 3
4. Bố cục ề tài .......................................................................................................... 3
5. Kết quả dự kiến ạt ược ........................................................................................ 3
PHẦN NỘI DUNG .................................................................................................... 5
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ AMAZON TRANSLATE ..................... 5

1. Tổng quan về Amazon Translate ........................................................................ 5
2. Các bước sử dụng dịch vụ Amazon Translate .................................................... 9
3. So sánh và phân tích dịch vụ Amazon Translate và Google Translate ............ 11
4. Tìm hiểu một số dịch vụ kết hợp vào ề tài ........................................................ 13
CHƯƠNG 2: XÂY DỰNG ỨNG DỤNG MINH HỌA ........................................ 14
PHẦN KẾT LUẬN .................................................................................................. 32
1. Kết quả ạt ược ................................................................................................... 32
1.1. Nền tảng kiến thức ..................................................................................... 32
1.2. Vận dụng .................................................................................................... 32
2. Ưu iểm ............................................................................................................... 32
3. Nhược iểm ......................................................................................................... 32
4. Hướng phát triển ............................................................................................... 32
TÀI LIỆU THAM KHẢO ...................................................................................... 34 PHẦN MỞ ĐẦU
1. Tính cấp thiết của ề tài
Ngày nay, vấn ề ngôn ngữ luôn là mối quan tâm lớn nhất trong cuộc sống bởi
ngôn ngữ kết nối con người với con người, kể cả với công nghệ. Bạn không nên ể
ngôn ngữ trở thành rào cản trong thời ại công nghệ 4.0, nhưng không phải ai cũng
có thể học một ngôn ngữ nào ó trước cần sử dụng nó. lOMoARcPSD| 36991220
Nhận thấy vấn ề này, người ta không ngừng tìm kiếm và sáng tạo ra những
công cụ dịch thuật giúp mọi người kết nối với nhau, vượt qua mọi rào cản và xóa
bỏ mọi khoảng cách ngôn ngữ một cách hiệu quả, chẳng hạn như: Google Translate,...
Khi ược học về iện toán ám mây, chúng em có cơ hội tiếp cận với nền tảng
và hệ sinh thái Amazon Web Services (AWS) hoàn toàn mới, sau khi tìm hiểu,
chúng em nhận ra rằng dịch vụ hỗ trợ dịch thuật chính là Amazon Translate. Vì
vậy, với mong muốn học ngoại ngữ trong thời ại chuyển ổi số, chúng em quyết
ịnh áp dụng chủ ề: “Tìm hiểu Amazon Translate và viết ứng dụng minh họa”. 2.
Đối tượng nghiên cứu
Đối với ề tài này, chúng em tập trung nghiên cứu các ối tượng sau:
- Dịch vụ Amazon Translate
- Dịch vụ Amazon Polly
- Dịch vụ Amazon EC2
- Dịch vụ Amazon S3 3.
Phạm vi nghiên cứu
Chúng em sẽ nghiên cứu các kiến thức cơ bản về Amazon Translate, các tính
năng của nó, cách thức hoạt ộng, chi phí vận hành và cách ưa ứng dụng Amazon
Translate vào thực tế. So sánh Amazon Translate và Google Translate.
Ngoài ra, chúng em cũng sẽ tìm hiểu thêm về Amazon Polly, S3 ể mở rộng
chủ ề thêm một phần nào ó và sử dụng EC2 ể deploy web app. 4. Bố cục ề tài
Chương 1: Cơ sở lý thuyết về Amazon Translate.
Chương 2: Xây dựng ứng dụng minh họa. 5.
Kết quả dự kiến ạt ược
Với ề tài nghiên cứu này, chúng em dự ịnh thực hiện các nhiệm vụ sau:
- Tìm hiểu tổng quan về Amazon Translate, cách thức hoạt ộng, tính năng, lợi ích và ặc iểm của nó.
- Xây dựng một trang web dịch các từ và tài liệu sang nhiều ngôn ngữ bằng dịch vụ Amazon Translate. lOMoAR cPSD| 36991220
- Tính năng chuyển văn bản thành giọng nói giúp người dùng giao tiếp trực
quan hơn với người khác bằng cách tìm hiểu thêm về Amazon Polly.
- Ứng dụng ược deploy lên AWS. lOMoARcPSD| 36991220 PHẦN NỘI DUNG
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ AMAZON TRANSLATE 1.
Tổng quan về Amazon Translate 1.1. Khái niệm
Amazon Translate là dịch vụ máy dịch ứng dụng mạng nơron ể cung cấp
bản dịch ngôn ngữ nhanh chóng, chất lượng cao, giá cả phải chăng và có thể tùy
chỉnh. Dịch máy sử dụng mạng nơ-ron là hình thức tự ộng hóa công việc dịch
thuật sử dụng mô hình deep learning ể ưa ra bản dịch chính xác hơn và có văn
phong tự nhiên hơn các thuật toán dịch thuật theo quy tắc và thống kê truyền thống.
Với Amazon Translate, bạn có thể bản ịa hóa các nội dung như trang web
và ứng dụng cho bộ phận người dùng a dạng, dễ dàng dịch khối lượng lớn văn bản
ể phân tích, và cho phép giao tiếp a ngôn ngữ một cách hiệu quả giữa nhiều người dùng.
Gần ây, Intento ã xếp hạng Amazon Translate là nhà cung cấp dịch máy
hàng ầu trong năm 2020 với 14 cặp ngôn ngữ, 16 lĩnh vực công nghiệp và 8 loại nội dung.
Công nghệ sử dụng: API deep learning dựa trên ám mây.
1.2. Lợi ích mà Amazon Translate em lại -
Độ chính xác cao và khả năng cải thiện liên tục
Amazon Translate là dịch vụ dịch máy sử dụng mạng nơron. Công cụ dịch
thuật này liên tục cải thiện từ các bộ dữ liệu mới và mở rộng nhằm ưa ra bản dịch
chính xác hơn cho nhiều trường hợp sử dụng a dạng. -
Dễ dàng tích hợp vào ứng dụng
Amazon Translate loại bỏ i sự phức tạp của việc phải xây dựng các khả năng
dịch thuật thời gian thực và dịch thuật hàng loạt trong ứng dụng của chúng ta chỉ
bằng một lệnh gọi API ơn giản. Việc này khiến công tác bản ịa hóa ứng dụng hoặc
trang web, hoặc xử lý dữ liệu a ngôn ngữ trong quy trình công việc hiện tại trở nên dễ dàng. lOMoAR cPSD| 36991220 -
Có thể tùy chỉnh
Với tính năng Custom Terminology và Active Custom Translate, Amazon
Translate cho phép chúng ta tùy chính ầu ra máy dịch. Dùng Custom Terminology
ể xác ịnh cách dịch tên thương hiệu, tên mẫu mã và các thuật ngữ ặc biệt khác.
Dùng Active Custom Translation ể tạo ầu ra máy dịch tùy chỉnh sao cho phù hợp
với các nhu cầu cụ thể mà miền ó ặt ra. Chúng ta không cần xây dựng mô hình
dịch tùy chỉnh, có thể cập nhật mô hình bất cứ khi nào chúng ta muốn và chỉ phải
trả cho số lượng ký tự cần dịch. -
Tiết kiệm chi phí
Với sức mạnh của dịch máy, Amazon Translate có giá rẻ hơn 1000 lần so với
việc sử dụng thông dịch viên chuyên nghiệp ể dịch một cách thủ công. -
Có khả năng mở rộng
Dù chỉ là vài từ hay khối lượng văn bản lớn, Amazon Translate ều dễ dàng
thay ổi quy mô theo nhu cầu dịch thuật với quá trình dịch nhanh chóng và áng tin cậy. - Linh hoạt
Amazon Translate có thể dịch nhiều ịnh dạng nội dung khác nhau, bao gồm
văn bản Word, bài thuyết trình Powerpoint và bảng tính Excel.
1.3. Trường hợp sử dụng - Bản
ịa hóa ngôn ngữ
Các ội ngũ dịch giả rất khó có thể bắt kịp nội dung ộng hoặc thời gian thực.
Tuy nhiên với Amazon Translate, chúng ta có thể dễ dàng dịch thuật khối lượng
nội dung khổng lồ do người dùng tạo theo thời gian thực. Các trang web và ứng
dụng có thể tự ộng sáng tạo nội dung như câu chuyện trên nguồn cấp tin, mô tả hồ
sơ và bình luận bằng ngôn ngữ mà người dùng muốn chỉ bằng một lần nhấp chuột vào nút “dịch”. -
Phân tích văn bản
Với Amazon Translate, chúng ta không còn vướng phải rào cản ngôn ngữ. Có
thể vừa nắm bắt ược “tình cảm xã hội” của thương hiệu, sản phẩm hoặc dịch vụ
của chúng ta, vừa theo dõi các cuộc hội thoại trực tuyển bằng nhiều ngôn ngữ khác nhau. lOMoARcPSD| 36991220 - Giao tiếp
Amazon Translate có thể cung cấp bản dịch tự ộng ể tạo iều kiện giao tiếp a
ngôn ngữ giữa các người dùng. Bằng cách bổ sung khả năng dịch thuật thời gian
thực vào tính năng trò chuyện, email, tổng ài hỗ trợ và ứng dụng nhận yêu cầu, ơn
vị hoặc nhân viên nói tiếng Anh có thể giao tiếp với khách hàng bằng nhiều ngôn ngữ khác nhau.
Có thể sử dụng Amazon Translate ể thực hiện những việc sau: -
Kích hoạt trải nghiệm người dùng a ngôn ngữ trong các ứng dụng của bạn
bằng cách tích hợp Amazon Translate:
+ Dịch nội dung do công ty soạn thảo, chẳng hạn như biên bản cuộc họp,
báo cáo kỹ thuật viên, bài báo cơ sở kiến thức, bài ăng, v.v.
+ Dịch thông tin liên lạc giữa các cá nhân, chẳng hạn như email, trò
chuyện trong trò chơi, trò chuyện dịch vụ khách hàng, ể khách hàng và nhân
viên có thể kết nối bằng ngôn ngữ ưa thích của họ. -
Xử lý và quản lý dữ liệu
ến của công ty bạn:
+ Phân tích văn bản, chẳng hạn như mạng xã hội và nguồn cấp tin tức, bằng nhiều ngôn ngữ.
+ Tìm kiếm thông tin, chẳng hạn như các trường hợp khám phá iện tử, bằng nhiều ngôn ngữ. -
Cho phép xử lý không phụ thuộc vào ngôn ngữ bằng cách tích hợp Amazon
Translate với các dịch vụ AWS khác:
● Trích xuất các thực thể, tình cảm và cụm từ khóa ược ặt tên từ văn bản không
có cấu trúc, chẳng hạn như các luồng truyền thông xã hội với Amazon Comprehend . ● Cung cấp phụ ề và phụ
ề trực tiếp bằng nhiều ngôn ngữ với Amazon Transcribe . ● Đọc nội dung
ã dịch với Amazon Polly .
● Dịch kho tài liệu ược lưu trữ trong Amazon S3 .
● Dịch văn bản ược lưu trữ trong các cơ sở dữ liệu sau: Amazon DynamoDB
, Amazon Aurora và Amazon Redshift . lOMoARcPSD| 36991220
● Tích hợp liền mạch quy trình công việc với AWS Lambda hoặc AWS Glue.
1.4. Các tính năng của Amazon Translate -
Broad Language Coverage
Amazon Translate hỗ trợ dịch trên 75 ngôn ngữ: Afrikaans, Albanian,
Amharic, Arabic, … Giữa các cặp ngôn ngữ này, dịch vụ hỗ trợ khoảng 5550 tổ hợp dịch khác nhau. -
Neural Network-Based
Amazon Translate sử dụng Deep Learning ể tạo ra bản dịch chính xác và trôi
chảy hơn so với các mô hình dịch dựa trên quy tắc và thống kê truyền thống. Hệ
thống máy dịch nơ-ron ược xây dựng dựa trên mạng nơ-ron chứa toàn bộ ngữ cảnh
của ngôn ngữ nguồn và các bản dịch mà nó ã tạo ra cho ến nay. Trong khi ó các
máy dịch truyền thống chỉ dịch ngữ cảnh của một vài từ trước và sau từ ược dịch. -
Customized Machine Translation
Sử dụng Active Custom Translation (ACT), Amazon Translate cho phép
chúng ta kiểm soát ầu ra tốt hơn. Chúng ta có thể ưa dữ liệu của mình lên Amazon
Translate ể tùy chỉnh ầu ra ã dịch cho phù hợp với nhu cầu. Có thể cập nhật dữ
liệu của mình thường xuyên nếu cần ể bản dịch tùy chỉnh ược cập nhật mà không phải trả phí. -
Named Entity Translation Customization
Sử dụng Custom Terminology, Amazon Translate cho phép chúng ta ịnh
nghĩa các thuật ngữ hoặc tên tổ chức, vùng miền … ược dịch. Điều này giúp Giảm
số lượng bản dịch cần ược chỉnh sửa bởi các dịch giả chuyên nghiệp, tiết kiệm chi phí và dịch nhanh hơn. -
Language Identification
Amazon Translate có cơ chế xác ịnh ngôn ngữ nguồn khi không ược người
dùng chỉ ịnh với ộ chính xác cao. -
Batch and Real-Time Translations lOMoARcPSD| 36991220
Amazon Translate là lựa chọn tuyệt vời ể thực hiện bản dịch hàng loạt khi có
số lượng lớn văn bản sẵn có ể dịch và bản dịch thời gian thực khi chúng ta muốn
cung cấp bản dịch với nội dung theo yêu cầu. -
Secure Machine Translation
Giao tiếp giữa trang web hoặc ứng dụng của chúng ta tới Amazon Translate
ược bảo vệ bằng mã hóa SSL. Bất kỳ nội dung nào do Amazon Translate xử lý ều
ược mã hóa và lưu trữ tại Amazon Region nơi mà chúng ta ang sử dụng dịch vụ.
Quản trị viên cũng có thể kiểm soát quyền truy cập vào Amazon Translate thông
qua chính sách cấp phép AWS Identity and Access Management (IAM) - ảm bảo
rằng thông tin nhạy cảm ược giữ an toàn và bảo mật. - Pay-Per-Use
Với Amazon Translate, chỉ cần trả tiền cho những gì chúng ta sử dụng, giúp
dễ dàng tiết kiệm chi phí ể mở rộng nhu cầu dịch của mình. Chi phí ược tính dựa
trên tổng số ký tự ược gửi ến API ể dịch. 2.
Các bước sử dụng dịch vụ Amazon Translate
- Bước 1: Đăng nhập vào tài khoản AWS. lOMoARcPSD| 36991220
- Bước 2: Tại ô tìm kiếm nhập từ khóa “Amazon Translate” ể truy cập vào
dịch vụ dịch thuật của Amazon.
- Bước 3: Để bắt ầu sử dụng dịch vụ chọn “Launch real-time translation”.
- Bước 4: Gõ hoặc dán văn bản cần dịch vào, Amazon Translate sẽ tự ộng phát
hiện ngôn ngữ ầu vào và bạn có thể tùy chỉnh kết quả ầu ra. lOMoARcPSD| 36991220 3.
So sánh và phân tích dịch vụ Amazon Translate và Google Translate
Có thể nói ược ngôn ngữ là chìa khóa của sự kết nối thành công, nhưng thật
khó ể chọn công cụ dịch áng tin cậy nhất khi tất cả ều tự nhận là tốt nhất. So sánh
Google Translate Amazon Translate sẽ giúp chúng ra công cụ dịch hoàn hảo cho nhu cầu của mình. Phân tích Google Translate Amazon Translate Logo nhận diện thương hiệu Khái niệm
Google Translate là một dịch Amazon Translate là một
vụ dịch máy miễn phí do dịch vụ dịch thuật do
Google phát triển
ể giúp Amazon.com, Inc. cung
người dùng internet hàng ngày cấp, sử dụng công nghệ máy
dịch văn bản, tài liệu nhỏ hơn học tiên tiến ể cung cấp bản
và trang web từ ngôn ngữ này dịch chất lượng cao theo yêu sang ngôn ngữ khác. cầu. lOMoAR cPSD| 36991220 Dùng thử miễn ✔ ✔ phí Thanh toán Miễn phí Dùng bao nhiêu trả bấy nhiêu Số loại tệp ược hỗ 11 2 trợ
(.doc, .docx, .odf, .pdf, .ppt,
(.dox và .pdf nhưng phải kết
hợp thêm với các dịch vụ
.pptx, .ps, .rtf, .txt, .xls, .xlsx) khác như: Amazon S3, Amazon Textract. AWS Lambda) Giới hạn tải lên 150MB 20MB tài liệu Tích hợp dịch ✔ ✔ máy Số lượng ngôn 108 ngôn ngữ 71 ngôn ngữ ngữ ược hỗ trợ Công cụ trực ✔ ✔ tuyến Bộ nhớ dữ liệu ã ⌧ ✔ dịch Lưu trữ trên ⌧ ✔ ám mây Duy trình ịnh ⌧ ⌧ dạng và thiết kế tài liệu lOMoARcPSD| 36991220 Tích hợp ứng ✔ ⌧ dụng Tiện ích dịch ✔ ⌧ trang web Chỉnh sửa trong ⌧ ✔ ngữ cảnh
Amazon Dịch có tốt hơn Google Dịch không?
So sánh Google Dịch và Amazon Dịch cho thấy cả hai ều sử dụng công nghệ dịch
máy. Google Dịch chính xác hơn một chút theo các so sánh khác nhau, nhưng sự khác
biệt là không áng kể. Tuy nhiên, các dịch giả chuyên nghiệp không tham gia vào quá
trình dịch thuật. Điều này có nghĩa là không có công cụ dịch nào chỉ chính xác một phần
và không phải là lựa chọn tốt nhất ể dịch nội dung nhạy cảm. 4.
Tìm hiểu một số dịch vụ kết hợp vào ề tài
4.1. Dịch vụ Amazon Polly
Amazon Polly là dịch vụ chuyển ổi văn bản thành giọng nói chân thực, cho
phép bạn tạo các ứng dụng có thể nói chuyện và phát triển những thể loại sản
phẩm ược trang bị khả năng nói hoàn toàn mới.
Polly là dịch vụ Text-to-Speech (TTS) (chuyển văn bản thành lời nói) sử
dụng công nghệ deep learning tiên tiến ể tổng hợp thành lời nói tự nhiên của con người.
Với hàng chục giọng nói chân thực theo 31 ngôn ngữ, bạn có thể xây dựng
ứng dụng có giọng nói hoạt ộng ở nhiều nước khác nhau. Tuy nhiên, Amazon
Polly vẫn chưa hỗ trợ ngôn ngữ Việt Nam.
Ứng dụng vào ề tài nhằm giúp chuyển ổi văn bản thành giọng nói và ể ọc
những ngôn ngữ ặc trưng theo từng quốc gia ể trang web dịch thuật trở nên tiện lợi hơn.
4.2. Dịch vụ Amazon S3 lOMoARcPSD| 36991220
Amazon S3 là dịch vụ lưu trữ ối tượng ược xây dựng ể lưu trữ và
truy xuất bất kỳ lượng dữ liệu nào từ bất cứ nơi nào. Đây là dịch vụ lưu
trữ ơn giản có ộ bền, ộ sẵn có, hiệu suất, tính bảo mật dẫn ầu ngành và khả
năng thay ổi quy mô gần như không giới hạn với chi phí cực kỳ thấp.
CHƯƠNG 2: XÂY DỰNG ỨNG DỤNG MINH HỌA
1. Giới thiệu sản phẩm ề tài 1.1. Giới thiệu
Trong cuộc sống hiện ại ngày nay, việc phiên dịch ngôn ngữ ể mọi người
có thể hiểu và giao tiếp dễ dàng là vô cùng quan trọng và cần thiết. Công cụ dịch
thuật càng quan trọng hơn ối với sinh viên, những người thường xuyên phải tiếp
cận với học tập, nghiên cứu và tham khảo tài liệu bằng nhiều ngôn ngữ.
Vì vậy, ứng dụng "AWS TRANSLATE WEB" ược phát triển với mục ích
xóa bỏ mọi rào cản ngôn ngữ và cho phép người dùng dịch, nghe và gửi hình ảnh
văn bản dựa trên các dịch vụ của AWS như: Ví dụ: Amazon Translate, Amazon Polly,…
1.2. Nền tảng công nghệ
Ứng dụng ược viết dựa trên các công nghệ như: Công nghệ Mô tả NodeJS
NodeJS là một trình biên dịch ngôn ngữ javascript runtime. ExpressJS
Framework hỗ trợ tạo server sử dụng ngôn ngữ Framework
javascript, typescript chạy trên nền nodejs runtime. HTML, CSS, JS
Dùng tạo giao diện website Amazon Translate
Giúp dịch các văn bản sang nhiều ngôn ngữ khác nhau. Amazon Polly
Chuyển văn bản thành giọng nói với nhiều giọng ọc và ngôn ngữ khác nhau. lOMoARcPSD| 36991220 Amazon S3 Dùng ể lưu trữ Amazon EC2
Dùng ể deploy và chạy server Amazon IAM
Dùng ể cấp quyền sử dụng các dịch vụ AWS. 1.3. Chức năng -
Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác (với 71
ngôn ngữ ược hỗ trợ). -
Chuyển văn bản thành giọng nói với nhiều ngôn ngữ (với 11
ngôn ngữ ược hỗ trợ). 2. Cài ặt ứng dụng Setup AWS Tạo EC2 Instance Bước 1: Launch Instance
Bước 2: Điền tên Phiên bản EC2 và chọn loại Máy ảo hệ iều hành (tôi ã chọn cái
ầu tiên này ược ề xuất bởi người ủ iều kiện bậc miễn phí của AWS). lOMoARcPSD| 36991220
Bước 3: Chọn Instance type (mình chọn micro type vì nó miễn phí). Bước 4: Tạo keypair. lOMoARcPSD| 36991220
Điền thông tin cho cặp khóa bạn muốn tạo (!QUAN TRỌNG: LƯU CẶP KHÓA
CỦA BẠN VÀ KHÔNG BAO GIỜ QUÊN NÓ).
Bước 5: Cấu hình cài ặt Network (có thể bỏ qua bước này và chỉnh sửa sau) lOMoARcPSD| 36991220
Bước 6: Sau khi iền tất cả các cài ặt, nhấp vào “Launch Instance”. Tạo IAM User.
Bước 1: Thêm người dùng.
Bước 2: Nhập tên người dùng. lOMoARcPSD| 36991220
Bước 3: Tiếp theo tất cả các bước sau khi nhìn thấy CREATE USER. Bước 4: Click CREAT USER.
Bước 5: Tạo thành công, bạn cần save (lưu trữ) access_key_id và
secret_access_key_id của mình. lOMoARcPSD| 36991220
Cấp quyền cho người dùng IAM.
Bước 1: Chọn người dùng bạn muốn cấp quyền.
Bước 2: Click Add Permission.
Bước 3: Chọn Attach existing policies directly.
Bước 4: Tìm kiếm các chính sách và thêm vào (Ví dụ: TranslateFullAccess).
Bước 5: Sau khi thêm xong nhấn Next Review.
Bước 6: Xem lại chính sách của bạn rồi nhấp vào Add Permission. lOMoARcPSD| 36991220 Tạo S3 Bucket. Bước 1: Tạo bucket.
Bước 2: Nhập tên bucket (!QUAN TRỌNG).
Bước 3: chọn Object Ownership. lOMoARcPSD| 36991220
Bước 4: Unblock public access.
Bước 5: Các thiết lập còn lại ể mặc ịnh và nhấn CREATE BUCKET. Configuration Service.
Config Security Group EC2.
Bước 1: Mở chế ộ xem Phiên bản EC2 và chọn phiên bản bạn muốn cấu hình. lOMoARcPSD| 36991220
Bước 2: Chọn Security tab.
Bước 3: Bấm vào tên nhóm bảo mật ể mở.
Bước 4: Sau khi mở nhóm bảo mật và Click vào nút Edit inbound rules.
Bước 5: Bạn cần cấu hình bảo mật như vậy và click Save rules.
Deploy website HTML, CSS, JS to S3 Bucket.
Bước 1: Clone project này bằng command line.
git clone https://github.com/congdanh0101/final-aws-translate.git --branch master --single-branch
Bước 2: Mở Phiên bản EC2 và chọn phiên bản bạn muốn kết nối lOMoARcPSD| 36991220
Bước 3: Copy URL Public IPv4 address in Details tab.
Bước 4: Sau khi clone dự án, hãy mở tệp final-awstranslate/src/template/index.js và chỉnh sửa.
const URL_SERVER = `https://3.92.237.4:3000`.
Bước 5: Sau khi chỉnh sửa, lưu file index.js.
Bước 6: Mở S3 bucket ược tạo trong S3 Bucket.
Bước 7: Chọn bucket muốn deploy.
Bước 8: Bấm Tạo thư mục ể sử dụng AWS Polly (thư mục mp3). lOMoARcPSD| 36991220
Bước 9: Click Upload ể deploy website.
Bước 10: Click Add files hoặc Add folder muốn deploy.
Bước 11: Mở Permission setting và config như vậy. lOMoARcPSD| 36991220
Bước 12: Sau bước 10 và bước 11, click Upload.
Bước 13: Mở tệp index.html
Bước 14: Mở URL tại Object URL. Kết nối EC2.
Bước 1: Cài ặt ứng dụng PuTTY ể kết nối máy ảo EC2. Bước 2: Mở chế
ộ xem Phiên bản EC2, chọn phiên bản bạn muốn kết nối và nhấp vào nút Connect. lOMoARcPSD| 36991220
Bước 3: Chọn tab SSH Client ể lấy thông tin kết nối
Bước 4: Mở ứng dụng PuTTY
Kết nối EC2 bằng PuTTY
Hostname: ec2-user@ec2-3-94-92-56.compute-1.amazonaws.com Username: ec2-user
Key: your keypair after you create when launched instance lOMoARcPSD| 36991220 lOMoARcPSD| 36991220
Bước 5: Nhấn Open trong ứng dụng PuTTY.
Bước 6: Click Accept ể hoàn thành kết nối.
Bước 7: Kết nối thành công lOMoARcPSD| 36991220 Cài ặt gói
sudo yum update sudo yum install curl curl -sL
https://rpm.nodesource.com/setup_10.x | sudo bash sudo yum install nodejs sudo yum install git Execute
Bước 1: clone dự án về máy ảo EC2 và thiết lập thư viện
git clone https://github.com/congdanh0101/final-aws-translate.git --branch
master --single-branch cd final-aws-translate npm install
Bước 2: Chỉnh sửa khóa IAM (access_key_id và secret_access_key_id) Bước
3: Mở file final-aws-translate/src/app/controller.js và chỉnh sửa cd src/app vi controller.js
Chỉnh sửa tệp cấu hình nếu bạn config.json hoặc cf.json Bước 4: Run server lOMoARcPSD| 36991220 npm start
3. Kết quả thực nghiệm
- Giao diện trang web .
- Có thể chọn nhiều ngôn ngữ khác nhau
- Dịch ngôn ngữ và chuyển văn bản thành giọng nói. lOMoARcPSD| 36991220 PHẦN KẾT LUẬN
1. Kết quả ạt ược
Sau một thời gian học tập, nghiên cứu và thực hiện ề tài “Tìm hiểu
Amazon Translate và xây dựng ứng dụng minh hoa”, nhóm chúng em ã
bản ạt ược những kết quả sau:
1.1. Nền tảng kiến thức
Thu thập kiến thức và các chủ ề liên quan về khái niệm, lợi ích, cách sử
dụng, tính năng, iểm mạnh và khả năng của dịch vụ Amazon Translate. 1.2. Vận dụng
Xây dựng hoàn chỉnh cơ bản một trang web dịch thuật ứng dụng dịch vụ
Amazon Translate, Amazon Polly, Amazon EC2, Amazon S3 với các chức năng cơ bản như:
- Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác (với 71 ngôn ngữ ược hỗ trợ).
- Chuyển văn bản thành giọng nói với nhiều ngôn ngữ (với 11 ngôn ngữ ược hỗ trợ).
- Chuyển hình ảnh file .png, .jpeg chữ viết tay hoặc ánh máy sang dạng văn
bản ể tiến hành việc dịch thuật (với số lượng ngôn ngữ truy xuất hạn chế như:
Tiếng Anh, Pháp, Đức, Ý, Bồ Đào Nha và Tây Ban Nha). 2. Ưu iểm
- Có tính năng chuyển văn bản thành giọng nói giúp thuận tiện trong giao tiếp với người bản ịa.
- Dịch ược các từ vựng và oạn văn bản trên nhiều ngôn ngữ, ộ chính xác cao
và văn phong trôi chảy nhờ dịch vụ Amazon Translate. 3. Nhược iểm
- Amazon Polly chỉ hỗ trợ cho 11 ngôn ngữ nên việc ọc các văn bản còn hạn chế.
4. Hướng phát triển - Mở rộng dữ liệu
ầu vào có thể thể là dạng file .txt, .pdf và giọng nói. lOMoARcPSD| 36991220
- Mở rộng cho nhiều ngôn ngữ. lOMoARcPSD| 36991220
TÀI LIỆU THAM KHẢO
[1]. Amazon Translate - Dịch máy chính xác và thông thạo
Link: https://aws.amazon.com/vi/translate/
https://docs.aws.amazon.com/translate/latest/dg/what-is.html [2]. Amazon Polly
Link: https://aws.amazon.com/vi/polly/
[3]. Amazon Translate And Google dịch
Link: https://taia.io/google-translate-vs-amazon-translate/