Luận văn Nghiên cứu xây dựng hệ tổng hợp tiếng Việt trên điện thoại di động

1.1. Nhu cầu và lý do Tổng hợp tiếng nói là lĩnh vực được rất nhiều nhóm nghiên cứu quan tâm, vì nó có rất nhiều ứng dụng trong thực tế, như các hệ thống trả lời tự động, đọc nội dung văn bản, máy phiên dịch, tuy nhiên tổng hợp tiếng nói cho tiếng Việt còn rất nhiều hướng nghiên cứu, đặc biệt là trên thiết bị di động như điện thoại thông minh, các ứng dụng còn rất hạn chế. Cùng với sự phát triển của Khoa học kỹ thuật, các điện thoại thông minh (smart phone) ngày nay có cấu hình mạnh (tốc độ xử lý) và bộ nhớ lớn, có thể chạy được các ứng dụng yêu cầu cao về xử lý và bộ nhớ. Các dịch vụ nội dung số cũng phát triển mạnh mẽ cùng với sự phát triển của các điện thoại thông minh và cước phí viễn thông ngày càng rẻ, băng thông ngày càng cao. Vì vậy các ứng dụng tiện ích chạy trên điện thoại di động được rất nhiều người quan tâm. Trong đó, các ứng dụng tổng hợp tiếng nói là một lĩnh vực khó, được nhiều nhóm nghiên cứu quan tâm. Đối với đa số người dùng điện thoại, nhắn tin là một tiện ích không thể thiếu, nó rất tiện lợi trong việc truyền đạt thông tin một cách rõ ràng và người đọc cũng ít bị ảnh hưởng. Tuy nhiên với một số người mắt kém (đặc biệt là người già), việc đọc các tin nhắn rất khó khăn vì chữ trên điện thoại thường rất nhỏ. Nếu có phần mềm đọc tin nhắn văn bản thành lời sẽ rất tiện cho những người này. Kỹ thuật tổng hợp tiếng nói trên điện thoại di động cũng sẽ có nhiều ứng dụng bổ ích cho một số mục đích như: đọc nội dung trang web, đọc nội dung một file văn bản, Tuy nhiên viết ứng dụng trên điện thoại di động sẽ gặp phải những khó khăn so với lập trình trên máy tính để bàn như: tốc độ xử lý, bộ nhớ thấp hơn, hệ điều hành đi động hỗ trợ lập trình kém hơn (thư viện lập trình hạn chế, giao diện hạn chế, ) 1.2. Mục tiêu Đề xuất giải pháp xây dựng hệ tổng hợp tiếng nói tiếng Việt trên thiết bị di động dùng hệ điều hành Windows mobile. Đồng thời xây dựng phần mềm đọc tin nhắn văn bản tiếng Việt (có dấu) làm thực nghiệm cho giải pháp này. Thực nghiệm thực hiện trên hai phương pháp, dùng hệ thống nền (khoảng lặng cố định) và hệ thống cải tiến (khoảng lặng thay đổi dựa vào máy chuyển đổi trạng thái hữu hạn có trọng số) 1.3. Các hướng nghiên cứu liên quan Ở trong nước, các nghiên cứu về tổng hợp tiếng nói cho tiếng Việt chủ yếu được tiến hành theo hai phương pháp tổng hợp ghép nối và tổng hợp formant. Đã có một số nghiên cứu và sản phẩm tổng hợp tiếng nói cho tiếng Việt trên cơ sở ghép nối cho tiếng Việt, trong đó đơn vị ngữ âm cơ sở là âm tiết được chọn lựa nhiều nhất. Một số nhóm nghiên cứu điển hình: Nhóm của TS. Vũ Hải Quân thuộc phòng thí nghiệm trí tuệ nhân tạo (AiLab) của Khoa Công Nghệ Thông tin trường Đại học Khoa Học tự Nhiên TP. Hồ Chí Minh đã áp dụng khá thành công phương pháp chọn đơn vị với tập dữ liệu âm thanh khá lớn, trang web thử nghiệm của nhóm: www.ailab.hcmus.edu.vn/slp/vos/ Nhóm của Phạm Thanh Nam, với phần mềm “Tiếng nói Việt Nam”, sourceforge.net/projects/vietnamesevoice/ Nhóm của Lương Chi Mai, thuộc Phòng Công nghệ phần mềm, Viện Ứng dụng Công nghệ - Bộ Khoa học và Công nghệ, Website: www.vndocr.com/ Các hệ thống tổng hợp tiếng nói cho tiếng Việt thường sử dụng công nghệ TD-PSOLA để làm trơn điểm ghép nối và biến đổi các tham số cao độ và trường độ. Tương tự như vậy, cũng đã có một số nghiên cứu cũng như sản phẩm tổng hợp tiếng nói cho tiếng Việt theo phương pháp formant (cộng hưởng tần số). Tuy nhiên thực nghiệm cho thấy chất lượng tiếng nói tổng hợp theo phương pháp này còn rất hạn chế. Một số nhóm nghiên cứu điển hình: Lê Hồng Minh, Hệ thống vnspeech, website: www.vnisg.com/ Lê Hồng Minh, Tổng hợp formant âm tiết tiếng Việt, Tạp chí Bưu chính Viễn thông. Văn Ngọc An, Tổng hợp tiếng Việt bằng giải thuật TD-PSOLA, ĐH Bách Khoa Hà Nội [1] Hướng tiếp cận của đề tài này là dùng máy chuyển đổi trạng thái hữu hạn có trọng số để xác định khoảng lặng giữa các đơn vị âm thanh dùng phương pháp ghép nối. 1.4. Nội dung Phần nội dung chính của đề tài gồm một số chương sau: Chương 2: Tổng quan về tổng hợp tiếng nói Giới thiệu tổng quan về một hệ thống tổng hợp tiếng nói từ văn bản. Chương 3: Tổng hợp tiếng nói trên windows mobile Giới thiệu môi trường và các vấn đề cần giải quyết để xây dựng ứng dụng tổng hợp tiếng nói trên môi trường di động, mà cụ thể là trên Windows mobile. Chương 4: Máy chuyển đổi trạng thái hữu hạn Giới thiệu tổng quan về máy chuyển đổi trạng thái hữu hạn (Finite State Transducer - FST), các thuật toán tối ưu trên FST. Một dạng của FST áp dụng trong luận văn này là máy chuyển đổi trạng thái hữu hạn có trọng số (Weighted Finite State Transducer - WFST) Chương 5: Thực nghiệm Thực nghiệm được thực hiện trên hia phương pháp: hệ thống nền (ghép nối với khoảng lặng có định) và hệ thống cải tiến (ghép nối với khoảng lặng thay đổi) và so sánh kết quả đánh giá giữa hai phương pháp. Chương 6: Kết luận Kết quả đạt được và hướng phát triển

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC

HỖ TRỢ TÌM VÀ TẢI TÀI LIỆU

  • Từ ngày 01/05/2022

    Luanvan365 sẽ có thêm dịch vụ hỗ trợ các bạn tìm kiếm các tài liệu, luận văn ở nhiều website khác nhau
    Bạn có thể liên hệ với Admin để được hỗ trợ nhé
  • THÔNG TIN LIÊN HỆ


    Phone: 0909.773687 (Zalo, Text) Facebook : Facebook chat hỗ trợ

  • XEM THÊM THÔNG TIN

    Xem thêm bài viết
LIÊN HỆ NGAY

TIN KHUYẾN MÃI

  • thư viện luận văn

    Thư viện tài liệu Phong Phú

    Hỗ trợ download nhiều Website

  • thư viện luận văn

    Nạp thẻ & Download nhanh

    Hỗ trợ nạp thẻ qua Momo & Zalo Pay

  • thư viện luận văn

    Nhận nhiều khuyến mãi

    Khi đăng ký & nạp thẻ ngay Hôm Nay

NẠP THẺ NGAY