Đồ án Xây dựng hệ thống soạn thảo văn bản đa ngữ Anh - Việt - Chăm

- Dùng bảng mã ASCII mở rộng (1 byte chuẩn 8 bit) như vậy có 256 ký tự. - Cách mã hóa : * Theo cấu trúc dấu liền (mã hóa 1 byte): Theo nguyên tắc dựng sẵn con chữ nguyên âm và dấu thanh 5 thanh x 12 nguyên âm x 2 dạng hoa/thường = 120 tổ hợp 29 nguyên âm x 2 dạng hoa/thường = 58 dạng chữ có 44 chữ hình dáng giống chữ latinh -> mã hóa 134 ký tự. * Theo cấu trúc dấu rời (mã hóa 2 byte): Theo nguyên tắc các nguyên âm và các thanh được thay đổi hình dáng trong những ô riêng. -> cần 24 dạng hình để thể hiện tất cả chữ thuần Việt : 10 dấu thanh sắc, huyền, hỏi, ngã, nặng cho chữ hoa/thường. 12 nguyên âm hoa/thường : Ă, Â, Ê, Ô, Ơ, Ư – ă, â, ê, ô, ơ, ư. 2 phụ âm hoa/thường : Đ, đ.

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC