Unicode mã hoá mỗi kí tự bởi A. 1 byte. B. 2 byte C. 4 byte. D. Từ 1 đến 4 byte.

294

Với giải Câu 3.7 trang 9 SBT Tin học lớp 10 Kết nối tri thức chi tiết trong Bài 3: Một số kiểu dữ liệu và dữ liệu văn bản giúp học sinh dễ dàng xem và so sánh lời giải từ đó biết cách làm bài tập trong SBT Tin học 10. Mời các bạn đón xem:

Giải SBT Tin học lớp 10 Bài 3 Một số kiểu dữ liệu và dữ liệu văn bản

Câu 3.7 trang 9 SBT Tin học 10: Unicode mã hoá mỗi kí tự bởi

A. 1 byte.

B. 2 byte

C. 4 byte.

D. Từ 1 đến 4 byte.

Trả lời:

Đáp án đúng là: D

UTF-8 là một trong các hệ thống định dạng chuyển đổi cho phép mã hóa kí tự với độ dài khác nhau (từ 1 byte đến 4 byte) dành cho Unicode.

Lý thuyết Bảng mã Unicode

- Ngoài các kí tự có trong bảng chữ cái tiếng Anh, Tiếng Việt còn có 134 nguyên âm có dấu thanh và phụ âm “đ” đều không có sẵn trong bảng mã ASCII, trong khi phần mở rộng của bảng mã ASCII lại chỉ có 128 vị trí.

- Tình trạng thiếu vị trí còn trầm trọng hơn với những quốc gia dùng chữ tượng hình như Trung Quốc, Hàn Quốc, …

⇒ Do đó bảng mã Unicode được xây dựng dùng chung cho mọi quốc gia.

- Unicode là một bộ tiêu chuẩn biểu diễn kí tự văn bản trong máy tính, cho phép biểu diễn kí tự thuộc nhiều loại ngôn ngữ khác nhau.

- UTF-8 là hệ thống mã hóa kí tự với độ dài khác nhau dành cho Unicode.

- Từ năm 2017, Việt Nam ban hành quy định bắt buộc sử dụng UTF-8 để biểu diễn các kí tự Tiếng Việt trong máy tính, dùng bảng mã ASCII để mã hóa kí tự latinh không dấu, sử dụng 2 byte để mã hóa các nguyên âm có dấu, các kí tự Đ đ và chỉ dùng 3 byte một số rất ít các kí tự đặc biệt.

Đánh giá

0

0 đánh giá