Mục lục:
- Định nghĩa - Định dạng chuyển đổi Unicode (UTF) có nghĩa là gì?
- Techopedia giải thích Định dạng Chuyển đổi Unicode (UTF)
Định nghĩa - Định dạng chuyển đổi Unicode (UTF) có nghĩa là gì?
Định dạng chuyển đổi Unicode (UTF) là định dạng mã hóa ký tự có thể mã hóa tất cả các điểm mã ký tự có thể có trong Unicode. Phổ biến nhất là UTF-8, là mã hóa có độ dài thay đổi và sử dụng các đơn vị mã 8 bit, được thiết kế để tương thích ngược với mã hóa ASCII.
Định dạng chuyển đổi Unicode còn được gọi là Định dạng chuyển đổi phổ quát.
Techopedia giải thích Định dạng Chuyển đổi Unicode (UTF)
Định dạng chuyển đổi Unicode là một trong hai bảng mã được sử dụng trong Unicode, còn lại là Bộ ký tự phổ quát (UCS). Cả hai đều được sử dụng để ánh xạ phạm vi các điểm mã Unicode thành các chuỗi các giá trị mã được gọi là. Các số trong tên của mã hóa cho biết có bao nhiêu bit đang được sử dụng trong một giá trị mã của mã hóa. Điều này chỉ có nghĩa là mỗi ký tự duy nhất đang được gán một mã định danh mã được gọi là điểm mã.
Các loại mã hóa UTF khác nhau bao gồm:
- UTF-1 - Tiền thân đã nghỉ hưu của UTF-8, không còn là một phần của Tiêu chuẩn Unicode
- UTF-7 - Sử dụng 7 bit để mã hóa và chủ yếu được sử dụng trong email, nhưng hiện được coi là lỗi thời
- UTF-8 - Sử dụng mã hóa độ rộng biến 8 bit để tối đa hóa khả năng tương thích với ASCII
- UTF-16 - Mã hóa độ rộng biến đổi 16 bit
- UTF-32 - Mã hóa độ rộng cố định 32 bit
- UTF-EBCIDC - Sử dụng 8 bit và được thiết kế để tương thích với Mã trao đổi thập phân nhị phân mã hóa mở rộng (EBCDIC)