Unicode 101

Mục lục:

Anonim

Nếu bạn không chú ý, có cả một thế giới bên ngoài Hoa Kỳ. Thật không may, đại diện cho văn bản trong các ngôn ngữ khác nhau có thể là thách thức cho các lập trình viên. Unicode là một tiêu chuẩn phổ biến để thể hiện văn bản giúp dễ dàng hỗ trợ hầu hết mọi ngôn ngữ. Ở đây chúng ta sẽ xem xét những điều cơ bản của Unicode.

Unicode là gì?

Nếu bạn quen thuộc với các chi tiết kỹ thuật về cách lưu trữ văn bản trong máy tính và bạn là người nói tiếng Anh bản địa, có lẽ bạn đã nghe nói về ASCII, Mã tiêu chuẩn Mỹ để trao đổi thông tin. ASCII ánh xạ byte thành số, chữ cái, ký hiệu khác nhau và ký tự điều khiển, làm những việc như tiếng bíp của loa máy tính hoặc báo hiệu bắt đầu một dòng mới. Nó tồn tại mãi mãi và nó hoạt động rất tốt - nếu ngôn ngữ chính của bạn là tiếng Anh Mỹ.

Tuy nhiên, nhiều người dùng máy tính trên khắp thế giới nói các ngôn ngữ khác, nhiều ngôn ngữ thậm chí không gần với tiếng Anh. Nếu bạn là nhà phát triển và phần mềm của bạn không tính đến điều này, bạn có thể bị đau đầu thực sự.

Unicode 101