مشخصات مقاله
-
1700
-
0.0
-
4804
-
0
-
0
آموزش Unicode در Java
آموزش Java – سیستم Unicode
سیستم یونیکد یک استاندارد بین المللی کدگذاری کاراکتر است که قابلیت نمایش و ارائه ی بیشتر زبان های نوشتاری دنیا را دارا می باشد.
چرا Java از سیستم Unicode استفاده می کند؟
پیش از اختراع Unicode استانداردهای زیادی وجود داشت که در زیر به شرح آن ها می پردازیم:
- ASCII استانداری برای درج و نمایش الفبای انگلیسی و برخی از کاراکترهای پرکاربرد معمول می باشد.
- ISO 8859-1 استانداردی برای درج و نمایش حروف الفبای زبان های مربوط به سمت غرب اروپا
- KOI-8 استانداردی برای نوشتن و نمایش حروف الفبای زبان روسی
- GB18030 و BIG-5 استانداری برای نوشتن و نمایش حروف الفبای زبان چینی
این امر سبب رخداد دو معضل زیر می شد:
- مقدار یک کد (بر اساس استانداردها) در زبان های مختلف ممکن بود با چندین حروف مختلف منطبق باشد.
- الگوریتم های کدگذاری برای زبان های مختلف با مجموعه کاراکترهای طولانی و بزرگ طبیعتا دارای طول متغیر بود. برخی از کاراکترهای پرکاربرد و معمول در قالب یک بایت واحد کدگذاری می شدند و سایر کاراکترها دو یا چند بایت را اشغال می کردند.
راه حل ارائه شده
به منظور حل مشکلات نام برده، یک استاندارد جدید کدگذاری نویسه های زبان به نام Unicode طراحی و ارائه شد. در استاندارد یونیکد، هر کاراکتر دو بایت را اشغال می کند. به همین خاطر Java برای ذخیره ی هر کاراکتر 2 بایت، معادل 16 بیت را در حافظه اختصاص می دهد.
- پایین ترین بازه ی مقدار: \u0000
- بالاترین بازه ی مقدار: \uFFFF