کانال بله, جهت پشتیبانی و اطلاع رسانی کانال بله, جهت پشتیبانی و اطلاع رسانی
عضویت

آموزش Unicode در Java

آموزش Java – سیستم Unicode

سیستم یونیکد یک استاندارد بین المللی کدگذاری کاراکتر است که قابلیت نمایش و ارائه ی بیشتر زبان های نوشتاری دنیا را دارا می باشد.

چرا Java از سیستم Unicode استفاده می کند؟

پیش از اختراع Unicode استانداردهای زیادی وجود داشت که در زیر به شرح آن ها می پردازیم:

  1. ASCII استانداری برای درج و نمایش الفبای انگلیسی و برخی از کاراکترهای پرکاربرد معمول می باشد.
  2. ISO 8859-1 استانداردی برای درج و نمایش حروف الفبای زبان های مربوط به سمت غرب اروپا
  3. KOI-8 استانداردی برای نوشتن و نمایش حروف الفبای زبان روسی
  4. GB18030 و BIG-5 استانداری برای نوشتن و نمایش حروف الفبای زبان چینی

این امر سبب رخداد دو معضل زیر می شد:

  1. مقدار یک کد (بر اساس استانداردها) در زبان های مختلف ممکن بود با چندین حروف مختلف منطبق باشد.
  2. الگوریتم های کدگذاری برای زبان های مختلف با مجموعه کاراکترهای طولانی و بزرگ طبیعتا دارای طول متغیر بود. برخی از کاراکترهای پرکاربرد و معمول در قالب یک بایت واحد کدگذاری می شدند و سایر کاراکترها دو یا چند بایت را اشغال می کردند.

راه حل ارائه شده

به منظور حل مشکلات نام برده، یک استاندارد جدید کدگذاری نویسه های زبان به نام Unicode طراحی و ارائه شد. در استاندارد یونیکد، هر کاراکتر دو بایت را اشغال می کند. به همین خاطر Java برای ذخیره ی هر کاراکتر 2 بایت، معادل 16 بیت را در حافظه اختصاص می دهد.

  • پایین ترین بازه ی مقدار: \u0000
  • بالاترین بازه ی مقدار: \uFFFF
1396/06/23 4804 1700
رمز عبور : tahlildadeh.com یا www.tahlildadeh.com
نظرات شما

نظرات خود را ثبت کنید...