یونی کد چیست
یونی کد چیست و اهمیت آن در کجاست؟یونیکد به ما تعداد زیادی «نویسه» (یا character) میدهد.
یونی کد چیست و اهمیت آن در کجاست؟
یونیکد به ما تعداد زیادی «نویسه» (یا character) میدهد. در
یونیکد، نویسه به این شکل تعریف میشود: «کوچکترین جزء زبان نوشتاری که ارزش
معنایی دارد؛ نویسه به معنی و/یا شکل انتزاعی اطلاق میشود، نه به اَشکال مشخص».
مجموعهٔ کامل نویسههای یونیکد را میتوانید در اینجا ببینید، و متن کامل این
استاندارد را میتوانید از اینجا بگیرید (استاندارد یونیکد، نسخهٔ ۶٫۰٫۰، پروندهٔ
PDF زیپشده، ۸ مگابایت).
مثلاً، حرف «ب» یک نویسه است، و یونیکد آن را در
نشانی U+0628 و با نام ARABIC LETTER BEH به رسمیت شناخته و کدگذاری کرده است. با
این حساب، کد U+0628 کد مشخصهٔ حرف «ب» است، مستقل از این که برای چه زبانی استفاده
شود.
حواستان باشد که نویسه را با «شکل» (یا glyph) اشتباه نگیرید. «شکل»، صورت
مشخصی است که نویسهها در حالتهای مختلف ممکن است به خود بگیرند. در نمایش اطلاعات
با نویسههای یونیکدی، برای هر نویسهٔ مشخص ممکن است از یک یا چند شکل مختلف
استفاده شود.
مثلاً، حرف «غ» در حروف چاپی چهار شکل مختلف به خود میگیرد: ۱)
اول: «غـ»، ۲) وسط: «ـغـ»، ۳) آخر: «ـغ»، و ۴) تنها: «غ». یونیکد سعی میکند
مفاهیم را کدگذاری کند، نه شکلها را.
ممکن است متوجه شده باشید که فقط زبانهای
فارسی و عربی نیستند که به خط عربی نوشته میشوند. زبانهای فراوانی وجود دارند که
خط عربی را برای نیازهای خود گسترش داده و از آن استفاده میکنند.
در نتیجه، در
بلوکهای عربی یونیکد، صدها حرف مختلف وجود دارد. حرفهایی که ممکن است به چشم
فارسیزبانان یا عربیزبانان عجیب بیاید، مثل نویسهٔ U+069B با نام ARABIC LETTER
SEEN WITH THREE DOTS BELOW، که حرف «س» است با سه تا نقطه زیرش.
(خوانندگانی که
با تاریخ خط فارسی آشنایی دارند ممکن است بدانند که این حرف در بعضی از متون
قدیمیتر فارسی وجود دارد).
از ویژگیهای این تعدد نویسهها این است که بعضی
نویسهها در بعضی حالتها عین یکدیگر به نظر میرسند ولی در حالتهای دیگر
متفاوتند. برای مثال، میشود از «ی فارسی» در مقابل «ی عربی» نام برد؛ البته
مثالهای ظریفتر و مشکلتری نیز وجود دارند.
در نوشتههای بعدی این مجموعه
دربارهٔ این نویسههای گیجکننده خواهیم نوشت. اما تا آن وقت، تکلیف شب شما این که
جدول نویسههای بلوک اصلی خط عربی یونیکد را بررسی کنید (پروندهٔ PDF، ۱۸۰
کیلوبایت). دربارهٔ چیزهای جالبی که پیدا کردید برای ما بنویسید.
اگر سردرگم
شدهاید، دو راهنمای بسیار عالی هست که به شما میگوید برای زبان فارسی ایران و
زبانهای فارسی دری و پشتوی افغانستان از چه نویسههایی باید استفاده کرد.
برای
ایران، مرجع رسمی این مسائل استاندارد ملی ایران ۶۲۱۹ است که پروژهٔ فارسیوب به
زبان فارسی در سال ۱۳۸۱ برای سازمان ملی استاندارد ایران تهیه کرده است. نسخهٔ PDF
این استاندارد را میتوانید از وبگاه فارسیوب بگیرید.
وبگاه سازمان ملی
استاندارد ایران فقط نسخهٔ HTML استانداردهایش را در دسترس عموم قرار داده است، و
متأسفانه در روند تبدیل پروندهٔ PDFی که پروژهٔ فارسیوب تهیه کرده بوده است به
HTML، سازمان ملی استاندارد ایران همان اشتباههایی را مرتکب شده است که در
استاندارد ۶۲۱۹ توصیه شده است از آنها اجتناب شود. از نسخهٔ HTML این استاندارد
پرهیز کنید.
برای افغانستان، مرجع رسمی، سند «Computer Locale Requirements for
Afghanistan» است (به زبان انگلیسی) که در سال ۱۳۸۲ شمسی به سفارش برنامهٔ توسعهٔ
سازمان ملل متحد تهیه شده است. نسخهٔ PDF این گزارش را میتوانید از وبگاه
اِوِرتایپ بگیرید.
به نقل از وبلاگ فارسی گوگل
برخی از محصولات شرکت مهندسی آبان رایان البرز
- خرید نرم افزار مشاور املاک سرو
- خرید نرم افزار خیریه سرو
- خرید نرم افزار مدیریت بدهکاران و بستانکاران سرو
- خرید نرم افزار دفترچه تلفن سرو
- خرید نرم افزار نامه نگار سرو
- نرم افزار چاپ قولنامه مشاور املاک سرو
- نرم افزار چاپ قولنامه نمایشگاه اتومبیل سرو
- نرم افزار بایگانی اسناد
- نرم افزار مدیریت سفارشات
- نرم افزار دبیرخانه سرو
- نرم افزار صندوق مکانیزه مشاور املاک سرو
- نرم افزار اجاره خودرو سرو
سایر مقالات آموزشی شرکت نرم افزاری آبان رایان البرز :
- خنثی کردن عملیات باundo
- فرهنگ لغات کامپیوتری2
- دزدان اینترنتی
- خطا با کلیک روی دکمه نصب
- مقدمه داده کاوی
- سیستم فایل 2
- دسته بندی سیستم ها
- پردازنده های آینده
- دلیل پیدایش داده کاوی
- مرور گر internet explorer
- تک پردازشی
- برگشت چک دریافتنی در نرم افزارخیریه سرو
- خواباندن به حساب چک دریافتنی در نرم افزارخیریه سرو
- عودت چک دریافتنی در نرم افزارخیریه سرو
- وصول چک دریافتنی و واریز به صندوق در نرم افزارخیریه سرو
- وصول چک دریافتنی در نرم افزارخیریه سرو