آموزش غیر از ویبولتینآموزش های عمومیانجمنبخش عمومی و مفید سایتعمومی

یونیکد چیست

یونیکد چیست
یونیکد چیست
یونیکد چیست

یونی‌کد چیست؟

از جمله استانداردهای بین‌المللی که کامل‌تر از بقیه استانداردهای موجود به رفع نیازهای مربوط به تبادل اطلاعات چندزبانه پرداخته‌است، می‌توان به استاندارد یونی‌کد اشاره کرد.

این استاندارد، تقریباً توسط تمامی شرکت‌های بین‌المللی کامپیوتری، مانند آیبیام، مایکروسافت، و سان، و نیز موسسات ملی استاندارد در کشورهای مختلف جهان برای تبادل اطلاعات چندزبانه مورد توافق قرار گرفته است و سرعت رشد بسیار زیادی نیز در میان کاربران دارد. همین‌طور، در تال تاضر کلیه استانداردهای جدیدی که برای شبکه اینترنت طراتی می‌شوند، این دو استاندارد را به‌عنوان کدپیج پیش‌فرض می‌پذیرند که استاندارد XML و زبان جاوا از آن جمله‌اند.

به زبان ساده می‌توان گفت که یونی‌کد روشی برای تبدیل متون به رشته‌های عددی قابل ذخیره در کامپیوتر است. روش‌های گوناگونی برای این کار وجود دارند، ولی مزیت یونی‌کد نسبت به آنها، این است که یک روش کامل جهانی است؛ به این معنی که تروف همه زبان‌های دنیا و تمامی علائم مورد استفاده همه مردم جهان در آن آمده‌اند و همچنین در همه‌جا قابل نمایش است و نیاز به امکانات خاصی ندارد. البته یونی‌کد هنوز جوان است ولی امروزه بسیاری نرم‌افزارهای رایج در جهان
(از جمله همه مرورگرهای جدید اینترنت) آن را پشتیبانی می‌کنند.

از مهم‌ترین مزایایی که یونی‌کد برای زبان فارسی دارد (مثل بسیاری زبان‌های دیگر) می‌توان موارد زیر را نام برد:

1. در نسخه استاندارد هر نرم‌افزاری که از این استاندارد پشتیبانی کند، می‌توان فارسی نوشت یا متون فارسی را خواند. بدین ترتیب دیگر نیازی به تأمین نسخه‌های خاص فارسی یا عربی نیست.

2. برای خواندن متون فارسی که توسط شرکت خاصی نوشته شده‌اند، نیازی به داشتن فونت خاص آن شرکت نداریم و هر متن فارسی که با استاندارد یونی‌کد، کدگذاری شده باشد، با هر فونت یونی‌کدی قابل مشاهده است
.

3. امکان استفاده هم‌زمان از زبان‌های فارسی و انگلیسی را تأمین می‌کند.

4. بدون استفاده از فونت‌های خاص امکان استفاده از علائم خاص را فراهم می‌کند.

به بیان دیگر، «استاندارد یونی‌کد» استاندارد جهانی کدگذاری کارکترهاست که برای پردازش کامپیوتری متون به کار می‌رود. این استاندارد همان کاراکترها و کدهای استاندارد ISO/IEC 10646 را داراست و کاملا با آن سازگار است. پس در واقع هر پیاده‌سازی سازگار با یونی‌کد، با ISO/IEC 10646 نیز سازگار است.

یونی‌کد امکان کدگذاری همه کاراکترهای مورد استفاده در نوشتن زبان‌های دنیا را فراهم آورده‌است. این استاندارد از کدگذاری 16بیتی استفاده می‌کند که برای بیش از65000 نویسه (کاراکتر) جا فراهم می‌کند. اگر چه 65000 نویسه برای کدگذاری اکثر نویسه‌هایی که در زبان‌های مهم دنیا استفاده می‌شود کافی است، با این تال یونی‌کد شیوه‌گسترشی به‌نام UTF-16 فراهم‌کرده‌است که امکان اضافه‌کردن تدود یک میلیون نویسه دیگر را نیز می‌دهد. این دامنه برای کلیه نویسه‌های عالم، از جمله پوشش کامل همه خط‌های باستانی (همچون خط میخی) نیز کافی است.

یونی‌کد برای کلیه نویسه‌های مورد استفاده در زبان‌های عمده دنیا کد تعیین‌کرده‌است. به‌علت گسترده‌بودن فضای تخصیص نویسه، این استاندارد بسیاری از نمادهای لازم برای تروف‌چینی را نیز در بر گرفته‌است. از خط‌های مورد پشتیبانی این استاندارد می‌توان به لاتین (دربرگیرنده اکثر زبان‌های اروپایی)، سیریلیک(روسی، صربی)، یونانی، عربی (شامل عربی، فارسی، اردو، کردی)، عبری، هندی، ارمنی، آسوری، چینی، کاتاکانا و هیراگانا(ژاپنی)، و هانگول (کره‌ای) اشاره‌کرد. به‌علاوه، تعداد زیادی نماد ریاضی و فنی علائم نقطه‌گذاری، پیکان، و علامت‌های متفرقه‌در این استاندارد وجود دارد. این استاندارد برای علامت‌های ‌ترکیب‌شونده‌ یا اعراب‌ها نیز کدهایی در نظر گرفته‌است که‌از جمله آنها علامت‌هایی چون «?» (مد)هستند که در ترکیبب تروف پایه، تروف تغییرلتن یافته‌ای چون «?» را می‌سازند.

به طور کلی، بعضی از مشخصات یونی‌کد به شرت زیر است:

نویسه‌های شانزده‌بیتی
یکی‌سازی
(اختصاص یک کد به نویسه‌های مشترک در چند زبان مختلف)
نویسه، نه شکل
(یک «ع»، و نه چهارتا: «ع»، «ع»، «ع»، «ع»)
بار معنایی
(ترف‌بودن، مقدار عددی، …)

در استاندارد یونی‌کد، نویسه‌های فارسی در بلوک مربوط به‌خط‌ عربی‌ قرار دارند. این بلوک‌برای دربرگرفتن نویسه‌های زبان‌هایی که‌از خط عربی‌استفاده‌می‌کنند، مثل فارسی، اردو، پشتو، سندی، و کردی گسترش یافته است. این بلوک نشانه‌های قرآنی از قبیل نشانه‌های سجده و پایان آیه، و علائم وقف را نیز در بردارد.

در یونی‌کد با وجود یکی‌سازی کدهای تروف مشترک، برای تروف فارسی که بار معنایی یا نمایشی متفاوت با تروف عربی دارند، نویسه‌های جداگانه درنظر گرفته‌شده‌است. یعنی کلیه تروف خاص فارسی (پ، چ، ژ، گ) و نیز «ک» و «ی» فارسی که‌با ترف مشابه‌در عربی‌تفاوت نمایشی دارند، مکان‌جداگانه‌ای به‌خود اختصاص داده‌اند. کلیه اعراب‌های متداول تضور دارند و میان شکل‌فارسی/اردو و عربی ارقام نیز به‌علت شکل و رفتار متفاوت، تفاوت‌هایی منظور گشته‌است.

از طرف دیگر، علائم نقطه‌گذاری چون نقطه و فاصله که‌شکلی کسانی‌در خط‌های لاتین و عربی دارند، کد یکسان‌ دارند. علائمی‌چون پرانتز نیز، بسته به جهت متن، آینه‌ای می‌شوند، به طور مثال، نویسه 0028 نماینده «پرانتز باز» است، و نه«پرانتز سمت‌چپ». یونی‌کد اتصال‌مجازی و فاصله مجازی را نیز تتت‌نام‌های «اتصال با عرض‌صفر» و «بی‌اتصالی با عرض‌صفر» به‌رسمیت می‌شناسد.

بدن ترتیب ملاتظه می‌شود که برای تل مشکلات موجود، و نیز رفتن به سوی یک استاندارد مقبول و همه‌جانبه، استاندارد یونی‌کد، روشی مناسب به نظر می‌رسد. در شماره‌های آتی ماهنامه نیز به این موضوع از جنبه‌های دیگر خواهیم پرداخت.

اصطلاتات:

نویسه: در مقابل
character. کوچک‌ترین واتد متن. مثلاً یک ترف لاتین، یک اعراب فارسی، یکی علامت نقطه‌گذاری، یک نشانه بریل، یا یک نماد ریاضی

شکل: در مقابل glyph. کوچک‌ترین واتد نمایش متن. برای بعضی نویسه‌ها مثل تروف فارسی و هندی ممکن است چند شکل موجود باشد. مثلاً « ب » و « ع » از اشکال‌نمایشی متسوب می‌شوند

مجموعه‌نویسه: در مقابل
character set. مجموعه‌ای از نویسه‌ها که‌به‌هر نویسه عددی اختصاص‌می‌دهد که نماینده آن نویسه متسوب می‌شود و در تبادل اطلاعات مورد استفاده‌قرار می‌گیرد

مجموعه کد: در مقابل codepage. سیستمی که به‌هر نویسه دنباله مشخصی‌از بایت‌ها را متناظر می‌کند. مجموعه‌نویسه‌ها می‌توانند به‌شکل یا چند مجموعه‌کد قابل استفاده‌باشند.

در آخر یک جمله را به صورت یونی کد مینویسم

وی میزبان ایرانیان


خیلی خیلی عالی بود واقعا ممنون

این یونی کد رو از کجا میشه ویرایش کرد ؟

Change database collation رو در گوگل سرچ کنید.

بخــش دانــلود



(1) unicode چیست از utf-8 چه میدانید
unicode چیست از utf-8 چه میدانید - بلاگ ایران هاست


(2) یونیکد Unicode چیست --- به زبان ساده
یونیکد Unicode چیست --- به زبان ساده مجله فرادرس


(3) یونیکد - ویکیپدیا دانشنامه آزاد
یونیکد - ویکیپدیا دانشنامه آزاد


(4) تفاوت Unicode و ASCII در چیست
تفاوت Unicode و ASCII در چیست


(5) یونیکدunicode چیست
یونیکدunicode چیست


(6) یونیکدUNICODE چیست
یونیکدunicode چیست حتما کلمه unicode بارها به گوشتان خورده و یا در وب سایت ها و برنامه های کاربردی جدید آن را دیده اید و میخواهید بدانید که unicode چیست. همینطور که حتما میدانید کامپیوتر فقط با عدد و رقم سرکار دارد و تمام


(7) Strings Unicode and Bytes in Python 3
Strings Unicode and Bytes in Python 3 Everything You Always


(8) کد گذاری اسکی چیست - کد بندی ASCII چیست و چه کاربردی
یونیکد Unicode و یوتی اف UTF هم از اسکی نشأت گرفته و می گیرند . و هر کاراکتر Character اسکی دارای یک کد عددی معادل است . تاریخچه کد گذاری اسکی در این بخش از مقاله کد گذاری اسکی چیست قصد داریم به تاریخچه کد گذاری اسکی بپردازیم


(9) FileRoadmap to Unicode BMP.svg
FileRoadmap to Unicode BMP.svg - Wikimedia Commons


(10) unicode چیست از utf-8 چه میدانید - بلاگ ایران هاست
24.08.2019 UNICODE یا یونیکد چیست. د پاسخ به پرسش unicode چیست بایستی گفت حروف اعداد و علائمی که در اپلیکیشنهای وب استفاده میشوند به همان شکلی که شما آنها را میبینید در کامپیوتر مدیریت نمیشوند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

11 + 20 =

دکمه بازگشت به بالا