تبدیل متن به باینری چگونه کار میکند؟
کامپیوترها زبان انسان را نمیفهمند؛ آنها فقط جریان الکتریسیته (قطع و وصل) را درک میکنند. برای اینکه متنی مانند «سلام» در کامپیوتر ذخیره شود، ابتدا باید به اعداد تبدیل شود (کدگذاری). استاندارد جهانی فعلی برای این کار Unicode است. در مرحله بعد، این اعداد به مبنای دو (Binary) تبدیل میشوند که تنها شامل ارقام 0 و 1 است.
فرمول ریاضی تبدیل (تقسیم متوالی)
برای تبدیل هر کاراکتر به باینری، ابتدا کد عددی آن (ASCII یا Unicode Code Point) پیدا میشود، سپس آن عدد به طور متوالی بر 2 تقسیم میشود تا باقیماندهها، رشته باینری را بسازند.
مثال: حرف 'A' (کد 65)
32 ÷ 2 = 16 (rem 0)
16 ÷ 2 = 8 (rem 0)
8 ÷ 2 = 4 (rem 0)
4 ÷ 2 = 2 (rem 0)
2 ÷ 2 = 1 (rem 0)
1 ÷ 2 = 0 (rem 1)
Result: 01000001
TextEncoder به صورت خودکار انجام میشود تا پیچیدگی حروف فارسی و یونیکد مدیریت شود.نمونههای تبدیل شده
کلمه "آب"
هر حرف فارسی ۲ بایت (۱۶ بیت) فضا میگیرد.
کلمه "Web"
حروف کوچک و بزرگ انگلیسی کدهای متفاوتی دارند.
اشتباهات رایج در درک باینری
- !حساسیت به حروف بزرگ و کوچک: در باینری، 'a' با 'A' کاملاً متفاوت است. (01100001 در برابر 01000001).
- !تفاوت اسکی و یونیکد: بسیاری از ابزارهای قدیمی فقط از ASCII پشتیبانی میکنند و متن فارسی را خراب میکنند. ابزار WordAbyss از UTF-8 کامل پشتیبانی میکند.
پرسشهای متداول
چرا خروجی باینری من فقط شامل ۰ و ۱ است؟▼
زیرا سیستم باینری بر مبنای ۲ است و تنها دو حالت (خاموش/روشن) دارد که با ۰ و ۱ نمایش داده میشوند. این پایهایترین سطح ذخیره اطلاعات در سختافزار است.
آیا میتوانم ایموجیها را هم تبدیل کنم؟▼
بله! ایموجیها بخشی از استاندارد یونیکد هستند و معمولاً به ۴ بایت (۳۲ بیت) تبدیل میشوند. مثلاً ایموجی لبخند 😊 یک رشته باینری منحصر به فرد دارد.
