Двійкові та текстові дані не розділені: вони просто дані . Це залежить від тлумачення, яке робить їх тим чи іншим. Якщо ви відкриєте двійкові дані (наприклад, файл зображення) в текстовому редакторі, велика частина цього не матиме сенсу, оскільки це не відповідає обраній інтерпретації (як текст).
Те, що ви називаєте текстом, - це підмножина можливого вмісту файлу: Дані, які в заданому наборі символів перекладаються на читаються символи.
Наприклад, в ASCII ви бачите, що з 128 "дозволених" значень лише половина - букви та цифри, 30 - пунктуаційні, а решта - контрольні символи . Остання група просто не використовується багато в текстових файлах, і вони не мають насправді хорошого текстового подання. Деякі з них - це символи Tab і Newline , де текстові редактори вже потребують творчості для їх відображення.
Деякі текстові редактори мають можливість чітко відображати пробіл. Тоді вони насправді малюватимуться як символи, крім звичайної поведінки форматування (що також є лише інтерпретацією цих символів).
Чистий ASCII інтерпретує лише 128 значень. У байтах, що використовуються для зберігання цієї інформації, є 256 можливих значень кожен, тому половина можливих значень заборонена в ASCII. Вони використовуються, наприклад, у наборах символів для регіону, таких як латинська 1, але в ASCII вони не визначені. Вони не мають корисного представлення в засобі перегляду тексту, який може обробляти лише ASCII.
Бінарні дані зазвичай не інтерпретуються як текст. Тож у цих файлах зазвичай знаходяться всі можливі значення байтів . Все інше було б марно (і це є причиною, що ви можете дуже добре стиснути текст). Формати файлів зображень складні, і ви зазвичай не розглядаєте їх як текст, тому їх не потрібно читати.
Оскільки немає загальної інтерпретації даних (набір символів), яка відображає всі можливі значення для читаються символів, і оскільки це все одно не мало б сенсу (оскільки це не читабельний текст), основні частини відображаються як безглузді.
Шістнадцятковий редактор вибирає для даних інше представлення: він відображає кожен байт у вигляді двох шестинадцяткових цифр. Це просто інше представлення, і таке з легко читабельним набором символів: Усі 256 можливих байтових значень можна представити двома шістнадцятковими цифрами.
Оскільки просте зіставлення двійкових даних у шістнадцяткове і навпаки (4 двійкові цифри до / з однієї шістнадцяткової цифри), а двійкові дані містять дуже мало інформації на одну цифру, то шістнадцятковий - це, як правило, кращий спосіб для читання бінарних даних, якщо немає конкретних причини віддати перевагу іншому представництву.
Деякі текстові редактори можуть мати шістнадцятковий режим редактора та деякі евристичні, які намагалися визначити, чи є файл текстовим чи двійковим, і автоматично вибирають один або інший режим. Але це може бути складно виправити, і це не специфічна властивість файлу, яка говорить про те, що це один чи інший вид.
Деякі клієнти FTP просять вас вказати, які закінчення файлів використовуються для текстових даних . Потім ці програми змінять вміст файлу відповідно до ОС машини, до якої ви підключені, оскільки Windows використовує іншу послідовність символів, що закінчується ( CR/LF
), ніж Linux та Unix (включаючи Mac OS X; LF
).