Вообще-то стандартный ASCII - семибитная телеграфная кодировка и действительно не содержит кириллицы. Но т.к. принято, что в байте 8 битов, а не 7, широкое распространение получила т.н. расширенная ASCII, в которой кроме 128 стандартных символов ASCII присутствует еще 128. Но т.к. для разных языков потребный набор символов различается, существует масса различных вариантов расширенной таблицы ASCII, называемых кодировками. В этом случае прочитать текст, не зная, в какой кодовой странице он закодирован, невозможно. Отсюда и "кракозябры". Собственно, даже вариантов кодировки кириллицы существует не менее 6 (1251-Windows, 866-DOS, ГОСТ, КОИ-8, 8859-5 и MAC). Решением проблемы разнообразных кодировок является Юникод, имеющий две разновидности: UTF-16 - двухбайтовая кодировка, UTF-8 - кодировка с переменным количеством байт на символ. В частности, символы первой половины ASCII - однобайтовые, а символы кириллицы - двухбайтовые.
Никаких препятствий для обработки любой кодировки (включая Юникод) в Паскале - нет. Единственное, достаточно трудоемко их адекватная отображение. Кроме того, можно воспользоваться средствами, скажем, WinAPI.
|