Это - учебно-методические материалы по медицинской информатике и статистике с сайта 1mgmu.com


Увеличить шрифт :: Уменьшить шрифт

5.2.1 (краткий)
ТЕОРИЯ - ОБЩИЕ ПОНЯТИЯ ИНФОРМАТИКИ - Единицы измерения объема информации

Запись информации в виде последовательности символов – типичный пример числовой кодировки. Заранее определяется, какой набор символов может быть использован. Набор символов может быть больше или меньше, но в любом случае промежуточные варианты недопустимы. Например, если Вы пишете текст на русском языке, то нужны символы прописных и строчных букв кириллицы, знаки препинания, знак пробела (о нем часто забывают, но это – отдельный и важный знак), скобки, цифры и, возможно, некоторые другие символы. Если текст пишется на кириллице и латинице (например, в русский текст вставляются латинские названия лекарств), то суммарно нужно под двести символов.
Если Вы пишете музыку, то нужны символы семи нот, бемоля, диеза и еще несколько символов для задания длительностей, характера звучания и т.д. всего несколько десятков символов. Если Вы пишете на китайском, то каждое слово – отдельный символ, и в знаковой системе десятки тысяч символов. Если Вы перестукиваетесь морзянкой, то в знаковой системе всего три символа: точка, тире и пробел.
Самая маленькая знаковая система состоит из двух разных символов (например, «Да» и «Нет» или «0» и «1»).
Так как любую дискретную информацию можно считать текстом в некоторой знаковой системе, то объем информации определяется длиной текста и количеством символов в нем.
Самый маленький объем информации называется бит и соответствует самому короткому слову в самой маленькой знаковой системе, то есть однобуквенному слову в двухбуквенном алфавите. Например, бит содержится в одном ответе на вопрос типа «Да» или «Нет».
Пример устройства, имеющего память емкостью в один бит – выключатель. Работающий выключатель может быть либо включен, либо выключен. Как не странно, это – очень точный пример, так как в компьютерах оперативная память состоит именно из большого (сейчас – обычно в несколько миллиардов) количества маленьких включателей.
Следующая и основная единица объема информации называется байт . Принято, что один байт равен 8 бит. Для компьютера, работающего на самом деле в двоичной системе исчисления, 8 – круглое число, так как степень двойки. Для человека байт – единица информации, соответствующая объему данных в один символ уже не в минимальной, а в удобной знаковой системе. Так, 8 бит дают 256 разных комбинаций, а выше было подсчитано, что для записи текста в двуязычной системе желательно иметь порядка 200 разных символов.
В современных компьютерах считывание, обработка и запись информации происходит обычно не по битам, а по байтам. Все остальные единицы измерения – производные от байта.
Принято, что один килобайт (1 Кб) равен 1024 байта. Это, конечно, некоторое насилие над десятичной системой, но удобно из-за того, что 1024 = 2в десятой степени, то есть степень двойки.
Аналогичным образом мегабайт (Мб) – 1024 килобайта, или 1048576 байтов, гигабайт – 1024 мегабайта, или 1073741824 байтов и т.д .


Оглавление раздела нижнего уровня
Оглавление раздела верхнего уровня
ОГЛАВЛЕНИЕ ОГЛАВЛЕНИЙ



НА ГЛАВНУЮ СТРАНИЦУ САЙТА


Материалы используются на Едином Образовательном Пространстве Первого московского государственного медуниверситета им. И.М. Сеченова