Основные единицы измерения количества и объема информации. Меры и единицы количества и объема информации. Что будем делать с полученным материалом

06.02.2019

При реализации информационных процессов всегда происходит перенос информации в пространстве и времени от источника информации к приемнику (получателю). При этом для передачи информации используют различные знаки или символы, например естественного или искусственного (формального) языка, позволяющие выразить ее в некоторой форме, называемой сообщением.

Таким образом, достигнута военная цель снаряда. Однако урановые пули оставляют вторичный эффект. Плавление, напыление и воспламенение урана приводит к образованию частиц урана и оксидов урана, которые поступают в окружающий воздух в виде взвешенных частиц и пыли. Люди, находящиеся в местах воздействия, дышат этими частицами и пылью или поглощают их пищей. Поскольку уран всегда радиоактивен, это также аэрозоли и пыль. В результате пострадавшие подвергаются дополнительному воздействию радиоактивного излучения в дополнение к химическому воздействию урана из тяжелого металла.

Сообщение – форма представления информации в виде совокупности знаков (символов), используемая для передачи.

Сообщение как совокупность знаков с точки зрения семиотики (от греч. setneion - знак, признак ) – науки, занимающейся исследованием свойств знаков и знаковых систем, - может изучаться на трех уровнях:

1) синтаксическом , где рассматриваются внутренние свойства сообщений, т. е. отношения между знаками, отражающие структуру данной знаковой системы. Внешние свойства изучают на семантическом и прагматическом уровнях. На этом уровне рассматривают проблемы доставки получателю сообщений как совокупности знаков, учитывая при этом тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т. п., полностью абстрагируясь от смыслового содержания сообщений и их целевого предназначения. На этом уровне информацию, рассматриваемую только с синтаксических позиций, обычно называют данными, так как смысловая сторона при этом не имеет значения.

Оба могут привести к заболеванию в зависимости от количества урана. Это соответствует количеству урана около 11, 5 тонн. Общая длина снаряда, включая задний движитель, составляет около 29 см, его общая масса составляет около 0, 69 кг. Ядро урана расположено в передней части снаряда, фактический снаряд около 14, 5 см в длину и около 1, 5 см в диаметре и имеет массу около 0, 27 кг.

В пострадавших районах значительных количества урана пыли и урансодержащие аэрозоли в результате использования боеприпасов урана, которые приходят перемешанное снова и снова в окружающем воздухе, и, таким образом, могут представлять опасность для людей, присутствующих там людей. С другой стороны, потенциальная опасность облучения урана, осажденного на земле или из неразорвавшихся боеприпасов, незначительна.

Современная теория информации исследует в основном проблемы именно этого уровня. Она опирается на понятие «количество информации», являющееся мерой частоты употребления знаков, которая никак не отражает ни смысла, ни важности передаваемых сообщений. В связи с этим иногда говорят, что современная теория информации находится на синтаксическом уровне.

Физические, химические и радиобиологические аспекты урановых боеприпасов

Уран - это тяжелый металл и природный компонент земной коры. В результате воздух, питьевая вода, почвы и пищевые продукты содержат следы природного урана. С пищей и питьевой водой взрослый потребляет от 1 мкг до 4 мкг урана ежедневно, в зависимости от диетических привычек и региона. Значительная часть этого выделяется с фекалиями, только малая часть поглощается телом. Результатом является среднее содержание урана в организме взрослого человека от около 30 до 60 мкг.

2) семантическом , где анализируются отношения между знаками и обозначаемыми ими предметами, действиями, качествами, т. е. смысловое содержание сообщения, его отношение к источнику информации. Проблемы семантического уровня связаны с формализацией и учетом смысла передаваемой информации, определения степени соответствия образа объекта и самого объекта. На данном уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи, формируются понятия и представления, выявляется смысл, содержание информации, осуществляется ее обобщение.

Природный уран - это природный уран. Это смесь различных изотопов урана. Истощение обедненного урана является отходами от производства ядерного топлива для атомных электростанций. Обычно это 99, 8% урана-238 и 0, 2% урана-235 и практически не содержит урана-234. Если он не получен из природного урана, а из отработавших топливных элементов атомных электростанций, он может также содержать следы плутония-239.

Обогащенный уран используется на атомных электростанциях. Это необходимо для поддержания цепной реакции. Обогащение увеличивает долю урана-235 по сравнению с природным ураном. Неожиданный уран также используется в ядерных бомбах. Доля урана-235 составляет около 90%. Уран - серебристо-белый, мягкий металл. Литровая бутылка, наполненная водой, весит 1 кг и заполнена ураном 19 кг.

3) прагматическом , где рассматриваются отношения между сообщением и получателем, т. е. потребительское содержание сообщения, его отношение к получателю.

На этом уровне интересуют последствия от получения и использования данной информации потребителем. Проблемы этого уровня связаны с определением ценности и полезности использования информации при выработке потребителем решения для достижения своей цели. Основная сложность здесь состоит в том, что ценность, полезность информации может быть совершенно различной для различных получателей и, кроме того, она зависит от ряда факторов, таких, например, как своевременность ее доставки и использования.

Высокая плотность урана является причиной использования в снарядах: они имеют значительно более высокую массу такого же размера, что и обычные боеприпасы, а следовательно, и значительно большую силу прокола. Сила прокола дополнительно увеличивается за счет упрочнения материала, который может быть достигнут за счет добавления небольших количеств титана.

Уран является одним из актинидов. Это все элементы с порядковыми номерами от 89 до 102, при этом только элементы до номера порядка 92 происходят в природе в значительном количестве. Все актиниды являются металлами и радиоактивными. Наиболее важными представителями актинидов, а именно тория-232, урана-235, урана-238 и плутония-239, являются альфа-излучатели. Таким образом, при радиоактивном распаде α-излучение всегда выделяется; Гамма-излучение также производится в небольшой степени.

Для каждого из рассмотренных выше уровней проблем передачи информации существуют свои подходы к измерению количества информации и свои меры информации. Различают соответственно меры информации синтаксического уровня, семантического уроня и прагматического уровня.

Меры информации синтаксического уровня. Количественная оценка информации этого уровня не связана с содержательной стороной информации, а оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту. В связи с этим данная мера дает возможность оценки информационных потоков в таких разных по своей природе объектах, как системы связи, вычислительные машины, системы управления, нервная система живого организма и т. п.

В тонкоизмельченном состоянии актиноиды являются пирофорными, т.е. в воздухе самовоспламеняющийся. Физический период полураспада радиоактивного вещества указывает период, в течение которого его радиоактивность уменьшилась наполовину. Эта деятельность дается в Беккереле. Беккерель соответствует радиоактивному распаду в секунду. Его специфическая деятельность тесно связана с периодом полураспада вещества. Он указывает, какая активность имеет массу 1 г, т.е. сколько радиоактивного распада в секунду происходит в 1 г вещества.

Чем короче период полувыведения, тем больше удельная активность. В следующей таблице приведены примеры различных изотопов урана, смесей уранизотопов и двух изотопов плутония и тория. Кроме того, бесцветный гексафторид урана, используемый в процессе обогащения.

Для измерения информации на синтаксическом уровне вводятся два параметра: объем информации (данных) – V д (объемный подход) и количество информации – I (энтропийный подход).

Объем информацииV д (объемный подход). При реализации информационных процессов информация передается в виде сообщения, представляющего собой совокупность символов какого-либо алфавита. При этом каждый новый символ в сообщении увеличивает количество информации, представленной последовательностью символов данного алфавита. Если теперь количество информации, содержащейся в сообщении из одного символа, принять за единицу, то объем информации (данных) V д в любом другом сообщении будет равен количеству символов (разрядов) в этом сообщении. Так как одна и та же информация может быть представлена многими разными способами (с использованием разных алфавитов), то и единица измерения информации (данных) соответственно будет меняться.

Если урановая пуля попадает в цель, большая часть ее энергии движения преобразуется в тепловую энергию. В результате снаряд расплавляется и распыляет частицы урана и оксиды урана. Они образуют пыль или мелкие частицы, которые попадают в окружающий воздух и могут вдыхаться или поглощаться людьми, находящимися в окружающей среде.

Химически-токсический эффект вещества понимается как повреждающий здоровье эффект, основанный на его химических свойствах. Уран - тяжелый металл, такой как свинец, кадмий, ртуть или плутоний. Тяжелые металлы и их соединения являются токсичными. В частности, возникают повреждения почек и печени.

Так, в десятичной системе счисления один разряд имеет вес, равный 10, и соответственно единицей измерения информации будет дит (десятичный разряд п п дит. Например, четырехразрядное число 2009 имеет объем данных V д = 4 дит.

В двоичной системе счисления один разряд имеет вес, равный 2, и соответственно единицей измерения информации будет бит (bit (binary digit) – двоичный разряд ). В этом случае сообщение в виде n -разрядного числа имеет объем данных V д = п бит. Например, восьмиразрядный двоичный код 11001011 имеет объем данных V д = 8 бит.

Всемирная организация здравоохранения рекомендует ограничить 0, 5 мкг на килограмм массы тела и день приема урана с пищей и питьевой водой; при весе тела 70 кг, т.е. около 35 мкг в день. Фактическое среднее потребление урана зависит от региона и диетических привычек примерно в 1 мкг в день.

Радиотоксический эффект вещества является вредным для здоровья радиоактивным излучением, выделяемым веществом. Радиоактивное излучение является ионизирующим излучением, поскольку оно ионизирует атомы и молекулы в теле, т.е. электрический заряд от них. На эту ионизацию, а также на образование радикалов вредное воздействие радиоактивного излучения, которое в конечном итоге проявляется в изменениях клеток. Чем больше доза облучения, получаемая организмом, тем больший урон. Это, в свою очередь, дается частным.

В современной вычислительной технике наряду с минимальной единицей измерения данных бит широко используется укрупненная единица измерения байт , равная 8 бит. Именно восемь битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=2 8).

При работе с большими объемами информации для подсчета ее количества применяют более крупные единицы измерения:

Радиотоксический эффект урана-238, основного компонента обедненного урана, обусловлен главным образом его α-излучением. Радиотоксический эффект такой же, как и радиотоксический эффект плутония-239 или других радиоактивных тяжелых металлов с α-делением.

При высокой удельной активности, такой как, Например, в случае плутония-239 основным источником опасности является радиотоксический эффект; химическая токсичность, однако, ничтожно мала. В случае небольшой удельной активности, Например, в случае урана-238 токсический и токсический эффект следует рассматривать в дополнение к радиотоксическим.

1 Килобайт (Кбайт) = 1024 байт = 2 10 байт,

1 Мегабайт (Мбайт) = 1024 Кбайт = 2 20 байт = 1 048 576 байт;

1 Гигабайт (Гбайт) = 1024 Мбайт = 2 30 байт = 1 073 741 824 байт;

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:

1 Терабайт (Тбайт) = 1024 Гбайт = 2 40 байт = 1 099 511 627 776 байт;

Для оценки радиотоксического эффекта α-излучения необходимо провести различие между внешним и внутренним радиационным воздействием. Внешняя радиационная нагрузка возникает, когда человек находится вблизи радиоактивного вещества, и радиоактивное излучение воздействует на него снаружи. Поскольку α-излучение легко экранируется и, следовательно, имеет всего несколько сантиметров в воздухе, внешнее облучение ураном 238 играет лишь второстепенную роль. Это различно для β и γ-излучателей, так как β - и, прежде всего, γ - излучение имеют значительно больший диапазон.

1 Петабайт (Пбайт) = 1024 Тбайт = 2 50 байт = 1 125 899 906 842 624 байт.

Следует обратить внимание, что в системе измерения двоичной (компьютерной) информации, в отличие от метрической системы, единицы с приставками «кило», «мега» и т. д. получаются путем умножения основной единицы не на 10 3 = 1000, 10 6 = 1 000 000 и т. д., а на 2 10 = 1024, 2 20 = 1 048 576 и т. д.

Количество информации I (энтропийный подход). В теории информации и кодирования принят энтропийный подход к измерению информации. Этот подход основан на том, что факт получения информации всегда связан с уменьшением разнообразия или неопределенности (энтропии) системы. Исходя из этого, количество информации в сообщении определяется как мера уменьшения неопределенности состояния данной системы после получения сообщения. Неопределенность может быть интерпретирована в смысле того, насколько мало известно наблюдателю о данной системе. Как только наблюдатель выявил что-нибудь в физической системе, энтропия системы снизилась, так как для наблюдателя система стала более упорядоченной.

Если, например, радиоактивное вещество осаждается на землю, внешняя радиационная нагрузка урана 238 примерно в 1000 раз меньше, чем у бета-и гамма-излучателей цезия-137, что является большим в случае той же активности почвы и того же времени воздействия Освобожден от аварии на Чернобыльской АЭС.

Внутреннее облучение происходит, когда человек получает радиоактивное вещество в свое тело. Затем радиоактивное излучение в организме высвобождается. Радиоактивные вещества поглощаются в основном воздухом, пищей и питьевой водой. Радиоактивные вещества, поглощаемые пищевыми продуктами и питьевой водой, поступают в кровь через желудочно-кишечный тракт, в зависимости от растворимости, и поэтому могут быть распределены в организме.

Таким образом, при энтропийном подходе под информацией понимается количественная величина исчезнувшей в ходе какого-либо процесса (испытания, измерения и т.д.) неопределенности. При этом в качестве меры неопределенности вводится энтропия Н , а количество информации равно:

I = H apr – H aps

где, H apr – априорная энтропия о состоянии исследуемой системы или процесса;

Радиоактивные вещества, поглощаемые воздухом, подвешены в дыхательных путях в зависимости от размера частиц, откуда они также попадают в кровь, в зависимости от их растворимости. В случае α-эмиттеров, таких как уран-238 или плутоний-239, внутреннее облучение является доминирующим источником дозы облучения. Например, доза облучения ураном 238 примерно в 700 раз больше, чем у цезия с помощью β - и γ-излучателей. Поскольку α-лучи имеют высокую энергию и в то же время имеют небольшой диапазон в тканях, большая часть энергии поглощается в небольших областях ткани.

H aps – апостериорная энтропия.

Апостериори (от лат. a posteriori – из последующего ) – происходящее из опыта (испытания, измерения).

Априори (от лат. a priori – из предшествующего ) – понятие, характеризующее знание, предшествующее опыту (испытанию), и независимое от него.

В случае, когда в ходе испытания имевшаяся неопределенность снята (получен конкретный результат, т. е. Н = 0), количество полученной информации совпадает с первоначальной энтропией

Доза облучения и, следовательно, риск заболевания радиацией или лейкемией или генетического повреждения, вызванного излучением, возрастают с продолжительностью облучения. Чем дольше радиоактивное вещество остается в организме, тем больше излучаемая энергия поглощается тканью, тем выше доза облучения. Поскольку физический период полураспада очень большой по сравнению с ожидаемой продолжительностью жизни человека в α-излучателях, обсуждаемом здесь, имеет решающее значение, как долго происходит так называемый биологический период полураспада приобретенного вещества.

Рассмотрим в качестве исследуемой системы дискретный источник информации (источник дискретных сообщений), под которым будем понимать физическую систему, имеющую конечное множество возможных состояний {а i }, i = .

Все множество А = {a 1 , a 2 , ..., а n } состояний системы в теории информации называют абстрактным алфавитом или алфавитом источника сообщений.

Это время, в течение которого половина из когда-то поглощенного количества материала снова выводится из организма. Это в решающей степени зависит от того, как химическая форма и в какой физической форме поглощается вещество. Биологические периоды полураспада урана находятся в диапазоне от нескольких дней до нескольких лет. Поэтому радиация может очень сильно воздействовать на организм.

Все эти аспекты включены в определение так называемых дозовых факторов. С помощью этих дозовых факторов можно рассчитать дозу облучения количества радиоактивности, однажды поглощенной телом в течение всей жизни. В качестве первого эмпирического фактора дозы для радиационно-биологически значимых α-излучателей, таких как уран-238, уран-235, плутоний-239, радий-226 или торий-232, имеют одинаковый порядок. В этом отношении определенное количество активности урана-238 аналогично эквивалентному здоровью активности плутония.

Отдельные состояния a 1 , а 2 ,..., а n называют буквами или символами алфавита.

Такая система может в каждый момент времени случайным образом принять одно из конечных множеств возможных состояний a i . При этом говорят, что различные состояния реализуются вследствие выбора их источником.

Получатель информации (сообщения) имеет определенное представление о возможных наступлениях некоторых событий. Эти представления в общем случае недостоверны и выражаются вероятностями, с которыми он ожидает то или иное событие. Общая мера неопределенности (энтропия) характеризуется некоторой математической зависимостью от этих вероятностей, количество информации в сообщении определяется тем, насколько уменьшается мера неопределенности после получения сообщения.

Тот факт, что Плутоний-239, тем не менее, часто называют «особо опасным» или даже «самым токсичным», обусловлен его специфической активностью. Для плутония-239 это примерно в 1000 раз больше, чем для урана-238, что в основном связано с периодом полураспада урана-238, 000 раз короче, чем 1000 лет. Таким образом, в определенной массе плутония-239 в тысячу раз больше радиоактивного распада происходит в секунду, чем в равной массе урана.

Поэтому достаточно вдыхать крошечную массу около 40 нанограмм плутония-239, чтобы достичь допустимого предельного значения годового объема деятельности для ингаляции 100 беккерелей в соответствии с Постановлением о радиационной защите для облучения рабочей радиации. Химическая токсичность такого небольшого количества тяжелого металла незначительна. Это около 15 мЗв.

Поясним эту идею на примере.

Пусть у нас имеется 32 различные карты. Возможность выбора одной карты из колоды – 32. До произведения выбора, естественно предложить, что шансы выбрать некоторую определенную карту, одинаковы для всех карт. Произведя выбор, мы устраняем эту неопределенность. При этом неопределенность можно охарактеризовать количеством возможных равновероятностных выборов. Если теперь определить количество информации как меру устранения неопределенности, то полученную в результате выбора информацию можно охарактеризовать числом 32. Однако удобнее использовать не само это число, а логарифм от полученной выше оценки по основанию 2:

где m – число возможных равновероятных выборов (При m=2, получим информацию в один бит). То есть в нашем случае

H = log 2 32 = 5.

Изложенный подход принадлежит английскому математику Р. Хартли (1928 г.). Он имеет любопытную интерпретацию. Он характеризуется числом вопросов с ответами «да» или «нет», позволяющим определить, какую карту выбрал человек. Таких вопросов достаточно 5.

Если при выборе карты, возможность появления каждой карты не одинаковы (разновероятны), то получим статистический подход к измерению информации, предложенный К. Шенноном (1948 г.). В этом случае мера информации измеряется по формуле:

где p i – вероятность выбора i -го символа алфавита.

Легко заметить, что если вероятности p 1 , ..., p n равны, то каждая из них равна 1/N , и формула Шеннона превращается в формулу Хартли.

Меры информации семантического уровня. Для измерения смыслового содержания информации, т. е. ее количества на семантическом уровне, наибольшее распространение получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Действительно, для понимания и использования полученной информации получатель должен обладать определенным запасом знаний. Полное незнание предмета не позволяет извлечь полезную информацию из принятого сообщения об этом предмете. По мере роста знаний о предмете растет и количество полезной информации, извлекаемой из сообщения.

Если назвать имеющиеся у получателя знания о данном предмете тезаурусом (т. е. неким сводом слов, понятий, названий объектов, связанных смысловыми связями), то количество информации, содержащееся в некотором сообщении, можно оценить степенью изменения индивидуального тезауруса под воздействием данного сообщения.

Тезаурус - совокупность сведений, которыми располагает пользователь или система.

Иными словами, количество семантической информации, извлекаемой получателем из поступающих сообщений, зависит от степени подготовленности его тезауруса для восприятия такой информации.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя S p изменяется количество семантической информации I с , воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис. 2.1. Рассмотрим два предельных случая, когда количество семантической информации I с равно 0:

а) при S p = 0 пользователь не воспринимает (не понимает) поступающую информацию;

б) при S -> ∞ пользователь «все знает», и поступающая информация ему не нужна.

Рис. 1.2. Зависимость количества семантической информации,

воспринимаемой потребителем, от его тезауруса I c =f(S p)

Максимальное количество семантической информации потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом S p (S = S p opt), когда поступающая информация понятна пользователю и несет ему ранее неизвестные (отсутствующие в его тезаурусе) сведения.

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным для пользователя некомпетентного.

При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и Sp.

Относительной мерой количества семантической информации может служить коэффициент содержательности С, который определяется как отношение количества семантической информации к ее объему:

С = I с / V д

Меры информации прагматического уровня. Эта мера определяет полезность информации для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе.

Одним из первых российских ученых к проблеме оценки информации прагматического уровня обратился А.А. Харкевич, который предложил принять за меру ценности информации количество информации, необходимое для достижения поставленной цели, т. е. рассчитывать приращение вероятности достижения цели. Так, если до получения информации вероятность достижения цели равнялась р 0 , а после ее получения – p 1 то ценность информации определяется как логарифм отношения p 1 /p 0:

I = log 2 p 1 – log 2 р 0 = log 2 (p 1 /p 0)

Таким образом, ценность информации при этом измеряется в единицах информации, в данном случае в битах.

Количественные характеристики информации

Классификация мер информации представлена на рис.1.


Рис. 1. Классификация мер информации

Синтаксическая мера информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации.

Существуют два основных подхода в определении количества информации. Исторически они возникли почти одновременно. В конце 40-х г. XX века один из основоположников кибернетики, американский математик Клод Шеннон развил вероятностный подход к измерению количества информации, а работы по созданию ЭВМ привели к «объемному» подходу.

Объём данных (V Д) понимается в техническом смысле этого слова как информационный объём сообщения или как объём памяти, необходимый для хранения сообщения без каких-либо изменений.

Информационный объём сообщения измеряется в битах и равен количеству двоичных цифр (“0” и “1”), которыми закодировано сообщение.

В компьютерной практике слово “бит” используется также как единица измерения объёма памяти. Ячейка памяти размером в 1 бит может находиться в двух состояниях (“включено” и “выключено”) и в неё может быть записана одна двоичная цифра (0 или 1). Понятно, что бит – слишком маленькая единица измерения информации, поэтому пользуются кратными ей величинами. Основной единицей измерения информации является байт . 1 байт равен 8 битам. В ячейку размером в 1 байт можно поместить 8 двоичных цифр, то есть в одном байте можно хранить 256 = 2 8 различных чисел. Для измерения ещё больших объёмов информации используются следующие величины:

1 Кбайт (один килобайт) = 2 10 байт = 1024 байта (1 kB );

1 Мбайт (один мегабайт) = 2 10 Кбайт = 1024 Кбайта (1 MB );

1 Гбайт (один гигабайт) = 2 10 Мбайт = 1024 Мбайта (1 GB );

1 Тбайт (один терабайт) = 2 10 Гбайт = 1024 Гбайта (1 TB );

1 Пбайт (один петабайт) = 2 10 Тбайт = 1024 Тбайта (1 PB );

1 Эбайт (один эксабайт) = 2 10 Пбайт = 1024 Пбайта (1 EB );

1 Збайт (один зеттабайт) = 2 10 Эбайт = 1024 Эбайта (1 ZB );

1 Йбайт (один йоттабайт) = 2 10 Збайт = 1024 Збайта (1 YB ).

Пример 1 . При двоичном кодировании текста каждая буква, знак препинания, пробел занимают 1 байт. На странице книги среднего формата примерно 50 строк, в каждой строке около 60 символов, таким образом, полностью заполненная страница имеет объём 50x60= = 3000 байт ≈3 Килобайта. Вся книга среднего формата занимает ≈0,5 Мегабайт. Один номер четырёхстраничной газеты – 150 Килобайт. Если человек говорит по 8 часов в день без перерыва, то за 70 лет он наговорит около 10 Гигабайт информации. Один чёрно-белый кадр (при 32 градациях яркости каждой точки) содержит примерно 300Кб информации, цветной кадр содержит уже около 1Мб информации. Телевизионный фильм продолжительностью 1,5часа с частотой 25 кадров в секунду - 135 Гб.

При вероятностном подходе количество информации I на синтаксическом уровне определяется через понятие энтропии системы.

Пусть до получения информации потребитель имеет некоторые предварительные (априорные) сведения о системе α. Мерой его неосведомленности о системе является функция H(α), которая в то же время служит и мерой неопределенности состояния системы.

После получения некоторого сообщения β получатель приобрел некоторую дополнительную информацию I β (α), уменьшившую его априорную неосведомленность так, что неопределенность состояния системы после получения сообщения β стала H β (α).

Тогда количество информации I β (α) о системе, полученной в сообщении β, определится как

I β (α) = H(α) - H β (α).

т.е. количество информации измеряется изменением (уменьшением) неопределенности состояния системы. Если конечная неопределенность H β (α) обратится в нуль, то первоначальное неполное знание заменится полным знанием и количество информации будет определяться как I β (α) = H(α). Иными словами, энтропия системы Н(а) может рассматриваться как мера недостающей информации.

Энтропия системы H(α), имеющая N возможных состояний, согласно формуле Шеннона, равна:

где – вероятность того, что система находится в i-м состоянии. Для случая, когда все состояния системы равновероятны, т.е. их вероятности равны, ее энтропия определяется соотношением:

Пример 2. Часто информация кодируется числовыми кодами в той или иной системе счисления, особенно это актуально при представлении информации в компьютере. Естественно, что одно и то же количество разрядов в разных системах счисления может передавать разное число состояний отображаемого объекта, что можно представить в виде соотношения

N = m n ,где N – число всевозможных отображаемых состояний;

m – основание системы счисления (разнообразие символов, применяемых в алфавите);

n – число разрядов (символов) в сообщении.

Допустим, что по каналу связи передается n-разрядное сообщение, использующее m различных символов. Так как количество всевозможных кодовых комбинаций будет N = m n , то при равновероятности появления любой из них количество информации, приобретенной абонентом в результате получения сообщения, будет определяться по формуле Хартли:

I = log N = n log m

Если в качестве основания логарифма принять m, то I = n. В данном случае количество информации (при условии полного априорного незнания абонентом содержания сообщения) будет равно объему данных I = V Д, полученных по каналу связи.

Наиболее часто используются двоичные и десятичные логарифмы. Единицами измерения в этих случаях будут соответственно бит и дит .

Семантическая мера информации

Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие «тезаурус пользователя» .

Тезаурус – это совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя S p изменяется количество семантической информации I c , воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер зависимости количества семантической информации, воспринимаемой потребителем, от его тезауруса показан на рис. 2.

Рис. 2. Характер зависимости количества семантической информации от его тезауруса

Рассмотрим два предельных случая, когда количество семантической информации I c равно 0:

При пользователь не воспринимает и не понимает поступающую информацию;

При пользователь все знает, и поступающая информация ему не нужна.

Максимальное количество семантической информации I c потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом S p (S p = S p opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения. Следовательно, количество семантической информации в сообщении, т.е. количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным для пользователя некомпетентного.

Относительной мерой количества семантической информации может служить коэффициент содержательности С , который определяется как отношение количества семантической информации к ее объему: .

Прагматическая мера информации (аксиологический подход)

Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цепи. Эта мера также является величиной относительной, обусловленной особенностями использования этой информации в той или иной системе.

Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

Представим для сопоставления введённые меры информации в таб. 1.

Таб. 1. Меры информации