Основная единица измерения информации. Количество и единицы измерения информации

31.01.2019

Язык как способ представления информации

Язык - это система обозначений и правил для передачи сооб­щений. Различают языки естественные, на которых общаются лю­ди, и искусственные (или формальные), обеспечивающие взаи­модействие систем «человек - машина» или «машина - машина». К формальным языкам относятся языки программирования.

Формальный язык задается алфавитом, синтаксисом и се­мантикой. Теоретические основы методов проектирования язы­ков программирования, конструирования трансляторов рас­сматриваются в теории формальных языков.

Формальный язык - это язык, обеспечивающий удобное описание конкретных проблем, формулируемых человеком и решаемых с помощью компьютера.

На языке программирования пишется программа, позво­ляющая при ее выполнении компьютером (вычислительной системой) получить конкретные результаты. Язык программи­рования состоит из синтаксиса и семантики.

Алфавит представляет собой совокупность упорядоченных в определенном смысле символов в данном языке или системе. Эти символы называются буквами . Только символы, принадле­жащие данному алфавиту, можно использовать для построения слов.

Буква - это элемент алфавит. Например, алфавит языка Паскаль состоит из латинских букв (причем строчные и про­писные буквы не различаются), цифр и специальных символов.

Под символом понимается элемент алфавита, имеющий оп­ределенное значение. Символ, как правило, записывается в па­мяти компьютера восемью битами, или одним байтом.

Синтаксис (от грсч. syntaxis - построение, порядок) - это набор правил построения слов, конструкций и структур текста в языке или системе. Некоторые авторы включают в синтаксис и алфавит. Ошибки, возникающие при написании программы и касающиеся только синтаксиса, выявляются при синтакси­ческом анализе, осуществляемом транслятором.

В информатике понятие «слово» имеет несколько опреде­лений, приведем два из них.

Слово - это:

Упорядоченный набор символов в заданном алфавите, имеющий определенный смысл;

Единица данных, рассматриваемая как целое при переда­че и обработке данных в процессе.

Транслятор (от англ. translator - переводчик) - это про­грамма, производящая трансляцию программы с одного языка программирования в другой.

Под семантикой (от греч. semantikos - обозначающий) по­нимается смысл каждой синтаксической конструкции в языке или системе.

В язык программирования транслятор превращает синтак­сические построения команд, понятные операционной систе­ме и процессору. Смысловые ошибки транслятор не выявляет, их поиск осуществляет человек в процессе отладки, тестирова­ния и даже эксплуатации языка программирования.

Формы представления и преобразования информации

При любых формах работы с информацией всегда идет речь о ее представлении в виде определенных символических струк­тур. Наиболее распространены одномерные представления ин­формации, при которых сообщения имеют вид последователь­ности символов. Так информация представляется в письмен­ных текстах, при передаче по каналам связи, в памяти ЭВМ. Однако широко используется и многомерное представление информации, причем под многомерностью понимается не толь­ко расположение элементов информации на плоскости или в пространстве в виде рисунков, схем, графов, объемных маке­тов и т. п., но и множественность признаков используемых символов, например цвет, размер, вид шрифта в тексте.

Формирование представления информацииназывается ее кодированием . В более узком смысле под кодированием пони­мается переход от исходного представления информации, удобного для восприятия человеком, к представлению, удоб­ному для ее хранения, передачи и обработки. В этом случае об­ратный переход к исходному представлению информации на­зывается декодированием.

При кодировании информации ставятся следующие цели:

Удобство физической реализации;

Удобство восприятия;

Высокая скорость передачи и обработки;

Экономичность, т. с. уменьшение избыточности сообще­ний;

Надежность, т. е. зашита от случайных искажений;

Сохранность, т. е. зашита от нежелательного доступа к ин­формации.

Эти цели часто противоречат друг другу. Стремясь к эко­номным сообщениям, мы тем самым уменьшаем их надеж­ность и удобство восприятия. Экономные сообщения могут по­высить скорость обработки информации (такое сообщение бу­дет передано или прочтено быстрее), но могут и уменьшить ее. А зашита от нежелательного доступа уменьшает объем храни­мой информации и замедляет работу с ней.

Рассмотрим способы представления информации в ЭВМ. Для записи, хранения и выдачи по запросу информации, обра­батываемой с помощью ЭВМ, предназначено запоминающее устройство (или память) вычислительной машины.

В отличие от обычной словесной формы, принятой в пись­менной речи, информация в памяти ЭВМ записывается в форме цифрового двоичного кода. Это объясняется тем, что электрон­ные элементы, на которых строится память ЭВМ, находятся только в одном из двух устойчивых состояний - их можно интерпретировать как 0 или 1.

Количество информации, которое может помешаться в один элемент памяти (0 или 1), называемый битом, очень мало и не несет никакой смысловой нагрузки. Однако если соединить несколько таких элементов в ячейку, то можно сохранить в за­поминающем устройстве столько информации, сколько потре­буется. Последовательность бит, рассматриваемых аппаратной частью ЭВМ как единое целое, называется машинним словом. Слово «бит» происходит от английских слов binary - двойной и digit - цифра: BInary + digiT = BIT.

Так как оперативная память ЭВМ состоит из конечной по­следовательности слов, а слова - из конечной последователь­ности бит, то объем представляемой в ЭВМ информацииогра­ничен емкостью памяти, а числовая информация может быть представлена только с определенной точностью, зависящей от архитектуры памяти данной ЭВМ.

Количество и единицы измерения информации

Понятие информации можно рассматри­вать при различных ограничениях, накладываемых на ее свойства, т.е. при различных уровнях рассмотрения. В основном выделяют три уровня - синтаксический, семантический и прагматический. Соответственно на каждом из них для определения количества информации применяют различные оценки.

На синтаксическом уровне для оценки количества информации используют вероятностные методы, которые принимают во вни­мание только вероятностные свойства информации и не учитыва­ют другие (смысловое содержание, полезность, актуальность и т.д.). Разработанные в середине ХХ в. математические и, в частности, вероятностные методы позволили сформировать подход к оценке количества информации как к мере уменьшения неопределенности знаний. Такой подход, называемый также вероятностным, посту­лирует принцип: если некоторое сообщение приводит к уменьше­нию неопределенности наших знаний, то можно утверждать, что такое сообщение содержит информацию. При этом сообщения содержат информацию о каких-либо событиях, которые могут реализоваться с различными вероятностями. Формулу для опреде­ления количества информации для событий с различными вероят­ностями и получаемых от дискретного источника информации предложил американский ученый К. Шеннон в 1948 г. Согласно этой формуле количество информации может быть определено следующим образом:

где I - количество информации; N - количество возможных со­бытий (сообщений); p i - вероятность отдельных событий (сооб­щений); Σ - математический знак суммы чисел.

Определяемое с помощью формулы (1.1) количество информа­ции принимает только положительное значение. Поскольку веро­ятность отдельных событий меньше единицы, то соответственно выражение log p i является отрицательной величиной и для получе­ния положительного значения количества информации в формуле (1.1) перед знаком суммы стоит знак минус.

Если вероятность появления отдельных событий одинаковая, и они образуют полную группу событий, т.е.

то формула (1.1) преобразуется в формулу Р. Хартли:

В формулах (1.1) и (1.2) отношение между количеством инфор­мации и соответственно вероятностью, или количеством, отдель­ных событий выражается с помощью логарифма.

Применение логарифмов в формулах (1.1) и (1.2) можно объяснить следующим образом. Для простоты рассуждений воспользуемся соотношением (1.2). Будем последовательно присваивать аргументу N значения, выбираемые, например, из ряда чисел: 1, 2, 4, 8, 16, 32, 64 и т.д. Чтобы определить, какое событие из N равновероятных событий произошло, для каждого числа ряда необходимо последовательно производить операции выбора из двух возможных событий. Так, при N = 1 количество операций будет равно 0 (вероятность события равна 1), при N = 2, количество операций будет равно 1, при N = 4 количество операций будет равно 2, при N = 8, количество опера­ций будет равно 3 и т.д. Таким образом получим следующий ряд чисел: 0, 1, 2, 3, 4, 5, 6 и т.д., который можно считать соответству­ющим значениям функции I в соотношении (1.2). Последователь­ность значений чисел, которые принимает аргумент N, представ­ляет собой ряд, известный в математике как ряд чисел, образующих геометрическую прогрессию, а последовательность значений чи­сел, которые принимает функция I, будет являться рядом, образу­ющим арифметическую прогрессию. Таким образом, логарифм в формулах (1.1) и (1.2) устанавливает соотношение между рядами, представляющими геометрическую и арифметическую прогрессии, что достаточно хорошо известно в математике.

Для количественного определения (оценки) любой физической величины необходимо определить единицу измерения, которая в теории измерений носит название меры. Как уже отмечалось, ин­формацию перед обработкой, передачей и хранением необходимо подвергнуть кодированию. Кодирование производится с помощью специальных алфавитов (знаковых систем). В информатике, изу­чающей процессы получения, обработки, передачи и хранения информации с помощью вычислительных (компьютерных) систем, в основном используется двоичное кодирование, при котором используется знаковая система, состоящая из двух символов 0 и 1. По этой причине в формулах (1.1) и (1.2) в качестве основания логарифма используется цифра 2.

Исходя из вероятностного подхода к определению количества информации эти два символа двоичной знаковой системы можно рассматривать как два различных возможных события, поэтому за единицу количества информации принято такое количество ин­формации, которое содержит сообщение, уменьшающее неопре­деленность знания в два раза (до получения событий их вероят­ность равна 0,5, после получения - 1, неопределенность уменьша­ется соответственно: 1/0,5 = 2, т.е. в 2 раза). Такая единица измерения информации называется битом (от англ. слова binary digit - двоичная цифра). Таким образом, в качестве меры для оцен­ки количества информации на синтаксическом уровне, при усло­вии двоичного кодирования, принят один бит.

Следующей по величине единицей измерения количества ин­формации является байт, представляющий собой последователь­ность, составленную из восьми бит, т.е.

1 байт = 2 3 бит = 8 бит.

В информатике также широко используются кратные байту единицы измерения количества информации, однако в отличие от метрической системы мер, где в качестве множителей кратных единиц применяют коэффициент 10 n , где n = 3, 6, 9 и т.д., в крат­ных единицах измерения количества информации используется коэффициент 2 n . Выбор этот объясняется тем, что компьютер в основном оперирует числами не в десятичной, а в двоичной сис­теме счисления.

Кратные байту единицы измерения количества информации вводятся следующим образом:

1 Килобайт (Кбайт) = 2 10 байт = 1024 байт,

1 Мегабайт (Мбайт) = 2 10 Кбайт = 1024 Кбайт,

1 Гигабайт (Гбайт) = 2 10 Мбайт = 1024 Мбайт,

1 Терабайт (Тбайт) = 2 10 Гбайт = 1024 Гбайт,

1 Петабайт (Пбайт) = 2 10 Тбайт = 1024 Тбайт,

1 Экзабайт (Эбайт) = 2 10 Пбайт = 1024 Пбайт.

Единицы измерения количества информации, в названии ко­торых есть приставки «кило», «мега» и т.д., с точки зрения теории измерений не являются корректными, поскольку эти приставки используются в метрической системе мер, в которой в качестве множителей кратных единиц используется коэффициент 10", где n = 3, 6, 9 и т.д. Для устранения этой некорректности международ­ная организацией International Electrotechnical Commission, занима­ющаяся созданием стандартов для отрасли электронных техноло­гий, утвердила ряд новых приставок для единиц измерения коли­чества информации: киби (kibi), меби (mebi), гиби (gibi), теби (tebi), пети (peti), эксби (exbi). Однако пока используются старые обо­значения единиц измерения количества информации, и требуется время, чтобы новые названия начали широко применяться.

Вероятностный подход используется и при определении коли­чества информации, представленной с помощью знаковых систем. Если рассматривать символы алфавита как множество возможных сообщений N, то количество информации, которое несет один знак алфавита, можно определить по формуле (1.1). При равновероят­ном появлении каждого знака алфавита в тексте сообщения для определения количества информации можно воспользоваться фор­мулой (1.2).

Количество информации, которое несет один знак алфавита, тем больше, чем больше знаков входит в этот алфавит.

Количество знаков, входящих в алфавит, называется мощностью алфавита. Количество информации (информационный объем), содержаще­еся в сообщении, закодированном с помощью знаковой системы и содержащем определенное количество знаков (символов), опре­деляется с помощью формулы:

V = I ∙K, (1.3)

где V - информационный объем сообщения; I = log 2 N, информа­ционный объем одного символа (знака); K - количество символов (знаков) в сообщении; N - мощность алфавита (количество знаков в алфавите).

Пример 1.1

Определим, какое количество информации можно получить после реализации одного из шести событий. Вероятность первого события составляет 0,15; второго - 0,25; третьего - 0,2; четверто­го - 0,12; пятого - 0,12; шестого - 0,1.

Т.е. P 1 = 0,15; P 2 = 0,25; P 3 = 0,2; P 4 = 0,18; P 5 = 0,12; P 6 = 0,1.

Для определения количества информации применим формулу

I = -(P1 ∙ log2P1 + P2 ∙ log2P2 + P3 ∙ log2P3 + P4 ∙ log2P4 +

P 5 ∙ log 2 P 5 + P 6 ∙ log 2 P 6) = -(0,15 ∙ log 2 0,15 + 0,25 ∙ log 2 0,25 + 0,2 ∙ log 2 0,2 + 0,18 ∙ log 2 0,18 + 0,12 ∙ log 2 0,12 + 0,1 ∙ log 2 0,1) бит = 2,52 бит (рис. 1.4).

На семантическом уровне информация рассматривается по ее содержанию, отражающему состояние отдельного объекта или системы в целом. При этом не учитывается ее полезность для по­лучателя информации. На данном уровне изучаются отношения между знаками, их предметными и смысловыми значениями (см. рис. 1.1), что позволяет осуществить выбор смысловых единиц измерения информации. Поскольку смысловое содержание ин­формации передается с помощью сообщения, т.е. в виде совокуп­ности знаков (символов), передаваемых с помощью сигналов от источника информации к приемнику, то широкое распростране­ние для измерения смыслового содержания информации получил подход, основанный на использовании тезаурусной меры. При этом под тезаурусом понимается совокупность априорной инфор­мации (сведений), которой располагает приемник информации.

Данный подход предполагает, что для понимания (осмыслива­ния) и использования полученной информации приемник (полу­чатель) должен обладать априорной информацией (тезаурусом), т.е. определенным запасом знаков, наполненных смыслом, слов, понятий, названий явлений и объектов, между которыми установ­лены связи на смысловом уровне. Таким образом, если принять знания о данном объекте или явлении за тезаурус, то количество информации, содержащееся в новом сообщении о данном пред­мете, можно оценить по изменению индивидуального тезауруса под воздействием данного сообщения. В зависимости от соотно­шений между смысловым содержанием сообщения и тезаурусом пользователя изменяется количество семантической информации, при этом характер такой зависимости не поддается строгому мате­матическому описанию и сводится к рассмотрению трех основных условий, при которых тезаурус пользователя:

Стремится к нулю, т.е. пользователь не воспринимает поступив­шее сообщение;

Стремится к бесконечности, т.е. пользователь досконально зна­ет все об объекте или явлении и поступившее сообщение его не интересует;

Согласован со смысловым содержанием сообщения, т.е. посту­пившее сообщение понятно пользователю и несет новые сведе­ния.

Два первых предельных случая соответствуют состоянию, при котором количество семантической информации, получаемое пользователем, минимально. Третий случай связан с получением максимального количества семантической информации. Таким образом, количество семантической информации, получаемой пользователем, является величиной относительной, поскольку одно и то же сообщение может иметь смысловое содержание для компетентного и быть бессмысленным для некомпетентного поль­зователя.

Поэтому возникает сложность получения объективной оценки количества информации на семантическом уровне ее рассмотрения и для получения такой оценки используют различные единицы измерения количества информации: абсолютные или относитель­ные. В качестве абсолютных единиц измерения могут использо­ваться символы, реквизиты, записи и т.д., а в качестве относитель­ной - коэффициент содержательности, который определяется как отношение семантической информации к ее объему. Например, для определения на семантическом уровне количества информа­ции, полученной студентами на занятиях, в качестве единицы измерения может быть принят исходный балл (символ), характе­ризующий степень усвояемости ими нового учебного материала, на основе которого можно косвенно определить количество ин­формации, полученное каждым студентом. Это количество инфор­мации будет выражено через соответствующий оценочный балл в принятом диапазоне оценок.

При семантическом подходе к оценке количества информации и выборе единицы измерения существенным является вид получа­емой информации (сообщения). Так, данный подход к оценке количества экономической информации позволяет выявить со­ставную единицу экономической информации, состоящую из со­вокупности других единиц информации, связанных между собой по смыслу. Элементарной составляющей единицей экономической информации является реквизит, т.е. информационная совокуп­ность, которая не поддается дальнейшему делению на единицы информации на смысловом уровне. Деление реквизитов на симво­лы приводит к потере их смыслового содержания. Каждый рекви­зит характеризуется именем, значением и типом. При этом под именем реквизита понимается его условное обозначение, под зна­чением - величина, характеризующая свойства объекта или явле­ния в определенных обстоятельствах, под типом - множество значений реквизита, объединенных определенными признаками и совокупностью допустимых преобразований.

Реквизиты принято делить на реквизиты-основания и реквизи­ты-признаки .

Реквизиты-основания характеризуют количественную сторону экономического объекта, процесса или явления, которые могут быть получены в результате совершения отдельных операций - вычислений, измерений, подсчета натуральных единиц и т.д. В экономических документах к ним можно отнести, например, цену товара, его количество, сумму и т.п. Реквизиты-основания чаще всего выражаются в цифрах, над которыми могут выполнять­ся математические операции.

Реквизиты-признаки отражают качественные свойства эконо­мического объекта, процесса или явления. С помощью реквизитов-признаков сообщения приобретают индивидуальный характер. В экономических документах к ним можно отнести, например, номер документа, имя отправителя, дату составления документа, вид операции и т.п. Реквизиты-признаки позволяют осуществлять логическую обработку единиц количества информации на семан­тическом уровне: поиск, выборку, группировку, сортировку и т.д.

Отдельный реквизит-основание вместе с относящимися к нему реквизитами-признаками образует следующую в иерархическом отношении составную единицу экономической информации - по­казатель. Показатель имеет наименование, в состав которого вхо­дят термины, обозначающие измеряемый объект: себестоимость, затраты, мощность, прибыль и т.д. Кроме того, показатель содер­жит формальную характеристику и дополнительные признаки. К формальной характеристике относится способ его получения (объем, сумма, прирост, процент, среднее значение и т.д.), а к до­полнительным - пространственно-временные (где находится из­меряемый объект, время, к которому относится данный показа­тель) и метрологические (единицы измерения).

Таким образом, с помощью совокупности реквизитов и соот­ветствующих им показателей можно оценить количество эконо­мической информации, получаемой от исследуемого объекта (ис­точника информации).

Кроме подхода, основанного на использовании тезаурусной меры, при определении количества информации на семантическом уровне находят применение и другие подходы. Например, один из подходов, связанных с семантической оценкой количества ин­формации, заключается в том, что в качестве основного критерия семантической ценности информации, содержащейся в сообще­нии, принимается количество ссылок на него в других сообщени­ях. Количество получаемой информации определяется на основе статистической обработки ссылок в различных выборках.

Подводя итог сказанному, можно утверждать, что существовала и существует проблема формирования единого системного подхода к определению информации на семантическом уровне. Это под­тверждается и тем, что в свое время для создания строгой научной теории информации К. Шеннон вынужден был отбросить важное свойство информации, связанное со смысловым ее содержанием.

Кроме перечисленных уровней рассмотрения понятия инфор­мации достаточно широко используется прагматический уровень. На данном уровне информация рассматривается с точки зрения ее полезности (ценности) для достижения потребителем информации (человеком) поставленной практической цели. Данный подход при определении полезности информации основан на расчете прира­щения вероятности достижения цели до и после получения полу­чения информации . Количество информации, определяющее ее ценность (полезность), находится по формуле:

где Р 0 , Р 1 - вероятность достижения цели соответственно до и после получения информации.

В качестве единицы измерения (меры) количества информации, определяющей ее ценность, может быть принят 1 бит (при основа­нии логарифма, равном 2), т.е. это такое количество полученной информации, при котором отношение вероятностей достижения цели равно 2.

Рассмотрим три случая, когда количество информации, опре­деляющее ее ценность, равно нулю и когда она принимает поло­жительное и отрицательное значение.

Количество информации равно нулю при Р 0 = Р 1 , т.е. получен­ная информация не увеличивает и не уменьшает вероятность до­стижения цели.

Значение информации является положительной величиной при Р 1 > Р 0 , т.е. полученная информация уменьшает исходную неопре­деленность и увеличивает вероятность достижения цели.

Значение информации является отрицательной величиной при Р 1 < Р 0 , т.е. полученная информация увеличивает исходную не­определенность и уменьшает вероятность достижения цели. Такую информацию называют дезинформацией.

Дальнейшее развитие данного подхода базируется на статистиче­ской теории информации и теории решений. При этом кроме веро­ятностных характеристик достижения цели после получения инфор­мации вводятся функции потерь и оценка полезности информации производится в результате минимизации функции потерь. Макси­мальной ценностью обладает то количество информации, которое уменьшает потери до нуля при достижении поставленной цели .

Системы счисления

Системой счисления называется совокупность приемов на­именования и записи чисел. В любой системе счисления для представления чисел выбираются некоторые символы (слова или знаки), называемые базисными числами , а все остальные числа получаются в результате каких-либо операций из базисных чисел данной системы счисления. Символы, используемые для записи чисел, могут быть любыми, только они должны быть разными и значение каждого из них должно быть известно. В современном мире наиболее распространенным является представление чисел посредством арабских цифр: 0,1,2,3,4,5,6,7,8,9 - специальных знаков, используемых для записи чи­сел. Системы счисления различаются выбором базисных чисел и правилами образования из них остальных чисел. Например, в римской системе счисления базисными являются числа 1, 5, 10,50, 100,500, 1000, которые обозначаются знаками, соответ­ственно I, V, X, L, С, D, М, а другие числа получаются путем сложения и вычитания базисных: если цифра справа меньше или равна цифре слева, то эти цифры складываются; если циф­ра слева меньше, чем цифра справа, то левая цифра вычитается из правой. Так, например, число 146 в римской системе счис­ления имеет вид: CXLVI (С - 100, XL- 40, VI - 6). Здесь число 40 получается посредством вычитания из 50 числа 10, а 6 - по­средством сложения чисел 5 и 1.

Системы счисления, в кото­рых любое число получается путем сложения или вычитания базисных чисел, называются аддитивными . При таком представ­лении чисел правила сложения для небольших чисел очевидны и просты, однако если возникает необходимость выполнять операции сложения над большими числами или операции ум­ножения и деления, то римская система счисления оказывает­ся неудобной. В этой ситуации преимущество имеют позици­онные системы счисления, хотя в них, как правило, представ­ления чисел далеко не так просты и очевидны, как в римской. Систематичность представления, основанная на позицион­ном весе цифр, обеспечивает простоту выполнения операций умножения и деления.

В римской системе счисления каждый числовой знак в записи любого числа имеет одно и то же значение, т. е. значение число­вого знака не зависит от его расположения и записи числа. Таким образом, римская система счисления не является позиционной.

Тема 1. Единицы измерения информации. Системы счисления

Единица измерения информации называется бит (bit) – сокращение от английских слов binary digit, что означает двоичная цифра.

Пример. Если подбросить монету и проследить, какой стороной она упадет, то мы получим определенную информацию. Обе стороны монеты «равноправны», поэтому одинаково вероятно, что выпадет как одна, так и другая сторона. В таких случаях говорят, что событие несет информацию в 1 бит.

Пример. Если положить в мешок два шарика разного цвета, то, вытащив вслепую один шар, мы также получим информацию о цвете шара в 1 бит.

В информатике часто используется величина, называемая байтом (byte),

1 байт = 8 бит.

И если бит позволяет выбрать один вариант из двух возможных, то байт – из 256 (2 8) вариантов.

Наряду с байтами, для измерения количества информации используются более крупные единицы:

1 Кбайт (килобайт) = 2 10 байт = 1024 байта;

1 Мбайт (мегабайт) = 2 10 Кбайт = 1024 Кбайта;

1 Гбайт (гигабайт) = 2 10 Мбайт = 1024 Мбайта.

1 Тбайт (терабайт) = 2 40 байта = 1024 Гбайта,

1 Пбайт (петабайт) = 2 50 байта = 1024 Тбайта.

Пусть в некотором сообщении содержатся сведения о том, что произошло одно из N равновероятных событий. Тогда количество информации х , заключенное в этом сообщении, и число событий N связаны формулой:

Решение уравнения (1) имеет вид:

То есть именно такое количество информации необходимо для устранения неопределенности из N равнозначных вариантов. Формула (2) носит название формулы Хартли . Получена она в 1928 г. американским инженером Р. Хартли.

Алфавитный подход к измерению информации

При алфавитном подходе, если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то количество информации, которое несет каждый символ (информационный вес одного символа ), вычисляется по формуле (2), где N – мощность алфавита (полное количество символов, составляющих алфавит выбранного кодирования).

В алфавите, который состоит из двух символов (двоичное кодирование), каждый символ несет 1 бит (2 1) информации; из четырех символов – каждый символ несет 2 бита информации(2 2); из восьми символов – 3 бита (2 3) и т.д. Один символ из алфавита мощностью 256 (2 8) несет в тексте 8 битов информации. Алфавит из 256 символов используется для представления текстов в компьютере. Один байт информации можно передать с помощью одного символа кодировки ASCII. Если весь текст состоит из K символов, то при алфавитном подходе размер содержащейся в нем информации I определяется по формуле:

где x – информационный вес одного символа в используемом алфавите.

Пример . Книга содержит 100 страниц; на каждой странице – 35 строк, в каждой строке – 50 символов. Необходимо рассчитать объем информации, содержащийся в книге.

Страница содержит

35×50 = 1750 байт информации.

Объем всей информации в книге (в разных единицах):

1750×100 = 175000 байт.

175000÷1024 = 170,8984 Кбайт.

170,8984÷1024 = 0,166893 Мбайт.

Вероятностный подход к измерению информации

Формулу для вычисления количества информации, учитывающую неодинаковую вероятность событий, предложил К. Шеннон в 1948 г. Количественная зависимость между вероятностью события р и количеством информации в сообщении о нем x выражается формулой:

Качественную связь между вероятностью события и количеством информации в сообщении об этом событии можно выразить следующим образом – чем меньше вероятность некоторого события, тем больше информации содержит сообщение об этом событии.

Пример . В коробке имеется 50 шаров. Из них 40 белых и 10 черных. Очевидно, вероятность того, что при вытаскивании «не глядя» попадется белый шар, больше, чем вероятность попадания черного. Можно сделать заключение о вероятности события, которое интуитивно понятно.

Проведем количественную оценку вероятности для каждой ситуации.

Обозначим p ч – вероятность попадания при вытаскивании черного шара, р б – вероятность попадания белого шара.

Вероятность попадания белого шара в 4 раза больше, чем черного.

Количественная зависимость между вероятностью события р и количеством информации в сообщении о нем x выражается формулой (4). В нашем примере количество информации в сообщении о попадании белого шара и черного шара получится

Бит; бит.

Для определения среднего значения количества информации применяется следующая формула

В случае равновероятных выборов . Подставляя это значение в формулу (5), получим

Пример . При бросании несимметричной четырехгранной пирамидки вероятности выпадения граней равны: , , , .

Тогда количество информации, получаемое после броска, будет равно:

Для симметричной четырехгранной пирамидки количество информации будет

Заметим, что для симметричной пирамидки количество информации оказалось больше, чем для несимметричной пирамидки.

Системы счисления

Система счисления – набор конкретных знаков-цифр вместе с системой приемов записи, которая представляет числа этими цифрами.

Различные системы счисления могут отличаться друг от друга по следующим признакам:

разные начертания цифр, которые обозначают одни и те же числа;

разные способы записи чисел цифрами;

разное количество цифр.

Примером непозиционной системы счисления является римская система, в которой в качестве цифр используются латинские буквы:

I V X L C D M

В числе цифры записываются слева направо в порядке убывания. Величина числа определяется как сумма или разность цифр в числе. Если меньшая цифра стоит слева от большей цифры, то она вычитается, если справа – прибавляется.

Пример . VI=5+1=6;

СССXXVII=100+100+100+10+10+5+1+1=327.

В позиционных системах счисления количество используемых цифр называется основанием системы счисления. Место каждой цифры в числе называется позицией . Позиционные системы отличаются друг от друга количеством цифр и поэтому именуются по своему основанию . База системы – это последовательность цифр, используемых для записи числа. Ни в одной системе нет цифры, равной основанию системы.

В десятичной системе счисления числа записываются с помощью десяти цифр, т.е. база системы – цифры 0,1,2,3,4,5,6,7,8,9, основание системы р =10. Самая правая цифра обозначает единицы, левее – десятки, еще левее – сотни и т.д.

Восьмеричная и шестнадцатеричная системы счисления используются в ЭВМ как вспомогательные для записи информации в сокращенном виде. Для представления одной цифры восьмеричной системы используются три двоичных разряда (триада). Для представления одной цифры шестнадцатеричной системы счисления используются четыре двоичных разряда (тетрада).

Таблица 2
Двоичная (p=2) Восьмеричная (p=8) Шестнадцатеричная (p=16)
триады тетрады
A
B
C
D
E
F

В любой позиционной системе счисления число N может быть представлено в виде полинома с основанием p :

где a i – цифры системы счисления; n и m – число целых и дробных разрядов соответственно; p – основание системы.

Принято представлять числа в виде последовательности цифр:

Пример . ;

В ЭВМ применяют позиционные системы счисления с недесятичным основанием: двоичную, восьмеричную, шестнадцатеричную.

В аппаратной основе ЭВМ лежат двухпозиционные элементы, которые могут находиться только в двух состояниях; одно из них обозначается 0, а другое – 1. Поэтому основной системой счисления, применяемой в ЭВМ, является двоичная система.

Перевод целого числа из десятичной системы счисления в недесятичную

Чтобы перевести целое десятичное число N p , необходимо выполнить последовательное деление числа на основание p до тех пор, пока результат не станет меньше p . Последний результат и остатки от деления, взятые в обратном порядке, дают число в необходимой системе счисления.

Пример . Перевести число 164 из десятичной системы счисления в двоичную, восьмеричную, шестнадцатеричную.

В результате 164 10 =10100100 2 =244 8 =А4 16 .

Перевод правильной дроби из десятичной системы счисления в недесятичную

Для перевода правильной десятичной дроби F в систему счисления с основанием p необходимо F умножить на p , записанное в той же десятичной системе, затем дробную часть полученного произведения снова умножить на p , и т.д., до тех пор, пока дробная часть очередного произведения не станет равной нулю либо не будет достигнута требуемая точность изображения числа F в p -ичной системе. Представлением дробной части числа F в новой системе счисления будет последовательность целых частей полученных произведений, записанных в порядке их получения и изображенных одной p -ичной цифрой. Если требуемая точность перевода числа F составляет k знаков после запятой, то предельная абсолютная погрешность при этом равняется .

Пример. Перевести число 0,36 из десятичной системы счисления в двоичную, восьмеричную и шестнадцатеричную.

Для чисел, имеющих как целую, так и дробную части, перевод из десятичной системы счисления в другую осуществляется отдельно для целой и дробной частей по правилам, указанным выше.

Для перевода восьмеричного (шестнадцатеричного ) числа в двоичную форму достаточно заменить каждую цифру этого числа соответствующим трехразрядным двоичным числом (триадой) или четырехразрядным двоичным числом (тетрадой), при этом отбрасывают ненужные нули в старших и младших разрядах.

Пример . Перевести 305,4 8 Х 2 .

Пример . Перевести 7B2,E 16 Х 2 .

Для перехода от двоичной к восьмеричной (шестнадцатеричной) системе поступают следующим образом: двигаясь от точки влево и вправо, разбивают двоичное число на группы по три (четыре) разряда, дополняя при необходимости нулями крайние левую и правую группы. Затем триаду (тетраду) заменяют соответствующей восьмеричной (шестнадцатеричной) цифрой.

Пример. Перевести 1101111001,1101 2 Х 8 .

Пример. Перевести 11111111011,100111 2 Х 16 .

Перевод из восьмеричной в шестнадцатеричную систему и обратно осуществляется через двоичную систему с помощью триад и тетрад.

Пример . Перевести 175,24 8 Х 16 .

175,24 8 = 7D,5 16 .

Перевод из недесятичной системы счисления в десятичную

Для перевода необходимо разложить число по основанию системы счисления, используя формулу (7), и посчитать результат.

Пример. ;

Двоичная арифметика

Рассмотрим основные арифметические операции: сложение, вычитание, умножение и деление. Правила выполнения этих операций в десятичной системе хорошо известны – это сложение, вычитание, умножение столбиком и деление углом. Эти правила применимы и ко всем другим позиционным системам счисления.

Правила выполнения арифметических действий над двоичными числами задаются таблицами двоичных сложения, вычитания и умножения.

При сложении двоичных чисел в каждом разряде производится сложение цифр слагаемых и перенос из соседнего младшего разряда, если он имеется. При этом необходимо учитывать, что 1+1 дают нуль в данном разряде и единицу переноса в следующий.

Деление двоичных чисел производится по тем же правилам, что и для десятичных. При этом используются таблицы двоичного умножения и вычитания.

Пример. Вычислить 1100,011 2: 10,01 2 .

Результат 1100,011 2: 10,01 2 =101,1 2 .

Задания для выполнения

1. Одна страница книги содержит 25 строк по 80 символов. В книге 30 страниц. Какой объем информации необходим для хранения книги?

2. Определить максимальное количество книг (объемом 300 страниц, на каждой странице 60 строк, 80 символов в строке), полностью размещенных на диске емкостью 600 Мбайт.

3. В текстовом файле хранится текст объемом в 400 страниц. Каждая страница содержит 3200 символов. Если используется кодировка Unicode, то каков будет размер файла?

4. Решить систему уравнений (найти x, y). Указать единицы измерения.

5. Перевести числа в десятичную систему счисления: а) 10110111,1011 2 ; б) 110111 2 ; в) 563,44 8 ; г) 721,35 8 ; д) 1C4,A 16 ; е) 9A2F,B5 2 .

6. Перевести числа из десятичной системы счисления в двоичную, восьмеричную, шестнадцатеричную: а) 463; б) 1209; в) 362; г) 3925; д) 11355.

7. Перевести следующие числа из десятичной системы счисления в двоичную, восьмеричную, шестнадцатеричную (точность вычислений – 5 знаков после точки: а) 8846,04; б) 725,03125; в) 0,225; г) 0,725; д) 217,375; е) 31,2375; ж) 0,345; з) 0,0625.

8. Перевести числа в двоичную систему счисления: а) 341,4 8 ; б) 1725,326 8 ; в) 7BF,52A 16 ; г) 3D2,C 16 .

9. Перевести числа из одной системы счисления в другую: а) 101,11 2 →Х 8 ; б) 1011110,1101 2 →Х 8 ; в) 1101111101,0101101 2 →Х 16 ; г) 1101010,100101 2 →Х 16 .

10.Перевести числа из одной системы счисления в другую: а) 51,43 8 →Х 16 ; б) 312,7 8 →Х 16 ; в) 5B,F 16 →Х 8 ; г) D4,19 16 →Х 8 .

11. В двоичной системе счисления заданы числа X и Y. Вычислить X+Y и X–Y, если: а) X=11001; Y=1011; б) X=101110110; Y=10111001; в) X=100011001; Y=101011.

12. В двоичной системе счисления заданы числа X и Y. Вычислить X´Y и X/Y, если: а) X=1000010011; Y=1011; б) X=1100101; Y=1001; в) X=100101,011; Y=110,1; г) X=100000,1101; Y=101,01.

Контрольные вопросы

1. Какие подходы к измерению информации вам известны?

2. Какова основная единица измерения информации?

3. Сколько байт содержит 1 Кб информации?

4. Приведите формулу подсчета количества информации при уменьшении неопределенности знания.

6. Что такое система счисления?

7. Алгоритм перевода из десятичной в недесятичную систему счисления. Примеры.

8. Что такое позиционная система счисления?

9. Алгоритм перевода из недесятичной в десятичную систему счисления. Пример.

10. Двоичная арифметика. Примеры.

Информация. Виды информации, единицы её измерения.

Информация – это сведения об окружающем мире (объекте, процессе, явлении, событии), которые являются объектом преобразования (включая хранение, передачу и т.д.) и используются для выработки поведения, для принятия решения, для управления или для обучения.

Виды информации:

· графическая или изобразительная - первый вид, для которого был реализован способ хранения информации об окружающем мире в виде наскальных рисунков, а позднее в виде картин, фотографий, схем, чертежей на бумаге, холсте, мраморе и др. материалах, изображающих картины реального мира;

· звуковая - мир вокруг нас полон звуков и задача их хранения и тиражирования была решена с изобретение звукозаписывающих устройств в 1877 г.; ее разновидностью является музыкальная информация - для этого вида был изобретен способ кодирования с использованием специальных символов, что делает возможным хранение ее аналогично графической информации;

· текстовая - способ кодирования речи человека специальными символами - буквами, причем разные народы имеют разные языки и используют различные наборы букв для отображения речи; особенно большое значение этот способ приобрел после изобретения бумаги и книгопечатания;

· числовая - количественная мера объектов и их свойств в окружающем мире; особенно большое значение приобрела с развитием торговли, экономики и денежного обмена; аналогично текстовой информации для ее отображения используется метод кодирования специальными символами - цифрами, причем системы кодирования (счисления) могут быть разными;

· видеоинформация - способ сохранения «живых» картин окружающего мира, появившийся с изобретением кино.

Единицы измерения информации:

Бит- минимальная единица измерения информации; двоичный знак двоичного алфавита {0, 1}.

Байт - это восьмиразрядный двоичный код, с помощью которого можно представить один символ; единица количества информации в системе СИ.

1 байт = 8 бит

1 Кб (килобайт) = 2 10 байт = 1024 байт ~ 1 тысяча байт

1 Мб (мегабайт) = 2 10 Кб = 2 20 байт ~ 1 миллион байт

1 Гб (гигабайт) = 2 10 Мб = 2 30 байт ~ 1 миллиард байт

Основные свойства информации

Как и всякий объект, информация обладает свойствами. Характерной отличительной особенностью информации от других объектов природы и общества, является дуализм: на свойства информации влияют как свойства исходных данных, составляющих ее содержательную часть, так и свойства методов, фиксирующих эту информацию.

С точки зрения информатики наиболее важными представляются следующие общие качественные свойства: объективность, достоверность, полнота, точность, актуальность, полезность, ценность, своевременность, понятность, доступность, краткость и пр.

Объективность информации . Объективный – существующий вне и независимо от человеческого сознания. Информация – это отражение внешнего объективного мира. Информация объективна, если она не зависит от методов ее фиксации, чьего-либо мнения, суждения.

Пример. Сообщение «На улице тепло» несет субъективную информацию, а сообщение «На улице 22°С» – объективную, но с точностью, зависящей от погрешности средства измерения.

Объективную информацию можно получить с помощью исправных датчиков, измерительных приборов. Отражаясь в сознании конкретного человека, информация перестает быть объективной, так как, преобразовывается (в большей или меньшей степени) в зависимости от мнения, суждения, опыта, знаний конкретного субъекта.

Достоверность информации . Информация достоверна, если она отражает истинное положение дел. Объективная информация всегда достоверна, но достоверная информация может быть как объективной, так и субъективной. Достоверная информация помогает принять нам правильное решение. Недостоверной информация может быть по следующим причинам:

ü преднамеренное искажение (дезинформация) или непреднамеренное искажение субъективного свойства;

ü искажение в результате воздействия помех («испорченный телефон») и недостаточно точных средств ее фиксации.

Полнота информации . Информацию можно назвать полной, если ее достаточно для понимания и принятия решений. Неполная информация может привести к ошибочному выводу или решению.

Точность информа ции определяется степенью ее близости к реальному состоянию объекта, процесса, явления и т. п.

Актуальность информации – важность для настоящего времени, злободневность, насущность. Только вовремя полученная информация может быть полезна.

Полезность (ценность) информации . Полезность может быть оценена применительно к нуждам конкретных ее потребителей и оценивается по тем задачам, которые можно решить с ее помощью.

Самая ценная информация – объективная, достоверная, полная, и актуальная. При этом следует учитывать, что и необъективная, недостоверная информация (например, художественная литература), имеет большую значимость для человека. Социальная (общественная) информация обладает еще и дополнительными свойствами:

ü имеет семантический (смысловой) характер, т. е. понятийный, так как именно в понятиях обобщаются наиболее существенные признаки предметов, процессов и явлений окружающего мира.

ü имеет языковую природу (кроме некоторых видов эстетической информации, например изобразительного искусства). Одно и то же содержание может быть выражено на разных естественных (разговорных) языках, записано в виде математических формул и т. д.

С течением времени количество информации растет, информация накапливается, происходит ее систематизация, оценка и обобщение. Это свойство назвали ростом и кумулированием информации. (Кумуляция – от лат. cumulatio – увеличение, скопление).

Старение информации заключается в уменьшении ее ценности с течением времени. Старит информацию не само время, а появление новой информации, которая уточняет, дополняет или отвергает полностью или частично более раннюю. Научно-техническая информация стареет быстрее, эстетическая (произведения искусства) – медленнее.

Логичность, компактность, удобная форма представления облегчает понимание и усвоение информации.

Основные этапы развития ЭВМ

Основными этапами развития вычислительной техники являются:

I. Ручной - с 50-го тысячелетия до н. э.;

II. Механический - с середины XVII века;

III. Электромеханический - с девяностых годов XIX века;

IV. Электронный - с сороковых годов XX века.

I. Ручной период автоматизации вычислений начался на заре человеческой цивилизации. Он базировался на использовании пальцев рук и ног. Счет с помощью группировки и перекладывания предметов явился предшественником счета на абаке - наиболее развитом счетном приборе древности. Аналогом абака на Руси являются дошедшие до наших дней счеты. Использование абака предполагает выполнение вычислений по разрядам, т.е. наличие некоторой позиционной системы счисления.

В начале XVII века шотландский математик Дж. Непер ввел логарифмы, что оказало революционное влияние на счет. Изобретенная им логарифмическая линейка успешно использовалась еще пятнадцать лет назад, более 360 лет прослужив инженерам. Она, несомненно, является венцом вычислительных инструментов ручного периода автоматизации.

II. Развитие механики в XVII веке стало предпосылкой создания вычислительных устройств и приборов, использующих механический способ вычислений. Вот наиболее значимые результаты, достигнутые на этом пути.

1623 г. - немецкий ученый В.Шиккард описывает и реализует в единственном экземпляре механическую счетную машину, предназначенную для выполнения четырех арифметических операций над шестиразрядными числами.

1642 г. - Б.Паскаль построил восьмиразрядную действующую модель счетной суммирующей машины. Впоследствии была создана серия из 50 таких машин, одна из которых являлась десятиразрядной. Так формировалось мнение о возможности автоматизации умственного труда.

1673 г. - немецкий математик Лейбниц создает первый арифмометр, позволяющий выполнять все четыре арифметических операции.

1881 г. - организация серийного производства арифмометров.

Арифмометры использовались для практических вычислений вплоть до шестидесятых годов XX века.

Английский математик Чарльз Бэббидж (Charles Babbage, 1792-1871) выдвинул идею создания программно-управляемой счетной машины, имеющей арифметическое устройство, устройство управления, ввода и печати. Первая спроектированная Бэббиджем машина, разностная машина, работала на паровом двигателе. Она заполняла таблицы логарифмов методом постоянной дифференциации и заносила результаты на металлическую пластину. Работающая модель, которую он создал в 1822 году, была шестиразрядным калькулятором, способным производить вычисления и печатать цифровые таблицы. Второй проект Бэббиджа - аналитическая машина, использующая принцип программного управления и предназначавшаяся для вычисления любого алгоритма. Проект не был реализован, но получил широкую известность и высокую оценку ученых.

Аналитическая машина состояла из следующих четырех основных частей: блок хранения исходных, промежуточных и результирующих данных (склад - память); блок обработки данных (мельница - арифметическое устройство); блок управления последовательностью вычислений (устройство управления); блок ввода исходных данных и печати результатов (устройства ввода/вывода).

Одновременно с английским ученым работала леди Ада Лавлейс (Ada Byron, Countess of Lovelace, 1815- 1852). Она разработала первые программы для машины, заложила многие идеи и ввела ряд понятий и терминов, сохранившихся до настоящего времени.

III. Электромеханический этап развития ВТ явился наименее продолжительным и охватывает около 60 лет - от первого табулятора Г.Холлерита до первой ЭВМ “ENIAC”.

1887 г. - создание Г.Холлеритом в США первого счетно-аналитического комплекса, состоящего из ручного перфоратора, сортировочной машины и табулятора. Одно из наиболее известных его применений - обработка результатов переписи населения в нескольких странах, в том числе и в России. В дальнейшем фирма Холлерита стала одной из четырех фирм, положивших начало известной корпорации IBM.

Начало - 30-е годы XX века - разработка счетноаналитических комплексов. Состоят из четырех основных устройств: перфоратор, контрольник, сортировщик и табулятор. На базе таких комплексов создаются вычислительные центры.

В это же время развиваются аналоговые машины.

1930 г. - В.Буш разрабатывает дифференциальный анализатор, использованный в дальнейшем в военных целях.

1937 г. - Дж. Атанасов, К.Берри создают электронную машину ABC.

1944 г. - Г.Айкен разрабатывает и создает управляемую вычислительную машину MARK-1. В дальнейшем было реализовано еще несколько моделей.

1957 г. - последний крупнейший проект релейной вычислительной техники - в СССР создана РВМ-I, которая эксплуатировалась до 1965 г.

IV. Электронный этап , начало которого связывают с созданием в США в конце 1945 г. электронной вычислительной машины ENIAC.

В истории развития ЭВМ принято выделять несколько поколений, каждое из которых имеет свои отличительные признаки и уникальные характеристики. Главное отличие машин разных поколений состоит в элементной базе, логической архитектуре и программном обеспечении, кроме того, они различаются по быстродействию, оперативной памяти, способам ввода и вывода информации и т.д. Эти сведения обобщены ниже в таблице на c. 10.

ЭВМ пятого поколения должны удовлетворять следующим качественно новым функциональным требованиям:

1) обеспечивать простоту применения ЭВМ путем эффективных систем ввода/вывода информации, диалоговой обработки информации с использованием естественных языков, возможности обучаемости, ассоциативных построений и логических выводов (интеллектуализация ЭВМ);

2) упростить процесс создания программных средств путем автоматизации синтеза программ по спецификациям исходных требований на естественных языках; усовершенствовать инструментальные средства разработчиков;

3) улучшить основные характеристики и эксплуатационные качества ЭВМ, обеспечить их разнообразие и высокую адаптируемость к приложениям.

Шаблоны

Для автоматизации работы часто используют шаблоны. Шаблоны подобны бланкам, в которые нужно вписать текст, который меняется от документа к документу, остальные составляющие остаются неизменными. В учебном учреждении с помощью шаблонов удобно создавать титульные листы, листы заданий, ведомости, отчёты успеваемости и др., в офисе с помощью шаблонов создаются приказы, отчёты, поздравления, деловые письма, приглашения и т.д. Отличительной особенностью шаблонов является то, что в них можно хранить локальные настройки, которые будут действовать только при использовании именно данного шаблона. Это относится к стилям, панелям управления и макросам. Шаблон можно сделать автоматически загружаемым, поместив его в папку STARTUP каталога настроек OFFICE. Наиболее часто используемые макросы, созданные пользователем панели управления и стили обычно сохраняют (сохраняются автоматически) в шаблон NORMAL.DOT. Теперь о том, как создаются шаблоны. Создайте обычный документ, задайте в нём необходимые стили, отступы и т.д., создайте в нём панели, предназначенные для управления документом, напишите макросы, обрабатывающие данные документа. Выберите команду Файл/Сохранить как..., укажите тип Шаблон документа (*.dot), наименование и папку для сохранения. После этого скопируйте полученный шаблон в папку «Шаблоны». Теперь при выборе команды Файл/Создать... в списке будет выведено имя вновь созданного шаблона. При создании нового документа на основе шаблона имя шаблона не замещает имя документа, как если бы был открыт обычный документ, и при сохранении имя должно быть непосредственно задано.

Стили

Стиль – это набор настроек форматирования документа, применяемых одновременно. Использование стилей значительно упрощает работу с документами. Настройте стили для всех элементов документа, и Ваши документы будут не только «стильно» выглядеть, но и Вы получите возможность в ОЧЕНЬ короткие сроки подготовить документы к публикации с различными требованиями оформления. Стили различают для шрифта и для абзаца. Стиль шрифта аккумулирует форматирование шрифта, стиль абзаца, кроме включения форматирования шрифта содержит элементы форматирования абзаца и, кроме того, позволяет несколько автоматизировать смену самих стилей. Например, Вы настроили стили, используемые в Вашем документе – Заголовок 1, Заголовок 2, Заголовок 3, Обычный, Оглавление 1, Название, Список, Формула. Сначала настраивают стиль ОБЫЧНЫЙ. Установите размер и тип шрифта, выравнивание, отступ первой строки. стиль «Заголовок 1» строится из стиля «обычный» со следующими изменениями: форматирование шрифта – «все прописные», отступ первой строки – нет, выравнивание – по центру, следующий стиль – «Заголовок 2». Когда набираете текст, то выделите текст заголовка и примените к нему стиль заголовка. Автоматически будут применены все параметры форматирования, которые содержит стиль. Автоматически для следующего нового абзаца будет установлен стиль «Заголовок 2». Для стиля «Заголовок 2» сделайте следующие изменения – нумерация, стиль следующего абзаца – обычный. Таким образом настройте все применяемые стили (выберите опцию сохранения настроек стилей в NORMAL.DOT). Теперь при наборе документа достаточно указать стиль абзаца, и форматирование документа будет производиться автоматически. Кроме ускорения набора и поддержки стандартного оформления, применение стилей позволяет автоматически создавать оглавление документа. Вызовите команду «Оглавление и указатели» меню Вставка, укажите стили, примененные к абзацам, из которых Вы хотите построить оглавление. В дальнейшем, при изменении документа поместите курсор мыши на оглавление и нажмите правую кнопку мыши, выберите команду «Обновить поле», номера страниц и названия глав будут обновлены. При изменении стандарта достаточно изменить настройки стиля, все абзацы, к которым применён этот стиль будут изменены в документе автоматически. Если документ достаточно большой, то Вам поможет в работе режим «Структура документа», который также использует стили.

Печать текущего документа

1. Открыть требуемый документ.

2. Выполнить команду Файл –> Печать или нажать комбинацию клавиш Ctrl+Shift+F12. На экране появится окно диалога Печать (рис. 4.49).

3. Нажать кнопку ОК.

В этом случае распечатываются все страницы от начала до конца документа в одном экземпляре с параметрами печати, принятыми по умолчанию или установленными в окне диалога Печать для предыдущего сеанса печати. В качестве альтернативного способа печати открытого документа можно нажать кнопку Печать стандартной панели инструментов.

Окно диалога Печать предоставляет пользователю возможность осуществлять различные варианты печати документа:

· Печать нескольких копий – в поле Число копий раздела Копии указать требуемое число копий документа. По умолчанию в разделе Копии установлен флажок Разобрать по копиям, в результате чего вначале будут напечатаны все страницы первого экземпляра, затем второго и т. д.

· Печать части документа – печать части документа можно осуществить двумя путями: указать в окне диалога Печать номера отдельных страниц (или диапазон страниц) или выделить требуемые страницы перед открытием окна диалога Печать. Кроме того, может быть напечатана только текущая страница документа.

· Печать четных (или нечетных) страниц – для этого в раскрывающемся списке Вывести на печать выбрать Нечетные страницы (Четные страницы).

· Печать дополнительной информации о документе – по умолчанию при выводе на печать MS Word печатает сам документ. Раскрывающийся список Напечатать в окне диалога Печать позволяет вместо документа напечатать информацию о документе.

Дополнительные опции печати

MS Word при печати документов предоставляет еще некоторые средства. Это относится к опциям окна диалога Параметры в окне диалога Печать.

· Черновая печать – в режиме черновой печати вывод документа осуществляется с максимальной для данного принтера скоростью. При этом качество документа существенно зависит от принтера, на который выводится документ. Документ будет распечатан равноширинным шрифтом с игнорированием всех элементов форматирования символов. Графика также не выводится на принтер.

· Печать страниц в обратном порядке – некоторые принтеры упорядочивают страницы документа так, что наверху оказывается последняя страница. В таких случаях целесообразно изменить порядок печати на обратный. Для этого в разделе Режим вкладки Параметры установить флажок В обратном порядке.

· Обновление полей – если документ содержит коды полей, которые не обновляются автоматически, необходимо установить в разделе Режим флажок Обновлять поля. При отсутствии полей в документе устанавливать этот флажок не имеет смысла.

· Обновление связей – перед печатью может потребоваться обновить связи с объектами OLE. Для этого в разделе Режим устанавливается флажок Обновлять связи. При отсутствии в документе объектов OLE устанавливать этот флажок не имеет смысла.

· Фоновая печать – во время печати документа в фоновом режиме можно продолжать работу в MS Word. Для включения фонового режима печати устанавливается флажок Фоновая печать.

· Печать только данных для форм –эта опция имеет смысл, когда сами формы уже напечатаны заранее, и нужно только впечатать данные. Для этого устанавливается Печатать только данные для форм.

Колонтитулами называют области, расположенные в верхнем, нижнем и боковом полях каждой из страниц документа. Колонтитулы содержат текст и изображения, которые можно изменять. Например, в колонтитулы можно включать номера страниц, время, дату, эмблему компании, название документа, имя файла, а также фамилию автора.

17.Работа с большими документами в Word(оглавление, гиперссылки, автозамены,...)

Под большим документом понимается документ, имеющий не только большой объем, но, и это самое главное, сложную структуру (главы, разделы, параграфы и т.д.).

Размещение текста

Созданная в результате выполнения всех перечисленных операций структура, подготовлена к тому, чтобы размещать в ней текст. Для размещения текста нужно использовать обычный режим.

Нумерация заголовков

Для автоматической нумерации заголовков необходимо:

2. В окне диалога Нумерация заголовков выбрать соответствующий стиль.

3. При необходимости изменения стиля нажать кнопку Изменить.

Для того чтобы удалить номер заголовков, необходимо:

1. Выполнить команду Формат/Нумерация заголовков.

2. В окне диалога Нумерация заголовков нажать кнопку Удалить.

Работа с колонтитулами

Колонтитул- заголовочные данные, включающие в себя, как правило, название произведения, части, главы, параграфа и помещаемые над (верхний колонтитул) или под (нижний колонтитул) текстом каждой страницы документа.

Для того чтобы создать колонтитул, необходимо:

1. Выполнить команду Вид/Колонтитулы.

2. Набрать и отформатировать в области колонтитула нужный текст.

Для того чтобы в последующем изменить или удалить колонтитул, необходимо:

1. Выполнить команду Вид/Колонтитулы или дважды щелкнуть по колонтитулу.

2. Отформатировать в области колонтитула нужный текст или удалить его.

3. На панели инструментов Колонтитулы нажать кнопку Закрыть.

Нумерация страниц

Для того чтобы пронумеровать страницы, необходимо:

1. Выполнить команду Вставка/Номера страниц.

2. В диалоговом окне Номера страниц установить нужные параметры нумерации.

При этом Word использует колонтитулы. По этому в последствии пользователь может изменить соответствующий колонтитул, например, добавив в него текстовые надписи, элементы форматирования или вообще удалить его.

Пронумеруйте страницы в Вашем документе так же, как в настоящем пособии.

Word располагает средствами автоматической компиляции оглавления большого документа. В оглавление включаются заголовки, имеющие стандартный стиль форматирования.

Для создания оглавления, необходимо:

1. Установить курсор в то место, где планируется разместить оглавление.

2. Выполнить команду Вставка/Оглавление и указатели.

3. Во вкладке Оглавление диалогового окна Оглавление и указатели установить нужные параметры оглавления.

4. Если вместо оглавления на экране присутствуют коды поля, то необходимо установить курсор на это поле и нажать клавиши Shift+F9.

Для того чтобы в последствии обновлять оглавление, необходимо:

1. Установить курсор в то поле, где находится оглавление.

2. Нажать клавишу F9.

3. В диалоговом окне Обновить оглавление выбрать способ обновления оглавления

MS Excel

Область применения Excel широка:

· благодаря тому, что лист Excel представляет из себя готовую таблицу, Excel часто используют для создания документов без всяческих расчётов, просто имеющих табличное представление (например, прайс-листы в магазинах, расписания);

· в Excel легко можно создавать различные виды графиков и диаграмм, которые берут данные для построения из ячеек таблиц (график снижения веса тела за указанный период от начала занятий спортом);

· его могут использовать обычные пользователи для элементарных расчетов (сколько потратил за этот месяц, что/кому/когда дал/взял);

· Excel содержит многие математические и статистические функции, благодаря чему его могут использовать школьники и студенты для расчетов курсовых, лабораторных работ;

· Excel интенсивно используется в бухгалтерии -- во многих фирмах это основной инструмент для оформления документов, расчётов и создания диаграмм. Естественно, он имеет в себе соответствующие функции;

· Excel может даже работать как база данных. Хотя, конечно, до полноценной базы данных ему далеко.

Если вы ставите в какой то ячейке знак «=", затем щелкаете левой кнопкой мыши на какой то ячейке, Excel подставляет после "=" относительную ссылку на эту ячейку. Эта ссылка "запоминает», на каком расстоянии (в строках и столбцах) Вы щелкнули ОТНОСИТЕЛЬНО положения ячейки, где поставили «=" (смещение в строках и столбцах). Например, вы щелкнули на ячеку 3-мя столбцами левее и на 2 строки выше. Если после нажатия Enter потянуть вниз за маркер автозаполнения, эта формула скопируется во все ячейки, через которые мы протянули. И в каждой ячейке эта ссылка будет указывать на ячейку, расположенную на 3 столбца влево и 2 строки вверх ОТНОСИТЕЛЬНО положения ссылки. Это можно проверить, дважды щелкнув на одной из скопированных формул, или выделив ее, и нажав F2. Для лучшего понимания вспомните, как ходит шахматный конь. Он ходит буквой "Г» и из центра доски бьёт 8 клеток. «Упростим» немного правило хода коня: представим, что он может ходить только одной буквой «Г» - 2 клетки вперед и одну вправо. На какую бы клетку доски мы не поставим коня, каждый раз он ОТНОСИТЕЛЬНО своего положения отсчитывает смещение в строках и столбцах - 2 строки вверх и один столбец влево. Точно таким же образом работают относительные ссылки, только правило их «хода» задает пользователь. Каждый раз, когда мы тянем за маркер автозаполнения формула, содержащую относительные ссылки, Excel пересчитывает адреса всех относительных ссылок в ней в соответствии с их «правилом хода» (у каждой относительной ссылки в формуле может быть свое «правило»).

Как было сказано выше, если потянуть за маркер автозаполнения формулу, содержащую относительные ссылки, Excel пересчитает их адреса. Если же в формуле присутствуют абсолютные ссылки, их адрес останется неизменным. Проще говоря - абсолютная ссылка всегда указывают на одну и ту же ячейку.

Чтобы сделать относительную ссылку абсолютной, достаточно поставить знак «$» перед буквой столбца и адресом строки, например $A$1. Более быстрый способ - выделить относительную ссылку и нажать один раз клавишу «F4», при этом Excel сам проставит знак «$». Если второй раз нажать «F4», ссылка станет смешанной такого типа A$1, если третий раз - такого $A1, если в четвертый раз - ссылка опять станет относительной. И так по кругу.

Смешанные ссылки являются наполовину абсолютными и наполовину относительными. Знак доллара в них стоит или перед буквой столбца или перед номером строки. Это самый сложный для понимания тип ссылки. Например, в ячейке записана формула «=A$1». Ссылка A$1 относительная по столбцу A и абсолютная по строке 1. Если мы потянем за маркер автозаполнения эту формулу вниз или вверх, то ссылки во всех скопированных форумулах будут указывать на ячейку A1, то есть будет вести себя как абсолютные. Однако, если потянем вправо или влево - ссылки будет вести себя как относительные, то есть Excel будет пересчитывать ее адрес. Таким образом, формулы, созданные автозаполнением, будут использовать один и тот же номер строки ($1), но изменится номер столбца (A, B, C...).

20. Расчеты в электронных таблицах MS Excel.

Возможность использования формул и функций является одним из важнейших свойств программы обработки электронных таблиц. Это, в частности, позволяет проводить статистический анализ числовых значений в таблице.

Текст формулы, которая вводится в ячейку таблицы, должен начинаться со знака равенства (=), чтобы программа Excel могла отличить формулу от текста. После знака равенства в ячейку записывается математическое выражение, содержащее аргументы, арифметические операции и функции.

В качества аргументов в формуле обычно используются числа и адреса ячеек. Для обозначения арифметических операций могут использоваться следующие символы: + (сложение); - (вычитание); * (умножение); / (деление).

Формула может содержать ссылки на ячейки, которые расположены на другом рабочем листе или даже в таблице другого файла. Однажды введенная формула может быть в любое время модифицирована. Встроенный Менеджер формул помогает пользователю найти ошибку или неправильную ссылку в большой таблице.

Кроме этого, программа Excel позволяет работать со сложными формулами, содержащими несколько операций. Для наглядности можно включить текстовый режим, тогда программа Excel будет выводить в ячейку не результат вычисления формулы, а собственно формулу.

Элементы диаграммы

Диаграмма состоит из множества элементов. Некоторые из них отображаются по умолчанию, а другие можно добавлять при необходимости. Отображение элементов диаграммы можно изменить путем их перемещения в другое место диаграммы, изменения их размера или формата. Кроме того, ненужные элементы можно удалить.

ü Область диаграммы.

ü Область построения диаграммы.

ü Элементы данных в рядах данных, которые используются для построения диаграммы.

ü Горизонтальная (ось категорий) и вертикальная (ось значений) оси, по которым выполняется построение диаграммы.

ü Легенда диаграммы.

ü Диаграмма и названия осей, которые можно использовать на диаграмме.

ü Метки данных, которые можно использовать для подписи точек данных в рядах данных.

Функции в MS Excel.

МИН, МАКС

МИН(число1; число2; ... ; число30) МАКС(число1; число2; ... ; число30)

Функции МИН и МАКС принимают от 1 до 30 аргументов (в Office 2007 -- до 255) и возвращает минимальный / максимальный из них. Если в качестве аргумента передать диапазон ячеек, из диапазона будет выбрано минимальное / максимальное значение. Эти функции также могут быть вставлены с помощью кнопки "сигма".

СРЗНАЧ

СРЗНАЧ(число1; число2; ... ; число30)

Функция СРЗНАЧ (среднее значение) принимает от 1 до 30 аргументов (в Office 2007 -- до 255) и возвращает их среднее арифметическое (сумма чисел, делённая на количество чисел). Эту функцию также можно вставить с помощью кнопки "сигма"

СТЕПЕНЬ

СТЕПЕНЬ(число; степень)

Функция СТЕПЕНЬ возвращает результат возведения первого аргумента ("число"), в степень, указанную во втором аргументе ("степень").

СУММ

СУММ(арг1; арг2; ... ; арг30)

Функция СУММ принимает от 1 до 30 аргументов (в Office 2007 -- до 255) и возвращает их сумму. В качестве аргументов можно передавать адреса диапазонов (что чаще всего и делается), в этом случае просумируются все числа в диапазоне.

СЧЁТ

СЧЁТ(арг1; арг2; ... ; арг30)

Функция СЧЁТ принимает от 1 до 30 аргументов (в Office 2007 -- до 255) и возвращает количество аргументов, являющиеся числами. Чаще всего функции просто передают адрес диапазона, а она подсчитывает количество ячеек с числами.

Возвращает значение тригонометрической константы pi = 3,1415...

ПРОИЗВЕД

ПРОИЗВЕД(арг1; арг2; ... ; арг30)

Функция ПРОИЗВЕД принимает от 1 до 30 аргументов (в Office 2007 -- до 255) и возвращает их произведение. В качестве аргументов можно передавать адреса диапазонов, в этом случае перемножатся все числа в диапазоне.

ЕСЛИ

ЕСЛИ(логическое_выражение; значение_если_истина; значение_если_ложь).

Функция ЕСЛИ выполняет то ("Значение если ИСТИНА") или иное ("Значение если ЛОЖЬ") действие в зависимости от того, выполняется (равно ИСТИНА) условие или нет (равно ЛОЖЬ).

Логич_знач И(логич_знач1; логич_знач2; ... ; логич_знач30)

Функция И используется тогда, когда нужно проверить, выполняются ли несколько условий ОДНОВРЕМЕННО. Одно из наиболее часто испльзуемых применений функции И -- проверка, попадает ли число x в диапазон от x1 до x2.

Логич_знач ИЛИ(логич_знач1; логич_знач2; ... ; логич_знач30)

Функция ИЛИ используется тогда, когда нужно проверить, выполняется ли ХОТЯ-БЫ ОДНО из многих условий.

Назначение надстройки Поиск решения. Задание целевой ячейки и установка изменяемых ячеек. Ввод ограничений.

Поиск решений является частью блока задач, который иногда называют анализ "что-если". Процедура поиска решения позволяет найти оптимальное значение формулы содержащейся в ячейке, которая называется целевой. Эта процедура работает с группой ячеек, прямо или косвенно связанных с формулой в целевой ячейке. Чтобы получить по формуле, содержащейся в целевой ячейке, заданный результат, процедура изменяет значения во влияющих ячейках. Чтобы сузить множество значений, используемых в модели, применяются ограничения. Эти ограничения могут ссылаться на другие влияющие ячейки.

Процедуру поиска решения можно использовать для определения значения влияющей ячейки, которое соответствует экстремуму зависимой ячейки - например можно изменить объем планируемого бюджета рекламы и увидеть, как это повлияет на проектируемую сумму расходов.

Пример поиска решения

В приведенном ниже примере объем продаж в каждом квартале зависит от уровня рекламы, что косвенно определяет сумму доходов, издержки, а также прибыль. Чтобы найти максимальную возможную сумму общего дохода, процедура поиска решения может повышать ежеквартальные расходы на рекламу (ячейки B5:C5), пока общие расходы не превысят ограничения в 20 тысяч (ячейка F5). Значения во влияющих ячейках служат для вычисления дохода за каждый квартал, поэтому они связаны с формулой в целевой ячейке F7, =СУММА(Q1 Прибыль:Q2 Прибыль).

Изменяемые ячейки

· Ячейка с ограничениями

· Целевая ячейка

После выполнения процедуры получены следующие значения:

Основные задачи Поиска решений:

1) Ассортимент продукции: необходимо максимировать выпуск товара при ограниченном сырье

2) Штатное расписание

3) Транспортная задача – планирование перевозок

4) Составление смесей

Три свойства задач:

1) Имеется единственная целевая функция

2) Имеются ограничения, выражаемые в виде неравенства

3) Имеется набор вводимых значений переменных, который непосредственно либо косвенно влияет на ограничения и на оптимизацию величины

Макросы в Excel.

Если требуется периодическое выполнение задачи в Microsoft Excel, можно автоматизировать задачу с помощью макроса. Макрос - это последовательность команд и функций, хранящаяся в модуле Visual Basic. Ее можно выполнять всякий раз, когда необходимо выполнить данную задачу.

Например, если в ячейки часто вводятся длинные текстовые строки, можно создать макрос для форматирования этих ячеек для охватывания ими текста.

Запись макросов. При записи макроса Microsoft Excel сохраняет информацию о каждом шаге выполнения последовательности команд. Последующий запуск макроса вызывает повторение («воспроизведение») команд. Если при записи макроса была допущена ошибка, сделанные исправления также будут записаны. Visual Basic хранит каждый записанный макрос в отдельном модуле, присоединенном к книге.

Упрощение запуска макроса . Макрос можно запустить, выбрав его из списка в диалоговом окне Макрос. Чтобы макрос запускался после каждого нажатия определенной кнопки или сочетания клавиш, можно назначить макросу кнопку на панели инструментов, сочетание клавиш или графический объект на листе.