В чём главное отличие баз данных и баз знаний? Различие между знанием, информацией, сведениями и данными.

04.05.2019

Характерным признаком интеллектуальных систем является наличие знаний, необходимых для решения задач конкретной предметной области.

Введение в инженерию знаний

Введение в инженерию знаний

2. Знания как особая форма информации. Отличие знаний от данных.

5. Подразделение знаний. Декларативная и процедурная формы представления знаний

6. Свойства знаний

7. Интенсионал и экстенсионал понятия.

8. Парадигмы представления знаний. Классификация моделей представления знаний

Теоретическими и практическими вопросами представления и обработки знаний в компьютерных системах активно занимаются исследователи, работающие в области инженерии знаний. Это понятие в 1977 г. ввел Э. Фейгенбаум, который писал: «По опыту нам известно, что большая часть знаний в конкретной предметной области остается личной собственностью эксперта. И это происходит не потому, что он не хочет разглашать своих секретов, а потому, что он не в состоянии сделать этого - ведь эксперт знает гораздо больше, чем сам осознает». Инженерия знаний - направление ИИ, которое связано с развитием теоретических и прикладных аспектов приобретения и формализации знаний специалистов, с проектированием и разработкой баз знаний.

Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной области, а также их свойства. В процессах компьютерной обработки данные проходят следующие этапы преобразований:

исходная форма существования данных (результаты наблюдений и измерений, таблицы, справочники, диаграммы, графикии т.д.);

представление на специальных языках описания данных предназначенных для ввода и обработки исходных данных в ЭВМ;

базы данных на машинных носителях информации.

Знания являются более сложной категорией информации по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда называют структурированными данными. Знания могут быть получены на основе обработки эмпирических данных. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

3. Способы наделения знаниями программных систем

Для того чтобы наделить ИИС знаниями, их необходимо представить в определенной форме. Существуют два основных способа наделения знаниями программных систем .

Первый - поместить знания в программу, написанную на обычном языке программирования. Такая система будет представлять собой единый программный код, в котором знания не вынесены в отдельную категорию. Несмотря на то, что основная задача будет решена, в этом случае трудно оценить роль знаний и понять, каким образом они используются в процессе решения задач. Нелегким делом являются модификация и сопровождение подобных программ, а проблема пополнения знаний может стать неразрешимой.



Второй способ базируется на концепции баз данных и заключается в вынесении знаний в отдельную категорию, т.е. знания представляются в определенном формате и помещаются в БЗ. База знаний легко пополняется и модифицируется. Она является автономной частью интеллектуальной системы, хотя механизм логического вывода, реализованный в логическом блоке, а также средства ведения диалога накладывают определенные ограничения на структуру БЗ и операции с нею. В современных ИИС принят этот способ.

Задача представления знаний в информационных системах

Для того, чтобы поместить знания в компьютер, их необходимо представить определенными структурами данных, соответствующих выбранной среде разработки интеллектуальной системы. Следовательно, при разработке ИИС сначала осуществляются накопление и представление знаний, причем на этом этапе обязательно участие человека, а затем знания представляются определенными структурами данных, удобными для хранения и обработки в ЭВМ.

Знания в ИИС существуют в следующих формах:

исходные знания (правила, выведенные на основе практического опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением времени; функции, диаграммы, графы и т. д.);

описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или продукционных правил, семантическая сеть, иерархии фреймов и т. п.);

представление знаний структурами данных, которые предназначены для хранения и обработки в ЭВМ;

базы знаний на машинных носителях информации.

4. Определение понятия знание

Из толкового словаря С. И. Ожегова: 1) «Знание - постижение действительности сознанием, наука»; 2) «Знание - это совокупность сведений, познаний в какой-либо области».

Из японского толкового словаря: «Знания - это результат, полученный познанием», или, более подробно, «система суждений с принципиальной и единой организацией, основанная на объективной закономерности».

Исследователями в области ИИ даются более конкретные определения знаний.

«Знания - это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области

«Знания - это хорошо структурированные данные или данные о данных, или метаданные»

«Знания - формализованная информация, на которую ссылаются или используют в процессе логического вывода»

Знание о предметной области - это описание объектов, их окружения, необходимых явлений, фактов, а также отношений между ними.

5. Подразделение знаний

Существует множество классификаций знаний. Вместе с тем, с помощью классификаций, как правило, систематизируют знания конкретных предметных областей. На абстрактном уровне рассмотрения можно говорить о признаках, по которым подразделяются знания, а не о классификациях.

По своей природе знания можно делятся на декларативные и процедурные.

Декларативны е знания представляют собой описания фактов и явлений, фиксируют наличие или отсутствие таких фактов, а также включают описания основных связей и закономерностей, в которые эти факты и явления входят.

Процедурные знания - это описания действий, которые возможны при манипулировании фактами и явлениями для достижения намеченных целей.

По способу приобретения знания можно разделить на факты и эвристики (правила, которые позволяют сделать выбор при отсутствии точных теоретических обоснований). Первая категория знаний обычно указывает на хорошо известные в данной предметной области обстоятельства. Вторая категория знаний основана на собственном опыте эксперта, работающего в конкретной предметной области, накопленном в результате многолетней практики.

По типу представления знания делятся на факты и правила . Факты - это знания типа «А - это А», такие знания характерны для баз данных и сетевых моделей. Правила, или продукции - это знания типа «ЕСЛИ А, ТО В».

Фактические и стратегические знания . Фактические знания - основные закономерности предметной области, позволяющие решать конкретные производственные, научные и другие задачи, то есть факты, понятия, взаимосвязи, оценки, правила, эвристики. Стратегические знания - стратегии принятия решений в предметной области;

Кроме фактов и правил существуют еще метазнания - знания о знаниях. Они необходимы для управления БЗ и для эффективной организации процедур логического вывода. Классическими примерами метазнаний являются народные пословицы и поговорки, каждая из которых характеризует знания (рекомендации по деятельности) в широком классе конкретных ситуаций (например, пословица "Семь раз отмерь, один - отрежь" применима не только в среде хирургов или портных. «Не зная броду не суйся в воду»).

Глубинные и поверхностные знания . В глубинных знаниях отражается понимание структуры предметной области, назначение и взаимосвязь отдельных понятий (глубинные знания в фундаментальных науках - это законы и теоретические основания). Глубинные знания образуются как результат обобщения первичных понятий в некоторые абстрактные структуры, которые могут и не иметь вербального описания Глубинные знания обладают такими важными особенностями, как гибкость и аддитивность (лат. additio - прибавление; получаемый путем сложенияПоверхностные знания представляют собой совокупность эмпирических ассоциаций и отношений между понятиями предметной области для стандартных рассуждений и ситуаций

Жесткие и мягкие знания . Жесткие знания позволяют получать однозначные рекомендации при заданных начальных условиях. Мягкие знания допускают множественные, «размытые» решения и различные варианты рекомендаций.

В практике разработки СИИ обозначилась тенденция перехода от использования поверхностных знаний к глубинным и мягким. Использование глубинных и мягких знаний позволяет создать БЗ большой мощности.).

Данные

Информация

Операции с данными

В ходе информационного процесса данные преобразуются из одного вида в другой. По мере развития НТП и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают (постоянное усложнение условий управления производством и обществом + быстрые темпы появления и внедрения новых носителей/хранителей данных – увеличение объёма данных).

1. Сбор – накопление данных с целью обеспечения достаточной полноты информации для принятия решения;

2. Формализация – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;

3. Фильтрация – отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;

4. Сортировка – упорядочение данных по заданному признаку с целью удобства использования; повышает доступность информации;

5. Группировка – объединение данных по заданному признаку с целью повышения удобства использования; повышает доступность информации;

6. Архивация – организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат на хранение данных и повышает общую надежность информационного процесса в целом;

7. Защита – комплекс мер, направленных на предотвращение утраты, воспроизведение и модификации данных;

8. Транспортировка – прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя – клиентом;

9. Преобразование – перевод данных из одной формы в другую или из одной структуры в другую. Пример: изменение типа носителя; книги – бумага, электронная форма, микрофотоплёнка. Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных.

2. Связь понятий «информация, данные, знания». Модель dikw

Универсальных опеределений нет.

Зна́ние - в теории искусственного интеллекта и экспертных систем - совокупность информации и правил вывода (у индивидуума, общества или системы ИИ) о мире, свойствах объектов, закономерностях процессов и явлений, а также правилах использования их для принятия решений. Главное отличие знаний от данных состоит в их структурности и активности, появление в базе новых фактов или установление новых связей может стать источником изменений в принятии решений.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Для решения задачи данные обрабатываются на основании имеющихся знаний, информация анализируется с помощью знаний. На основе анализа предлагаются варианты решения, принимвается лучшее, пополняет знания.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний. Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

DIKW (англ. data, information, knowledge, wisdom - данные, информация, знания, мудрость) - информационная иерархия, где каждый уровень добавляет определённые свойства к предыдущему уровню.

Сама модель ведет свои истоки от работ философа Мортимера Адлера, однако впервые в приложении к теории управления знаниями она была формализована Николя Анри. В качестве дополнения в 1989 г. Расселом Акоффом было предложено расширение этой модели слоем «understanding» (понимание): понимание требует анализа и предопределения, благодаря чему оно помещено между знанием и мудростью. Относительно временного распределения слоев он указывает на краткость жизненного цикла информации по сравнению с жизненным циклом знания; понимание считается непостоянным, а мудрость принимается за константу

В основании находится уровень данных.

Информация добавляет контекст.

Знание добавляет «как» (механизм использования)

Мудрость добавляет «когда» (условия использования)

Данные и знания. Основные определения.

Информация, с которой имеют дело ЭВМ, разделяется на процедурную и декларативную. Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач, декларативная информация - в данных, с которыми эти программы работают.

Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного для данного типа ЭВМ числа двоичных разрядов - битов. Машинное слово для представления данных и машинное слово для представления команд, образующих программу, могут иметь одинаковое или разное число разрядов. Одинаковое число разрядов в машинных словах для команд и данных позволяет рассматривать их в ЭВМ в качестве одинаковых информационных единиц и выполнять операции над командами, как над данными. Содержимое памяти образует информационную базу. Машинное слово является основной характеристикой информационной базы, т.к. его длина такова, что каждое машинное слово хранится в одной стандартной ячейке памяти, снабженной индивидуальным именем - адресом ячейки. По этому имени происходит извлечение информационных единиц из памяти ЭВМ и записи их в нее. В языках программирования высокого уровня используются абстрактные типы данных, структура которых задается программистом.

Появление баз данных (БД) знаменовало собой еще один шаг на пути организации работы с декларативной информацией. В базах данных могут одновременно храниться большие объемы информации, а специальные средства, образующие систему управления базами данных (СУБД), позволяют эффективно манипулировать с данными, при необходимости извлекать их из базы данных и записывать их в нужном порядке в базу.

По мере развития исследований в области ИС возникла концепция знаний, которые объединили в себе многие черты процедурной и декларативной информации. В ЭВМ знания так же, как и данные, отображаются в знаковой форме - в виде формул, текста, файлов, информационных массивов и т.п. Поэтому можно сказать, что знания - это особым образом организованные данные. В системах ИИ знания являются основным объектом формирования, обработки и исследования. База знаний, наравне с базой данных, - необходимая составляющая программного комплекса ИИ. Машины, реализующие алгоритмы ИИ, называются машинами, основанными на знаниях, а подраздел теории ИИ, связанный с построением экспертных систем, - инженерией знаний.



Отличия между данными и знаниями:

1. внутренняя интерпретируемость знаний (например: данные – 243849..., знания – предложения естественного языка).

2. активность знаний. Если есть знания, то появления новых знаний может привести к изменению старых знаний и появлению новых.

3. связность знаний. Знания не интересны сами по себе, они интересны в совокупности (система знаний).

4. знания динамичны, а данные как правило статичны.

Интенсиональные знания определяются через понятие более высокого уровня с указанием специфических свойств. Экстенсиональные знания определяются через понятия более низкого уровня, обычно путем их простого перечисления. Как правило экстенсионалы хранятся в базах данных, а интенсионалы в базах знаний. Знания по способу представления различают на декларативные (описывается информация) и процедуральные (записаны в алгоритме). Основное направление движения в области представления знаний – большее использование декларативных знаний.

Классификации знаний и их моделей

Существует много способов классифицировать знания. Остановимся на классификации по носителю знаний. Знания делятся на:

1. Формализованные

· справочные руководства,

· энциклопедии,

· знания в корпоративных информационных системах

2. Персональные

· навыки, связанные с ремеслом,

· спортивные навыки,

· способы мышления, анализа,

· способы выполнения работ

Формализованные знания обычно уже размещены на материальных носителях - книги, брошюры, сайты интернет/интранет, файлы данных, КИС (ERP). Эти способы организации знаний очень хороши и проверены временем. Мы вряд ли сможем их существенно улучшить, чтобы это отразилось на производительности или других экономических показателях вашей организации.

Персональные знания, напротив, обычно содержатся только в умах их носителей. Для того, чтобы сделать их достоянием организации, необходимо, чтобы знания активно передавались между сотрудниками. Для этого издавна существует наставничество, системы внутреннего корпоративного обучения.

Очень многие из персональных знаний могут быть формализованы. Это касается прежде всего методов и способов выполнения работ, принятых и оптимальных в вашей организации. В зависимости от этапа развития организации, методы выполнения работ развиваются от творческих, созданных на рабочих местах методом проб и ошибок до лучших практик в индустрии, закрепленных в документации о бизнес-процессе, ERP-системе и в политике организации.

Определения фрейма. Фрейм как список свойств и как сеть. Иерархия и наследование свойств

Фрейм – это некоторая структура представления знаний, которая при ее заполнении соответствующими значениями превращается в описание конкретного фактора, события или ситуации. Фрейм - это минимальное возможное описание сущности какого-либо явления, события, ситуации, процесса или объекта. Минимальность означает, что при дальнейшем упрощении описания теряется его полнота, она перестает определять ту единицу знаний, для которой предназначено. Фрейм имеет определенную структуру, состоящую из множества элементов – слотов. Каждый слот в свою очередь, представляется определенной структурой данных, процедурой, или может быть связан с другим фреймом. Структуру фрейма можно представить так:

ИМЯ ФРЕЙМА: (имя 1-го слота: значение 1-го слота), (имя 2-го слота: значение 2-го слота), … (имя N-го слота: значение N-гo слота).

Ту же запись представим в виде таблицы, дополнив двумя столбцами.

В качестве значения слота может выступать имя другого фрейма; так образуют сети фреймов, состоящие из выделенных вершин и связей. Верхний уровень фрейма представляет соответствующие понятия, а последующие уровни терминальные слоты, которые содержат конкретные значения. Иерархия объектов реализуется через аппарат исследования свойств, когда классы объектов определенного уровня наследуют строения классов фреймов более высокого уровня. Если объект, кот. описывается некоторой группой фреймов находится в концептуальной связи с верхним и нижним уровнями фреймов, то соотв. ему фреймы конструируются с учетом и иерархических отношений и при этом наследование свойств осущ. через слоты или фреймы с одинаковым именем.

Отличия знаний от данных

Информация, данные, знания

Информация существует в трех видах: в виде данных (Data ), собственно информации (Information ) и знаний (Knowledge ).

При компьютерной обработке информации исходные данные понимаются как данные , и должны быть представлены в форме, которую можно хранить, обрабатывать, передавать.

Данные – зафиксированные наблюдения, которые в данный момент времени не оказывают воздействия на принятие решения.

Данные обычно представлены в форме, которая позволяет использовать их для компьютерной обработки и передачи, то есть, закодированы, могут храниться.

Примеры данных: словарь – упорядоченный набор текстовых данных, энциклопедия – упорядоченный набор данных, произвольный текст (статья, конспект).

Из данных можно извлечь информацию.

Информация – это обработанные данные, которые представлены в виде, пригодном для принятия получателем решения.

Примеры информации: извлеченное из словаря толкование слова, извлеченное из энциклопедии значение термина.

Информацией является содержание, значение данных, или факты, которые используются для принятия решения.

Знания – факты, сообщения об окружающей среде, процедуры и правила манипулирования фактами, а также информация о том, когда и как следует применять эти процедуры и правила.

В целом, знания – это проверенный практикой результат познания действительности, вид информации, которая отображает знания человека, специалиста в предметной области.

Знания различаются: есть декларативные (факты) и процедурные (правила). Декларативные, это знания об определенных явлениях, событиях, свойствах объектов («Я знаю, что…»). Процедурные, это знания о действиях, которые нужно предпринять для достижения какой-либо цели («Я знаю, как…»).

Отличия знаний от данных

1. Интерпретация . Хранимые данные могут быть интерпретированы только человеком или программой. Данные не несут информации. Знания содержат как данные, так и их описание (правила интерпретации).

2. Наличие связей классификации . Данные не имеют эффективного описания связей между различными типами данных. Знания структурированы, так как можно установить соответствие между единицами знаний.

3. Наличие ситуационных связей . Связи описывают множество текущих ситуаций объекта. Данные трудно поддаются анализу. Из структуры и состава знаний по ситуации возможно построение процедур анализа знаний.

Подходы к определению количества информации
(способы измерения информации)

В теории информации доказано, что информация допускает количественную оценку, то есть может быть измерена объективно.

Очевидно, что для этого нужно сделать допущения: в определенных условиях можно пренебречь качественными особенностями информации. Тогда количество информации может быть измерено числом, следовательно, можно сравнить количество информации, содержащейся в различных сообщениях.


Модуль 1 (1,5 кредит): Введение в экономическую информатику

Тема 1.1: Теоретические основы экономической информатики

Тема 1.2: Технические средства обработки информации

Тема 1.3: Системное программное обеспечение

Тема 1.4: Сервисное программное обеспечение и основы алгоритмизации

Экономическая информатика и информация

1.1. Теоретические основы экономической информатики

1.1.2. Данные, информация и знания

Основные понятия данных, информации, знаний.

К базовым понятиям, которые используются в экономической информатике, относятся: данные, информация и знания. Эти понятия часто используются как синонимы, однако между этими понятиями существуют принципиальные различия.

Термин данные происходит от слова data - факт, а информация (informatio) означает разъяснение, изложение, т.е. сведения или сообщение.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Существуют и другие определения информации, например, информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Знания – это зафиксированная и проверенная практикой обработанная информация, которая использовалась и может многократно использоваться для принятия решений.

Знания – это вид информации, которая хранится в базе знаний и отображает знания специалиста в конкретной предметной области. Знания – это интеллектуальный капитал.

Формальные знания могут быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или учебников, инструкций с описанием решения задач.

Неформальные знания – это знания и опыт специалистов в определенной предметной области.

Необходимо отметить, что универсальных определений этих понятий (данных, информации, знаний) нет, они трактуются по-разному.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний.

Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

Взаимосвязь данных, информации и знаний в процессе принятия решений представлена на рисунке.


Рис. 1.

Для решения поставленной задачи фиксированные данные обрабатываются на основании имеющихся знаний, далее полученная информация анализируется с помощью имеющихся знаний. На основании анализа, предлагаются все допустимые решения, а в результате выбора принимается одно наилучшее в некотором смысле решение. Результаты решения пополняют знания.

В зависимости от сферы использования информация может быть различной: научной, технической, управляющей, экономической и т.д. Для экономической информатики интерес представляет экономическая информация.