Гибридная система. Большая энциклопедия нефти и газа

15.03.2019

Мичиган (англ. Michigan) – штат, расположенный на Среднем Западе США. Столица – город Лэнсинг. Крупные города: Детройт, Грэнд-Рэпидс, Флинт, Уоррен, Стерлинг-Хайтс, Уэйн. Население составляет 9 876 187 человек (2011 год). Площадь 250 493 км². На востоке и севере Мичиган имеет общую границу с канадской провинцией Онтарио, озерами Гурон и Верхнее, южная граница с Индианой и Огайо. В 1837 году стал 26-м по счету штатом США.

Достопримечательности штата

Каждый год в Мичигане устраивают грандиозное автошоу, в котором участвуют около 40 тысяч необычных и раритетных машин. Можно побывать в старинной деревне Гринфилд-Вилидж с ее историческими зданиями: лаборатория Томаса Эдисона и здание суда, где работал Авраам Линкольн. В Холланде проводят фестиваль тюльпанов, в Траверс-Сити – «вишневый» фестиваль. На берегу Детройт-Ривер возвышаются 7 огромных стеклянных круглых башен. Можно также посетить самый большой в мире культурный исторический музей африканской культуры имени Райта, Центр музей, интересное сооружение Коммерика-Тауэр. Здесь расположено множество курортов, оснащенных всеми условиями для плавания, рыбалки, занятий водным спортом. Можно посетить курортный остров Макинак с его огромным мостом и фортом или совершить путешествие на необыкновенно красивый остров Ройал.

География и климат

Около 41,3% площади штата – водное пространство. В Мичигане находится около 11 тысяч озер. Территория делится на два полуострова – Нижний и Верхний, соединяющиеся мостом Макино, а также множество островов. Нижний полуостров водами озера Мичиган имеет западную границу с Иллинойсом и Висконсином. Верхний полуостров на западе граничит с Висконсином и водами озера Верхнего – с Миннесотой. Более 75% Верхнего полуострова занимают леса. Нижний полуостров имеет характерную форму, похожую на варежку. Рельеф равнинный с невысокими холмами. Климат влажный континентальный. На юге штата средняя температура в январе месяце составляет от -8°C до -1°C, в июле месяце от 18°C до 28°C. На севере штата климат более суровый. Лето здесь теплое, но более короткое, зима длинная и холодная. Средняя температура в январе месяце от -16°C до -7°C, а в июле месяце от 12°C до 24°C. В Мичигане довольно часто бывают метели и снегопады, грозы, проносятся торнадо.

Экономика

В 2003 году ВВП штата составлял $365 млрд. Из полезных ископаемых здесь добывают нефть, природный газ и железную руду. Мичиган занимает лидирующие позиции по производству торфа. Город Детройт является главным центром автомобилестроения США. На территории штата работают около 4000 предприятий связанных с автомобилестроением. Развита пищевая промышленность, работают крупные заводы, в том числе крупнейшего производителя сухих завтраков (Келлогг). Так как штат окружен Великими озерами, большую роль играет водный транспорт. В Мичигане находятся 38 портов, которые обеспечивают судоходство по озерам и рекам, а также выход к Атлантическому океану. В области сельского хозяйства (2-е место) занимаются выращиванием кукурузы, соевых бобов, пшеницы, сахарной свеклы, картофеля. Штат занимает лидирующие позиции по производству яблок, вишни, черники, персиков. Здесь занимаются разведением крупного рогатого скота, свиней и птиц. Большое внимание уделяется развитию туризма.

Население и религия

Плотность населения составляет 39,43 человек на км². Расовый состав населения штата: 78,9% – белые, 14,2% – афроамериканцы, 2,4% – азиаты, 0,6% – индейцы, 1,5% – другие расы, 2,3% – смешанные расы. Около 22,3% населения имеют немецкое происхождение, 11,9% – ирландское, 10,1% – английское, 9% – польское, 6,7% – французское и франкоканадское, 5,1% – голландское, 4,7% – итальянское. По религиозной принадлежности: католики – 2 миллиона, лютеране – 250 тысяч, методисты – 225 тысяч, евангелисты-лютеране – 160 тысяч человек. Кроме того в штате проживает около 110 тысяч иудеев и 100 тысяч мусульман.

Штат Мичиган

Штат Мичиган расположен на Среднем Западе Соединенных Штатов Америки. Штат входит в группу штатов Северо-Восточного Центра.

Считается 26-м штатом вошедшим в состав США.

Официальная столица штата Мичиган расположена в городе Лэнсинг.

Крупнейший город в штате – Детройт. Среди других крупных городов можно выделить Грэнд-Рэпидс, Уоррен, Флинт, Стерлинг-Хайтс, Энн-Арбор.

Население штата Мичиган составляет свыше 10 миллионов человек.

География

Штат Мичиган имеет площадь более 250,7 тысяч квадратных километров, по этому показателю занимает 11-е место в стране.

Более 40 процентов этой площади приходится на водное пространство.

Территория штата условно делится на два полуострова – Нижнего и Верхнего, соединенных мостом Макино.

На востоке Мичиган граничит с канадской провинцией Онтарио и омывается водами озёр Гурон и Эри, на юге граничит со штатами Огайо и Индиана, на западе граничит с Висконсином и омывается озером Мичиган, на севере омывается озером Верхнее и имеет водную границу со штатами Иллинойс и Миннесота.

Общая береговая линия штата имеет длину 5,2 тысяч километров (самый большой показатель среди континентальных штатов). На территории Мичигана находится более 11 тысяч внутренних озёр, что существенно влияет на климат штата.

История

На протяжении нескольких тысячелетий на территории Мичигана обитали индейские племена. Ко времени появления европейцев здесь обитали индейские племена оджибва (чиппева), оттава, потаватоми и виандот. Первым европейцем, побывавшим на Верхнем полуострове, был Этьен Брюле (1622). В 1668 году миссионер-иезуит Жак Маркетт основал здесь первое поселение Су-Сент-Мари. В 1679 году Робер да ла Салль осуществил постройку первого европейского парусного судна на Верхнем озере.

В 1701 году французский офицер и исследователь Антуан Кадиллак основал поселение Детройт вокруг форта Понтшартрен (назван в честь тогдашнего французского премьер-министра, Луи Фелипо, графа де Понтшартрен).

В середине XVIII века провинция перешла от французов к англичанам в результате Войны с французами и индейцами. После американской Войны за независимость Мичиган вошел в состав Северо-Западной Территории. В 1794 году американские войска разбили индейцев в Битве у поваленных деревьев и по договору Джея получили контроль над несколькими фортами.

В 1805 году была создана Территория Мичиган. Во время англо-американской войны 1812-1814 года она временно оказалась в руках англичан. В 1830-х здесь начался массовый приток переселенцев, связанный с созданием канала Эри, дорожной инфраструктуры, а также с развитием сельского хозяйства и добывающей промышленности.

В 1835 году была подписана конституция штата, но из-за территориального спора с Огайо Мичиган вступил в состав союза лишь 26 января 1837 году Первым губернатором штата стал в 1835 году Стивенс Мейсон.

В Гражданской войне на стороне северян участвовало 23 % мужского населения Мичигана (более 90 тыс. человек), около 14 тысяч из них погибло.

В 1903 году на заводе Генри Форда было основано конвейерное производство автомобилей. В 1926 компания General Motors поставила отраслевой рекорд, доведя годовой объём продаж до 1 миллиардов долларов США.

Экономика

Мичиган, и в первую очередь Детройт, считается центром американского автомобилестроения. Важные статьи доходов также - туризм и охота. Кроме того, имеются полезные ископаемые - нефть, железная руда, природный газ. Штат занимает первое место по производству торфа.

По оценке Бюро экономического анализа, в 2003 году ВВП Мичигана составил 365 миллиардов долларов США.

Cтраница 3

В гибридных системах с замещением берется главная модель, один из элементов которой замешается другой моделью, например, а) перерасчет весов в процедуре обратного распространения производится с помощью генетического алгоритма; б) подбор функций принадлежности в нечетком регуляторе осуществляется с использованием генетического алгоритма. В гибридных системах со взаимодействием используются независимые модули, которые обмениваются информацией и выполняют различные функции с целью получения общего решения. К примеру, если решаемая задача включает распознавание образов, вывод и оптимизацию, то эти функции берут на себя нейронные сети, экспертные системы и генетические алгоритмы. В полиморфных гибридных системах одна модель применяется для имитации функционирования другой модели.

График зависимости среднеквадратичного отклонения поля направлений, полученного в численном эксперименте (I и полученного в натурном эксперименте (2, от периода полос к размеру зоны одного.

Однако существующие гибридные системы идентификации дактилограмм несвободны от недостатков. Метод анализа дактилограмм по фурье-спектру будет интерпретировать изображения, отличающиеся перестановкой фрагментов, одинаковые. Кроме того, дактилоскопические изображения являются структурно избыточными.

В целом гибридная система АДТ является дальнейшим шагом в развитии аналоговой вычислительной техники.

Вопросам построения гибридных систем, включающих подсистемы эволюционного моделирования, блоки оптимизации, взаимодействующие с имитационными моделями, экспертными системами и другими системами поддержки принятия решений, посвящена пятая глава. Создание имитационных моделей выступает здесь как одно из направлений развития подходов интеллектуального имитационного моделирования. В данной главе описаны подходы и модели многоагентных систем, различного уровня интеллектуальности и их дальнейшая эволюционная форма - модели искусственной жизни. Как примеры гибридных систем с эволюцией приводятся моделирование развития популяции простейших автоматов и многомодельные системы.

Возможно применение гибридных систем, объединяющих элементы активных и пассивных систем.

При исследовании дискретных и гибридных систем встречаются параметры, которые нельзя описать функциями от зависимых или независимых переменных.

В случае гибридной системы работы ЭВМ ограничена арифметическими действиями, с помощью которых вычисляют площади пиков; при этом можно учесть чувствительность детектора, определить содержание веществ исходя из внутреннего стандарта и напечатать протокол заданного формата.

Введение в гибридную систему для автоматизации обработки данных, получаемых от всех голографических систем, блока сканирование - анализ, управляемого цифровой ЭВМ, к свойству системы выполнять разносторонние функции должно добавить высокую скорость, увеличение точности и объективности при анализе данных.

Во многих гибридных системах управления используются различные модификации протокола Ethernet на основе Carrier Sense Multiple Access with Collision Detection (CSMA / CD), соответствующие стандарту ISO 8802 - 3 / IEEE 802.3. Сущность его сводится к тому, что каждый узел сети отслеживает загрузку линии, и осуществляет передачу только тогда, когда определяет, что линия свободна. Если из-за того, что другой узел также требует линию для передачи, возникает коллизия, то оба узла прекращают передачу.

В iMAN используется гибридная система управления базами данных (СУБД) на базе Oracle V8, поддерживающая реляционную и объектно-ориентированную модели данных, осуществляются контроль доступа и вносимых изменений, формирование спецификаций изделий, интегрирование прикладных подсистем. Управление параллельными и последовательными бизнес-процессами и процессами проектирования возложено на модуль Workflow.

Рассматривается задача оптимизации линейных гибридных систем с обобщенным квадратичным критерием, когда к традиционным членам - штрафам на квадраты отклонений состояний и управлений добавлены члены, которые позволяют штрафовать отклонения в соответствии с их знаком. Задачи оптимального управления с такими предпочтениями, т.е. когда требуется, чтобы определенные компоненты управления (или состояния) были положительными или отрицательными большую часть времени, часто встречаются на практике.

В случае применения гибридной системы автоматического контроля и управления, состоящей из электрических и пневматических устройств, для связи этих устройств между собой необходимо преобразование электрического сигнала в давление воздуха.

Наряду с этими гибридными системами могут быть использованы и гибридные модели другого вида, в которых пассивные модели стыкуются с устройствами, работающими по принципам электронного моделирования. Такие модели позволяют использовать преимущества пассивных моделей (простота, большое количество узлов, быстродействие и др.) с возможностью осуществления ряда логических операций, необходимых при решении нелинейных задач теории поля, без участия в вычислительном процессе ЭЦВМ с многократным преобразованием информации из одного вида в другой, без оборудования, необходимого для этого преобразования. Стоимость таких систем значительно ниже стоимости гибридных машин, включающих ЭЦВМ.

Похоже, дни классического двигателя внутреннего сгорания сочтены. И виной тому необходимость соблюдения экологических норм.

Стандарт Евро-6, вступивший в силу с 1 сентября 2015 года, ужесточил требования к дизельным двигателям в части содержания в выхлопе оксидов азота и остаточных углеводородов. Выполнение установленных норм токсичности обеспечивают система каталитической нейтрализации , система рекуперации отработавших газов , усовершенствованный сажевый фильтр . С 1 сентября 2017 года сертификация новых автомобилей будет проводиться по более жесткому общемировому циклу движения и наличие перечисленных систем на дизельных двигателях будет недостаточно для выполнения установленных норм токсичности.

В соответствии с решением комиссии Европарламента, начиная с 2021 года, на все выпускаемые автомобили вводится норма выброса углекислого газа в объеме 95 г/км вместо нынешних 130 г/км. Это соответствует среднему расходу топлива для бензиновых двигателей 4,06 л/100 км, для дизельных двигателей 3,62 л/100 км. Такой уровень расхода топлива недостижим для классических ДВС.

Поэтому на передний план выходят гибридные конструкции привода автомобилей, полностью отвечающие предъявляемым экологическим требованиям. Но современные гибриды очень дороги. Компромиссным решением является так называемая низковольтная гибридная система . В основу системы положена 48-вольтовая электрическая сеть , которая планируется в качестве дополнения к основной 12-вольтовой бортовой сети.

Основные функции низковольтной гибридной системы:

Применение низковольтной гибридной системы на автомобилях позволяет сократить на 10-15% выбросы углекислого газа. Низковольтный гибрид с дизельным двигателем снижает выбросы оксидов азота на 20%, а вместе с системой каталитической нейтрализации – на 80%. Экономия топлива может достигать от 13 до 21%.

Разработкой низковольтных гибридных систем сегодня занимаются сразу несколько ведущих производителей, среди которых Bosch, Continental, Delphi, Ricardo, Valeo. В настоящее время большинство автопроизводителей приняли решение о внедрении, а Audi, Honda, Ford, Kia, Renault, Volkswagen уже устанавливают низковольтную гибридную систему на свои автомобили. По прогнозу к 2020 году 25% новых автомобилей будут иметь гибридный привод, а половина из них будет использовать 48-вольтовую электрическую сеть.

Типовая конструкция низковольтной гибридной системы состоит из следующих основных элементов, включенных в 48-вольтовую электрическую сеть: стартер-генератора, инвертора, преобразователя постоянного тока и 48-вольтовой аккумуляторной батареи.

Стартер-генератор является основным конструктивным элементом системы. Он работает в двух режимах – как генератор и как стартер (точнее как электрический двигатель). В генераторном режиме создается электрическая энергия, что позволяет полностью отказаться от традиционного 12-вольтового генератора. Стартерный режим используется для создания дополнительного крутящего момента при движении автомобиля. В качестве стартер-генератора применяются синхронные и асинхронные электрические машины переменного тока.

Конкретный вид электрической машины определяется конструктивной схемой гибридной установки. Различают несколько конструктивных схем низковольтной гибридной силовой установки:

Стартер-генератор соединен с двигателем внутреннего сгорания ременным приводом.
Стартер-генератор установлен на коленчатом валу двигателя внутреннего сгорания.
Стартер-генератор расположен в коробке передач.

Самым простой и, поэтому, пока самой распространенной схемой интеграции стартер-генератора является соединение его с двигателем внутреннего сгорания с помощью ременного привода.

Работу стартер-генератора обеспечивает двунаправленный инвертор. Он преобразует постоянный ток аккумуляторной батареи в трехфазный переменный ток. При рекуперации энергии инвертор преобразует переменный ток в постоянный ток зарядки аккумуляторной батареи. По конструкции 48-вольтовый инвертор аналогичен высоковольтному инвертору, который используется в полных гибридах и электромобилях.

Преобразователь постоянного тока используется для передачи энергии между 48-вольтовой и 12-вольтовой электрическими сетями. Для 12-вольтовой электрической сети он заменяет генератор.

Каждая из сетей имеет собственную аккумуляторную батарею: 48-вольтовую литий-ионную и 12-вольтовую свинцово-кислотную батарею. 48-вольтовая аккумуляторная батарея служит для питания мощных устройств: компрессора системы кондиционирования, водяного насоса, электромеханических поворотных амортизаторов, активной подвески и др. 12-вольтовая аккумуляторная батарея обеспечивает энергией систему освещения , системы безопасности, информационно-развлекательную систему .

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Гибридные системы

Раньше уже неоднократно высказывалась идея, что экспертная система может содержать не одну форму представления знаний. Даже в таких ранних системах, как MYCIN (см. главу 3), информация, специфическая для предметной области, хранилась в разных формах -- например, в виде порождающих правил и в виде таблиц медицинских параметров. Программы, аналогичные CENTAUR (см. главу 13), уже можно было считать гибридными в том смысле, что в них объединялись разные способы представления знаний, а затем эти знания использовались с разной целью -- для решения проблемы и формирования пояснений.

Поздние исследовательские системы, такие как XPLAN (см. главу 16), имели более сложную архитектуру, в которой для разработки и обслуживания экспертных систем объединялись разнообразные программные инструменты и модели. Такие системы можно рассматривать как очередной шаг вперед по сравнению с простейшей оболочкой, поддерживающей единственную парадигму программирования. В системах на базе доски объявлений (см. главу 18), подобных HEARSAY и ВВ, объединялись разнообразные источники знаний, которые могли иметь совершенно отличную внутреннюю структуру.

Системы, которые мы рассмотрим в этой главе, ознаменовали дальнейшее продвижение по этому пути -- в них объединяются традиционные программы решения проблем и компоненты самообучения и критического анализа. Система ODYSSEUS способна обучаться тому, как уточнять базу знаний. Для этого используются две разные методики: одна основана на анализе прецедентов, а вторая -- на анализе пояснений. Обе методики являются сравнительно новыми, и читатель сможет вкратце ознакомиться с ними в данной главе. Далее будет описана программа, в которой логический вывод на основе прецедентов используется для обработки исключений из правил, а основным инструментом решения проблем являются порождающие правила. Программа обладает потенциальными возможностями обучения новым правилам . В конце главы будет рассмотрена система извлечения информации SCALIR , в которой множество обычных символических методов комбинируется с подходом, основанным на сетях подключений.

Методы обучения в системе ODYSSEUS

Методы обучения, которые рассматривались в главе 20 (пространство версий и IDЗ), иногда называют методами, основанными на подобии (similarity-based). Реализация обучения на основе этих методов требует обработки больших объемов информации -- позитивных и негативных примеров, -- из которой извлекаются характерные свойства нового концепта.

Альтернативой таким методам являются методы, основанные на пояснениях (explanation-based), которые позволяют выполнить обобщение на осно.ве единственного обучающего экземпляра. Это становится возможным, поскольку в таких методах процессом обобщения "руководят" знания, специфические для конкретной предметной области. Обучение, основанное на пояснениях, является дедуктивным или аналитическим, а не эмпирическим или индуктивным . Иными словами, при такой методике описание нового концепта формируется в результате анализа предъявленного экземпляра в свете имеющихся фоновых знаний.

Методика логического вывода на основе прецедентов, которой была посвящена глава 22, позволяет решить новую проблему, адаптируя ранее полученные решения аналогичных проблем. Эта же методика может быть использована и для обучения, поскольку если уж ранее сформированное решение адаптировано применительно к новой проблеме, его можно добавить в базу прецедентов для использования в будущем.

Ниже будут более подробно рассмотрены методика обучения на основе пояснений и возможность использования прецедентов для машинного обучения.

Термином обобщение на основе пояснений (EBG -- explanation-based generalization) обозначается независимый от, предметной области метод использования знаний, специфических для предметной области, для контроля процесса обобщения по единственному обучающему экземпляру.

Использование метода EBG предполагает, что система располагает следующей информацией:

· позитивным экземпляром обучающей выборки;

· теорией предметной области;

· определением концепта, который система должна "изучить".

Для формализации этих идей обычно используется язык логического программирования (см. главу 8). В частности, концепт, как правило, представляется в форме предиката, который характеризует то подмножество пространства объектов, которое нас интересует. Например, предикат сuр(Х) может представлять понятие "cuphood" (чашкообразность), которое определено в стиле языка PROLOG как сосуд малого объема (small), обладающий свойствами open (открытый), stable (устойчивый). Напомним, что выражение

читается как "а истинно, если b истинно". Тогда:

cup(X) :- small(X), stable(X), open(X).

Знания о предметной области должны включать описания условий, выполнение которых необходимо для того, чтобы объект можно было считать "устойчивым" (stable), например указано, что объект должен иметь плоское дно, определение свойства "открытый" (open) -- например, объект должен иметь вогнутую форму, причем центр кривизны должен быть расположен выше основания.

В качестве экземпляра обучающей выборки укажем объект с плоским дном вогнутой формы, диаметр которого не превышает нескольких дюймов. Экземпляр должен "сопровождаться" пояснением, что указанные свойства вполне достаточны для представления понятия "cuphood". Образец обычно описывается некоторым количеством фундаментальных литералов (ground literals), например:

color(red, obj). diameter(4, obj).

flat(bottom, obj). concave(top, obj).

Эти литералы представляют определенный объект obj красного цвета (red) с плоским дном (flat bottom), вогнутый, причем центр кривизны располагается сверху (concave top). Знания о предметной области, представленные ниже, позволяют распознать этот экземпляр как представляющий концепт сир:

small(X) :- diameter(Y, X), Y < 5.

stable(X) :- flat(bottom, X).

open(X) :- concave(top, X).

Обратите внимание -- то, что объект obj является чашкой, логически следует из этого фрагмента знаний. Наше пояснение, почему obj является чашкой, фактически есть доказательство. Этим завершается фаза пояснений в EBG.

Далее начинается фаза обобщения-- вырабатывается набор достаточных условий, которые существовали при пояснении. Главное, что нужно при этом сделать, -- определить самые слабые условия, которых достаточно, чтобы на основании имеющихся знаний прийти к заключению, что obj -- это чашка. Полученное в результате обобщение концепта состоит в том, что чашкой является объект с плоским дном, вогнутый, с центром кривизны вверху и диаметром менее 5:

cup(X) :- flat (bottom, X), concaveftop, X), diameter(Y, X), Y < 5.

Обратите внимание на то, что это обобщение логически следует из исходного определения понятия "чашкообразности" и базовых знаний о том, что такое "малый объем", "устойчивость" и "открытость". В этом смысле новое обобщение уже было неявно представлено в ранее имевшихся знаниях. Анализ представленного образца позволил сделать это обобщение явным. Кроме того, использование сформированного заранее обобщенного определения "чашкообразности" позволило нам совершенно безболезненно проигнорировать несущественные характеристики, в данном случае -- цвет.

Обучение на основе прецедентов (CBL -- case-based learning) представляет собой подход к обучению, совершенно противоположный методу EBG. Как было показано в главе 22, извлечение информации при таком подходе базируется в основном на подобии аргументов, а не на их логическом анализе. Можно с полным правом утверждать, что процесс адаптации сформулированного ранее решения к новой проблеме не включает обобщения в смысле логического программирования. В качестве дополнительного средства, обеспечивающего использование знаний об отношениях между сущностями предметной области, можно использовать иерархию абстракций, в частности в форме семантической сети. Однако результатом будут не новые правила, включающие переменные, а скорее новые прецеденты, сформированные из старых подстановкой констант.

Рассуждения на основе прецедентов -- это, по сути, рассуждения по аналогии, а не логический вывод. Если некто придет к заключению, что Джон, владелец Порше, -- водитель, склонный к риску, поскольку имеется прецедент, что Джек, который ездит на Ферра-ри, тоже склонен к риску, то фактически по аналогии делается вывод-- Джон похож на Джека, так как автомобиль Порше имеет много общего с Феррари. Напрашивается заключение, что, когда строится такая аналогия, каждый прецедент неявно генерирует определенное правило. В нашем примере такое обобщенное правило состоит в том, что люди, которые ездят на спортивных автомобилях, склонны к риску. Но такое правило не является полным. Все ли водители спортивных машин склонны к риску, или только водители-мужчины, или молодежь? Программа, использующая методику рассуждений на основе прецедентов, не может ответить на такой вопрос. Она способна только отыскать прецедент, наиболее близкий к рассматриваемому случаю.

Между методами CBL и EBG есть и кое-что общее. Оба метода можно противопоставить индуктивным методам, рассмотренным в главе 20, поскольку ни тот ни другой не предполагает анализа большого количества данных. Мы уже показали, что методу EBG достаточно иметь один обучающий экземпляр, а метод CBL для формирования аналогии может обойтись одним подходящим прецедентом.

Но обучение -- это нечто большее, чем просто накопление сведений. Система, основанная на анализе прецедентов, должна обладать способностью выявить неподходящие прецеденты, которые не позволяют получить удовлетворительное решение насущной проблемы. В противном случае она будет накапливать прецеденты с ошибочными решениями.

Программа CHEF, описанная в главе 22, способна выявить ситуацию, в которой она формирует неудачный рецепт, и предпринимает попытку исправить его. Чтобы сделать это, программа должна объяснить, почему она полагает рецепт неудачным. Для этого программе требуется воспользоваться определенными знаниями из предметной области, которые в таком случае должны иметь форму правил причинной связи.

Например, модули извлечения и модификации могут предложить замариновать креветок, а потом уже их чистить. Но в этом случае креветки станут слишком влажными, и в рецепте не удастся реализовать заданное в заказе свойство "очищенные креветки". Программа обнаружит это, когда попытается смоделировать процесс приготовления блюда по созданному рецепту. Тогда другой модуль системы, ответственный за восстановление, обратится к знаниям о типах ошибок в рецептах, отыщет подходящую стратегию исправления ситуации и повторит этап составления рецепта. В новом рецепте сначала нужно очистить креветки, а уже потом их мариновать.

Даже после того, как будет получено решение для нового случая, программа не сможет его правильно индексировать до тех пор, пока не поймет, почему это решение считается успешным. Если пользователь заказывает легкое, нежирное блюдо и если программа, манипулируя прежними рецептами, сформировала новый, то этот результат можно использовать в будущем только после того, как с ним будут ассоциированы признаки "легкий" и "нежирный".

Системы ODYSSEUS и MINERVA

Программа ODYSSEUS обучается тому, как совершенствовать базы знаний экспертных систем, предназначенных для решения проблем эвристической классификации (см. главы 11 и 12). Она наблюдает за тем, как эксперт решает проблему, и формирует пояснение каждого действия эксперта (например, запрашивая эксперта, почему некоторому атрибуту присвоено то или иное значение). Формирование пояснений базируется на тех знаниях о проблемной области и стратегии решения проблем, которыми располагает программа. Если программе не удается сформировать пояснение, инициируется процесс коррекции базы знаний.

Оболочка экспертной системы MINERVA

MINERVA-- это оболочка экспертной системы, разработанная на базе EMYCIN и NEOMYCIN (см. главы 10-12). Система MINERVA обеспечивает ODYSSEUS базой знаний и методом решения проблем и разработана специально для поддержки метода обучения EBL. Одно из главных отличий системы MINERVA от EMYCIN состоит в том, что в ней представлены не только знания о предметной области, но и стратегические знания, отражающие способ мышления практикующего врача. Такие знания можно рассматривать как дальнейшее развитие метаправил систем MYCIN, EMYCIN и NEOMYCIN.

Главным компонентом этой системы является база медицинских знаний о диагностировании менингита и других неврологических заболеваний. MINERVA реализована на языке PROLOG, и знания о предметной области представлены в этой системе в виде фраз Хорна (см. главу 8), но правила по содержанию аналогичны тем, что использовались в MYCIN. Например, следующее выражение представляет тот факт, что фотофобия может быть связана с головной болью:

conclude(migraine-headache, yes)

:- finding(photophobia, yes).

Знания о состоянии проблемы записываются в виде выражений для фактов в процессе работы системы. Например, выражение

rule-applied(rulel63).

утверждает, что в процессе работы системы было активизировано правило 123 и что эта информация доступна программе в процессе дальнейшей работы. Другое простое выражение

differential(migraine-headache, tension-headache).

зафиксирует тот факт, что мигрень и повышенное давление -- текущие гипотезы, выдвинутые программой.

Очевидно, что такая информация может быть представлена и зарегистрирована любым способом, например установкой флагов или переменных, но наиболее целесообразно использовать такое же представление, какое принято в базе знаний предметной области.

Несложное метаправило может быть представлено в следующем виде: goal(findout(Р)) :- not(concluded(P)), ask-user(P).

Это правило утверждает, что если текущая цель системы -- найти значение параметра Р и если система не может прийти к заключению о значении этого параметра на основании имеющихся у нее знаний, то она должна запросить его у пользователя. Поскольку Р является переменной, то головная часть выражения goal (findout (Р)) сопоставляется с выражением цели системы, представленным в явном виде, например goal (f indout (temperature)). Подцели вроде not(concluded(P)) могут быть сопоставлены (успешно или нет) с системными данными, описывающими текущее состояние процесса вычислений, например concluded (temperature).

Такие стратегические знания используются для выработки суждения о текущем состоянии проблемы и принятия решения о том, располагает ли система в данном случае достаточными знаниями. Кроме того, наличие таких знаний упрощает программу обучения, которая может обращаться к структурам на метауровне экспертной системы.

Обучение в системе ODYSSEUS

Способ обучения, который используется в системе ODYSSEUS, существенно отличается от рассмотренных в главе 20. При разработке этой системы преследовалась цель наделить ее способностью расширять существующую неполную базу знаний, а не включать в базу знаний новые понятия на основании анализа обучающей выборки большого объема. Система обучается, "наблюдая" за тем, как эксперт решает задачу, примерно так, как прилежный ученик постигает таинства мастерства учителя, стоя у него за спиной.

Основной вид действий, которые выполняются экспертом в процессе решения проблемы диагностики, -- определение значений разнообразных переменных, т.е. характеристик пациента, таких как температура и т.п. Программа, наблюдая за работой эксперта, расширяет свои знания, пытаясь понять, почему эксперту понадобился ответ на тот или иной вопрос.

Таким образом, концепция процесса обучения в системе ODYSSEUS очень близка к формулированию пояснений. Фактически в контексте работы этой системы смысл термина "пояснение" отличается как от общепринятого, так и от того, какой мы придавали ему в главе 16. В ODYSSEUS пояснение -- это вид доказательства, которое несет информацию о том, почему эксперт задает определенный вопрос на конкретном этапе решения проблемы диагноза. Смысл определенного вопроса связан как с текущим состоянием проблемы, так и с той стратегией, которой пользуется эксперт. Поэтому, "уразумев", почему был задан вопрос, программа как бы постигает стратегию действий эксперта.

Если программа располагает исчерпывающими знаниями, она способна сформулировать вопрос (а точнее, высказывание, которое стоит за ним) как логическое следствие текущего состояния проблемы, стратегических знаний, заключенных в метаправилах, знаний о предметной области и одной из текущих целей.

Например, если задан вопрос askuser(temprature), то обратный просмотр приведет нас к ближайшей цели goal (f indout (temperature)).

Но эта цель, в свою очередь, сформирована целью более высокого уровня, например желанием применить определенное правило или произвести разделение гипотез. Наличие в текущей ситуации такой цели высокого уровня объясняет, почему была сформирована цель более низкого уровня, а следовательно, почему был задан определенный вопрос. Эта обратная цепочка рассуждений от подцелей к целям выполняется обычными средствами языка PROLOG или даже MYCIN, но обратите внимание -- эти рассуждения выполняются на метауровне, т.е. на уровне, который определяет, почему программа работает именно так, а не иначе. Применяемая в системе ODYSSEUS стратегия обучения "из-за спины" включает три основные фазы.

· Определение изъяна в базе знаний. Такой изъян обнаруживает себя, когда не удается сформировать объяснения действиям эксперта, используя описанный выше метод обратного просмотра. Неудача такого рода служит сигналом, что пора приступить к обучению.

· Формирование предложений для внесения изменения в базу знаний. Если не удалось сформировать доказательство (пояснение в терминологии ODYSSEUS), значит, можно предположить, что в знаниях о предметной области или о состоянии проблемы имеется какой-то изъян. Если это изъян в знаниях о предметной области, можно временно добавить в базу подходящую фразу и посмотреть, будет ли после этого сформировано доказательство. Если же изъян существует в знаниях о состоянии проблемы, программа должна поискать другое доказательство.

· Внесение изменения в базу знаний. Метод, который используется в системе ODYSSEUS для внесения изменений в базу знаний, называется "процедурой подтверждения принятого решения". Если не вдаваться в детали, то при этом требуется, чтобы разработчик системы сформировал процедуру, которая будет обрабатывать новые правила, определив, например, на сколько сократится количество конкурирующих гипотез в результате применения правила.

Детали реализации перечисленных фаз выходят за рамки обсуждения в данной книге, но основные принципы довольно очевидны. В применяемой методике экземпляр обучающей выборки представляет собой отдельную пару атрибут--значение, но в процессе сеанса обучения может возникнуть множество таких пар, так как программа пытается объяснить, почему она придает значение каждому из этих экземпляров. Если сформировать объяснение не удается, программа предпринимает попытку модифицировать базу знаний.

Для модификации правил или добавления новых правил в базу знаний программа ODYSSEUS использует также в примитивном виде и метод CBL. Программа располагает библиотекой прецедентов, каждый из которых содержит и соответствующий правильный диагноз. Эту библиотеку программа может использовать для тестирования. Если при тестировании окажется, что сформирован неверный диагноз, программа назначает использованным при этом правилам нечто вроде штрафов.

Предпосылки правил, которые привели к ошибочному заключению, "ослабляются", т.е. сужается зона их" применения. Если же применение правил подтвердило вынесенный ранее правильный диагноз, то соответствующие предпосылки "усиливаются". В этой процедуре есть много общего с тем методом, который используется в системе Meta-DENDRAL, описанной в главе 20. Конечно, этот метод модификации правил не гарантирует решения проблемы, но он может пригодиться для настройки новых правил.

Использование прецедентов для обработки исключений

В этом разделе мы рассмотрим способ совместного использования правил и прецедентов, отличный от того, какой применен в системе ODYSSEUS. Роль прецедентов при новом подходе состоит не в том, чтобы содействовать модификации правил, а в том, чтобы при обработке исключений служить дополнением тем знаниям, которые представлены в правилах. Таким образом, каждый из компонентов занимается тем, что у него лучше получается, -- правила имеют дело с обобщениями предметной области, а прецеденты -- с отдельными нетипичными случаями.

Как уже было не раз продемонстрировано в предыдущих главах (см., например, главы 10-15), построение набора правил для экспертной системы-- задача далеко не тривиальная. Помимо сложностей, сопряженных с извлечением и представлением знаний, существует еще и проблема полноты охвата предметной области набором правил. В идеале база правил должна быть корректной, непротиворечивой (по крайней мере, в рамках принятой стратегии разрешения конфликтов) и полной. Но по мере того, как количество правил расширяется, а сами правила усложняются, достичь такого идеального состояния становится все труднее.

Особенно сложно учесть в правилах все возможные исключения. Такая попытка приводит к чрезвычайному усложнению правил. Утверждение, что не бывает правил без исключений, давно уже стало общим местом. Иногда эту проблему пытаются решить включением в набор множества "мелких" правил, которые должны активизироваться в таких исключительных ситуациях. Но это означает возлагать на правила несвойственную им функцию -- обрабатывать не общий случай, а частный.

Голдинг и Розенблум предложили использовать в экспертных системах гибридную архитектуру, в которой при решении проблем методика использования порождающих правил сочетается с методикой использования прецедентов . Идея состояла в том, что механизм обработки прецедентов должен использоваться для критического анализа результатов применения правил. Это выполняется путем поиска прецедентов, аналогичных рассматриваемому случаю, если последний можно считать исключением из правила. Такой подход требует, чтобы база прецедентов была индексирована по применяемым правилам. Авторы предложили и соответствующую меру близости, которая позволяет оценить степень подобия текущего случая и прецедента (рис. 23.1).

Архитектура гибридной системы, использующей правила и прецеденты

Основная идея системы очень проста и элегантна. Сначала для решения текущей проблемы применяются правила, в результате чего формируется некоторое решение. Затем просматривается библиотека прецедентов на предмет выявления в ней ранее ветречавшегося случая исключения из использованных правил. Алгоритм работы системы приведен ниже.

Цикл, ПОКА не будет получено решение

1 . Для выбора следующей операции использовать правила.

2. Поиск в библиотеке "неотразимых" прецедентов, которые предлагают противоположный вариант выбора операции.

3. Если прецедент найден, использовать предлагаемый в нем вариант операции. Иначе использовать тот вариант, который предлагается правилами.

Обратите внимание на то, что обращение к правилам и прецедентам выполняется в каждом цикле. (Если программа не сможет найти ни правила, которое можно было бы применить, ни прецедента, она останавливается.)

Для того чтобы предложенная идея стала работоспособной, прецеденты в библиотеке должны быть проиндексированы по правилам, которым они противоречат. Рассмотрим, например, правило страховки водителей транспортных средств:

"Мужчины не старше 25 лет платят страховой взнос по повышенному тарифу".

Такое правило должно быть связано в библиотеке с прецедентом, в котором упоминается 18-летний юноша, успешно прошедший тесты повышенной сложности и выплачивающий взнос по сниженному тарифу.

На основании каких соображений принимается решение, является ли прецедент "неотразимым" или нет? Предложенное Голдингом решение состоит в следующем. Когда мы проводим аналогию между прецедентом и текущим случаем, мы тем самым формируем некое неявное правило, скрытое от посторонних глаз. Предположим, что в нашем примере речь идет о водителе-мужчине 20 лет, который имеет квалификацию повышенной категории, и мы обнаружили аналогичный прецедент, но в нем речь шла о 1 8-летнем водителе. "Мужчины не старше 25 лет, имеющие повышенную квалификационную категорию, платят страховой взнос по сниженному тарифу".

Предположим, что при оценке степени близости, которая необходима для извлечения и последующего анализа прецедентов, возраст водителей разделяется на диапазоны, скажем "до 25 лет", "от 25 до 65 лет" и "свыше 65 лет". Эта мера близости оценит рассматриваемый нами случай и прецедент как очень похожие, поскольку совпадают возрастная категория и пол.

Можно протестировать это правило и на остальных прецедентах в библиотеке и оценить, какой процент выявленных прецедентов оно накрывает. Любой прецедент с мужчиной-водителем повышенной квалификационной категории, чей возраст не превышает 25 лет и который выплачивает взнос по повышенному тарифу, будет считаться исключением и, следовательно, снижать рейтинг прецедента. Если же случаи достаточно похожи, а правило достаточно точное, то аналогия считается "неотразимой" и компонент обработки прецедентов "выигрывает". В противном случае выигрыш будет за применяемым правилом, и в окончательном решении будет использован вариант, следующий из правила.

Таким образом, "неотразимость" зависит от трех факторов:

· степени близости случаев, которая должна превышать определенный порог;

· точности неявного правила, сформулированного в результате выявленной аналогии; в качестве меры точности берется пропорция прецедентов, которые подтверждают применение этого правила;

4 достоверности оценки точности, которая определяется размером выборки, на которой эта оценка сформирована.

Авторы продемонстрировали возможности предложенной архитектуры на примере задачи определения произношения имен. Реализованная ими система, получившая название ANAPRON, содержит около 650 лингвистических правил и 5000 прецедентов. Результаты испытания системы показали, что она обладает более высокой производительностью, чем системы-аналоги, использующие либо только правила, либо только прецеденты.

Гибридный символический подход и нейронные сети

В этом разделе будет рассмотрена перспектива использования нейронных сетей в экспертных системах. Нейронные сети предполагают совершенно другую модель вычислительного процесса, принципиально отличную от той, которая традиционно используется в экспертных системах. В качестве примера будет рассмотрена система SCALIR (Symbolic and Connectionist Approach to Legal Information Retrieval) .

Эта система помогает пользователю отыскать правовые документы -- описания прецедентов или статьи законов, -- имеющие отношение к определенному делу. Поскольку юридическая практика охватывает все области жизни современного общества, использование традиционного подхода, основанного на обычных базах знаний, к поиску и извлечению правовой информации потребует представления в системе огромного объема знаний, в большинстве нетривиальных, представляющих такие сложные понятия, как права, разрешения, обязанности, соглашения и т.п. Проблема усугубляется использованием естественного языка при составлении запросов. Большинство поисковых систем, имеющих дело с запросами на естественном языке, которые используются для поиска в сети World Wide Web, основаны на статистическом подходе, а не на базах знаний.

В системе предпринята попытка решить эту проблему посредством сочетания статистического подхода к извлечению информации и подхода, основанного на базах знаний, в которых учитываются смысловые связи между документами.

Нейронные сети

В отношении систем искусственного интеллекта вообще и экспертных систем, в частности, иногда можно услышать следующие критические замечания.

· Такие системы слишком "хрупкие" в том смысле, что, встретившись с ситуацией, не предусмотренной разработчиком, они либо формируют сообщения об ошибках, либо дают неправильные результаты. Другими словами, эти программы довольно просто можно "поставить в тупик".

· Они не способны непрерывно самообучаться, как это делает человек в процессе решения возникающих проблем.

Еще в середине 1980-х годов многие исследователи рекомендовали использовать для преодоления этих (и других) недостатков нейронные сети.

В самом упрощенном виде нейронную сеть можно рассматривать как способ моделирования в технических системах принципов организации и механизмов функционирования головного мозга человека. Согласно современным представлениям, кора головного мозга человека представляет собой множество взаимосвязанных простейших ячеек -- нейронов, количество которых оценивается числом порядка 10 10 . Технические системы, в которых предпринимается попытка воспроизвести, пусть и в ограниченных масштабах, подобную структуру (аппаратно или программно), получили наименование нейронные сети.

Нейрон головного мозга получает входные сигналы от множества других нейронов, причем сигналы имеют вид электрических импульсов. Входы нейрона делятся на две категории -- возбуждающие и тормозящие. Сигнал, поступивший на возбуждающий вход, повышает возбудимость нейрона, которая при достижении определенного порога приводит к формированию импульса на выходе. Сигнал, поступающий на тормозящий вход, наоборот, снижает возбудимость нейрона. Каждый нейрон характеризуется внутренним состоянием и порогом возбудимости. Если сумма сигналов на возбуждающих и тормозящих входах нейрона превышает этот порог, нейрон формирует выходной сигнал, который поступает на входы связанных с ним других нейронов, т.е. происходит распространение возбуждения по нейронной сети. Типичный нейрон может иметь до 10 J связей с другими нейронами.

Было обнаружено, что время переключения отдельного нейрона головного мозга составляет порядка нескольких миллисекунд, т.е. процесс переключения идет достаточно медленно. Поэтому исследователи пришли к заключению, что высокую производительность обработки информации в мозге человека можно объяснить только параллельной работой множества относительно медленных нейронов и большим количеством взаимных связей между ними. Именно этим объясняется широкое распространение термина "массовый параллелизм" в литературе, касающейся нейронных сетей.

Подход, базирующийся на нейронных сетях, часто рассматривается как несимволический, или субсимволический (subsymbolic), поскольку основная информационная единица, подлежащая обработке, является не символом (как это определено в главе 4), а чем-то более примитивным. Например, символ в LISP-программе, скажем МУ LAPTOP, можно было бы представить схемой активности некоторого числа связанных нейронов в нейронной сети. Но, поскольку нейронные сети часто моделируются программно, сам нейрон представляется некоторой программной структурой, которая, в свою очередь, может быть реализована с использованием символов. Например, роль нейрона может исполнять объект данных, располагающий подходящими свойствами и методами и связанный указателями с другими объектами в сети. Таким образом, на концептуальном уровне в субсимволической системе, реализованной компьютерной программой, которая содержит символы, нет ничего парадоксального.

Независимо от способа реализации, нейронную сеть можно рассматривать как взвешенный ориентированный граф такого типа, который описан в главе 6. Узлы в этом графе соответствуют нейронам, а ребра -- связям между нейронами. С каждой связью ассоциирован вес -- рациональное число, -- который отображает оценку возбуждающего или тормозящего сигнала, передаваемого по этой связи на вход нейрона-реципиента, когда нейрон-передатчик возбуждается.

Поскольку нейронная сеть носит явно выраженный динамический характер, время является одним из основных факторов ее функционирования. При моделировании сети время изменяется дискретно, и состояние сети можно рассматривать как последовательность мгновенных снимков, причем каждое новое состояние зависит только от предыдущего цикла возбуждения нейронов.

Для выполнения обработки информации с помощью такой сети необходимо соблюдение определенных соглашений. Для того чтобы сеть стала активной, она должна получить некоторый входной сигнал. Поэтому некоторые узлы сети играют роль "сенсоров" и их активность зависит от внешних источников информации. Затем возбуждение передается от этих входных узлов к внутренним и таким образом распространяется по сети. Это обычно выполняется посредством установки высокого уровня активности входных узлов, которая поддерживается в течение нескольких циклов возбуждения, а затем уровень активности сбрасывается.

Часть узлов сети используется в качестве выходных, и их состояние активности считывается в конце процесса вычислений. Но часто интерес представляет и состояние всей сети после того, как вычисления закончатся, либо состояние узлов с высоким уровнем активности. В некоторых случаях интерес может представлять наблюдение за процессом установки сети в стабильное состояние, а в других -- запись уровня активизации определенных узлов перед тем, как процесс распространения активности завершится.

На рис. 23.2 показан фрагмент нейронной сети, состоящий из четырех сенсорных узлов S 1 --S 4 , возбуждение от которых передается другим узлам сети. Один узел, R, является выходным. Если веса связей в сети неизвестны, то узел R будет возбужден тогда, когда будут возбуждены узлы S 1 и S 4 Но если будут возбуждены также узлы S 2 и S 3 , это приведет к подавлению возбуждения R даже при возбужденных узлах 5) и S 4 . Будет ли узел R действительно возбужден при таком состоянии сигналов на входах сенсорных узлов, зависит от весов связей в сети.

Количество возможных конфигураций сети такого типа очень велико. Велико и количество способов вычисления состояния нейрона при заданной сумме состояний на его входах. Эти детали теории нейронных сетей выходят за рамки данной книги. Далее мы будем следовать идеям Роуза (Rose) и рассмотрим относительно простую модель нейронной сети, в которой любой узел может быть связан с любым другим узлом и в которой выходом узла является его состояние активности (т.е. не делается различия между активностью нейрона и сигналом на его выходе).

Фрагмент нейронной сети с возбуждающими и тормозящими связями

· Для более строгой формулировки такой модели введем следующие обозначения:

· w ij -- вес связи от узла j к узлу i,

· net i = Z j w ij -- состояние в текущий момент времени входов узла l, связанного с другими узлами сети.

При любом определении нейронной сети необходимо принимать во внимание и фактор времени, поскольку состояние любого нейрона в некоторый момент времени зависит от его предыдущего состояния и от предыдущего состояния нейронов, связанных с его входами.

Определение

Сеть связности (connectionist network) может рассматриваться как взвешенный ориентированный граф, в котором для каждого узла i выполняются следующие требования:

(1) состояние активности узла в любой момент времени t является действительным числом (будем обозначать его как a i (t));

(2) вес связи, которая связывает узел i с любым другим узлом у сети, является действительным числом w ij ,

(3) активность узла в момент t+1 является функцией от

· его активности в момент времени t, a i (t);

· взвешенной суммы сигналов на входах в момент времени t, net i {f);

· произвольного внешнего входного сигнала x i (t).

Простая функция вычисления состояния активности узла i, удовлетворяющая требованию (3) приведенного выше определения, имеет вид

a i (t+1) = Cумма j

Это, однако, не единственно возможный способ определения активности. Функции других видов включают добавление термов, соответствующих росту или спаду активности, или имеют вид нелинейных дифференциальных функций (см., например, ). В данной книге они рассматриваться не будут.

При конструировании сети веса связей могут быть назначены априори или изменяться со временем. В последнем случае изменение весов является одним из следствий активности сети. Веса можно рассматривать как отражение знаний, а процесс их настройки и уточнения -- как процесс обучения системы. Поскольку веса существенно влияют на распространение активности по сети, от них во многом зависит и поведение сети, а следовательно, изменяя веса, можно изменять поведение сети в желаемом направлении.

Как отмечено выше, знания в сети связности представлены неявно, поскольку нельзя выделить один определенный структурный элемент сети, который представлял бы отдельное правило или сущность предметной области. Знание отражено именно во взвешенных связях между мириадами отдельных элементов сети. Таким образом, в данном случае мы имеем дело с распределенными знаниями, которые нельзя представить в виде простого перечисления числовых или символических элементов. По этой причине часто можно встретить утверждение, что в нейронных сетях выполняется субсимволическая обработка информации.

В сетях связности знания сохраняются не в декларативном виде, а потому они не могут быть доступны для интерпретации со стороны какого-либо внешнего процессора . Доступ к знаниям и процесс логического вывода могут быть описаны только в терминах активности сети.

Конечно, ничто не препятствует конструктору сети ассоциировать отдельные ее узлы с определенными сущностями предметной области, как это сделал Роуз в системе SCALIR. Однако такое отражение понятий на узлы сети не противоречит ранее сделанному утверждению, что отношения между сущностями неявно представлены в виде связей между узлами и обычно не могут интерпретироваться в форме правил. Следовательно, хотя мы и частично приоткрыли завесу таинственности, скрывающую, что же стоит за узлами сети, сущность взвешенных связей между ними остается по-прежнему "субсимволической".

Даже в случае, если узлы представляют сущности предметной области, общая картина активности мириад узлов сети может скрывать понятия достаточно высокого уровня, объединяющие определенные аспекты сущностей, представленных узлами. Пусть, например, узлы представляют слова и пусть узлы "гонки", "машина", "водитель" возбуждены. Этим может быть представлено понятие "водитель гоночной машины" или, наоборот, факт вождения гоночной машины. В любом случае такое представление может расцениваться как субсимволическое, поскольку составляющие его узлы не могут быть оформлены в виде какой-нибудь синтаксической структуры, имеющей явно выраженный смысл. Точно так же нельзя выполнить и семантический анализ состояния мириад узлов с помощью какого-либо внешнего набора правил.

SCALIR -- гибридная система для извлечения правовой информации

Узлы в сетевой структуре системы SCALIR представляют прецеденты (дела, ранее рассмотренные судами), статьи правовых актов и важные (ключевые) слова, которые встречаются в подобных документах. Таким образом, структурно сеть разделена на три части (слоя), как показано на рис. 23.3. В этой сети слой прецедентов и слой законодательных актов разделены слоем узлов, представляющих ключевые слова (термины). Последние связаны с документами, в которых они встречаются.

Таким образом, в базовой структуре сети связь между узлами терминов и документов образует схему индексации с взвешенными связями. В результате массив терминов отображается как на массив прецедентов, так и на массив правовых актов.

Вместо того чтобы связывать каждый термин с каждым документом, в котором он встречается, в SCALIR вычисляется вес термина для каждого ключевого слова, связанного с документом, как функция от частоты упоминания этого термина в данном документе и частоты его упоминания во всем массиве документов. Интуитивно кажется, что термином, наиболее подходящим для индексации некоторого документа, будет такой, который часто появляется в этом документе, но редко во всех остальных. Полученное значение сравнивается с пороговым, в результате чего каждый документ индексируется примерно десятком ключевых слов. (Обращаю ваше внимание на тот факт, что на схеме сети системы SCALIR показаны двунаправленные связи. Фактически каждая из них представлена в системе парой однонаправленных связей, причем эти связи могут иметь разные веса. Таким образом, не только термин позволяет найти документ, но и по документу можно отыскать термин.)

Сеть связности в системе SCAUR ()

При конструировании сети в SCALIR сначала были организованы узлы для всех отобранных терминов, а затем они связывались с узлами документов, причем связям назначались веса в зависимости от значимости того или иного термина в контексте данного документа.

Такой тип связей (в документации они названы С-связями) не является единственным в SCALIR. Существуют и символические связи (S-связи), которые во многом напоминают связи в семантических сетях, поскольку маркированы и имеют постоянные веса. С помощью связей этого типа в сети представлены отношения между документами, например один документ цитирует другой, в одном судебном решении критикуется другое, один правовой акт ссылается на другой и т.д. Таким образом, S-связи представляют знания в явном виде.

В целом сеть сиетемы SCALIR содержит порядка 13 000 узлов терминов, около 4 000 узлов прецедентов и около 100 узлов законодательных актов. Между узлами терминов и прецедентов организовано приблизительно 75 000 связей, а между узлами терминов и законодательных актов -- около 2 000 связей. Кроме того, существует около 10 000 символических связей между узлами прецедентов. Роуз не счел нужным останавливаться на том, каких усилий потребовало создание подобной сети, но можно предположить, что такие ключевые задачи, как извлечение терминов и цитирование, были решены программно, а затем на основании этой информации автоматически сформированы узлы сети и связи между ними. Нужно принять во внимание и тот факт, что большинство горидических документов было уже ранее обработано публикаторами, которые составили достаточно полные индексы цитирования и ключевых слов.

Описанная сеть была затем использована в качестве базовой информационной структуры для извлечения документов. В основу функционирования системы положен принцип распространяющейся активности (spreading activation). Этот принцип не нов -- ранее он использовался Квиллианом для работы с семантическими сетями (см. об этом в главе 6). Использование этого формального аппарата позволяет выяснить, существует ли какое-либо отношение между узлами в сети. Для этого запускается процесс распространения маркеров от узлов, представляющих интерес, и анализируется, произошло ли где-либо в сети "пересечение" распространяющихся маркеров.

Основная идея, положенная в основу работы SCALIR, состоит в том, что уровень активности данного узла должен быть пропорционален его "уместности" в рассматриваемом контексте. Если в результате обработки запроса возбуждается некоторое число узлов слоя терминов, это должно привести к возбуждению узлов тех документов, которые касаются данного запроса, причем уровень возбуждения зависит от того, насколько тот или иной документ отвечает сути запроса. Узлы, воспринимающие запросы, являются, по сути, сенсорными узлами нейронной сети, от которых возбуждение по С-связям передается другим узлам. В процессе распространения возбуждения в дело включаются и S-связи, которые передают возбуждения от одних узлов документов другим, связанным с ними. Таким образом, символические связи отражают знания о том, что если определенный документ имеет отношение к полученному запросу, то, скорее всего, и связанный с ним другой документ также имеет отношение к этому запросу. Веса символических связей фиксированы, поскольку сила такой ассоциативной зависимости может быть оценена заранее.

Существуют два свойства функции активизации сети, которые представляются крайне желательными с точки зрения приложений, требующих ассоциативного поиска информации. Эти свойства влияют на выбор способа возбуждения сенсорных узлов, воспринимающих запросы пользователей, методики назначения весов связям и формы функции активизации.

(1) Количество активности, которое вносится в систему, не должно зависеть от размерности запроса.

(2) В каждом очередном цикле распространения активность не должна возрастать.

Если первое из указанных требований не будет выполняться, то запрос, состоящий из одного слова, приведет к меньшей активности сети, чем многословный. При этом окажется, что в ответ на более ограниченный многословный запрос система извлечет больше документов, чем в ответ на более свободный однословный, а это противоречит нашим интуитивным ожиданиям. Если же сеть не обладает вторым из сформулированных свойств, то будет извлечено слишком много документов, имеющих крайне слабое касательство к сути запроса, т.е. система будет производить много "информационного мусора".

Для того чтобы система обладала первым свойством, нужно на стадии предварительной обработки запроса распределить между входными узлами фиксированное количество активности. Вторым свойством система будет обладать в том случае, если сумма весов выходных связей не будет превышать единицы и, следовательно, значение функции активизации будет меньше или равно ее аргументу.

С-связи используют линейную функцию активизации, которая содержит константу сдерживания (retention constant) р, как показано в приведенном ниже выражении. Значение этой константы определяет, какая часть активности узла сохраняется в последующем цикле возбуждения, а какая распространяется дальше по сети.

a i (t + 1) = р а j (t) + (1 - p) Sum j

Совершенно очевидно, что приведенная функция активизации будет удовлетворять сформулированным требованиям, поскольку a i (t +1)=< a i (t) до тех пока, пока Sum j

Функция такого же вида использована и в работе . Роуз следует идеям, изложенным в этой работе, и в отношении организации управления активностью сети в SCALIR.

· Для выделения узлов, активность которых достаточна для участия в процессе извлечения информации, вводится параметр O s -- порог значимости (significance threshold). Значение этого порога уменьшается по мере распространения активности по сети.

· Для выделения узлов, активность которых слишком слаба и которые поэтому можно игнорировать в процессе извлечения информации, вводится параметр O q -- порог успокоения (quiescence threshold). Использование этого порога позволяет избежать непроизводительных затрат времени на анализ малоактивных узлов.

Эти параметры используются в алгоритме распространения активности по сети SCALIR, который в упрощенном виде представлен ниже. Этот алгоритм реализует метод поиска в ширину, начиная со входных узлов восприятия запроса (QUERY-NODES) и заканчивая всеми взвешенными связями.

Установить исходное значение O S .

Включить в множество ACTIVE-NODES узлы из множества QUERY-NODES.

Если имеется запрос, установить уровни активности узлов в QUERY-NODES.

Включить в множество RESPONSE-SET все узлы из ACTIVE-NODES, чья активность превышает O S .

Удалить из множества ACTIVE-NODES все узлы, чья активность ниже O q .

Добавить в множество ACTIVE-NODES все узлы, связанные с узлами, уже включенными в ACTIVE-NODES.

Обновить значение активности всех узлов множества ACTIVE-NODES, используя функцию активизации.

Рассортировать узлы в множестве ACTIVE-NODES по уровню активности. Уменьшить значение O s .

пока не будет выполнено (O S =< O q) или (ACTIVE-NODES = 0).

В упрощенном варианте не рассматривается использование параметра, ограничивающего ширину пространства поиска. Кроме того, мы опустили в этой формулировке алгоритма и анализ максимального размера множества выходных узлов. Ограничение множества выходных узлов прекращает выполнение поиска после того, как выделено предельное количество извлекаемых документов.

Значение большинства параметров, используемых в процессе управления активностью сети, устанавливается эмпирически. Настройка же весов связей между узлами сети W ij представляет собой, по сути, процесс обучения системы, который мы вкратце рассмотрим в следующем разделе.

обучения в системе SCALIR

Поскольку веса С-связей могут регулироваться системой в процессе работы, она способна таким образом самообучаться в соответствии с информацией, вводимой пользователем. Ниже мы опишем, как это делается в системе SCALIR, опуская несущественные детали.

Предположим, что один из входов узла i связан с выходом узла j, причем связь имеет вес W ij . Если узел i представляет документ, имеющий отношение к термину, представленному узлом j, то в процессе обучения нам может потребоваться усилить эту связь. Если же пользователь посчитает, что документ имеет мало общего с этим термином, то потребуется ослабить эту связь. Главный вопрос, который нужно при этом решить, -- в какой степени нужно менять значение веса. Одно из простых правил вычисления значения изменения веса W ij может быть выражено формулой

W i = nf i a j ,

где n| -- константа скорости обучения (learning rate), a f i -- коэффициент обратной связи от пользователя, который, например, может принимать значение +1 или--1.

Однако применение такого правила не настолько очевидно, как это может показаться с первого взгляда, по следующим причинам.

· Определить значения уровня активности а, не так просто, поскольку активизированный при возникновении запроса входной узел может снизить свою активность после того, как запрос будет снят.

· Соседи узлов, которые получают обратную связь, также должны, по-видимому, получать некоторую информацию обратной связи от пользователя, подтверждающую, что они представляют документы, имеющие отношение к запросу.

· Узел i может находиться в конце сети распространения активности, а следовательно, информация от пользователя (обратная связь) должна распространяться по сети в обратном направлении. Таким образом, получаемая от пользователя информация обратной связи должна распространяться по сети примерно так же, как активность. Максимальное значение обратной связи для каждого узла записывается и обновляется в процессе распространения, и эти значения в дальнейшем играют роль членов f i и а j в приведенном выше выражении. Далее полученные значения весов нормализуются таким образом, чтобы их сумма для каждого отдельного узла была равна 1.0. Конечно, в реальной системе SCALIR процесс самообучения несколько сложнее, поскольку в ней существуют связи разных типов. Читателям, интересующимся деталями этого процесса, следует познакомиться с работой , Но идея комбинированного использования символических и субсимволических методов заслуживает дальнейшего углубленного изучения. В системе SCALIR продемонстрирован довольно прагматический компромисс между чисто статистическим подходом к извлечению информации и традиционным подходом для экспертных систем, требующим большого объема знаний о предметной области.

Подобные документы

Кодеры формы, полосный вокодер. Кодирование с линейным предсказанием. Кодирование речи методом анализа через синтез. Векторное квантование и кодовые книги. Гибридные кодеры. Гибридные кодеры с частотным разбиением. Гибридные кодеры с временным разбиением.

реферат , добавлен 10.12.2008

Коды, обрабатывающие исключения, информация о причине их возникновения. Способы обработки исключений. Механизмы обработки исключений. Инициализация ссылки на объект. Конструкторы стандартных исключений. Автоматическая и программная генерации исключений.

презентация , добавлен 21.06.2014

Компьютерные обучающие системы. Принципы новых информационных технологий обучения. Типы обучающих программ. Активизация обучения. Компьютерное тестирование. Перспективные исследования в области компьютерного обучения. Интернет-технологии, мультимедиа.

контрольная работа , добавлен 10.09.2008

Анализ вариантов проектных решений и выбор на его основе оптимального решения. Синтез функциональной схемы микропроцессорной системы на основе анализа исходных данных. Процесс разработки аппаратного и программного обеспечения микропроцессорной системы.

курсовая работа , добавлен 20.05.2014

Обзор подхода к разработке системы управления персоналом. Формирование требований к системе, выбор методологии построения системы. Автоматизация работы алгоритма подсчета мощности. Практическая реализация подхода на примере компании ООО "Новая медицина".

дипломная работа , добавлен 03.07.2017

Методы решения задачи синтеза систепроцесса символьной регрессии. Генетический алгоритм с эволюционной стратегией. Разработка программы на языке Python версии 2.7 в среде Eclipse Juno с использование библиотеки для построения графиков Matplotlib.

дипломная работа , добавлен 17.09.2013

Разработка системы автоматизированного анализа сложных объектов образовательной системы. Построение диаграмм последовательности, кооперации, классов, состояний, компонентов, а также развертывания. Представление сгенерированных кодов клиента и сервера.

курсовая работа , добавлен 23.06.2014

Системы и задачи их анализа. Методы системного анализа: аналитические; математические. Сущность автоматизации управления в сложных системах. Структура системы с управлением, пути совершенствования. Цель автоматизации управления. Этапы приятия решений.

реферат , добавлен 25.07.2010

Разработка программы, моделирующей процессы обучения, работы и прогнозирования ИНС с использованием постоянного, а также адаптивного шага обучения. Исследование поведения системы в зависимости от количества входов при постоянном шаге самообучения.

контрольная работа , добавлен 16.10.2011

Установка операционной системы Windows Server 2003 SP-2 и драйверов. Запуск сетевых подключений. Использование, проверка и настройка различных программ MS Office 2007. Включение компонентов и программ, которые не устанавливаются во время установки ОС.