Скачать

Инженерия знаний

Система - посредник, заключение договора на поставку.

Инженерия знаний - область информатики, в рамках которой проводятся исследования по представлению знаний в ЭВМ, поддержание их в актуальном состоянии и манипулировании ими.

Knowledge system - система основанная на знаниях.

СОЗ СБЗ СУБД ЭС ИС СИИ - система искусственного интеллекта.

Структура системы, основанной на знаниях.


БЗ механизм получения решения




ИНТЕРФЕЙС


БЗ - это модель, представляющая в ЭВМ знания, накопленные в определенной предметной области. Эти знания должны быть формализованы. Знания формируются с помощью модели, а затем представляются с помощью определенного языка.

В БЗ обычно выделяются знания о конкретных объектах и правила. Эти правила исполняются как механизм получения решений, для того, чтобы из исходных фактов вывести новые.

Интерфейс обеспечивает ведение диалога на языке, близком пользователю.

Методы, основанные на использовании логических выводов, часто используется в инженерии знаний.


Понятие предметной области.

Объект – то что существует или воспринимается в качестве отдельной сущности.

Основные свойства: дискретность; различие.

При представлении знаний используется прагматический подход, т.е. выделяются те свойства объекта, которые важны для решения задач, которые будет решать создаваемая система. Поэтому система, основанная на знаниях, имеет дело с предметами, которые являются абстрактными объектами. Предмет выступает в роли носителя некоторых свойств объекта. Состояние предметной области может меняться со временем. В каждый момент времени состояние предметной области характеризуется множеством объектов и связями. Состояние предметной области характеризуется ситуацией.


Ситуация


Статическая


Динамическая


Постоянные свойства и соотношения


Состояния


Устойчивые


Временные


Процессы


События











Концептуальные средства описания предметной области.

Концептуальная модель отражает наиболее общие свойства. Для того, чтобы детализировать описание нужны языки. Характерными чертами концептуальных средств описания предметной области являются абстрактность и универсальность. Их можно использовать для описания любой предметной области.

Понятие класса объекта.

Понятие объекта – понятие множеств. Сходные между собой объекты объединяются в классы. В разные моменты времени одному и тому же классу могут соответствовать разные множества объектов.

К – класс объекта.

Кt – множество объектов класса К в момент времени t.

К = t Кt

Пример:

Группа (1999) = { ИА-1-99, ИА-1-98, … , ИА-1-94, ИБ-1-99,…}

Группа (1998) = { ИА-1-98, ИА-1-97, … , ИА-1-93, ИБ-1-98,…}

 t Кt = { … }

Преподавательская должность = { профессор, доцент, старший преподаватель, преподаватель, ассистент}


зел




син



1

син





желт


4 Геометрическая фигура, форма квадрат, цвет синий.

2

зел





5

3

(К : А1 К1, А2К2, … , АnКn)

имя атрибут название

классов классов

о
бъектов атрибутная пара

Идентификация объектов может быть прямая и косвенная. В случае прямой используются имена объектов, порядковые номера объектов; косвенная основана на использовании свойств объектов.

Атрибут может быть компонентом. Под атрибутом понимается свойство, характеристика, название компонентов.

Пример:

(Геометрическая фигура:

форма Геометрическая форма

цвет Цвет)

Пары имя атрибута и значение атрибута часто совпадают.

Пример ситуации:

(Лекция:

лектор Фамилия_лектора,

место №_аудитории,

тема Название_темы,

слушатель Код_группы,

день День_недели,

время Время_начала)

Ситуация – показана связь между «преподаватель» и «слушатель», остальные характеристики данной ситуации.

Роли участников ситуации:

  • лектор

  • место

  • слушатель

Характеристики ситуации:

  • день

  • время

(К: А1К12К2, … , АnКn) – представление знаний в виде некоторой структуры.

(К: АiКi)

Пример:

(дата, число, день_месяца)

(дата, месяц, название_месяца)

(дата, год, год)

(геометрическая_фигура, форма, геометрическая_форма)

(геометрическая_фигура, цвет, цвет)

Такому представлению знаний соответствует представление знаний в виде отдельных фактов.

(К: АiКi)

(К: А1К12К2, … , АnКn)

Представления знаний об объектах делятся на:

классы объекта (структура данных)

знания о конкретных объектах (о данных)

Классы объекта.

  1. (К: А1К12К2, … , АnКn)

Аi – имя атрибута

Кi – классы объекта, являются значением атрибута

К – имя класса

Пример:

(преподаватели:

ФИО фамилия_с_инициалами,

Должность преподпвательская_должность)

  1. (К: АiКi)

Пример:

(преподаватель, ФИО фамилия_с_инициалами,

преподаватель, должность преподпвательская_должность)

  1. К (К12, … , Кn)

  2. К (А12, … , Аn)

Пример:

(преподаватель (фамилия_с_инициалами, преподпвательская_должность),

преподаватель (ФИО, должность))

Представление знаний для первой формы:

(К: А1К12К2, … , АnКn) кi  Кi

Атрибутивное представление знаний:

Пример:

(преподаватель: - представляет собой

ФИО Семенов - некоторую структуру

Должность доцент) - данных

Представление знаний для второй формы:

(К: АiКi) к  К, кi Кi

Атрибутивное представление знаний в виде отдельных фактов:

Пример:

(преподаватель1, ФИО, Семенов) - 1, 2 являются связками между

(преподаватель1, должность, доцент) - фактами

(преподаватель2, ФИО, Петров)

(преподаватель2, должность, ассистент)

Представление знаний для третьей формы:

К (К12, … , Кn)

(преподаватель (Семенов, доцент) - позиционное представление знаний

Если имена атрибутов отсутствуют, а сами атрибуты записываются на определённых позициях, то – позиционноё представление знаний.

Представление знаний в виде «троек» - (объект, атрибут, значение).

Для представления неточных значений используются коэффициенты уверенности – (объект, атрибут, значение, коэффициент уверенности).

Пример:

(пациент1, диагноз, колит, К760)

0  100

0  1

-1  1

0 – соответствует неопределенности.

отрицательное значение – степень уверенности в невозможности значения атрибута.

(

(пациент1, диагноз, колит, К760)

(пациент1, диагноз, гастрит, К740)




*


пациент1, диагноз, гастрит, К740)


* (пациент, ФИО, Антонов, диагноз колит К760, гастрит К740)

Представление знаний о классе объекта называется минимальным, если при удалении одного из атрибутов приводит к тому, что оставшееся множество атрибутов перестает быть представлением данного класса объекта.

Пример:

Аренда (объект_аренды, арендатор, арендодатель, срок_аренды, плата).

Если удалить «срок_аренды», получится купля-продажа, а если удалить «срок_аренды» и «плата», то получиться подарок.

Представление знаний в реляционной базе данных.

Реляционная база данных – данные хранятся в позиционном формате.

Данные хранятся в виде таблицы, где название таблицы – имя класса. Каждому классу соответствует таблица или файл БД. Имя класса - название соответствующей таблицы. Имена атрибутов – соответствующие поля таблицы (столбец). Строки таблицы – записи БД. Записи соответствует запись в позиционном формате.

А1

А2

. . . . .

Аn

К1

К2

. . . . .

Кn


Преподаватели

ФИО

должность

Семенов

Петров

Доцент

ассистент

Понятие атрибута в позиционной БД сохраняется.

Запись К (А12, … , Аn) называется отношение между атрибутами. Такая терминология используется в реляционной БД. Идея данных в реляционной БД основана на понятие «ключ».

Ключ – набор атрибутов отношения, значение которых однозначно определяет запись в файле.

Квартира

городулицадомкорпусквартираплощадьколичество комнат

Москва

Москва

Тверская

Тверская

2

2

1

1

47

54

60

50

2

1

В данном случае ключ будет состоять из нескольких полей.

К
i sup Кj является подклассом класс sup подкласс; подкласс sup класс.

Кi является подклассом Кj, если t Kit Kjt

(Если в любой момент времени t класс Кi является подклассом Кj)

Npr – классификация сети.

Классификация сети представляется в виде иерархической структуры.

С

sup


sup


sup


sup


sup


учащийся





тудент sup учащийся.

K

sup


sup


sup


sup


sup


sup


sup


sup


sup


sup


sup


sup


sup


sup


студент


объект


Неопределенный объект


Определенный объект


Материальный объект


Нематериальный объект


имя


понятие


ситуация


время


пространство









человек


помещение


оборудование





учащиеся


административный персонал


преподаватели


обслуживающий персонал






студент


аспирант


декан


заведующий кафедрой


методист


профессор


ассистент


доцент


техник


лаборант
















i part of Kj - является частью Ki part Kj

Ki является частью Kj, если конкретный объект класса Ki является частью однозначно определенного объекта Kj.

part


part


sup


sup


время






part


part


part


part


год


неделя


месяц


сутки


час


минута


секунда









part


part


part


пространство




sup


sup


sup


sup


страна


область


губерния


штат


населенный пункт


город


деревня









Отношение принадлежности.

k

isa


город


Москва


isa K - является элементом

K
i ius K - является составляющей

К1 ius K

K2 ius K

. . . . . . .

Kn ius K

Означает, что объект класса К состоит из объектов класса К1, К2, … , Кn, причем объект класса К может включать несколько объектов класса Кi.


Лекция №4.

Свойства отношений.

Отношения частичного порядка обладают свойством транзитивности.

Ki sup Kj Kj sup Km

Ki sup Km

Ki part Kj Kj part Km

Ki part Km

Если элемент является составляющей блока, а блок составлен…

Нет циклов в графе принадлежности.

K1 ins K2, K2 ins K3,…,Kn-1 ins Kj

Неверно, что Kn ins K1

K isa Ki sup Kj

K isa Kj

Москва isa город

Город sup Населенный пункт

Москва isa Населенный пункт

K1




K2

K3



K5

K4

R6

R7




R3

R2

R1

R5

R4



Операции над классами объектов.

С помощью операций над классами объектов можно определить новый класс объектов

Ki ins K

℧ Ki множество блоков, к примеру, телевизоров

Ki sup K

℧ Ki = K


Материальные объекты делятся на три класса

Условие  Помещение Оборудование = Материальный объект

Человек  Помещение = Человек Оборудование = Помещение Оборудование =∅

Размещение классов объекта

Человек (Фамилия, Имя, Отчество, Год_Рождения, пол)

Пол={мужской, женский}

Мужчина, женщина = Человек\пол

K (K1, K2, K3, K4, K5)

K\K5 – Разбиение класса по классу К5.

Объединение всех этих классов есть человек.

Мужчина⋃Женщина=Человек

Мужчина⋃Женщина=∅

(Знание_иностранного языка

Знающий человек,

Предмет иностранный_язык)

(K A1K1, A2K2)

K1/(K, K2)

В результате разбиения мы получаем классы людей, знающих иностранный язык.

Концептуальной схемой предметной области называется множество классов объектов, заданных на нем отношений и операциями.

Шаблонные описания состояния предметной области:


Занятия K

<Преподаватель> проводит занятия по дисциплине <название дисциплины> в группе <код группы> в <день недели> на <номер пары> в <аудитории>.

Иванов И.И. проводит занятия по дисциплине ТОЭ в группе ИТ-1-98 в понедельник на 4 паре в Г-301.

(занятия:

преподаватель Преподаватель

дисциплина Название_дисциплины

группа Код_группы

день День_недели

время Номер_пары

место Аудитория)

Концептуальные модели предметной области – концептуальная схема вместе с множеством высказываний построенных по конечному набору шаблонов.

Диаграмма сущности и связи (ER – диаграмма)

Entety Relation Diagramm


Сущность


связь


Атрибуты сущности и связи




преподаватель

кафедра

N 1

*




На 1 кафедре работает N преподавателей. «*» – знак преподавателя – можно найти кафедру.


Связь глагол или дополнение




дисциплина

Группа










Атрибуты – прилагательное, числители, размеры, место действия



факультет


Код специальности






специальность

Назв. Спец.





Расписание нагрузки


Зав. кафедрой

преподаватель







группа

дисциплина





Логические системы (модели), на основе единственного примера поставки товара в магазин.

Логические модели представления знаний.

Описание предметной области на одном из логических языков программирования, основано на исчислении предикат.

Язык многократного исчисления предикатов 1-го порядка. Многократная логика 1-го порядка.

Для составления этого языка :

Понятие сорта соответствует понятию классов объектов.

Множество сортов S

- на множестве задаются функциями.

f-имя функции;

сорта аргументов;

В – сорт значения функции.

Z – сигнатура – это верхний уровень представления знаний в логических моделях.


Предикат -

Т={0;1}


ложь истина

-константа сорта В


Рассмотрим в качестве примеров обработку деталей на производстве

2-токарных;

1-фрезерный;


S={Деталь, Станок, Операция, Тип_детали, Тип_станка, Время }

1) дет: Операция Деталь;

f A1 B

2) ст: Операция  Станок;

3) нач: Операция  Время

4) кон: Операция  Время

5) тип_дет: Деталь  Тип_детали

6) тип_ст: Станок  Тип_станка

7) 0 :  Время

C B

1:  Время

. В

.

.

t:  Время

8) ст_вал:Тип_детали

вал_мест:  Тип_детали

9) фрез: Тип_станка

ток: Тип_станка

10) фрез_торц:операция Т

ток_обр: операция Т

11) +: Время*Время Время

12): Время*Время Т

Знания о конкретных объектах

(нижн. Уровень представления знаний) на языке многократного исчисления предикатов наз-ся структурой интегрированной сигнатурой

  1. сигнатура

  2. Структура интегр. Сигнатуры.

  3. Для каждого имя сорта создаётся мн-во объектов этого сорта.

Деталь = {дет.1, дет.2, дет.3, дет.4}

Станок = {ст.1, ст.2, ст3}

Операция ={опер1,опер2, опер3, опер4, опер5, опер6, опер7, опер8}

Тип_детали = {ст_вал, вал_мест}

Тип_станка = {ток, фрез}

Время = {1,2,…,t}

Объединение всех множеств - универсум.

Каждой функции и предикатов из структуры в системе соответствует множество факторов.

  1. дет.(опер.1)=дет1

дет.(опер.2)=дет1

дет.(опер.3)=дет2

…………………..

2) ст.(опер.1)= ст.3

ст.(опер.2)= ст.1

ст.(опер.3)= ст.3

…………………

3) нач.(опер.1)=0

нач.(опер.2)=5

нач.(опер.3)=5

…………………..

4) конц(опер.1)=5

конц(опер.2)=12

конц(опер.3)=0

…………………

5) тип_дет(дет.1)=ст_вал

тип_дет(дет.2)=вал_мест

тип_дет(дет.3)=ст_вал

тип_дет(дет.4)=вал_мест

………………….

6) тип_ст. (ст.1)=ток

тип_ст. (ст.2)=ток

тип_ст. (ст.3)=фрез

………………….

10) фрез_торц(опер1)

ток_обр (опер2)

фрез_торц(опер3)

операциядетальстанокначалоконецфрез_торцток_обр
Опер1Дет.1Ст.30510
Опер2Дет.1Ст.151201
Опер3Дет.2Ст.351010
Опер4Дет.2Ст.2101701
Опер5Дет.3Ст.3101610
Опер6Дет.3Ст.1162601
Опер7Дет.4Ст.3162210
Опер8Дет.4Ст.2223201

ДетальТип_дет
Дет.1Ст_вал
Дет.2Ст_вал
Дет.3Вал_мест
Дет.4Вал_мест

СтанокТип_ст
Ст.1Ток.
Ст.2Ток.
Ст.3Фрез.

3) Составляющая : Логические формулы

Правила построения формул:

а)константа сорта А, есть терм сорта А

б)переменная принимающая значение из сорта А, есть терм сорта А

в)если сигнатура содержит функцию-

построенные термы сортов соответственно, то

-есть терм сорта В

г)если сигнатура содержит предикат-

,термы построенных сортов

, то - есть атом.

д)если - термы одинакового сорта, то выражение , то есть атом

е)Атом есть формула правильно построенная (ППФ)Переменная, входящая в атом, является свободной в этом атоме.

ж)если построенная формула в которую свободно входит переменные х сорта А , то выражения:

также является ППФ, переменная “x” является

связанной (в новых файлах)

з)если уже построенные формулы, то , также

является ППФ

Примеры:

  1. Представление Знания b=> опер2 выполнены на токарном станке

тип_ст(ст(опер2))=nток

  1. Опер2 выполн на ост.1 на ст.1 нач 5 конец 12

)

3)


Лекция 8 12.11.99.


Метод резолюций

Метод резолюций доказывает невыполнимость.

Для использования этого метода необходимо исходную формулу привести к ДНФ.

ДНФ:

- дизъюнкция литер

рii – атом или отрицание атома.

Потом ДНФ представляют в виде множества дизъюнктов

В методе резолюций – имеется одно правило вывода

В результате из 2-х дизъюнктов получаем новую, называется руовентой

- получаем пустой дизъюнкт , который всегда ложный.

Если множество содержит пустой дизъюнкт , то оно является не выполнимым.

Получается пустой дизъюнкт, который доказывает что данное множество является невыполнимым.

Метод резолюций применяется до тех пор пока не получится пустой– дизъюнкт

m,n – const

подстановка вместо переменной константы –унификация.

В данном случае выполняем подстановку {n/y}:

Из (1)и (2) => a(x)c(x,n) (5)

Из (3) и (5) , выполняя ь подстановку {m/n}=> c(m,n) (6)

Из (4) и (6) без подстановок => 0


Принцип резолюций в Прологе

В Прологе используются хордовские дизъюнкты, т.е. дизъюнкты, содержащие одну литеру без отрицания.

На пример

=>

конъюнкция

без

отрицания


Могут использоваться дизъюнкты , которые вообще не содержат литер. –

это целевое утверждение на прологе: ? – a

a: - b,c,d.

b: - e,f.

c.

e.

f.

?-a

a(1)

a(2)

a(3)

№ шага

Целевой

дизъюнкт

Исходный

дизъюнкт

резольвета

1

2

3

4

5

6

?- a.

?-b,c,d

?-e,f,c,d

?-f,c,d

?-c,d

?-d

a:-b,c,d.

b:-e,f

e

f

c

d

-b,c,d.

-e,f,c,d

-f,c,d

-c,d

-d

0


Представление программы в виде графа

a: - b;c

b: - d,e

c: - g,f.

e: - i,h

g: - h,j

d.

f.

h.

?-a

«,» - и

«;» - или

Построение графа начинается с целевого дизъюнкта.

На графе видно какие и сколько решений имеет рассматриваемая задача.

- Два решения

задачи


Продукционная модель представления знаний.

Основа для данной модели – это продукционные правила, которые имеют следующий вид

  • продукционное правило >:=<имя правила>

Eсли <посылка> то < заключение> (КД=<коэффициент доверия>)


Примеры:

Правило 5

Если пол=женский

И сложение=мелкое

И вес=65 лет_или_больше

То относительный_вес=изменчивый

Коэффициент доверия определяется числом 0-100


Правило 27

ЕСЛИ перспектива=отличная

И риск=высокий

ТО фактор=0 КД=10

В общем случае посылка может быть логическим выражением.

Если посылка истинна, то истинно и заключение, т.е. в заключение может быть указано какое-либо действие , которое выполняется, если посылка истинна

<посылка>::<условие>(И<условие>И…И<условие>)

<условие>::=<объект>=<значение>

объект, атрибут, значение, коэфициент доверия- представление знаний в виде четвёрки

<заключение>::=<объект>=<заключение>

<факт>:=<объект>=<значение>КД=<коэффициент доверия>

Один и тот же объект может иметь разные значения.

Многозначные объекты – объекты, которые могут иметь несколько достоверных значений.

Если объект не объявлен, как многозначный, то он может иметь несколько значений, то они не должны быть достоверными, т.е. КД= 100

Список значений




Список разрешённых

значений


объект

вопрос


Для объектов, значение которое запрашивается у пользователя.

Какое сложение?

  1. Мелкое

  2. Среднее разрешённые значения

  3. Крупное


Каков возраст

  1. меньше 25

  2. от 25 до 55

  3. больше 55

Коэффициент доверия посылки=min(Кдусл)


- факта, полученного в результате выполнения правила

перспектива=отличная КД=50

риск=высокий КД=70

фактор=0

Базовая структура продукционной модели представления знаний

Рабочая память(база данных)


Исходные данные



Интерпритатор правил

База правил

Результат


Лекция 9 (Конец)

шага

Конфликтное

Множество правил

Выполнение

правила

Выведенный

факт

1


2


3

4


5


Выводы заканчиваются , когда достигается целевая вершина, либо не осталось применимых правил, а цель не достигнута.


Обратные выводы – выполняются сверху вниз (выводами ориентирующих на цель)



П6 П7

С2 С3