Генетический алгоритм и его модификация для формирования оптимального подмножества тестов

Содержание

Слайд 2

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

Содержание доклада

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. Содержание

1. Введение
2. Постановка задачи
3. Генетический алгоритм
4. Результаты экспериментов
5. Модифицированный алгоритм
6. Заключение

Слайд 3

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

1. Введение

Формирование

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 1.
и выбор «хороших» [1] безусловных безызбыточных диагностических тестов (ББДТ) является одним из наиболее важных при принятии решений в интеллектуальных системах, поскольку от свойств используемых тестов существенно зависит качество получаемых решений. Идея использования генетических алгоритмов (ГА) для построения ББДТ при большом признаковом пространстве предложена в статьях [2, 3, 4]. Первые алгоритмы построения ББДТ, описанные в [2, 3], программно реализованы и развиты в плане оптимизации построения в последующих работах Янковской А.Е. и Янковской А.Е. с Блейхер А.М. [5, 6].

Слайд 4

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

1. Введение

Выбор

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 1.
«хороших» безызбыточных диагностических тестов является одним из наиболее важных при принятии решений в интеллектуальных системах. Однако, этот выбор не всегда приводит к оптимальному решению.

Некоторые причины:
- Слишком большое общее количество признаков в тестах.
- Слишком большие затраты (временные, стоимостные) при выявлении значений используемых признаков.
- Слишком большой ущерб (риск) [8], связанный с выявлением значений признаков.

Слайд 5

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

2. Основные

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 2.
понятия. Постановка задачи

Тестом называется совокупность признаков, различающих любые пары объектов, принадлежащих разным образам (классам).
Тест называется безызбыточным, если при удалении любого признака тест перестает быть тестом.
Признак называется обязательным, если он содержится во всех безызбыточных тестах.
Признак называется псевдообязательным, если он не является обязательным и входит во множество используемых при принятии решений безызбыточных тестов.

Слайд 6

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

2. Основные

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 2.
понятия. Постановка задачи

Пусть – матрица ББДТ, n – количество ББДТ, m – количество характеристических признаков. соответствует i-му ББДТ (i-я строка матрицы Т). Обозначим через
– множество характеристических признаков, причем . Для каждого признака zj зададим весовой коэффициент wj и коэффициенты стоимости и ущерба (риска) .

Слайд 7

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

2. Основные

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 2.
понятия. Постановка задачи

Строки матрицы сопоставлены тестам, столбцы – признакам.
При решении практических задач количество тестов и признаков может принимать значения от нескольких десятков до нескольких десятков тысяч.

Слайд 8

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

2. Основные

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 2.
понятия. Постановка задачи

Для данной матрицы Т с заданными весами, стоимостью и ущербами признаков, необходимо выделить такую подматрицу Т0, содержащую n0 строк, чтобы соответствующее ей множество тестов N0 обеспечивало выполнение следующих критериев в порядке их следования:
1. В выбранном множестве тестов N0 мощности n0 должно содержаться максимальное число псевдообязательных признаков.
2. Выбранное множество тестов N0 должно содержать минимальное общее число признаков.
3. Выбранное множество тестов N0 должно иметь максимальный суммарный вес.
4. Множество выбранных тестов N0 должно иметь наименьшую суммарную стоимость.
5. Множество выбранных тестов N0 должно иметь наименьший суммарный ущерб.

Слайд 9

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

3. Генетический

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 3.
алгоритм

Эволюционные вычисления (evolutionary computation) – раздел мягких вычислений (soft computing) и вычислительного интеллекта (computational intelligence), посвященный разработке методов и алгоритмов, опирающихся на эволюционные принципы наследственности, изменчивости и естественного отбора.
Генетический алгоритм (ГА) (genetic algorithm) – вид эволюционного алгоритма (evolutionary algorithm), в котором наибольшее внимание уделяется оператору рекомбинации (скрещивания) возможных решений.

Слайд 10

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

3. Генетический

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 3.
алгоритм

Решение
Закодированное решение
Множество решений
Качество решения
Отбор решений
Рекомбинация решений
Вариации решений
Одна итерация (этап)

Особь
Хромосома
Популяция
Приспособленность особи
Селекция
Скрещивание
Мутации
Поколение

Терминология

Слайд 11

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

3. Генетический

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 3.
алгоритм

Исходная матрица Т и подматрица Т0 (решение)

Закодированное решение:

Слайд 12

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

3. Генетический

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 3.
алгоритм

Функция приспособленности:

– весовой коэффициент j-го критерия

– количество единичных разрядов в бинарной строке

Слайд 13

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

и

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. и
– соответственно суммарный вес, стоимость и ущерб по всем тестам множества, соответствующего матрице ;
и – соответственно количество единичных разрядов в конъюнкции и дизъюнкции по всем строкам бинарной матрицы .
Для экспериментов будем использовать следующие значения весов штрафов: , , , ,
.

3. Генетический алгоритм

Слайд 14

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

3. Генетический

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 3.
алгоритм

Поскольку необходимо максимизировать максимальное количество псевдообязательных признаков в искомом подмножестве ББДТ (критерий 1), а также его суммарный вес (критерий 3), но рассматривается задача минимизации целевой функции f , то в выражениях для соответствующих критериям функций штрафа и используется вычитание количества псевдообязательных признаков и веса от максимальных значений. Аналогичные рассуждения использовались при выборе вида функций штрафов для критериев 2, 4 и 5.
Отметим, что выбор значений штрафов зависит от рассматриваемой прикладной задачи.

Слайд 15

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

4. Результаты

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 4.
экспериментов

Исследование особенностей использования ГА для решения поставленной задачи проведено с использованием псевдослучайных матриц тестов размерностями 1000х50, 1000х100, 1000х200, 1000х300, 1000х400, 1000х500, 2000х500. Мощность n0 подмножества ББДТ, которое необходимо сформировать из матрицы Т, для всех экспериментов равна 300.
Параметры ГА:
Длительность эволюционного поиска: 1000 поколений
Турнирная селекция, размер турнира равен 6 особям.
Оператор кроссинговера: двухточечный
Оператор мутации: битовый
Все результаты усреднены по 100 запускам.

Слайд 16

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

4. Результаты

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 4.
экспериментов

Будем оценивать результаты как по полученному лучшему значению функции приспособленности, так и по следующим критериям [11], характеризующим стабильность решений, полученных в различных запусках:
1. Критерий стабильности, учитывающий частоту pi встречаемости i-го теста во всех решениях, полученных по результатам 100 запусков ГА. Чем больше количество тестов, для которых значение pi равно или близко к 1, тем выше сходимость алгоритма.
2. Суммарное количество Ω ББДТ, не вошедших в полученные решения. Чем больше Ω, тем выше сходимость алгоритма.

Слайд 17

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

4. Результаты

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 4.
экспериментов

Результаты решения поставленной задачи в зависимости от размера r популяции для псевдослучайных матриц различной размерности

Слайд 18

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

4. Результаты

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 4.
экспериментов

Зависимость времени работы запуска ГА от размера популяции

Слайд 19

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

4. Результаты

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 4.
экспериментов

Зависимость количества тестов от частоты их встречаемости в полученных решениях.
r обозначает размер популяции.

а) результаты для матрицы тестов размерностью 1000х50

б) результаты для матрицы тестов размерностью 1000х500

Количество тестов с заданным
процентом встречаемости

Количество тестов с заданным
процентом встречаемости

Слайд 20

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

4. Результаты

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 4.
экспериментов

Зависимость количества тестов от частоты их встречаемости в полученных решениях для матрицы 2000х500. r обозначает размер популяции.

Количество тестов с заданным
процентом встречаемости

Слайд 21

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

4. Результаты

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 4.
экспериментов

Зависимость количества неиспользованных тестов от размерности матрицы тестов. r обозначает размер популяции.

Слайд 22

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

4. Результаты

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 4.
экспериментов

Анализ решений, полученных при различных настройках ГА, показал, что сформированные по 100 запускам подмножества тестов, соответствующие различным параметрам ГА, отличаются незначительно.

Например, для матрицы тестов 1000х500 при размерах популяции 50 и 200 особей полученные подмножества тестов отличались только на 35 тестов, что позволяет сделать вывод о достаточно высокой степени сходимости алгоритма. Однако количество тестов, встречающихся менее чем в 50% решений довольно велико (соответственно, 460 и 162 для популяций из 50 и 200 особей).

Слайд 23

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

4. Результаты

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 4.
экспериментов

При использовании матрицы тестов размерностью 1000x500 результаты ГА с популяцией размером 50 особей для 10, 20, 30, 40, 50, 60, 70, 80, 90 и 100 запусков совпадают для 245 тестов (из 300 искомых). Совпадение с результатами ГА с популяцией 200 особей составляет 244 теста. Другими словами, 245 и 244 теста присутствуют в большинстве найденных решений, несмотря на различное количество запусков и размер популяции.

Слайд 24

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

4. Результаты

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 4.
экспериментов

Распределения количества тестов по частоте их встречаемости в полученных решениях для различного количества запусков ГА для матрицы размерностью 1000х500. r обозначает размер популяции.

Количество тестов с заданным
процентом встречаемости

Слайд 25

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

4. Результаты

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 4.
экспериментов

Несмотря на то, что увеличение размера популяции способствует повышению сходимости ГА, в соответствии с используемыми критериями, получены результаты, свидетельствующие о том, что для матриц тестов, имеющих не больше 1000 строк, анализ решений, полученных при использовании сравнительно небольшого размера популяции и малого количества запусков, позволяет сформировать подмножество тестов, близкое к оптимальному.

В силу приведенного анализа результатов сокращение количества особей в популяции в a1 раз и количества запусков ГА в a2 раз, позволяет в ряде случаев уменьшить вычислительные затраты и время поиска решения пропорционально произведению a1a2.

Слайд 26

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

5. Модифицированный

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 5.
алгоритм

При увеличении количества строк в матрице тестов сходимость ГА существенно уменьшается.

Слайд 27

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

5. Модифицированный

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 5.
алгоритм

Для повышения сходимости ГА предлагается следующая модификация с адаптацией к условиям эволюционного поиска.
Пусть ν(t) – количество ББДТ в матрице тестов в поколении t, ν(0) = n, и ν ’(t)– количество ББДТ, не входящих в закодированные в популяции решения за последние поколений и соответствующие неиспользуемым строкам из исходной матрицы тестов Т.
Представим пошагово модифицированный ГА:
Шаг 1. Инициализация.
Шаг 2. Осуществить Δt поколений эволюционного поиска.
Шаг 3. Если ν ’(t)>0 и ν(t) > n0, то удалить из матрицы Т строку с минимальным суммарным весом и провести коррекцию ν(t+1) = ν(t) – 1.
Шаг 4. Если не выполняются условия останова ГА, то перейти на Шаг 2. Иначе переход на Шаг 5.
Шаг 5. Конец.

Слайд 28

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

5. Модифицированный

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 5.
алгоритм

Однако полученные результаты экспериментов не выявили улучшений качества решений. В ряде случаев наблюдалось ухудшение результатов. В качестве возможного объяснения предполагается, что удаление неиспользуемых строк может либо случайно удалить «хорошую» строку (в случае, если строка удаляется на первых поколениях), либо не влияет на результат (если удаление происходит после наступления сходимости ГА).
Тем не менее, авторы надеются, что возможно улучшение алгоритма с удалением строк, т.к. поскольку увеличение количества строк приводит к ухудшению сходимости, то, вполне вероятно, что должен наблюдаться и «обратный эффект», когда уменьшение количества строк способствует повышению сходимости алгоритма.

Слайд 29

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

6. Заключение

В

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 6.
докладе рассматривалось применение ГА для решения задачи формирования оптимального подмножества ББДТ. Представленные результаты экспериментов показывают достаточно высокую сходимость ГА при решении поставленной задачи.
На основании полученных результатов и их анализа сделан вывод о возможности существенного уменьшения вычислительной сложности ГА при решении рассматриваемой задачи путем уменьшения размера популяции, а также количества запусков.
Отметим, что остается неясным вопрос о зависимости минимального допустимого размера популяции и количества запусков от размера и характеристик матрицы тестов, при которых возможно получение решения, близкого к оптимальному, поскольку необходимо проверить полученный результат на реальных данных.

Слайд 30

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

6. Заключение

Дальнейшие

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. 6.
исследования будут направлены на разработку более эффективных процедур эволюционного поиска оптимального подмножества ББДТ для решения задач принятия решений на основе тестового распознавания образов.

Программная реализация рассматриваемых алгоритмов создана с использованием инструментальной библиотеки классов Evolutionary Computation Workshop (http://qai.narod.ru/ecw/).
Планируется включение программного модуля, реализующего ГА в интеллектуальное инструментальное средство ИМСЛОГ.

Слайд 31

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

Благодарности

Исследование выполнено

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. Благодарности
при поддержке грантов РФФИ (проект № 07-01-00452) и РГНФ (проект № 06-06-12603В)

Слайд 32

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах.

Список источников

1.

Янковская А.Е., Цой Ю.Р. Применение генетических алгоритмов в интеллектуальных распознающих системах. Список
Naidenova R.A., Plaksin M.V., Shagalov V.L. Inductive inferring all good classification test // Знание-Диалог-Решение. Сб. науч. тр. междунар.конф., том 1, Ялта, 1995. с.79-84.
2. Янковская А.Е. Тестовое распознавание образов с использованием генетических алгоритмов // Распознавание образов и анализ изображений: новые информационные технологии (РОАИ-4-98). Труды IV Всероссийской с международным участием конференции. Часть I. -- Новосибирск, 1998. - С.195-199.
3. Yankovskaya A.E. Test Pattern Recognition with the Use of Genetic Algorithms // Pattern Recognition and Image Analysis, vol. 9, no. 1, 1999, p. 121-123.
4. Yankovskaya A.E. The Test Pattern Recognition with Genetic Algorithms Use // Proceedings of the Pattern Recognition and Image Understanding. 5th Open German-Russian Workshop. -- Germany, Herrshing, 1999. -- P. 47-54.
5. Янковская А.Е., Блейхер А.М. Оптимизация синтеза безызбыточных диагностических тестов с использованием генетических алгоритмов и реализация ее в интеллектуальной системе // Искусственный интеллект. Научно-теоретический журнал. ISSN 1561-535. Донецк, № 2, 2000,
6. Yankovskaya A.E., Bleikher A.M. Genetic Algorithms for the Synthesis Optimization of a Set of Irredundant Diagnostic Tests in the Intelligent System // Computer Science Journal of Moldova, vol. 9, no. 3(27), 2001, p. 336-349.
7. Yankovskaya A.E. Bleikher A.M. Optimization of tests synthesis on the base of descent algorithms with the use of genetic transformations // Radioelectronics & Informatics, no. 3(24), 2003, p. 51-55.
8. Yankovskaya A.E., Tsoy Y.R. Optimization of a set of tests selection satisfying the criteria prescribed using compensatory genetic algorithm // Proc. of IEEE EWDTW'05. Kharkov: SPD FL Stepanov V.V., 2005. P. 123-126.
9. Журавлев Ю.И., Гуревич И.Б. Распознавание образов и анализ изображений // Искусственный интеллект: В 3-х кн. Кн.2. Модели и методы: Справ. / Под ред. Д.А.Поспелова. М.: Радио и связь, 1990.
10. Янковская А.Е. Построение логических тестов с заданными свойствами и логико-комбинаторное распознавание на них // ИОИ-2002. Тез. докл. межд. науч. конф. -- Симферополь, 2002. -- С. 100-102.
11. Янковская А.Е., Цой Ю.Р. Исследование эффективности генетического поиска оптимального подмножества безызбыточных тестов для принятия решений // Искусственный интеллект. Научно-теоретический журнал, 2006, с. 257-260.
Имя файла: Генетический-алгоритм-и-его-модификация-для-формирования-оптимального-подмножества-тестов.pptx
Количество просмотров: 254
Количество скачиваний: 1