Слайд 6Методы решения задачи обобщения
Известен целый ряд методов, пригодных для обнаружения знаний. Каждый
предложенный метод имеет свои преимущества. Методы, обычно используемые для извлечения полезной информации из данных, можно разделить на следующие группы:
Статистические методы. Статистический подход обычно основывается на вероятностных моделях. Предполагается, что такие методы будут использованы специалистами по статистике и, следовательно, требуется человеческое вмешательство при порождении гипотез и моделей.
Вывод, основанный на прецедентах. Это технология решения поставленной проблемы путём непосредственного использования предыдущего опыта и ранее принятых решений. Прецедентом (случаем) считается проблема, которая возникала ранее и которая была решена. При возникновении новой проблемы вывод, основанный на прецедентах, проверяет множество ситуаций, хранящихся в информационной базе, и находит схожую.
Нейронные сети. Нейронные сети состоят из большого числа нейроподобных элементов, соединенных между собой наподобие нейронов человеческого мозга. Подобно тому, как это происходит в человеческом мозге, стремление нейронов к взаимодействию может изменяться в ответ на воздействие или полученный выходной сигнал, что делает возможным обучение в сети.
Деревья решений. Дерево решений – это дерево, в котором каждый узел, не являющийся конечным, представляет собой проверку условия, или, если узел конечный, предъявляется решение для рассматриваемого элемента. Чтобы выполнить классификацию предъявленного примера, необходимо начать с корневого узла. Затем мы следуем по дереву решений вниз, пока не будет достигнут конечный узел (или лист). В каждом узле, не являющемся конечным, проверяется одно из условий. В зависимости от результата проверки условия выбирается соответствующая ветвь для дальнейшего движения по дереву. Решение получено, если мы достигли конечного узла.
Байесовские доверительные сети. Байесовская доверительная сеть представляет собой направленный ациклический граф, узлы которого представляют значения атрибутов, а веса дуг представляют вероятностные зависимости между атрибутами. Каждому узлу сопоставляются условные распределения вероятностей, описывающие отношения между узлом и предками этого узла.
Генетические алгоритмы \ эволюционное программирование. Генетические алгоритмы и эволюция – это алгоритмически оптимизированные стратегии, базирующиеся на принципах естественной эволюции. Генетические алгоритмы и эволюционное программирование используют методы обобщения, чтобы сформулировать гипотезы относительно зависимостей между переменными в форме ассоциативных правил, либо используя какой-то иной формализм.
Приближенные множества. Приближенное множество определяется посредством задания верхней и нижней границ некоторого множества, называемых приближениями этого множества. Каждый элемент нижнего приближения наверняка является элементом множества. Каждый элемент, не вошедший в верхнее приближение, наверняка не является элементом множества. Верхнее приближение приближенного множества - это объединение нижнего приближения и так называемой граничной области. Элемент граничной области вероятно (но, не наверняка) является элементом множества. Подобно нечетким множествам, приближенные множества являются математической концепцией для работы с нечеткостями в данных.