Другие журналы
|
научное издание МГТУ им. Н.Э. БауманаНАУКА и ОБРАЗОВАНИЕИздатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл № ФС 77 - 48211. ISSN 1994-0408![]()
Адаптивный классификатор многомерных нестационарных сигналов на основе анализа динамических паттернов
# 08, август 2010
Файл статьи:
![]() УДК 519.25+004.9
Национальный исследовательский ядерный университет "МИФИ"
Введение Задачи анализа и классификации многомерных динамических данных получили широкое распространение в различных областях науки и техники, среди которых медицинская диагностика, распознавание речи, идентификация динамических систем, эконометрика и другие. В ряде случаев исследователю, работающему в этих областях, приходится иметь дело с принципиально нестационарными динамическими данными. Существующие методы цифровой обработки сигналов в основном ориентированы на анализ и обработку одномерных временных рядов, в то время как многомерным динамическим данным уделяется существенно меньшее внимание. Методы анализа и классификации, ориентированные на одномерные сигналы, зачастую оказываются неэффективными для многомерных данных или вообще не могут быть обобщены на многомерный случай. С другой стороны, нестационарность временных рядов накладывает дополнительные ограничения на возможность применения известных методов цифровой обработки сигналов. Как правило, методы обработки одномерных нестационарных сигналов сводятся к использованию скользящих оконных преобразований (в частности, вейвлет-преобразования) или к сегментации с последующим анализом выделенных квазистационарных участков. [1-3] Построение классификатора временных рядов предполагает выполнение следующих этапов: 1) Предобработка сигналов. На этом шаге осуществляется фильтрация сигналов от шумов, устранение артефактов или другие операции, позволяющие на ранних этапах отсеять неинформативные данные, используя априорно известную информацию о природе сигнала. 2) Выделение характерных признаков сигнала. Целью этого этапа является переход от исходного пространства динамических данных к пространству многомерных статических данных. Как только такой переход сделан, задача классификации сигналов сводится к известной задаче классификации многомерных данных. 3) Классификация в пространстве характерных признаков сигналов. На этом этапе могут использоваться классические алгоритмы классификации многомерных статических данных, например метод дискриминантных функций, нейросетевой аппарат и другие [4,5]. В настоящей работе вопросы предобработки сигналов рассматриваться не будут. При работе с конкретными временными рядами исследователь, обычно, знает, какие алгоритмы предобработки нужно применить к этим сигналам, чтобы увеличить их информативность. Как правило, это какие-либо стандартные методы обработки сигналов или известные специальные методы для рядов рассматриваемой природы. Наибольший интерес в данной работе представляет проблема выделения характерных признаков сигнала для классификации. Динамическая система, продуцирующая многомерный временной ряд, может находиться в различных функциональных состояниях или работать в различных режимах. Работа системы в том или ином функциональном состоянии находит отражение в наблюдаемых сигналах в виде паттернов. Как правило, моментам смены функционального состояния системы соответствуют моменты резкого изменения динамических характеристик наблюдаемого временного ряда, т.е. моменты смены паттернов. В данной работе предлагается методика расчёта характерных признаков многомерных нестационарных сигналов, основанная на выделении функциональных состояний динамической системы, продуцирующей сигнал. Анализ функциональных состояний и переходов между ними, а также соответствующих им паттернов, может послужить основой при классификации сигналов, а также позволить выявить скрытые закономерности, присутствующие в сигнале, и использовать их для лучшего понимания природы наблюдаемой динамической системы. В работе рассматривается практическое применение предлагаемой методики для анализа и классификации многомерных нестационарных сигналов электроэнцефалограмм (ЭЭГ). Классификатор сигналов ЭЭГ является основой телекоммуникационных систем нового поколения – интерфейсов "мозг-компьютер" (ИМК). ИМК – системы, позволяющие осуществлять управление внешними техническими устройствами непосредственно с помощью электрической активности нейронов мозга, минуя мышцы [6]. Такие системы могут использоваться в медицинских целях – для организации канала коммутации с парализованными пациентами, а также в быту и промышленности – для предоставления нового канала взаимодействия с внешним миром. Современные разновидности этих устройств, основанные на анализе сигналов ЭЭГ, не поддерживают необходимых для промышленного внедрения скоростей передачи информации от мозга к электронному устройству, что в высокой степени обусловлено недостаточной эффективностью существующих алгоритмов анализа сигналов ЭЭГ, отражающих электрическую активность мозга. Статья состоит из 4 разделов. В первом разделе приводится математическая постановка задачи классификации многомерных нестационарных сигналов. В разделе 2 вводится понятие динамического паттерна и излагаются теоретические основы предлагаемого алгоритма выделения характерных признаков сигнала для классификации на основе анализа динамических паттернов. В разделе 3 описывается математическая модель нейросетевого классификатора в пространстве выделенных характерных признаков. Раздел 4 посвящён результатам применения предложенной методики для классификации сигналов ЭЭГ, соответствующих различным типам мыслительной активности человека, и обсуждению полученных результатов. 1. Постановка задачи В связи с тем, что обработка данных осуществляется преимущественно в рамках классических ЭВМ, будем считать, что рассматриваемые сигналы либо имеют дискретную природу, либо дискретизованы. В этом случае значение каждого многомерного сигнала в момент времени t является вектором вида: где Пусть в результате P наблюдений получено множество многомерных временных рядов в общем случае различной длины, каждый из которых отнесён к одному из K классов. Таким образом, каждый класс представлен конечным числом сигналов. Обозначим Pk – число наблюдений, относящихся к k‑му классу, Значение временного ряда, относящегося к k‑му классу, полученное в результате p‑го наблюдения в момент времени t, будем обозначать где Классификатор сигналов запишем как оператор, сопоставляющий сигналу Задача построения классификатора временных рядов, таким образом, сводится к задаче нахождения оператора C на основе наблюдений вида , для которых результат действия этого оператора, т.е. номер класса, известен. В случае классификации статических данных построение оператора C, как правило, сводится к аппроксимации дискриминантных функций классов или границ между классами либо в пространстве самих данных, либо в некотором новом пространстве, рассчитанном в результате предобработки исходных данных [4]. Использование такого подхода к временных рядам, т.е. рассмотрение временной последовательности как вектора признаков, не представляется возможным в силу ряда причин, среди которых высокая размерность этого пространства (длина сигналов может достигать нескольких тысяч), а также различная длина наблюдаемых сигналов. Практически все методы классификации временных рядов предполагают сведение задачи классификации динамических данных к задаче классификации статических данных. Для такого сведения необходимо осуществить переход от временного ряда Основная проблема состоит в том, что не существует единого алгоритма такого перехода и в каждом конкретном случае исследователь сталкивается с необходимостью поиска оператора Y и пространства признаков для эффективной классификации. Особенно остро эта проблема встаёт для случая нестационарных временных рядов. Учитывая и , задача классификации временных рядов, таким образом, состоит в поиске операторов Y и c: Отметим, что задача нахождения этих операторов на основе результатов наблюдений является неоднозначной. Неточность в оценке оператора Y может быть компенсирована за счёт увеличения сложности оператора c, что, однако, может привести к ухудшению обобщающих способностей классификатора. Качество построенного классификатора напрямую связано с его обобщающими способностями, которые могут быть оценены по результатам классификации данных тестовой выборки, не использовавшихся при нахождении операторов Y и c. Также при построении адаптивного классификатора нередко применяется валидационная выборка, назначение которой состоит в контроле процесса настройки классификатора по обучающим примерам, в частности, валидационная выборка может участвовать в критерии останова итеративной процедуры обучения. В связи с вышесказанным, перед построением классификатора разобьём множество наблюдаемых временных рядов на обучающую, тестовую и валидационную выборки в заданной пропорции и перенумеруем сигналы внутри этих выборок так, что каждый из них может быть представлен в форме . 2. Алгоритм выделения характерных признаков многомерного сигнала на основе анализа динамических паттернов 2.1. Выделение моментных характерных признаков сигнала Оператор Y в модели ставит в соответствие временному ряду Введём оператор j, определённый на множестве рассматриваемых временных рядов вида и возвращающий в каждый момент времени t, Вектор v(t), характеризующий временной ряд Последовательность векторов Цель перехода от пространства X значений исходного временного ряда к пространству МХП V состоит во введении в рассмотрение дополнительных параметров исходного временного ряда, характеризующих его динамические свойства в каждый момент времени. Выбор конкретного типа оператора j осуществляется с учетом специфики анализируемых данных. Так, для сигналов гармонической природы в качестве элементов вектора МХП v(t) могут быть выбраны значения спектральной плотности мощности, рассчитанные по результатам оконного преобразования Фурье с центром окна в момент времени t; в задачах выделения специфических графоэлементов элементами вектора v(t) могут являться коэффициенты непрерывного вейвлет-преобразования в заданном частотном диапазоне. В простейшем случае Отметим, что размерность вектора v(t) может быть выше, чем размерность значений исходного временного ряда x(t). 2.2. Понятие статического и динамического паттерна временного ряда В связи с тем, что элементы вектора МХП v(t) связаны с динамическими особенностями сигнала x(t) в момент времени t, можно предположить, что близость векторов МХП v(t1) и v(t2) в пространстве V означает близость динамических свойств сигнала в моменты времени t1 и t2. Так, на квазистационарных участках динамические свойства сигнала с течением времени меняются слабо, что приводит к группированию соответствующих значений МХП в некоторой локальной области или появлению регулярности переходов между несколькими локальными областями. В то же время изменение динамических свойств сигнала приведёт к появлению новых локальных областей в пространстве МХП и/или изменению регулярности в переходах между существующими областями. Отметим, что обратное утверждение, вообще говоря, неверно. Близость динамических свойств сигнала в моменты времени t1 и t2 может не означать близость векторов v(t1) и v(t2) в пространстве МХП. Вектор МХП стационарного сигнала с неизменными динамическими свойствами может иметь в разные моменты времени существенно различные значения МХП. Пусть пространство V некоторым образом разбито на Q областей S1,…,SQ таких, что Эти области в пространстве МХП V далее будем называть статическими паттернами (СП). В каждый момент времени t, С течением времени активные статические паттерны для сигнала где T(Sq) – число тактов дискретного времени, в течение которого СП Sq был активным. Таким образом, для временного ряда Классификация временного ряда может быть проведена по результатам анализа индексов активностей СП, присутствовавших в сигнале. Так, среди множества СП могут быть найдены паттерны, специфичные для временных рядов одного класса и неспецифичные для временных рядов всех остальных классов. Эта специфичность паттерна может выражаться в существенном превышении индекса его активности для сигналов одного из классов над другими. Однако, как показывают эксперименты и как показано в работах [7,8], в ряде случаев классификация сигналов лишь на основе индексов активности СП не оказывается эффективной. Связано это с тем, что сигналы различных классов могут иметь одни и те же СП с примерно одинаковыми индексами активности. Различие же между классами сигналов проявляется в последовательности смены этих статических паттернов. Обобщим понятие индекса активности на цепочку статических паттернов где С ростом порядка r число возможных динамических паттернов комбинаторно растёт, в то время как индексы активностей динамических паттернов, наблюдающихся в сигнале, стремятся к нулю – с увеличением длины цепочки вероятность её возникновения уменьшается. Для ДП порядка r = 2 индексы активности образуют матрицу P размерности Q*Q. Визуально ДП 2‑го порядка могут быть представлены в виде ориентированного графа с взвешенными ребрами, каждая вершина которого соответствует статическому паттерну, а веса рёбер равны индексам соответствующих ДП 2‑го порядка. 2.3.Алгоритм формирования вектора характерных признаков сигнала Индексы активности динамических паттернов являются интегральными характеристиками временного ряда на рассматриваемом интервале времени. Однако использование индексов активности всех ДП (при r = 2 – всех элементов матрицы P) в качестве характерных признаков сигнала для последующей классификации не представляется рациональным в силу нескольких причин. Во-первых, некоторые ДП являются общими для сигналов всех классов, т.е. отражают некоторые общие свойства динамической системы, продуцирующей сигналы, и поэтому не представляют интереса с точки зрения классификации. Присутствие других ДП (с невысокими индексами активности) может являться индивидуальной особенностью конкретного сигнала или быть обусловлено действием различного рода случайных факторов и не может являться характеристикой класса сигналов. В связи с этим такие ДП также целесообразно исключить из дальнейшего рассмотрения. Во-вторых, общее число ДП r‑го порядка может быть довольно большим, особенно при высоких порядках r, что усложняет процесс их классификации. Введем понятие специфичности динамического паттерна S по отношению к паре классов где Наиболее простым классификатором индексов активности p динамического паттерна S на два класса k1 и k2 является линейный классификатор: где значение разделяющего порога p0 выбирается таким образом, чтобы обеспечить максимальное значение критерия . Отсортируем динамические паттерны, встречающиеся в обучающих сигналах классов k1 и k2, по значению показателя специфичности в порядке убывания. Обозначим Отметим, что для большей устойчивости классификации размерность вектора
где l – число используемых для классификации наиболее специфичных ДП. Далее будет рассматриваться вектор характерных признаков Задача линейной классификации сигналов на K > 2 классов может быть сведена к построению ряда линейных классификаторов на два класса вида , каждый из которых осуществляет классификацию в пространстве соответствующих признаков Размерность вектора z не превышает K*(K-1) / 2. Именно этот вектор предполагается использовать в качестве вектора характерных признаков сигнала 2.4. Алгоритм оптимизации специфичности динамических паттернов Для некоторых классов k1 и k2, Поставим задачу разбиения пространства V на статические паттерны Значение показателя I, равное 1, будет означать разделимость всех пар классов в пространстве характерных признаков z с помощью выбранного классификатора. Задача поиска оптимальных статических паттернов состоит в разбиении пространства признаков МПХ V на Q областей Задачу можно свести к задаче разбиения множества векторов МХП сигналов обучающей выборки, каждый из которых представляет собой точку в пространстве V, на Q групп. В связи с тем, что число точек в пространстве V может достигать десятков или даже сотен тысяч, перед решением оптимизационной задачи сократим её размерность. Для этого проведём предварительную кластеризацию данных в пространстве V на N кластеров (N >> Q), используя стандартные методы кластеризации, например, метод k‑средних или самообучающиеся карты Кохонена [5,9]. Обозначим На рис. 1 представлена последовательность операций, выполняемых при формировании вектора характерных признаков z для временного ряда
Рис. 1. Схема формирования вектора характерных признаков zk,p для многомерного временного ряда
3. Классификация в пространстве характерных признаков После выбора пространства характерных признаков z, следующим шагом алгоритма классификации является построение собственно классификатора данных В настоящей работе в качестве классификатора
где zk,p – вектор характерных признаков для сигнала Математическая модель многослойного персептрона имеет вид [5]: где R – число слоёв многослойного персептрона, z – вектор входов, y – вектор выходов, si – вектор выходов i‑го слоя нейронов, hi – вектор потенциалов i‑го слоя нейронов, В результате работы классификатора подаваемый на его вход пример будет отнесён к одному из K классов либо будет принято решение о невозможности классификации. Построение классификатора проводится на основе данных обучающей выборки, оценка качества его работы – на основе данных тестовой выборки. Для оценки качества классификации будем использовать показатель где nk – число верно распознанных примеров k-ого класса при предъявлении Nk сигналов этого класса. Значение показателя равное 1 означает правильную классификацию всех предъявленных на вход классификатора примеров. 4. Результаты экспериментальных исследований 4.1. Описание исходных данных Экспериментальные исследования предложенных алгоритмов классификации многомерных нестационарных временных рядов проводились на сигналах электроэнцефалограмм (ЭЭГ), полученных в лаборатории высшей нервной деятельности человека Института высшей нервной деятельности и нейрофизиологии Российской Академии Наук. Каждая ЭЭГ соответствует процессу решения испытуемым задачи одного из K = 4 типов, связанных с различными типами мышления: планиметрическое мышление (тип ‘G’), пространственное мышление (тип ‘C’), составление предложений (тип ‘S’) и исключение лишнего слова из перечня (тип ‘W’). Испытуемый решил примерно по 70 задач каждого типа, потратив на каждую от четырех секунд до нескольких десятков секунд. Все сигналы ЭЭГ были оцифрованы с частотой дискретизации wд = 250 Гц и очищены от артефактов. Запись ЭЭГ велась по 22 каналам, из которых информативными являются L = 19. Все сигналы были разбиты на обучающую и тестовую выборки, объёмы которых соответственно равны Pобуч = 48+55+42+53 = 198, Pтест = 21+24+19+23 = 87 (P = P1+ P2+ P3+ P4). 4.2. Расчет векторов моментных характерных признаков В связи с тем, что электрическая активность мозга имеет гармоническую природу [11], для формирования моментных характерных признаков многомерного сигнала ЭЭГ предложено использовать непрерывное вейвлет-преобразование (НВП) с материнской вейвлет-функцией Морле, имеющей аналитический вид [12]:
Расчёт вейвлет-коэффициентов сигнала
где DT – интервал дискретности, a, b – параметры масштаба и временного сдвига соответственно, ψ(t) – материнская вейвлет-функция, оператор * означает комплексное сопряжение. Для представления результатов НВП сигнала l‑го канала ЭЭГ в памяти компьютера используется матрица На рис. 2 показан пример визуального представления матрицы квадратов вейвлет-коэффициентов (вейвлетограммы), рассчитанной для одного из каналов ЭЭГ. Каждый столбец матрицы отражает распределение энергии сигнала по частотам в фиксированный момент времени. Каждая строка отражает распределение энергии сигнала на фиксированной частоте по времени.
Рис. 2. Вейвлетограмма сигнала ЭЭГ в диапазоне частот от 5 Гц до 30 Гц; по оси абсцисс отложены значения временных сдвигов b, по оси ординат – масштабных сдвигов a, соответствующих частотам.
Поскольку сигналы ЭЭГ являются многомерными, вектор МХП ЭЭГ v(t) составлен из значений энергии сигнала каждого из каналов ЭЭГ в заранее заданных частотных диапазонах W1,… Wm в момент времени t:
Размерность M вектора МХП v(t) равна m*L, где m – число выбранных частотных полос, L – число каналов (L = 19). В работе исследовался диапазон частот от 5 до 30 Гц, что соответствует диапазонам альфа- и бета-ритма. В качестве элементов вектора МХП выбраны моментные значения энергии в частотных полосах шириной 0.5 Гц в рассматриваемом диапазоне. Таким образом, размерность вектора МХП v(t) равна M = 50*19 = 475. 4.3. Выделение микросостояний Для каждого обучающего сигнала в каждый момент времени были рассчитаны векторы МХП В результате процесса кластеризации векторов МХП были сформированы N = 200 микросостояний, из которых далее формировались статические паттерны. На рис. 3 показано распределение числа точек в кластере по кластерам после завершения процедуры кластеризации. Рис. 3. Распределение числа точек в кластере по N = 200 кластерам после завершения процедуры кластеризации.
4.4. Формирование статических паттернов Формирование статических паттернов В связи с тем, что каждое микросостояние должно входить ровно в один статический паттерн, сформируем хромосому следующим образом:
где gi – i‑ый ген хромосомы g, представляющий собой целое число в диапазоне от 1 до Q. Значение Отметим, что никакой априорной информации о числе статических паттернов в пространстве МХП нет, в связи с этим определение числа статических паттернов, при которых наблюдается приемлемая точность классификации, определялось экспериментально. На рис. 4 показаны графики зависимости значений приспособленности лучшей хромосомы в популяции и средней приспособленности в популяции от номера популяции (такта работы генетического алгоритма) для заданного числа статических паттернов Q, рассчитанные для сигналов обучающей и тестовой выборок. Отметим, что лучшие хромосомы выбирались из всех хромосом популяции, при этом лучшие хромосомы на обучающей и тестовой выборках в общем случае являются разными хромосомами. Исследование поведения на тестовой выборке хромосомы, обладающей лучшей приспособленностью на обучающей выборке, показало, что практически во всех случаях её приспособленность на тестовой выборке не является лучшей, иными словами в популяции практически всегда существует хромосома с лучшей приспособленностью на тестовой выборке, при этом не обладающей лучшей приспособленностью на обучающей выборке. На рис. 5 представлены графики зависимостей значений приспособленности на обучающей и тестовой выборках для двух хромосом – показывающей лучший результат на обучающей выборке и лучший результат на тестовой выборке при Q = 15. Подобная картина наблюдается и при других значениях Q. В работе использованы следующие параметры генетического алгоритма. Длина хромосомы – N = 200, численность популяции – 40, алгоритм формирования родительского пула по методу рулетки, кроссинговер равномерный с вероятностью обмена генами 0.5, элитная стратегия селекции, вероятность мутации – 0.05.
![]() ![]()
![]() ![]()
![]() ![]() Рис. 4. Графики зависимости значений приспособленности лучшей хромосомы в популяции (слева) и средней приспособленности в популяции (справа) от номера популяции (такта работы генетического алгоритма) для заданного числа статических паттернов Q = 5 (а), 10 (б), 15 (в). Значения рассчитаны для сигналов обучающей (train) и тестовой (test) выборок.
Рис. 5. Графики зависимости значений приспособленности на обучающей (train) и тестовой (test) выборках для двух хромосом – хромосомы с лучшей приспособленностью на обучающей выборке (графики train 1 и test 1) и хромосомы с лучшей приспособленностью на тестовой выборке (графики train 2 и test 2). Число статических паттернов Q = 15.
Из графиков видно, что с ростом числа статических паттернов значение функции приспособленности лучшей хромосомы, полученной в результате работы генетического алгоритма, растёт. Отметим, что в процессе работы генетического алгоритма, несмотря на рост приспособленности лучшей хромосомы и средней приспособленности хромосом в популяции на обучающей выборке, на тестовой выборке эти значения практически перестают изменяться уже после 100-200 итераций генетического алгоритма. Кроме того, значения функции приспособленности, рассчитанные по данным тестовой выборки, для хромосомы, имеющей лучшую приспособленность на обучающей выборке, также практически перестают изменяться, что говорит о неспособности эволюционного процесса к дальнейшему улучшению обобщающих свойств найденного решения. Значения критерия после окончания работы генетического алгоритма на обучающей выборке при Q = 5, 10, 15 равны соответственно I = 0.37, 0.50, 0.62, рассчитанные для этих же хромосом значения приспособленности на тестовой выборке – I = 0.11, 0.11, 0.14 соответственно. Для дальнейшего анализа была отобрана лучшая хромосома (Iобуч = 0.62, Iтест = 0.14). Эта хромосома определяет разбиение N = 200 микросостояний на Q = 15 статических паттернов. На рис. 6 приведено распределение числа микросостояний по найденным статическим паттернам, рассчитанное для найденного разбиения.
Рис. 6. Распределение числа микросостояний по статическим паттернам для лучшей хромосомы. По оси абсцисс отложен номер статического паттерна, по оси ординат – отсортированное относительное число микросостояний. Общее число микросостояний N = 200. 4.5. Выделение наиболее специфичных динамических паттернов Как только сформированы статические паттерны
![]() ![]() ![]()
Рис. Графики отсортированных значений показателя специфичности динамических паттернов 2‑го порядка для классов 'C', 'S' (а), 'C', 'G' (б), 'G', 'W' (в), рассчитанные для сигналов обучающей выборки. По оси абсцисс отложен порядковый номер динамического паттерна. Число соответствующих статических паттернов Q = 15.
В табл. 1 приведены наиболее специфичные ДП
Таблица 1 Наиболее специфичные ДП 2‑го порядка и значения показателей специфичности
Из табл. 1 видно, что наиболее хорошо разделимы классы 'C', 'S', наименее хорошо – классы 'S', 'W'. Этот результат согласуется с нейрофизиологическими представлениями – когнитивные задачи на составление предложений (тип ‘S’) и исключение лишнего слова из перечня (тип ‘W’) оба являются вербальными и задействуют схожую мыслительную активность, в то время как при решении задач на пространственное мышление (тип ‘C’) и на составление предложений (тип ‘S’) активизируются принципиально различные участки коры головного мозга.
4.6. Формирование вектора характерных признаков и классификация Вектор характерных признаков z в соответствии с формируется из значений индексов активности наиболее специфичных ДП, приведённых в табл. 1. В связи с тем, что для классов 'C', 'S' и 'C', 'W' оказался один и тот же наиболее специфичный ДП, размерность вектора z равна 5. По построению каждый элемент вектора z является оптимальным с точки зрения попарного линейного разделения сигналов на соответствующую пару классов. На рис. 8 приведено распределение проекций вектора z, рассчитанных для сигналов обучающей выборки, на прямую, соответствующую выбранной паре классов. На рис. 9 приведено аналогичное распределение проекций вектора z на плоскость.
Рис. 8. Распределение проекций вектора z, рассчитанных для сигналов обучающей выборки, на прямую, соответствующую паре классов 'C', 'S'. Фактически по оси абсцисс отложены значения индексов ДП (9,9) для сигналов класса 'C' (помечены 'o') и сигналов класса 'S' (помечены 'x').
Рис. 9. Распределение проекций вектора z, рассчитанных для сигналов обучающей выборки, на плоскость индексов ДП (9,9) – ось абсцисс, и (12,12) – ось ординат. ДП (9,9) является наиболее специфичным для классов 'C', 'S', ДП (12,12) – для классов 'S', 'G'. Символами 'o', 'x', '·' помечены индексы классов 'G', 'S', 'C' соответственно.
Из рис. 9 видно, что классы 'C', 'S' хорошо разделимы вертикальной прямой (по значениям индексов ДП (9,9)), а классы 'G', 'S' хорошо разделимы горизонтальной прямой (по значениям индексов ДП (12,12)). Однако классы 'C', 'G' в указанной плоскости разделимы плохо – наиболее специфичный ДП для этих классов в соответствии с табл. 1 – (9,3). Векторы характерных признаков zk,p, рассчитанные для всех сигналов обучающей выборки, используются для обучения многослойного персептрона, предназначенного для их классификации. Объёмы обучающей и тестовой выборок соответственно равны Pобуч = 198, Pтест = 87. Обучение продолжалось по методу Левенберга-Маркардта в течение 2000 эпох. Число слоёв и нейронов в слоях многослойного персептрона подбиралось экспериментально. Наилучшие результаты по точности работы персептрона на тестовой выборке наблюдались при числе слоёв m = 3 и распределении нейронов по слоям: N1 = 8, N2 = 5, N3 = 4. Активационные характеристики скрытых слоёв – сигмоиды, выходного слоя – линейная. Достигнутые значения показателя точности на обучающей и тестовой выборках соответственно Iобуч = 0.81, Iтест = 0.56. Доля числа правильно распознанных примеров каждого класса (значения nk/Nk в формуле ) обученным нейросетевым классификатором на обучающей и тестовой выборках приведена в табл. 2.
Таблица 2 Доля числа правильно распознанных примеров каждого класса обученным нейросетевым классификатором на обучающей и тестовой выборках.
На рис. 10 приведено распределение значений выходов обученного нейросетевого классификатора при подаче на вход сигналов обучающей и тестовой выборок различных классов.
![]() ![]()
Рис. 10. Распределение значений выходов обученного нейросетевого классификатора при подаче на вход сигналов обучающей (а) и тестовой (б) выборок различных классов. Каждый рисунок содержит 4 гистограммы (по числу классов), каждая из которых содержит 4 столбика, соответствующие классам 'C', 'G', 'S', 'W'. Высота i‑го столбца k‑го класса представляет собой относительное число сигналов k‑го класса, отнесённых классификатором к i‑му классу (значения ni/Nk).
Из табл. 2 видно, что наиболее точно распознаются сигналы класса 'C', что говорит о высокой специфичности сигналов ЭЭГ этого класса. Наименьшая точность распознавания наблюдается для сигналов класса 'G', при этом, как видно из рис. 10, ошибки распознавания сигналов класса 'G' на тестовой выборке практически равномерно распределились "в пользу" всех остальных классов, что говорит о невысокой специфичности сигналов ЭЭГ данного класса по отношению ко всем остальным классам. Ошибки распознавания сигналов класса 'S' в основном приходятся "в пользу" класса 'W', что соответствует нейрофизиологическим представлениям о деятельности мозга при решении когнитивных задач этих типов.
Заключение Результаты применения предложенного алгоритма для выделения характерных признаков многомерных нестационарных сигналов ЭЭГ и их классификации показали его работоспособность на имеющихся экспериментальных данных. Точность нейросетевого классификатора в построенном пространстве признаков составила Iобуч = 0.81 на обучающей выборке и Iтест = 0.56 на тестовой. Установлено, что наиболее специфичными являются сигналы ЭЭГ класса 'C' (соответствующие ментальной активности при решении задач на пространственное мышление), точность распознавания сигналов этого класса достигает 98% на обучающей выборке и 76% на тестовой. Наименее специфичными являются сигналы класса 'G' (соответствующие задачам на планиметрическое мышление), которые вносят наибольший вклад в результирующую ошибку работы классификатора. Несмотря на достигнутый результат, предложенный алгоритм требует проведения ряда исследований, которые можно объединить в следующие группы: – исследование различных пространств моментных характерных признаков; – исследование процедуры кластеризации векторов МХП и формирования множества микросостояний; – исследование процедуры формирования статических паттернов из микросостояний; – исследование возможности и результатов применения динамических паттернов высоких порядков; – исследование различных вариантов формирования вектора характерных признаков на основе индексов активности динамических паттернов; – исследование процедуры обучения многослойного персептрона для классификации выделенных векторов характерных признаков. Результатом этих исследований должны стать рекомендации по выбору числа микросостояний и числа статических паттернов, определение порядка вводимых в рассмотрение динамических паттернов, достаточного для обеспечения требуемой точности классификации, а также ряд других выводов по применимости и эффективности предложенного алгоритма формирования характерных признаков для классификации многомерных нестационарных временных рядов. Работа выполнена при финансовой поддержке Совета по Грантам Президента РФ для поддержки молодых российских учёных (Грант МК‑4245.2009.8), а также в рамках гранта РФФИ 10-08-00816 и ФЦП "Научные и научно-педагогические кадры инновационной России" на 2009-2013 годы.
Литература
Публикации с ключевыми словами: нейронные сети, многомерные нестационарные сигналы, клиническая электроэнцефалография Публикации со словами: нейронные сети, многомерные нестационарные сигналы, клиническая электроэнцефалография Смотри также:
Тематические рубрики: Поделиться:
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|