|
|
Оценка сложности семантической сети в обучающей системе # 11, ноябрь 2008 УДК 519.6
А.П.Карпенко, Н.К.Соколов
МГТУ им. Н.Э. Баумана, 105005, Москва, 2-я Бауманская ул., д.5.
1. Введение Современные обучающие системы представляют собой интеллектуальные системы, построенные на основе парадигмы обработки знаний. При этом формализация онтологии предметной области выполняется в виде базы знаний, которая может быть реализована на основе продукционная модели знаний, семантической сети, фреймовая модели знаний и на основе формальной логической модели знаний. В работе полагается, что база знаний обучающей системы построена на основе семантической сети, содержащей понятия предметной области изучаемой дисциплины и отношения между этими понятиями. Семантическая сеть представляется в виде ориентированного графа, вершины которого соответствуют понятиям предметной области изучаемой дисциплины, а дуги задают отношение «определяемое понятие – определяющее понятие» между ними. Более строго, такая сеть классифицируется как однородная (с единственным типом отношений между понятиями) и бинарная (отношения связывают только по два понятия). Полагается также, что обучающая система реализует способ создания учебных материалов на основе «сборки» их из предварительно разработанных модулей (module) или разделяемых единиц контента (SCO – Shareable Content Object). Такую технологию поддерживает широко известный стандарт SCORM [1], а также оригинальная отечественная разработка, называемая технологий разделяемых единиц контента (ТРЕК) [2]. В отличие от технологии SCORM, ТРЕК обеспечивает взаимосвязь между модулями путем задания указанных выше отношений между понятиями, определенными в этих модулях. Важной задачей современной обучающей системы является педагогическая диагностика [3]. Стратегия диагностики, используемая в обучающей системе, зависит, прежде всего, от целей обучения, которые реализует эта система. Среди традиционных целей обучения выделяются следующие цели: приобретение знаний; приобретение навыки и приобретение умений [4]. Данная работа ориентирована на достижение первой из этих целей и связана с организацией контроля знаний в обучающей системе. Контроль знаний в обучающей системе является многоплановой проблемой. В работе рассматривается одна из актуальных граней этой проблемы - контроль усвоения субъектом обучения понятий предметной области изучаемой дисциплины, а также взаимосвязей этих понятий [5]. Для решения задачи контроля понятийных знаний можно использовать тестовую подсистему обучающей системы или в рамках этой системы разрабатывать подсистему автоматического контроля понятийных знаний (см., например, программный продукт «Сеть научных понятий» [6]). Во всех случаях для оценки уровня усвоения понятийных знаний, требуется оценка сложности понятий, модулей, репозитариев (библиотек) модулей и обучающих курсов. Эти же оценки необходимы для формирования индивидуальной образовательной траектории в интеллектуальной обучающей системе, менеджмента качества учебного процесса, проектирования учебных планов образовательных программ и пр. Задачу оценки сложности учебного материала следует рассматривать в контексте более широкой задачи оценки качества этого материала. Данная задача не нова. Так еще в работе [7] предложена такая формальная мера сложности учебного материала, как мера его «разнообразия». Для вычисления значений этой меры используется классический подход Клода Шеннона: в качестве меры разнообразия принимается логарифм числа элементов, составляющих учебный материал. В работе [8] с узлами семантической сети (понятиями) связывается картинка, видеоизображение, аудио-сегмент или текст и рассматриваются некоторые меры этих сущностей. В качестве одной из таких мер предлагается использовать меру количества информации по Колмогорову А.Н., заключенной в этой сущности. Значение указанной меры можно оценить размером соответствующего файла, сжатого с помощью современных алгоритмов сжатия. В публикации [9] предлагается оценивать качество семантической сети с помощью следующих критериев: достоверность (степень безошибочности данных); кумулятивность (свойство данных небольшого объема достаточно полно отражать соответствующую предметную область); непротиворечивость (отсутствие взаимоисключающих понятий). В диссертации [10] в качестве меры качества учебного материала предлагается использовать его объем, а также нечеткие экспертные оценки сложности этого материала. В отличии от указанных работ, в данной работе меры сложности строятся на основе таких параметров семантической сети, как количество входных и выходных понятий, реберная плотность и диаметр графа, соответствующего этой сети и т.д. Раздел 2 работы вводит основные обозначения. Некоторые меры сложности, рассматриваемые в работе, основаны на использование метрик графов. Поэтому в разделе 3 даны определения этих метрик. В разделе 4 рассматриваются меры сложности понятий, в разделах 5, 6 – меры сложности модулей, в разделах 7, 8 – меры сложности библиотек модулей, в разделах 9, 10 – меры сложности учебных курсов. В заключении сформулированы основные выводы. Организация в обучающей системе контроля понятийных знаний субъекта обучения может требовать использования расширенной семантической сети [5], которую следует отнести к неоднородным и, возможно, N-арным семантическим сетям. К необходимости построения такой сети приводит также задача планирования в обучающей системе индивидуальной траектории обучения. В качестве меры сложности такой сети и ее фрагментов могут использоваться некоторые из мер, рассмотренных в данной работе. Систематическое рассмотрение мер сложности расширенной семантической сети, полагается, составит предмет самостоятельной публикации.
2. Модель семантической сети
2.1. Понятия и модули. Будем обозначать модули рассматриваемой библиотеки знаний
Аналогично назовем выходным понятием (output concept) модуля
Каждое из понятий
Понятия из наборов
Семантическую сеть
Введенные обозначения иллюстрирует Рис. 2.1. Модуль
Рис. 2.1. Пример графа
Аналогично информационным связям понятий определены информационные связи моделей. Модули
Отметим следующее важное обстоятельство. В соответствие с концепцией технологии разделяемых единиц контента, одно и то же понятие может быть определено в разных модулях библиотеки знаний Современные интеллектуальные обучающие системы обеспечивают выполнение следующих правил расположения описаний понятий в модуле: o ни одно из понятий k-го уровня ЯПФ модуля не может быть введено до тех пор, пока не определены все понятия всех расположенных ниже уровней ЯПФ (см. п. 3); o при выполнении первого правила, описания понятий k-го уровня ЯПФ могут быть введены в модуле в произвольном порядке.
Наряду с этим современные обучающие системы разрешают использование в модуле понятий, которые еще не определены в данном модуле, а будет определены в нем позже. Такие понятия называются внутренними ссылочными понятиями. В терминах ЯПФ ссылка на понятие означает, что в тексте модуля при определении понятий k-го уровня используется понятие одного из расположенных выше уровней. Количество внутренних ссылочных понятий, используемых в модуле
Ссылочное понятие может быть также внешним ссылочным понятием. Если в тексте некоторого модуля
2.2. Библиотека модулей. Пусть библиотека модулей
Семантическую сеть
Граф
Вершины взвешенного мультиграфа
2.3. Учебный курс. Учебный курс, подготовленный из всех или некоторой совокупности модулей библиотеки
Аналогично библиотеке
Граф
Во взвешенном мультиграфе
3. Метрики графа семантической сети
3.1. Высота графа. Рассмотрим ярусно-параллельную форму (ЯПФ) ориентированного графа без контуров
o на первый ярус ЯПФ помещаются все те вершины графа o ….
o на
Проиллюстрируем этот алгоритм на примере графа
Номер яруса ЯПФ графа
Рис. 3.1. Пример. Граф
Высоту вершины
Пример 3.1. Пусть учебный курс T состоит из модулей
Рис. 3.2. Пример. Граф
Рис. 3.3. К примеру 3.1. Графы
Контекст, в котором рассматривается высота понятия, будем обозначать надиндексом, так что
Высоту ЯПФ графа
Легко видеть, например, что для курса T, состоящего из модулей
В случае если граф o выбирается дуга, входящая в первую из оставшихся вершин;
o если в результате этой процедуры продолжение построения ЯПФ графа o в противном случае, по тому же правилу выбрать следующую дугу и т.д.
Разные правила выбора разрываемых дуг могут приводить к ЯПФ графа
Будем далее полагать, что при построении ЯПФ графов
Отметим, что при построении ЯПФ графа
3.2. Диаметр графа. В качестве метрики графа
Диаметр графа При вычислении диаметров графов, фигурирующих в работе, эти графы рассматриваются как неориентированные.
Рассмотрим для примера, граф
Отметим следующее обстоятельство. Поскольку при определении диаметра графа
3.3. Реберная плотность графа. Еще одной графовой метрикой, используемой в работе, является реберная плотность графа (ориентированного или неориентированного)
где
Реберную плотность графа
Рассмотрим для примера, графы Отметим следующее важное обстоятельство: реберная плотность графа имеет значительно меньшую вычислительную сложность, по сравнению вычислительной сложностью его высоты и диаметра.
4. Постановка задачи
Ставится следующая задача: сформировать меры сложности понятий
Значение меры сложности понятия может зависеть от контекста, в котором производится оценка этой значения. В обозначениях меры сложности понятий соответствующий контекст будем указывать надиндексом. Так мера
Аналогично мерам сложности понятий, вводятся меры сложности модулей
Среди мер сложности библиотеки
Аналогично вводятся меры сложности Выделим два класса мер сложности понятий и модулей.
Меру сложности понятия Очевидно, что, при прочих равных условиях, определение значений контекстно-независимых мер требует меньших вычислительных затрат. Поэтому при отсутствии сильных преимуществ, мы будем стремиться к использованию именно этих мер. Большие значения всех рассматриваемых в работе мер, соответствуют большим значениям сложности соответствующих объектов. В работе предложено значительное количество мер сложности понятий, модулей, библиотек модулей и учебных курсов. В этой связи возникают следующие вопросы. Как много мер следует использовать? Какие из этих мер предпочтительнее? Каковы критерии такого выбора? При поиске ответов на поставленные вопросы, на наш взгляд следует руководствоваться следующими соображениями. 1). Следует учитывать особенности человеческой системы переработки информации. Так результаты некоторых экспериментов показывают, что на пределе человеческих возможностей находится задача классификации объектов по трем классам, характеризуемых семью критериями и всего двумя градациями на шкалах их оценок [14]. Исходя из этого, можно рекомендовать использование, по возможности, не большего количества мер – не более семи. 2). Предпочтение следует отдавать тем мерам сложности, значения которых имеют простую содержательную интерпретацию. 3). При прочих равных условиях, преимуществом обладают меры, имеющие меньшую вычислительную сложность.
5. Меры сложности понятий
5.1. Мера сложности
где
Как следует из формулы (5.1), мера
Очевидно, что если вес
Утверждение 5.1. Если во всех модулях библиотеки L вес
В качестве примера рассмотрим учебный курс T, граф семантической сети которого представлен на Рис. 3.3. Легко видеть, что справедливы следующие оценки:
5.2. Мера сложности
Отметим, что в соответствии с этим определением сложность входных понятий модуля, а также понятий, при определении которых не используется ни одно из других понятий, равна единице.
Содержательно мера (5.2) означает следующее. Усвоение субъектом обучения понятия Поскольку высота понятия является контекстно-зависимой величиной (см. п. 3), имеет место
Утверждение 5.2. Мера
Поясним последнее неравенство. Положим, что среди понятий, информационно-связанных с понятием
Рассмотрим в качестве примера модуль
5.3. Мера
Очевидно, что если высота понятия
Для определения значений мер Аналогично утверждению 5.2 имеем
Утверждение 5.3. Мера
Для примера, рассмотрим модуль
5.4. Мультимера
где Аддитивная свертка частных критериев оптимальности, используемая (5.3), является наиболее популярным приемом сведения многокритериальной задачи к однокритериальной. Наряду с этим могут использоваться мультипликативные свертки, лексикографическое упорядочение и пр. [15]. Мы здесь и далее ограничимся только аддитивной сверткой. Из утверждений 5.1 – 5.3 вытекает справедливость следующего утверждения.
Утверждение 5.4. Мультимера
Положим
Резюмируя данный раздел, отметим, что с точки зрения простоты интерпретации и минимума вычислительной сложности, из числа рассмотренных мер сложности понятий к применению можно рекомендовать меру
6. Меры сложности модулей, построенные на основе мер сложности понятий
. 6.1. Меры сложности
Т.е. мера
Поскольку мера
Утверждение 6.1. Меры
Рассмотрим для примера модуль
6.2. Меры сложности
Таким образом, аналогично мерам
Из того факта, что мера
Утверждение 6.2. Меры
В качестве примера рассмотрим модуль
6.3. Меры сложности
Таким образом, меры Из утверждения 5.3 вытекает справедливость следующего утверждения.
Утверждение 6.3. Меры
Рассмотрим для примера модуль
6.4. Мультимеры сложности
Таким образом, меры Из утверждения 5.4 вытекает справедливость следующего утверждения.
Утверждение 6.4. Меры
Положим
Таким образом,
и
Замечание. На основе мер
Эта мера имеет смысл максимальной высоты выходных понятий в модуле
С нашей точки зрения мера (6.9) менее содержательна, чем меры (6.3), (6.4), поскольку может приводить к одинаковым оценкам сложности двух модулей, первый из которых содержит только одно выходное понятие высоты
7. Прочие меры сложности модулей
7.1. Мера сложности
Здесь
Аналогично мере
Очевидно, что при любом
Утверждение 7.1. Мера
В качестве примера рассмотрим модуль
7.2. Мера сложности
Здесь аналогично мере
Содержательно мера (7.2) означает, что более сложным полагается модуль, в котором используется большее количество внутренних и внешних ссылочных понятий. Очевидно, что при любом
Утверждение 7.2. Мера
7.3. Мера сложности
Содержательно мера
Утверждение 7.3. Мера
В качестве примера так же, как в п. 7.1, рассмотрим модуль
7.4. Мера сложности
Содержательно мера
Утверждение 7.4. Мера
В качестве примера опять же рассмотрим модуль
7.5. Мультимера
Здесь для простоты записи опущены весовые множители в выражениях для Из утверждений 6.1 – 6.3, 7.1 – 7.4 следует справедливость следующего утверждения.
Утверждение 7.5. Мультимера
Замечание 7.1. Каждая из рассмотренных мер сложности модулей может служить также мерой такого показателя дидактического качества учебного материала, как его усвояемость [17]. Действительно, большое значение всех мер сложности, рассмотренных в п. 6, а также мер
Отдельного обсуждения с этой точки зрения заслуживает мера сложности
Резюмируя разделы 6, 7, приведем наши рекомендации по применению рассмотренных мер сложности модулей. Из соображений простоты интерпретации и минимума вычислительной сложности мы рекомендуем использовать меру
8. Меры сложности библиотек модулей, построенных на основе меры сложности модулей
. 8.1. Меры сложности
Таким образом, мера
Здесь и далее в этом разделе в качестве примера мы будем использовать библиотеку Таким образом, последовательно имеем:
На основе мер сложности модулей
8.2. Меры сложности
1). Построение мер
2). Построение мер
На основе мер
Мера
К примеру, для библиотеки
1). Меры
2). Меры
8.3. Меры сложности
На основе мер
Мера
Для библиотеки
1). Меры
2). Меры
8.4. Меры сложности
На основе мер
Таким образом, мера
8.5. Меры сложности
где
Таким образом, мера
Используя в качестве примера библиотеку
8.6. Меры сложности
где
Т.е. мера
8.7. Меры сложности
Мера
Меры
8.8. Меры сложности
Мера
Для библиотеки
8.9. Меры сложности
Мера
9. Прочие меры сложности библиотек модулей
Меры сложности библиотеки L, рассматриваемые в данном разделе, в основном сконструированы на основе мер сложности информационно-логического графа библиотеки
9.1. Меры сложности
Здесь
В качестве примера в данном и последующих пунктах рассматривается библиотека
Рис. 9.1. Пример графа информационных связей модулей
В предположении, что
9.2. Меры сложности
Для библиотеки
9.3. Меры сложности
Для библиотеки
9.4. Меры сложности
9.5. Меры сложности
Отметим, что в каждой из сумм (9.6) величина
9.6. Мультимеры
Здесь для простоты записи опущены весовые множители в выражениях для мер
Замечание 9.1. Аналогично мерам сложности модулей, каждая из рассмотренных мер сложности библиотеки может служить также мерой его усвояемость (см. замечание 7.1). Особенно естественно использовать в качестве такого критерия меры
В заключение разделов 8, 9 приведем рекомендации по применению рассмотренных мер сложности библиотеки. Из соображений простоты интерпретации и минимума вычислительной сложности рекомендуется использовать меры
· меры на основе количеств входных и выходных понятий модулей библиотеки (меры
· меры на основе количеств внешних и внутренних ссылочных понятий тех же модулей (меры
· меры на основе реберных плотностей графов
· меры на основе количества вершин и кратностей дуг в графе
· меры на основе реберной плотности графа
· меры на основе количества кратных понятий в библиотеке L (меры
Другими словами, рекомендуется использовать мультимеры
10. Меры сложности учебных курсов
В качестве мер сложности учебного курса
Таким образом, в качестве мер сложности учебного курса
Здесь для простоты записи опущены весовые множители в выражениях для мер
Непосредственно использовать введенные меры может быть методически ошибочным. Дело в том, что, очевидно, сложность учебного курса зависит еще и от количества времени, которое выделено на его изучение. Обозначим это время
Для введенных мер сложности учебного курса
Заключение Некоторые из мер сложности, предложенные в работе, могут быть использованы в качестве мер усвояемости учебного материала и мер его адаптивности. Это обстоятельство позволяет формально ставить задачу оценки качества учебных материалов, как трехкритериальную задачу (с критериями: сложность; усвояемость;, адаптивность). Результаты работы позволяют значения всех трех критериев качества вычислить автоматически, только на основе анализа семантической сети соответствующего учебного материала. Все меры, рассмотренные в работе, построены только на основе соответствующей семантической сети. Наряду с этим можно предложить и другие меры, например: меры, использующие объемы модулей, библиотек и учебных курсов; меры использующие метаданные тех же единиц контента и др. С нашей точки зрения меры такого сорта менее содержательны и объективны, чем меры, на основе метрик семантической сети. Для многих мер, предложенных в работе, можно предложить их варианты, построенные на основе шенноновской меры информации.
Литература 1. Official ADL SCORM overview //http://www.adlnet.gov/scorm 2. Норенков И.П. технология разделяемых единиц контента для создания и сопровождения информационно-образовательных сред //Информационные технологии, 2003, № 8. 3. Белоусова Л.И., Колгатин А.Г., Колгатина Л.С. Принципы построения автоматизированной системы педагогической диагностики //УСиМ, 2007, № 2, с. 75 – 81. 4. Креативная педагогика: методология, теория, практика /под ред. Ю.Г.Круглова. –М.:МГОПУ им. М.А.Шолохова, изд. центр «Альфа», 2002. -240 с. 5. Карпенко А.П., Соколов Н.К. Контроль понятийных знаний субъекта обучения с помощью когнитивных карт //Управление качеством инженерного образования и инновационные образовательные технологии. Сборник докладов Международной научно-методической конференции 28-30 октября 2008 г. –М.:МГТУ им. Н.Э.Баумана, 2008, Ч.2, с. 55-57. 6. Программный продукт «Сеть научных понятий» // http://www.websamba.com/supertest 7. Добряков А.А., Милова В.М. Экспертно-аналитический метод оценки качества образовательных систем на основе нечетко-множественного подхода //Качество. Инновации. Образование. 2007., №1, с. 36 -41. 8. Галямова Е.В. Оценка качества электронного учебного материала //Управление качеством инженерного образования и инновационные образовательные технологии. Сборник докладов Международной научно-методической конференции 28-30 октября 2008 г. –М.:МГТУ им. Н.Э.Баумана, 2008, Ч.2, с. 29-34. 9. Усачев Ю.Е. Проектирование интеллектуального учебника // http://www.e-joe.ru/sod/00/4_00/us.html 10. Рабинович П.Д. Исследование и разработка моделей, алгоритмов и программного обеспечения в компьютерных обучающих системах. Автореферат диссертации на соискание ученой степени кандидата технических наук. –Москва, 2005. 11. Норенков И.П., Уваров М.Ю. База и генератор образовательных ресурсов //Информационные технологии, 2005, №9, с. 60-65. 12. Федотов И.Е. Некоторые приемы параллельного программирования: Учебное пособие. - М.: Изд-во МГИРЭА(ТУ), 2008. - 188 с. 13. Евстигнеев В.А. Применение теории графов в программировании. –М.: Наука, 1985. -332 с. 14. Ларичев О.И. Теория и методы принятия решений, а также Хроника событий в Волшебных странах. – М.: Университетская книга, Логос, 2006. -292 с. 15. Карпенко А.П., Федорук В.Г. Обзор программных систем многокритериальной оптимизации. Отечественные системы //Информационные технологии, 2008, №1, с. 15-22. 16. Вентцель Е.С. Исследование операций: задачи, принципы, методология. – М.: Дрофа, 2006. -206 с. 17. Белоус В.В., Васильев Н.В., Карпенко А.П. Вопросы регистрации электронных изданий //Управление качеством инженерного образования и инновационные образовательные технологии. Сборник докладов Международной научно-методической конференции 28-30 октября 2008 г. –М.:МГТУ им. Н.Э.Баумана, 2008, Ч.2, с.45-50.
Публикации с ключевыми словами: Обучающая система,, семантическая сеть, мера сложности, разделяемая единица контента Публикации со словами: Обучающая система,, семантическая сеть, мера сложности, разделяемая единица контента Смотри так же: Тематические рубрики: |
|
|||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||