close

Вход

Забыли?

вход по аккаунту

?

labs 1 (2)

код для вставкиСкачать
 Учреждение образования
Белорусский государственный университет
информатики и радиоэлектроники
Кафедра ЭВМ
Отчет по лабораторной работе Тема: "Метрические методы классификации"
(метод сравнения с эталоном, метод ближайших соседей)
Минск 2013
1. Постановка задачи.
В самолете за каждый лишний сантиметр, выходящий за габариты необходимо заплатить 3$, а за каждый лишний килограмм веса - 4$. Всего у пассажира - 40$. Функция классификации ему неизвестна, поэтому он интуитивно пытается сформировать свой багаж и каждый раз проходит процедуру контроля...
2. Обучающая выборка
№dSdmКласс11202350343043105240686179718791988110661Контрольные значения1117012550131161
3. Решение задачи классификации методом сравнения с эталоном.
3.1. Расчёт эталонов
Координаты точек находятся как среднее арифметическое координат точек исходных данных.
КлассxyЭталон 02,63Эталон 17,67,2
3.2. Оценка распознающей способности классификатора.
№ΔSΔmКлассРезультаты классификации с использованием различных метрикНаправляющие косинусыЕвклидово расстояниеРасстояние ТанимотоCos0Cos1КлассPe0Pe1КлассPt0Pt1Класс11200,9690,94001,8878,40200,7070,238023500,9850,96302,0405,09900,8460,693034300,9770,99311,4005,53200,9080,630043100,8600,90612,0407,72000,7220,335052400,9690,94001,1666,45000,9270,514068610,9770,99316,1771,26510,5040,985179710,9810,99517,5471,41410,4380,983187910,9990,98907,4401,89710,4490,970198810,9971,00017,3590,89410,4530,9931106610,9971,00014,5342,00010,6200,9571
Эффективность:
* Метрика направляющих косинусов: R = 7/10*100% = 70%
* Метрика евклидова расстояния: R = 10/10*100% = 100%
* Метрика расстояния Танимото: R = 10/10*100% = 100%
3.3. Оценка обобщающей способности классификатора (классификация контрольной выборки).
№ΔSΔmКласс Результаты классификации с использованием различных метрикНаправляющие косинусыЕвклидово расстояниеРасстояние ТанимотоCos0Cos1КлассPe0Pe1КлассPt0Pt1Класс11700,8410,78304,3086,60300,3290,258025500,9971,00013,1243,40600,2710,3021311610,9370,96718,9203,60610,1700,3331
4. Решение задачи классификации методом k-ближайших соседей.
Решить задачу методом k-ближайших соседей для "контрольных" точек, используя те же метрики. Рассчитать все расстояния до всех обучающих образов и отнести их к тому классу, в котором ближайших соседей больше. Или выбрать нечётное количество ближайших соседей и отнести образ к тому классу, в котором ближайших соседей больше.
Точка ΔS = 1, Δm = 7 класс 0
ΔSΔmКлассНаправляющие косинусыЕвклидово расстояниеРасстояние Танимото1200,948685,000000,375003500,921642,828430,826094300,707115,000000,500003100,447216,324560,200002400,948683,162280,750008610,707117,071070,500009710,719408,000000,475417910,868246,324560,636368810,800007,071070,561406610,800005,099020,64865Класс : 0 0 0
Точка ΔS = 5, Δm = 5
ΔSΔmКлассНаправляющие косинусыЕвклидово расстояниеРасстояние Танимото1200,948685,000000,375003500,970142,000000,909094300,989952,236070,875003100,894434,472140,500002400,948683,162280,750008610,989953,162280,875009710,992284,472140,800007910,992284,472140,800008811,000004,242640,816336611,000001,414210,96774Класс: 1 0 1
Точка ΔS = 11, Δm = 6
ΔSΔmКлассНаправляющие косинусыЕвклидово расстояниеРасстояние Танимото1200,8209110,770330,165473500,862298,062260,492194300,989637,615770,516673100,984279,433980,304692400,820919,219540,351158610,989633,000000,932339710,986962,236070,965757910,916965,000000,839748810,959373,605550,912756610,959375,000000,80315Класс: 1 1 1
5. Вывод.
Результаты получились точнее при использовании метрики Евклидова расстояния. При использовании метрики направляющих косинусов результаты были менее точными т.к. эта метрика учитывает угол, а в данном случае эталоны находятся практически на одной прямой.
Так как точки на графике расположены компактно, то метод ближайших соседей показывает результаты хуже, чем метод сравнения с эталоном. Для метода ближайших соседей требуется брать нечетное количество соседей для того, чтобы не получить одинаковое количество соседей от каждого класса.
Качество классификации зависит от того, насколько компактна обучающая выборка.
Обучение классификатора - выбор эталона для каждого из классов, т.е. качество обучения - подбор точек, которые обеспечивают наилучший результат.
Документ
Категория
Рефераты
Просмотров
23
Размер файла
45 Кб
Теги
labs
1/--страниц
Пожаловаться на содержимое документа