close

Вход

Забыли?

вход по аккаунту

?

Орешко шпоры

код для вставкиСкачать
1. Хранилище данных. Определение. Структура. Виды хранилищ данных.
Хранилище данных - предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений. Данные в нем обычно обновляются согласно расписанию. процесс пополнения представляет собой просто добавление новых данных за определенный период времени без изменения прежней информации, уже находящейся в хранилище. может пополняться за счет внешних источников, например статистических отчетов. Таблица фактов(fact table) содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализироваться.(факты, связанные с транзакциями. факты, связанные с "моментальными снимками".факты, связанные с элементами документа. факты, связанные с событиями или состоянием объекта) Таблицы измерений(dimension tables) содержат неизменяемые либо редко изменяемые данные. содержат как минимум одно описательное поле (обычно с именем члена измерения) и, как правило, целочисленное ключевое поле (обычно это суррогатный ключ) для однозначной идентификации члена измерения. таблица измерений в отношении "один ко многим" с таблицей фактов.
Одно измерение куба может содержаться как в одной таблице, так и в нескольких связанных таблицах, соответствующих различным уровням иерархии в измерении. Если каждое измерение содержится в одной таблице, такая схема хранилища данных носит название "звезда". другое-снежинка. часто вместо ключевого поля для измерения, содержащего данные типа "дата", и соответствующей таблицы измерений сама таблица фактов может содержать ключевое поле типа "дата". В этом случае соответствующая таблица измерений просто отсутствует.
2. Хранилище данных. Основные требования к хранилищам данных.
Хранилище данных - предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений. основные требования(Ральфа Кимбалла): 1.поддержка высокой скорости получения данных из хранилища; 2.поддержка внутренней непротиворечивости данных; 3.возможность получения и сравнения так называемых срезов данных (slice and dice); 4.наличие удобных утилит просмотра данных в хранилище; 5.полнота и достоверность хранимых данных;
6.поддержка качественного процесса пополнения данных. Типичное хранилище данных, отличается от обычной реляционной базы данных. 1. обычные бд предназначены для того, чтобы помочь пользователям выполнять повседневную работу, тогда как хд предназначены для принятия решений. (Например, продажа товара и выписка счета производятся с использованием базы данных, предназначенной для обработки транзакций, а анализ динамики продаж за несколько лет, позволяющий спланировать работу с поставщиками, - с помощью хранилища данных.)
2. обычные бд подвержены постоянным изменениям в процессе работы пользователей, а хд относительно стабильно: данные в нем обычно обновляются согласно расписанию (например, еженедельно, ежедневно или ежечасно). процесс пополнения представляет собой просто добавление новых данных за определенный период времени без изменения прежней информации, уже находящейся в хранилище. 3. обычные бд чаще всего являются источником данных, попадающих в хранилище. Кроме того, хранилище может пополняться за счет внешних источников, например статистических отчетов.
3. Атрибуты измерения
Таблицы измерений содержат неизменяемые либо редко изменяемые данные. В подавляющем большинстве случаев эти данные представляют собой по одной записи для каждого члена нижнего уровня иерархии в измерении. Таблицы измерений также содержат как минимум одно описательное поле (обычно с именем члена измерения) и, как правило, целочисленное ключевое поле (обычно это суррогатный ключ) для однозначной идентификации члена измерения. Если будущее измерение, основанное на данной таблице измерений, содержит иерархию, то таблица измерений также может содержать поля, указывающие на <родителя> данного члена в этой иерархии. Нередко (но не всегда) таблица измерений может содержать и поля, указывающие на <прародителей>, и иных <предков> в данной иерархии (это обычно характерно для сбалансированных иерархий), а также дополнительные атрибуты членов измерений, содержавшиеся в исходной оперативной базе данных (например, адреса и телефоны клиентов).таблица измерений в отношении <один ко многим> с таблицей фактов. что скорость роста таблиц измерений должна быть незначительной по сравнению со скоростью роста таблицы фактов. Одно измерение куба может содержаться как в одной таблице, так и в нескольких связанных таблицах, соответствующих различным уровням иерархии в измерении. Если каждое измерение содержится в одной таблице, такая схема хранилища данных носит название <звезда> (star). Если хотя бы одно измерение содержится в нескольких связанных таблицах, <снежинка> (snowflake). Дополнительные таблицы измерений в такой схеме, обычно соответствующие верхним уровням иерархии измерения и находящиеся в соотношении <один ко многим> в главной таблице измерений, соответствующей нижнему уровню иерархии, иногда называют консольными таблицами (outrigger table). таблица измерений может содержать поля, не имеющие отношения к иерархиям и представляющие собой просто дополнительные атрибуты членов измерений (member properties).
4. Спецификация многомерных данных.
В многомерных хранилищах данных содержатся агрегатные данные сократить время выполнения запросов, поскольку в большинстве случаев для анализа и прогнозов интересны не детальные, а суммарные данные. три способа хранения данных: 1.MOLAP (Multidimensional OLAP) -- исходные и агрегатные данные хранятся в многомерной базе данных. (манипулирование данными как многомерным массивом, - скорость вычисления агрегатных значений одинакова для любого из измерений. Однако Многом БД оказывается избыточной, тк м данные содержат исходные реляционные данные). 2.ROLAP (Relational OLAP) - исходные данные остаются в той же реляционной базе данных, где они изначально и находились. Агрегатные же данные помещают в специально созданные для их хранения служебные таблицы в той же базе данных. 3.HOLAP (Hybrid OLAP) - исходные данные остаются в той же реляционной базе данных, где они изначально находились, а агрегатные данные хранятся в многомерной базе данных. Технология комплексного многомерного анализа данных получила название OLAP.
термины для описания многомерного пространства:
1.Измерение (Dimension) - описывает элемент данных, по которому производится анализ. (время);
2.Элемент (Member) - одна точке на измерении.(понедельник);
3.Значение Элемента (Member Value) - это уникальная характеристика элемента. (в измерении Время некоторая дата);
4.Атрибут (Attribute) - это полная коллекция элементов одного типа. (все дни недели будут атрибутом измерения Время);
5.Размер (Size), или Кардинальность измерения - это количество элементов, которое оно содержит. (измерение Время состоящее из дней недели, будет иметь размер 7).
6.Кортеж (Tuple) - это координата в многомерном пространстве;
7.Срез (Slice) - это секция многомерного пространства, которая может быть определена кортежем
8Многомерным Кубом (Cube) полный набор точек пространства, объединяющих фактическое и логическое пространство
9Ячейками (Cells) называются точки пространства куба
10Тип вычисления - это связь, которая связывает вместе физическое и логическое пространство куба. 11Функция агрегирования данных позволяет вычислять значения ячеек в логическом пространстве из значений ячеек в фактическом пространстве.
5. Правила Кодда для OLAP.
В 1993 году Кодд опубликовал труд под названием "OLAP для пользователей-аналитиков: каким он должен быть". В нем он изложил основные концепции оперативной аналитической обработки и определил 12 правил, которым должны удовлетворять продукты, предоставляющие возможность выполнения оперативной аналитической обработки.
1. Многомерность (облегчают моделирование, анализ, вычисления). 2. Прозрачность. (Пользователь способен получить все необходимые данные из OLAP-машины, даже не подозревая, откуда они берутся). 3. Доступность. (единая, согласованная модель данных. Доступ к данных независимо от того где и как они хранятся). 4. Постоянная производительность при разработке отчетов. 5. Клиент-серверная архитектура. 6. Равноправие измерений. (дб эквивалентны и в структуре, и в операционных возможностях). 7. Динамич управление разреженными матрицами(OLAP системы должны автоматически настраивать свою физическую схему в зависимости от типа модели, объемов данных и разреженности базы данных). 8. Многопользовательская поддержка. 9. Неограниченные перекрестные операции.(Все виды операций должны быть дозволены для любых измерений). 10. Интуитивная манипуляция данными.(Манип. данными осуществлялось посредством прямых действий над ячейками в режиме просмотра без использования меню и множественных операций). 11. Гибкие возможности получения отчетов. Неограниченная размерность и число уровней агрегации. (лучше как min 15 измерений. Более того, каждое из общих измерений не должно быть ограничено по числу определяемых пользователем-аналитиком уровней агрегации и путей консолидации).
6. Функции агрегирования.
Тип вычисления - это связь, которая связывает вместе физическое и логическое пространство куба. Функция агрегирования данных позволяет вычислять значения ячеек в логическом пространстве из значений ячеек в фактическом пространстве.
Функция агрегирования может быть либо простой - аддитивной (additive), либо сложной - полуадаитивной (semi-additive). Список аддитивных функций агрегирования довольно ограниченный - сумма данных (SUM), минимальное (MIN) и максимальное (МАХ) значения данных и вычисление количества (COUNT), которое по существу является просто разновидностью суммы. Все остальные функции - сложные и используют сложные формулы и алгоритмы.
Элемент All
В противоположность геометрическому пространству, в котором начальной точкой отсчета является точка, в которой все координаты равны 0, начальную точку для многомерного пространства определить сложнее. Например, для измерения времени по месяцам не существует значения 0, и январь является только первым месяцем. Поэтому приходится задавать начало многомерного пространство с помощью специального атрибута, который объединяет все элементы измерения. Этот атрибут содержит только один элемент - Все (Аll). Для простых функций агрегирования, например, суммы, элемент Аll эквивалентен сумме значений всех элементов фактического пространства, для сложных функций агрегирования, элемент АН вычисляется по формуле, связанной с функцией.
7. Определение меры в многомерном пространстве.
термины для описания многомерного пространства:
1.Измерение (Dimension) - описывает элемент данных, по которому производится анализ. (время);
2.Элемент (Member) - одна точке на измерении.(понедельник);
3.Значение Элемента (Member Value) - это уникальная характеристика элемента. (в измерении Время некоторая дата);
4.Атрибут (Attribute) - это полная коллекция элементов одного типа. (все дни недели будут атрибутом измерения Время);
5.Размер (Size), или Кардинальность измерения - это количество элементов, которое оно содержит. (измерение Время состоящее из дней недели, будет иметь размер 7).
6.Кортеж (Tuple) - это координата в многомерном пространстве;
7.Срез (Slice) - это секция многомерного пространства, которая может быть определена кортежем
8Многомерным Кубом (Cube) полный набор точек пространства, объединяющих фактическое и логическое пространство
9Ячейками (Cells) называются точки пространства куба
Значения в ячейке одного типа называются Мерой (Measure). Несколько мер вместе представляют собой Измерение Мер (Measure Dimension). Каждый элемент этого измерения (меры) имеет набор свойств, таких как тип данных, единица измерения, и - наиболее важное - тип вычисления для Функции Агрегирования данных (Aggregate Function).
Тип вычисления - это связь, которая связывает вместе физическое и логическое пространство куба. Функция агрегирования данных позволяет вычислять значения ячеек в логическом пространстве из значений ячеек в фактическом пространстве.
8. OLAP технология. Назначение. Основные понятия. Решаемые задачи.
OLTP (transaction) -системы оптимизированы для небольших дискретных транзакций. (запросы на комплексную информацию породят сложные соединения таблиц и просмотр таблиц целиком. На один такой запрос уйдет масса времени)
Термин OLAP (On-Line Analytical Processing) служит для описания модели представления данных и соответственно технологии их обработки в ХД. В OLAP применяется многомерное представление агрегированных данных для обеспечения быстрого доступа к стратегически важной информации в целях углубленного анализа. Приложения OLAP должны обладать следующими основными свойствами: многомерное представление данных; поддержка сложных расчетов; правильный учет фактора времени.
Задачи: 1)быстрый доступ к данным; 2)преагрегация; 3)иерархии; 4)работа с временем; 5)язык доступа к многомерным данным(MDX); 6)KPI ключевые показатели эффективности; 7)дата майнинг; 8)многоуровневое кэширование; 9)поддержка мультиязычности
тест FASMI (Кодд; возможности быстрого анализа разделяемой многомерной информации )
Fast (Быстрый) - анализ должен производиться одинаково быстро по всем аспектам информации. ( 5 с или менее). Analysis (Анализ) - (возможность числового и статанализа) Shared (Разделяемой) - множество пользователей должно иметь доступ к данным, при этом необходимо контролировать доступ к конфиденциальной информации. Multidimensional (Многомерной) Information (Информации) - приложение должно иметь возможность обращаться к любой нужной информации, независимо от ее объема и места хранения
9. Многомерные кубы. Способы определения. Примеры.
Модель данных организуется в виде многомерных кубов (Cubes). Оси- основные атрибуты анализируемого бизнес-процесса. Например, для продаж это могут быть товар, регион, тип покупателя. В качестве одного из измерений используется время. На пересечениях осей - измерений (Dimensions) - находятся данные, количественно характеризующие процесс - меры (Measures). Это могут быть объемы продаж в штуках или в денежном выражении, остатки на складе, издержки и т. п. Пользователь, анализирующий информацию, может "разрезать" куб по разным направлениям, получать сводные (например, по годам) или, наоборот, детальные (по неделям) сведения и осуществлять прочие манипуляции, которые ему придут в голову в процессе анализа.
Ячейки куба могут содержать агрегатные данные, соответствующие находящимся на осях куба значениям параметров запроса, например в предикате WHERE предложения SELECT языка SQL
10. Многомерные кубы. Подкубы. Виды измерений.
Модель данных организуется в виде многомерных кубов (Cubes). Оси- основные атрибуты анализируемого бизнес-процесса. Например, для продаж это могут быть товар, регион, тип покупателя. В качестве одного из измерений используется время. На пересечениях осей - измерений (Dimensions) - находятся данные, количественно характеризующие процесс - меры (Measures). Это могут быть объемы продаж в штуках или в денежном выражении, остатки на складе, издержки и т. п. Пользователь, анализирующий информацию, может "разрезать" куб по разным направлениям, получать сводные (например, по годам) или, наоборот, детальные (по неделям) сведения и осуществлять прочие манипуляции, которые ему придут в голову в процессе анализа.
Измерения используются в качестве индексов для идентификации элементов многомерного массива (гиперкуба), в котором хранятся значения многомерных показателей. Если пользователь выбирает один элемент какого-нибудь измерения, остальные измерения, для которых указывается диапазон элементов (или все элементы), образуют подкуб. Если для всех, кроме двух, измерений указывается один элемент, оставшиеся два измерения образуют электронную таблицу ("срез" или "проекцию" куба).
11. Определение многомерного пространства. Физическое и логическое пространство.
Многомерное пространство, пространство, имеющее число измерений более трёх. Термины, которые используются для описания многомерного пространства:
1.Измерение (Dimension) - описывает элемент данных, по которому производится анализ. (время); 2.Элемент (Member) - одна точке на измерении.(понедельник); 3.Значение Элемента (Member Value) - это уникальная характеристика элемента. (в измерении Время некоторая дата); 4.Атрибут (Attribute) - это полная коллекция элементов одного типа. (все дни недели будут атрибутом измерения Время); 5.Размер (Size), или Кардинальность измерения - это количество элементов, которое оно содержит. (измерение Время состоящее из дней недели, будет иметь размер 7). 6.Кортеж (Tuple) - это координата в многомерном пространстве; 7.Срез (Slice) - это секция многомерного пространства, которая может быть определена кортежем
Логическое пространство в противоположность пространству фактов, содержащему только точки, представляющие действительные значения, содержат точки, которые могут быть рассчитаны. Полный набор точек пространства, объединяющих фактическое(физическое) и логическое пространство, называется многомерной моделью, или многомерным Кубом (Cube), который скорее является многомерным гиперкубом, а точки пространства куба - Ячейками (Cells)
12. Определение многомерного пространства. Атрибуты измерения. Меры
Многомерное пространство, пространство, имеющее число измерений более трёх. Термины, которые используются для описания многомерного пространства:
1.Измерение (Dimension) - описывает элемент данных, по которому производится анализ. (время); 2.Элемент (Member) - одна точке на измерении.(понедельник);
3.Значение Элемента (Member Value) - это уникальная характеристика элемента. (в измерении Время некоторая дата);
4.Атрибут (Attribute) - это полная коллекция элементов одного типа. (все дни недели будут атрибутом измерения Время); Пример. Как шкала на линейке, по чему ведутся измерения. Может быть ключевым и дополнительным.
5.Размер (Size), или Кардинальность измерения - это количество элементов, которое оно содержит. (измерение Время состоящее из дней недели, будет иметь размер 7).
6.Кортеж (Tuple) - это координата в многомерном пространстве; 7.Срез (Slice) - это секция многомерного пространства, которая может быть определена кортежем
8Многомерным Кубом (Cube) полный набор точек пространства, объединяющих фактическое и логическое пространство 9Ячейками (Cells) называются точки пространства куба
Значения в ячейке одного типа называются Мерой (Measure). Несколько мер вместе представляют собой Измерение Мер (Measure Dimension). Каждый элемент этого измерения (меры) имеет набор свойств, таких как тип данных, единица измерения, и - наиболее важное - тип вычисления для Функции Агрегирования данных (Aggregate Function).
Тип вычисления - это связь, которая связывает вместе физическое и логическое пространство куба. Функция агрегирования данных позволяет вычислять значения ячеек в логическом пространстве из значений ячеек в фактическом пространстве.
13. Определение многомерного пространства. Функции агрегирования.
Многомерное пространство, пространство, имеющее число измерений более трёх. Термины, которые используются для описания многомерного пространства:
1.Измерение (Dimension) - описывает элемент данных, по которому производится анализ. (время); 2.Элемент (Member) - одна точке на измерении.(понедельник);
3.Значение Элемента (Member Value) - это уникальная характеристика элемента. (в измерении Время некоторая дата); 4.Атрибут (Attribute) - это полная коллекция элементов одного типа. (все дни недели будут атрибутом измерения Время); Пример. Как шкала на линейке, по чему ведутся измерения. Может быть ключевым и дополнительным.
5.Размер (Size), или Кардинальность измерения - это количество элементов, которое оно содержит. (измерение Время состоящее из дней недели, будет иметь размер 7).
6.Кортеж (Tuple) - это координата в многомерном пространстве; 7.Срез (Slice) - это секция многомерного пространства, которая может быть определена кортежем
8Многомерным Кубом (Cube) полный набор точек пространства, объединяющих фактическое и логическое пространство9Ячейками (Cells) называются точки пространства куба
Значения в ячейке одного типа называются Мерой (Measure). Несколько мер вместе представляют собой Измерение Мер (Measure Dimension). Функция агрегирования данных позволяет вычислять значения ячеек в логическом пространстве из значений ячеек в фактическом пространстве.
может быть либо простой - аддитивной (additive), либо сложной - полуадаитивной (semi-additive). Список аддитивных функций агрегирования довольно ограниченный - сумма данных (SUM), минимальное (MIN) и максимальное (МАХ) значения данных и вычисление количества (COUNT), которое по существу является просто разновидностью суммы. Все остальные функции - сложные и используют сложные формулы и алгоритмы.
14. Таблицы фактов. Типы фактов. Структура таблицы фактов. Примеры.
Таблица фактов является основной таблицей хранилища данных. Как правило, она содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализироваться. Обычно говорят о четырех наиболее часто встречающихся типах фактов:
1)факты, связанные с транзакциями (Transaction facts). Они основаны на отдельных событиях (типичными примерами которых являются телефонный звонок или снятие денег со счета с помощью банкомата); 2)факты, связанные с "моментальными снимками" (Snapshot facts). Основаны на состоянии объекта (например, банковского счета) в определенные моменты времени, например на конец дня или месяца. Типичными примерами таких фактов являются объем продаж за день или дневная выручка; 3)факты, связанные с элементами документа (Line-item facts). Основаны на том или ином документе (например, счете за товар или услуги) и содержат подробную информацию об элементах этого документа (например, количестве, цене, проценте скидки); 4)факты, связанные с событиями или состоянием объекта (Event or state facts). Представляют возникновение события без подробностей о нем (например, просто факт продажи или факт отсутствия таковой без иных подробностей). Пример:
15. Таблицы измерений. Типы измерений. Структуры таблиц измерений. Примеры
Таблицы измерений содержат неизменяемые либо редко изменяемые данные. В подавляющем большинстве случаев эти данные представляют собой по одной записи для каждого члена нижнего уровня иерархии в измерении. Таблицы измерений также содержат как минимум одно описательное поле (обычно с именем члена измерения) и, как правило, целочисленное ключевое поле (обычно это суррогатный ключ) для однозначной идентификации члена измерения. Если будущее измерение, основанное на данной таблице измерений, содержит иерархию, то таблица измерений также может содержать поля, указывающие на "родителя" данного члена в этой иерархии. Нередко (но не всегда) таблица измерений может содержать и поля, указывающие на "прародителей", и иных "предков" в данной иерархии (это обычно характерно для сбалансированных иерархий), а также дополнительные атрибуты членов измерений, содержавшиеся в исходной оперативной базе данных (например, адреса и телефоны клиентов). Каждая таблица измерений должна находиться в отношении "один ко многим" с таблицей фактов.
Одно измерение куба может содержаться как в одной таблице (в том числе и при наличии нескольких уровней иерархии), так и в нескольких связанных таблицах, соответствующих различным уровням иерархии в измерении. Если каждое измерение содержится в одной таблице, такаясхема хранилища данных носит название "звезда" (star schema).
Если же хотя бы одно измерение содержится в нескольких связанных таблицах, такая схема хранилища данных носит название "снежинка" (snowflake schema). Дополнительные таблицы измерений в такой схеме, обычно соответствующие верхним уровням иерархии измерения и находящиеся в соотношении "один ко многим"
Изм1-->изм2-->факты
То 1 - верхний уровень иерархии, 2 - нижний
16. Способы хранения данных в многомерных хранилищах.
Как исходные, так и агрегатные данные могут храниться либо в реляционных, либо в многомерных структурах. Поэтому в настоящее время применяются три способа хранения данных: MOLAP (Multidimensional OLAP) -- исходные и агрегатные данные хранятся в многомерной базе данных. Хранение данных в многомерных структурах позволяет манипулировать данными как многомерным массивом, благодаря чему скорость вычисления агрегатных значений одинакова для любого из измерений. Однако в этом случае многомерная база данных оказывается избыточной, так как многомерные данные полностью содержат исходные реляционные данные.
* ROLAP (Relational OLAP) - исходные данные остаются в той же реляционной базе данных, где они изначально и находились. Агрегатные же данные помещают в специально созданные для их хранения служебные таблицы в той же базе данных.
* HOLAP (Hybrid OLAP) - исходные данные остаются в той же реляционной базе данных, где они изначально находились, а агрегатные данные хранятся в многомерной базе данных.
Некоторые OLAP-средства поддерживают хранение данных только в реляционных структурах, некоторые - только в многомерных. Однако большинство современных серверных OLAP-средств поддерживают все три способа хранения данных. Выбор способа хранения зависит от объема и структуры исходных данных, требований к скорости выполнения запросов и частоты обновления OLAP-кубов. Отметим также, что подавляющее большинство современных OLAP-средств не хранит <пустых> значений (примером <пустого> значения может быть отсутствие продаж сезонного товара вне сезона).
17. Архитектура OLAP. Основные компоненты.
OLAP-сервер - обеспечивает хранение данных, выполнение над ними необходимых операций и формирование многомерной модели на концептуальном уровне. В настоящее время OLAP-серверы объединяют с ХД или ВД;
OLAP-клиент- представляет пользователю интерфейс к многомерной модели данных, обеспечивая его возможностью удобно манипулировать данными для выполнения задач анализа.
18. Архитектура OLAP. Виды серверов.
Способы реализации OLAP сервера
* MOLAP - для реализации многомерной модели используют многомерные БД;
* ROLAP - для реализации многомерной модели используют реляционные БД;
* HOLAP - для реализации многомерной модели используют и многомерные и реляционные БД.
* DOLAP- настольный (desktop) OLAP. Является недорогой и простой в использовании OLAP-системой, предназначенной для локального анализа и представления данных, которые загружаются из реляционной или многомерной БД на машину клиента.
JOLAP- новая, основанная на Java, коллективная OLAP-API-инициатива, предназначенная для создания и управления данными и метаданными на серверах OLAP. Основной разработчик - Hyperion Solutions. Другими членами группы, определяющей предложенный API, являются компании IBM, Oracle и др.
19. Свойства OLAP
* Многомерность - OLAP-система на концептуальном уровне должна представлять данные в виде многомерной модели, что упрощает процессы анализа и восприятия информации.
* Прозрачность - OLAP-система должна скрывать от пользователя реальную реализацию многомерной модели, способ организации, источники, средства обработки и хранения.
* Доступность- OLAP-система должна предоставлять пользователю единую, согласованную и целостную модель данных, обеспечивая доступ к данным независимо от того, как и где они хранятся.
* Постоянная производительность при разработке отчетов - производительность OLAP-систем не должна значительно уменьшаться при увеличении количества измерений, по которым выполняется анализ.
* Клиент-серверная архитектура-- OLAP-система должна быть способна работать в среде "клиент-сервер", т. к. большинство данных, которые сегодня требуется подвергать оперативной аналитической обработке, хранятся распределенно. Главной идеей здесь является то, что серверный компонент инструмента OLAP должен быть достаточно интеллектуальным и позволять строить общую концептуальную схему на основе обобщения и консолидации различных логических и физических схем корпоративных БД для обеспечения эффекта прозрачности.
* Равноправие измерений - OLAP-система должна поддерживать многомерную модель, в которой все измерения равноправны. При необходимости дополнительные характеристики могут быть предоставлены отдельным измерениям, но такая возможность должна быть предоставлена любому измерению.
* Динамическое управление разреженными матрицами - OLAP-система должна обеспечивать оптимальную обработку разреженных матриц. Скорость доступа должна сохраняться вне зависимости от расположения ячеек данных и быть постоянной величиной для моделей, имеющих разное число измерений и различную степень разреженности данных.
* Поддержка многопользовательского режима - OLAP-система должна предоставлять возможность работать нескольким пользователям совместно с одной аналитической моделью или создавать для них различные модели из единых данных. При этом возможны как чтение, так и запись данных, поэтому система должна обеспечивать их целостность и безопасность. * Неограниченные перекрестные операции - OLAP-система должна обеспечивать сохранение функциональных отношений, описанных с помощью определенного формального языка между ячейками гиперкуба при выполнении любых операций среза, вращения, консолидации или детализации. Система должна самостоятельно (автоматически) выполнять преобразование установленных отношений, не требуя от пользователя их переопределения. Интуитивная манипуляция данными - OLAP-система должна предоставлять способ выполнения операций среза, вращения, консолидации и детализации над гиперкубом без необходимости пользователю совершать множество действий с интерфейсом. Измерения, определенные в аналитической модели, должны содержать всю необходимую информацию для выполнения вышеуказанных операций. * Гибкие возможности получения отчетов - OLAP-система должна поддерживать различные способы визуализации данных, т. е. отчеты должны представляться в любой возможной ориентации. Средства формирования отчетов должны представлять синтезируемые данные или информацию, следующую из модели данных в ее любой возможной ориентации. Это означает, что строки, столбцы или страницы должны показывать одновременно от 0 до N измерений, где N- число измерений всей аналитической модели. Кроме того, каждое измерение содержимого, показанное в одной записи, колонке или странице, должно позволять показывать любое подмножество элементов (значений), содержащихся в измерении, в любом порядке. Неограниченная размерность и число уровней агрегации - исследование о возможном числе необходимых измерений, требующихся в аналитической модели, показало, что одновременно может использоваться до 19 измерений. Отсюда вытекает настоятельная рекомендация, чтобы аналитический инструмент мог одновременно предоставить хотя бы 15, а предпочтительно- 20 измерений. Более того, каждое из общих измерений не должно быть ограничено по числу определяемых пользователем-аналитиком уровней агрегации и путей консолидации. Пакетное извлечение против интерпретации - OLAP-система должна в равной степени эффективно обеспечивать доступ как к собственным, так и к внешним данным.Поддержка всех моделей OLAP-анализа - OLAP-система должна поддерживать все четыре модели анализа данных, определенные Коддом: категориальную, толковательную, умозрительную и стереотипную.Обработка ненормализованных данных - OLAP-система должна быть интегрирована с ненормализованными источниками данных. Модификации данных, выполненные в среде OLAP, не должны приводить к изменениям данных, хранимых в исходных внешних системах.Сохранение результатов OLAP: хранение их отдельно от исходных данных - OLAP-система, работающая в режиме чтения-записи, после модификации исходных данных должна результаты сохранять отдельно. Иными словами, обеспечивается безопасность исходных данных.Исключение отсутствующих значений- OLAP-система, представляя данные пользователю, должна отбрасывать все отсутствующие значения. Другими словами, отсутствующие значения должны отличаться от нуле вых значений
* Обработка отсутствующих значений - OLAP-система должна игнорировать все отсутствующие значения без учета их источника. Эта особенность связана с 17-м правилом.
20. Классы систем интеллектуального анализа данных
1.Статистические пакеты - корреляционному, регрессионному, факторному анализу и другим. 2) Нейронные сети - На нейроны самого нижнего слоя подаются значения входных параметров, на основе которых нужно принимать какие-то решения, прогнозировать развитие ситуации и т. д. Эти значения рассматриваются как сигналы, передающиеся в вышележащий слой, ослабляясь или усиливаясь в зависимости от числовых значений (весов), приписываемых межнейронным связям. В результате этого на выходе нейрона самого верхнего слоя вырабатывается некоторое значение, которое рассматривается как ответ. 3) Системы рассуждений на основе аналогичных случаев
4) Деревья решений к обучающей выборке данных создается иерархическая структура классифицирующих правил типа "ЕСЛИ... ТО...", имеющая вид дерева. к какому классу отнести некоторую ситуацию, мы отвечаем на вопросы, стоящие в узлах этого дерева, начиная с его корня. Ответ + переходим к правому узлу следующего уровня, - к левому узлу
5) Генетические алгоритмы. надо выбрать совокупность фиксированного числа параметров рынка- хромосомы,. Значения параметров, определяющих решение- гены. Поиск оптимального решения при этом похож на эволюцию популяции индивидов, представленных их наборами хромосом. отбор сильнейших(наборов хромосом, кот соответнаиболее оптиме решения); скрещивание; мутации. В результате смены поколений в конце концов вырабатывается такое решение поставленной задачи, которое уже не может быть далее улучшено.
6) Нелинейные регрессионные методы - Поиск зависимости целевых переменных от остальных ведется в форме функций какого-то определенного вида. (напр полином) 7) Эволюционное программирование (похож на генет алгор) - Суть метода в том, что гипотезы о виде зависимости целевой переменной от других переменных формулируются системой в виде программ на некотором внутреннем языке программирования.
21. Data Mining. Определение.
Data Mining - это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Примеры формулировок задач OLAP: Каковы средние показатели травматизма для курящих и некурящих?
DM: Какие факторы лучше всего предсказывают несчастные случаи? Неочевидных -найденные закономерности не обнаруживаются стандартными методами обработки информации или экспертным путем.
Объективных -обнаруженные закономерности будут полностью соответствовать действительности, в отличие от экспертного мнения, которое всегда является субъективным.
Практически полезных - выводы имеют конкретное значение, которому можно найти практическое применение.
Знания - совокупность сведений, которая образует целостное описание, соответствующее некоторому уровню осведомленности об описываемом вопросе, предмете, проблеме и т.д.
Использование знаний - действительное применение найденных знаний для достижения конкретных преимуществ (например, в конкурентной борьбе за рынок).
В основу технологии Data Mining положена концепция шаблонов (patterns), которые представляют собой закономерности, свойственные подвыборкам данных, кои могут быть выражены в форме, понятной человеку.
22. Data Mining. Типы закономерностей (методов обнаружения знаний).
Data Mining - это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
* Классификация - В результате обнаруживаются признаки, которые характеризуют группы объектов исследуемого набора данных - классы; по этим признакам новый объект можно отнести к тому или иному классу.(методы: ближайшего соседа байесовские сети; нейронные сети).
* Кластеризация - особенность: классы объектов изначально не предопределены. Результ- разбиение объектов на группы.
Пример метода решения задачи кластеризации: обучение "без учителя" особого вида нейронных сетей - самоорганизующихся карт Кохонена.
* Ассоциация (поиск ассоциативных правил) - отыскиваются закономерности между связанными событиями в наборе данных. Отличие от предыд задач: поиск закономерностей осуществляется не на основе свойств анализируемого объекта, а между несколькими событиями, которые происходят одновременно. (Наиболее известный алгоритм -Apriori).
* Последовательность или посл ассоциация - позволяет найти временные закономерности между транзакциями. Задача последовательности подобна ассоциации, но ее целью является установление закономерностей не между одновременно наступающими событиями, а между событиями, связанными во времени. Фактически, ассоциация является частным случаемпоследовательности с временным лагом, равным нулю. Правило последовательности: после события X через определенное время произойдет событие Y.
Пример. После покупки квартиры жильцы в 60% случаев в течение двух недель приобретают холодильник, а в течение двух месяцев в 50% случаев приобретается телевизор.
Прогнозирование - В результате решения задачи - на основе особенностей исторических данных оцениваются пропущенные или же будущие значения целевых численных показателей.
23. Нейронные сети. Виды нейронных сетей.
Нейронные сети - это класс моделей, основанных на биологической аналогии с мозгом человека и предназначенных после прохождения этапа обучения на имеющихся данных для решения разнообразных задач анализа данных. При применении этих методов прежде всего встает вопрос выбора конкретной архитектуры сети (числа "слоев" и количества "нейронов" в каждом из них). Поскольку на начальном этапе анализа природа явления обычно известна плохо, выбор архитектуры является непростой задачей и часто связан с длительным процессом "проб и ошибок" (однако в последнее время стали появляться нейронно-сетевые программы, в которых исп-ся методы искусственного интеллекта).
Затем построенная сеть подвергается процессу обучения. На этом этапе нейроны сети итеративно обрабатывают входные данные и корректируют свои веса так, чтобы сеть наилучшим образом прогнозировала ("осуществляла подгонку") данные. После на имеющихся данных сеть готова к работе и может использоваться для построения прогнозов.
Нейронная сеть, полученная в результате "обучения", выражает закономерности, присутствующие в данных. Однако, в отличие от традиционных моделей, в случае нейронных сетей эти зависимости не могут быть записаны в явном виде, подобно тому как это делается в статистике -по типу входной информации: Аналоговые (используют информацию в форме действительных чисел); Двоичные нейронные сети (в двоичном виде).
- по характеру обучения Обучение с учителем - выходное пространство решений нейронной сети известно; Обучение без учителя - нейронная сеть формирует выходное пространство решений только на основе входных воздействий. Такие сети называют самоорганизующимися; Обучение с подкреплением - система назначения штрафов и поощрений от среды.
- по времени передачи сигнала: синхронная сеть(время передачи каждой связи =0 или const). - по характеру связей: Сети прямого распространения;
Рекуррентные (имеется обратная связь).
24. Экспертные системы. Основные понятия и определения.
Экспе́ртная- компьютерная программа, способная частично заменить специалиста-эксперта в разрешении проблемной ситуации. Современные ЭС начали разрабатываться исследователями искусственного интеллекта в 1970-х годах, а в 1980-х получили коммерческое подкрепление. "интеллектуальные машины", позволявшие находить решения по заданным условиям, например определять наиболее подходящие лекарства по наблюдаемым у пациента симптомам заболевания[1].
В информатике экспертные системы рассматриваются совместно с базами знаний как модели поведения экспертов в определенной области знаний с использованием процедур логического вывода и принятия решений, а базы знаний - как совокупность фактов и правил логического вывода в выбранной предметной области деятельности.
База знаний состоит из правил анализа информации от пользователя по конкретной проблеме. ЭС анализирует ситуацию и, в зависимости от направленности ЭС, дает рекомендации по разрешению проблемы.
Как правило, база знаний экспертной системы содержит факты (статические сведения о предметной области) и правила - набор инструкций, применяя которые к известным фактам можно получать новые факты.
ЭС может функционировать в 2-х режимах.Режим ввода знаний - в этом режиме эксперт с помощью инженера по знаниям посредством редактора базы знаний вводит известные ему сведения о предметной области в базу знаний ЭС.Режим консультации - пользователь ведет диалог с ЭС, сообщая ей сведения о текущей задаче и получая рекомендации ЭС. Например, на основе сведений о физическом состоянии больного ЭС ставит диагноз в виде перечня заболеваний, наиболее вероятных при данных симптомах.
25. Структура баз знаний.
Знания в базе знаний можно разделить на * алгоритмические (процедурные) знания - это алгоритмы, решающие точно определенные конкретные задачи. Пример: любая библиотека программ. * неалгоритмические знания - состоит из мысленных объектов, называемых понятиями. Понятие обычно имеет имя, определение, структуру (составные элементы), оно связано с другими понятиями и входит в какую-то систему понятий. Другие неалгоритмические знания - это связи между понятиями или утверждения о свойствах понятий и связях между ними. На практике во многих экспертных системах содержимое базы знаний подразделяют на "факты" и "правила". Факты - элементарные единицы знания (простые утвержедения о характеристиках объекта), правила служат для выражения связей, зависимостей между фактами и их комбинациями. Таким образом, классификацию знаний можно представить следующим образом: 1)понятия (матем и нематематические); 2)факты; 3)правила, зависимости, законы, связи; 4)алгоритмы и процедуры Прямое использование знаний из базы знаний для решения задач обеспечивается механизмом получения решений (inference engine - машина вывода) - процедурой поиска, планирования, решения. Механизм решения дает возможность извлекать из базы знаний ответы на вопросы, получать решения, формулируемые в терминах понятий, хранящихся в базе. Примеры запросов: * найти объект, удовлетворяющий заданному условию; какие действия нужно выполнить в такой ситуации и т.д.
26. Модели представления знаний.
Традиционно, системы представления знаний (СПЗ) для ИС используют следующие основные виды моделей: Фрейм (рамка) - это единица представления знаний, запомненная в прошлом, детали которой могут быть изменены согласно текущей ситуации. Фрейм представляет собой структуру данных, с помощью которых можно, например, описать обстановку в комнате или место встречи для проведения совещания.
(Список работников: (Фамилия:Иванов);(Год:2012)).
(ИМЯ ФРЕЙМА: (имя 1-го слота: значение 1-го слота), (имя 2-го слота: значение 2-го слота),
(имя N-ro слота: значение N-ro слота)).
Продукционная модель или модель, основанная на правилах, позволяет представить знания в виде предложений типа "Если (условие), то (действие)".
Семантическая сеть (СС) - это граф, дуги которого есть отношения между вершинами (значениями). События - это суждения, факты, результаты наблюдений, рекомендации. (события-признаки, например, "идет дождь" для события "дождливая погода").
Атрибут - это характеризующее событие, имеющее несколько значений. (Например, "погода" атрибут "времени года").
Несколько признаков могут объединяться в комплекс, характеризующий событие в большей степени, чем отдельный признак.Процедура - это специфический компонент сети, выполняющий преобразование информации. Она позволяет вычислять значения одних атрибутов на основании других, оперируя как с числами, так и с символами.
27. Уровни представления знаний.
Данные - это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства. При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:
D1 - данные как результат измерений и наблюдений;
D2 - данные на материальных носителях информации (таблицы, протоколы, справочники);
D3 - модели данных в виде диаграмм, графиков, функций;
D4 - данные в компьютере на языке описания данных;
D5 - базы данных на машинных носителях информации.
Знания основаны на данных, полученных эмпирическим путем. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.
При обработке на ЭВМ знания трансф-ся аналогично данным,
Z1 - знания в памяти человека как результат мышления;
Z2 - материальные носители знаний (учебники, методические пособия);
Z3 - поле знаний - условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;
Z4 - знания, описанные на языках представления знаний (продукционные языки, семантические сети, фреймы);
Z5 - база знаний на машинных носителях информации.
База знаний - основа любой интеллектуальной системы. Знания могут быть классифицированы по следующим категориям:
Поверхностные - знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области.
Глубинные - абстракции, аналогии, схемы, отображающие структуру и природу процессов, протекающих в предметной области. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов
28. Модели представления знаний. Структура фрейма.
Традиционно, системы представления знаний (СПЗ) для ИС используют следующие основные виды моделей: Фрейм (рамка) - это единица представления знаний, запомненная в прошлом, детали которой могут быть изменены согласно текущей ситуации. Фрейм представляет собой структуру данных, с помощью которых можно, например, описать обстановку в комнате или место встречи для проведения совещания.
(Список работников: (Фамилия:Иванов);(Год:2012)).
(ИМЯ ФРЕЙМА: (имя 1-го слота: значение 1-го слота), (имя 2-го слота: значение 2-го слота),
(имя N-ro слота: значение N-ro слота)).
Продукционная модель или модель, основанная на правилах, позволяет представить знания в виде предложений типа "Если (условие), то (действие)".
Семантическая сеть (СС) - это граф, дуги которого есть отношения между вершинами (значениями). События - это суждения, факты, результаты наблюдений, рекомендации. (события-признаки, например, "идет дождь" для события "дождливая погода").
Атрибут - это характеризующее событие, имеющее несколько значений. (Например, "погода" атрибут "времени года").
Несколько признаков могут объединяться в комплекс, характеризующий событие в большей степени, чем отдельный признак.Процедура - это специфический компонент сети, выполняющий преобразование информации. Она позволяет вычислять значения одних атрибутов на основании других, оперируя как с числами, так и с символами.
29. Искусственный интеллект. Определения
Иску́сственный интелле́кт (ИИ, англ. Artificial intelligence, AI) - наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. ИИ связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Искусственный интеллект - это одно из направлений информатики, целью которого является разработка аппаратно-программных средств, позволяющих Пользователю-непрограммисту ставить и решать свои, традиционно считающиеся интеллектуальными задачи, общаясь с ЭВМ на ограниченном подмножестве естественного языкa
Другие определения искусственного интеллекта:
- Научное направление, в рамках которого ставятся и решаются задачи аппаратного или программного моделирования тех видов человеческой деятельности, которые традиционно считаются интеллектуальными.
- Свойство интеллектуальных систем выполнять функции (творческие) человека. При этом интеллектуальная система - это техническая или программная система, способная решать задачи, традиционно считающиеся творческими, принадлежащие конкретной предметной области, знания о которой хранятся в памяти такой системы. - Наука под названием "Искусственный интеллект" входит в комплекс компьютерных наук, а создаваемые на её основе технологии к информационным технологиям. Задачей этой науки является воссоздание с помощью вычислительных систем и иных искусственных устройств разумных рассуждений и действий
30. Искусственный интеллект. Направления исследований
Иску́сственный интелле́кт (ИИ, англ. Artificial intelligence, AI) - наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. ИИ связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами.
Вскоре после признания искусственного интеллекта отдельной областью Haуки произошло разделение его на два направления; нейрокибернетика и "кибернетика черного ящика". Эти направления развиваются практически независимо, существенно различаясь как в методологии, так и в технологии. И только в настоящее время стали заметны тенденции к объединению этих частей вновь в единое целое.
Нейрокибернетика
Основную идею этого направления можно сформулировать следующим образом: Единственный объект, способный мыслить, - это человеческий мозг. Поэтому любое "мыслящее" устройство должно каким-то образом воспроизводить его структуру. Таким образом, нейрокибернетика ориентирована на программно-аппаратное моделирование структур, подобных структуре мозга.
Кибернетика "черного ящика"
Не имеет значения, как устроено "мыслящее" устройство. Главное чтобы на заданные входные воздействия оно реагировало так же, как человеческий мозг. Это направление искусственного интеллекта было ориентировано на поиски алгоритмов решения интеллектуальных задач на существующих моделях компьютеров.
31. Методы поиска знаний
Знания - это закономерности предметной области (принципы, связи, законы) полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.
В системах, база знаний которых насчитывает сотни правил, желательным является использование стратегии управления выводом, позволяющей минимизировать время поиска решения и тем самым повысить эффективность вывода, К числу таких стратегий относятся: Поиск в глубину: в качестве очередной подцели выбирается та, которая соответствует следующему, более детальному уровню описания задачи. Например, диагностирующая система, сделав на основе известных симптомов предположение о наличии определенного заболевания, будет продолжать запрашивать уточняющие признаки и симптомы этой болезни до тех пор, пока полностью не опровергнет выдвинутую гипотезу.
Поиск в ширину, напротив, система вначале проанализирует все симптомы, находящиеся на одном уровне пространства состояний, даже если они относятся к разным заболеваниям, и лишь затем перейдет к симптомам следующего уровня детальности.
Разбиение на подзадачи - подразумевает выделение подзадач, решение которых рассматривается как достижение промежуточных целей на пути к конечной цели. Пример: поиск неисправностей в компьютере - сначала выявляется отказавшая подсистема (питание, память и т. д.), что значительно сужает пространство поиска. Если удается правильно понять сущность задачи и оптимально разбить ее на систему иерархически связанных целей-подцелей, то можно добиться того, что путь к ее решению в пространстве поиска будет минимален.
Альфа-бета алгоритм позволяет уменьшить пространство состояний путем удаления ветвей, неперспективных для успешного поиска, Поэтому просматриваются только те вершины, в которые можно попасть в результате следующего шага
32. Уровни представления данных и знаний
Данные - это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства. При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:
D1 - данные как результат измерений и наблюдений;
D2 - данные на материальных носителях информации (таблицы, протоколы, справочники);
D3 - модели данных в виде диаграмм, графиков, функций;
D4 - данные в компьютере на языке описания данных;
D5 - базы данных на машинных носителях информации.
Знания основаны на данных, полученных эмпирическим путем. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.
При обработке на ЭВМ знания трансф-ся аналогично данным,
Z1 - знания в памяти человека как результат мышления;
Z2 - материальные носители знаний (учебники, методические пособия);
Z3 - поле знаний - условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;
Z4 - знания, описанные на языках представления знаний (продукционные языки, семантические сети, фреймы);
Z5 - база знаний на машинных носителях информации.
База знаний - основа любой интеллектуальной системы. Знания могут быть классифицированы по следующим категориям:
Поверхностные - знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области.
Глубинные - абстракции, аналогии, схемы, отображающие структуру и природу процессов, протекающих в предметной области. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов.
33. Основы теории нечетких множеств.
Теория нечётких множеств - это расширение классической теории множеств, используется в нечёткой логике. В классической теории множеств принадлежность элементов множеству оценивается в бинарных терминах в соответствии с чётким условием - элемент либо принадлежит, либо нет данному множеству. Напротив, теория нечётких множеств разрешает градуированную оценку отношения принадлежности элементов множеству; то есть это отношение описывается при помощи функции принадлежности . Нечёткие множества - это расширение классической теории множеств, поскольку на некотором множестве функция принадлежности может действовать так же, как индикаторная функция, отображая все элементы либо в 1, либо в 0, как в классическом варианте.
Нечёткое число - это выпуклое, нормализованное нечёткое множество. Это можно связать с игрой в пари "предположите ваш вес", где некто предполагает вес соперников, и чем ближе предположения, тем они правильнее, а "побеждает" тот, чьи предположение веса соперников ближе остальных (будучи полностью правильным, когда функцией принадл. равна 1).
Нечёткий интервал - это неопределенное множество со средним интервалом, чьи элементы обладают функцией принадлежности μA(x) = 1. Как и для нечётких чисел, функция принадлежности должна быть выпуклой, нормализованной и по крайней мере кусочно непрерывной.
Нечёткая логика и теория нечётких множеств - раздел математики, являющийся обобщением классической логики и теории множеств. Понятие нечёткой логики было введено профессором Лютфи Заде в 1965 г. В этой работе понятие множества было расширено допущением, что функция принадлежности элемента к множеству может принимать любые значения в интервале [0..1] а не только 0 или 1. такие множества были названы нечеткими. Также автором были предложены различные логические операции над нечеткими множествами и предложено понятие лингвистической переменной, в качестве значений которой выступают нечеткие множества
Документ
Категория
Рефераты
Просмотров
216
Размер файла
768 Кб
Теги
орешки, шпоры
1/--страниц
Пожаловаться на содержимое документа