close

Вход

Забыли?

вход по аккаунту

?

1068.Информационные технологии управления Соловьев А В

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Министерство образования и науки Российской Федерации
Федеральное агентство по образованию
Ярославский государственный университет им. П.Г. Демидова
А.В. Соловьев
Информационные
технологии управления
Учебное пособие
Рекомендовано
Научно-методическим советом университета для студентов,
обучающихся по специальностям Менеджмент организации,
Бухгалтерский учет, анализ и аудит
Ярославль 2006
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 338.2
ББК У 9(2)212я73
С 60
Рекомендовано
Редакционно-издательским советом университета
в качестве учебного издания. План 2006 года
Рецензенты:
доцент ЯГТУ В.Г. Ухтомский;
кафедра проектирования экономических
информационных систем МУБиНТ
Соловьев, А.В. Информационные технологии управС 60 ления: учебное пособие / А.В. Соловьев; Яросл. гос.
ун-т. – Ярославль : ЯрГУ, 2006. – 116 с.
ISBN 5-8397-0488-1 (978-5-8397-0488-6)
Рассматриваются разделы, связанные с общими вопросами, а также со спецификой различных видов информационных технологий, таких как офисные технологии, технологии финансового менеджмента, анализа и
аудита, аналитические интеллектуальные технологии.
Предназначено для студентов экономического факультета всех форм обучения по специальностям 061100
Менеджмент организации и 060500 Бухгалтерский учет,
анализ и аудит (дисциплина "Информационные технологии управления", блоки ЕН, СД), очной формы обучения.
Табл. 7. Рис. 7. Библиогр.: 103 назв.
УДК 338.2
ББК У 9(2)212я73
ISBN 5-8397-0488-1 (978-5-8397-0488-6)
2
© Ярославский
государственный
университет, 2006
© А.В. Соловьев, 2006
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Введение
Данное пособие предназначено для студентов, обучающихся
по экономическим специальностям Менеджмент, Бухгалтерский
учет, анализ и аудит, Финансы и кредит.
В силу ограниченного объема пособия, в него вошла лишь
часть вопросов, связанных с проблемами информационных технологий управления. Естественно, это наиболее существенные
вопросы, составляющие основу курса.
К сожалению, такие темы, как локальные и глобальные технологии поиска информации, включая справочно-правовые технологии, корпоративные информационные технологии, электронный документооборот, проектирование web-сайтов, технологии информационной безопасности и деловой разведки не нашли
места в пособии по указанным выше причинам. В перспективе
они могут составить содержание второй части пособия по информационным технологиям управления.
Данное пособие надо рассматривать как теоретическую компоненту курса, т.е. делается упор на раскрытие содержания разнообразных технологий, используемых в управлении. Практическая часть курса не вошла в пособие по причине ограниченности
объема. Предполагается в дальнейшем дополнить пособие серией
методических указаний, в которых будут подробно рассмотрены
компьютерные методики реализации технологий в виде примеров. Кроме того, в указаниях предполагается дать перечень задач
для самостоятельного решения, тесты и контрольные вопросы
для проверки знаний.
Таким образом, в перспективе предполагается создать полноценный учебник по информационным технологиям. Помимо
пособия и серии методических указаний, учебник будет дополнен
описаниями программ, применяемых в курсе, демо-роликами
программ и презентациями отдельных тем, включенных в программу курса.
3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Глава 1. Основы информационных
технологий управления
1.1. Актуальность, цель, предмет и задачи ИТ
Человечество занималось обработкой информации тысячи
лет, а первые информационные технологии основывались на использовании счетов и книгопечатания. Ускорившееся за последние 40 лет развитие информационной технологии в первую очередь связано с появлением компьютеров. Успехи интегральной
микроэлектроники обусловили ее проникновение почти во все
стороны повседневной жизни, а также привели к многообразному
переплетению различных ее отраслей. Узкий смысл термина «
информационная технология» определился к концу 1970-х годов,
когда его стали употреблять в связи с использованием современной электронной техники для обработки информации.
Информационная технология охватывает всю вычислительную технику и технику связи и отчасти – бытовую электронику,
телевизионное и радиовещание. Она находит применение в промышленности, управлении, торговле, образовании, медицине,
науке и военной сфере.
Объектом исследования в информационной технологии являются не механические и программные средства, а деятельность
человека, т.е. взаимодействие его в системе: человек – ЭВМ – социальная среда. Речь идет о создании и преобразовании моделей
человеко-машинных систем. В этих моделях деятельность по
созданию, использованию и совершенствованию сливается воедино и неразрывно взаимосвязана.
Предметом исследования выступают закономерности становления и развития методов информационной технологии, а
также закономерности построения и функционирования средств
ее реализации.
1.2. Определение ИТ
В первую очередь, следует определиться с основным понятием, то есть с определением сочетания «информационные техно4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
логии» (или ИТ, что является производным от IT – information
technology).
Информационные технологии существовали давно, поэтому с
развитием компьютеров и средств связи начали появляться различные вариации: «информационные и коммуникационные технологии», «компьютерные информационные технологии», «автоматизированные информационные технологии» и др. Конечно,
существует множество определений данного термина.
По определению, принятому ЮНЕСКО, информационная
технология – это комплекс взаимосвязанных, научных, технологических, инженерных дисциплин, изучающих методы эффективной организации труда людей, занятых обработкой и хранением информации; вычислительную технику и методы организации
и взаимодействия с людьми и производственным оборудованием,
их практические приложения, а также связанные со всем этим
социальные, экономические и культурные проблемы.
Информационные технологии (ИТ) — это процессы, использующие совокупность средств и методов сбора, обработки и передачи данных (первичной информации) для получения информации нового качества о состоянии объекта, процесса или явления (информационного продукта). Информационная технология
является процессом, состоящим из четко регламентированных
правил выполнения операций, действий, этапов разной степени
сложности над данными, хранящимися в компьютерах.
Цель информационной технологии — производство информации для ее анализа человеком и принятия на его основе решения по выполнению какого-либо действия.
Информационная технология – сочетание процедур, реализующих функции сбора, получения, накопления, хранения, обработки, анализа и передачи информации в организационной структуре с использованием средств вычислительной техники, или,
иными словами, совокупность процессов циркуляции и переработки информации и описание этих процессов.
Информационная технология – системно организованная для
решения задач управления совокупность методов и средств реализации операций сбора, регистрации, передачи, накопления, поиска, обработки и защиты информации на базе применения развитого программного обеспечения, используемых средств вычис5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
лительной техники и связи, а также способов, с помощью которых информация предлагается клиентам.
Информационная технология представляет собой совокупность внедряемых в той или иной области новых средств и методов обработки информации, представляющих собой целостные
технологические системы, обеспечивающие целенаправленное
создание, передачу, хранение и отображение информационного
продукта с наименьшими затратами в соответствии с закономерностями предметной области.
Информационная технология – совокупность методов, производственных процессов и программно-технических средств,
объединенных в технологическую цепочку, обеспечивающую
сбор, обработку, накопление, хранение, актуализацию, поиск и
распространение информации с целью снижения трудоемкости
процессов использования информационного ресурса, а также повышения их надежности и оперативности.
Под информационной технологией обычно понимают совокупность технологических элементов (устройств и/или методов) и процессов, используемых людьми для обработки информации.
Информационная технология – приобретение, запись, организация, исправление, отображение и распространение информации. В последние годы данный термин чаще всего применяется к
компьютерной обработке информации.
Информационная технология – совокупность технологий,
относящихся к изучению и применению данных и их обработке;
например, автоматическое получение, хранение, обработка
(включая преобразование), управление, перемещение, отображение, коммутация, обмен, передача или получение данных, и разработка и использование аппаратного и программного обеспечения компьютеров и процедур, связанных с этой обработкой.
Под информационными технологиями понимается совокупность методов и технических средств сбора, организации, хранения, обработки, передачи и представления информации, расширяющих знания людей и развивающих их возможности по управлению техническими и социальными процессами.
Информационная технология – термин, который объединяет
все виды технологий, используемых для создания, хранения, об6
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
мена и использования информации в ее различных формах (данные бизнеса, голосовые сообщения, изображения, анимация,
мультимедиа, презентации и др.). Это удобный термин для объединения как телефонных, так и компьютерных технологий в одном понятии.
Информационная технология – совокупность методов, производственных процессов и программно-технических средств,
объединенных в технологическую цепочку, обеспечивающую
сбор, хранение, обработку, вывод и распространение информации
для снижения трудоемкости процессов и использования информационных ресурсов, повышения надежности и оперативности.
Понятие технологии включает применение научных и инженерных знаний для решения практической задачи. Тогда информационной технологией можно считать процесс превращения
знаний в информационный ресурс. Целью информационной технологии является производство информации для ее последующего анализа и принятия на его основе решения по выполнению какого-либо действия.
Анализируя вышеприведенные определения, можно сделать
ряд выводов.
Во всех определениях, приведенных выше, можно отметить
некоторое общее. Главное, отметить такие отличительные особенности, как процессуальность, совокупность методов и
средств, а также перечисление различных действий по работе
с информацией. Примечательно, что в иностранных источниках
комплексное понятие «информационная технология» определяется через базовое понятие «технология», а в определениях, данных
авторами популярных учебников по информатике, дается свое
понимание технологии как «совокупности методов и средств»
или как «процесса». В качестве существенного признака технологии указывается факт преобразования первичной информации в
информационный продукт.
Таким образам, можно сформулировать новое определение,
которое должно учитывать, что существенным признаком любой
технологии является систематизированная последовательность
действий. Итак, информационные технологии — систематизированная совокупность методов, средств и действий по работе с
информацией.
7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Кроме того, Информационная технология – это совокупность
средств и методов, представляющая собой целостную технологическую систему, которая призвана обеспечить эффективность в
процессах деятельности на том или ином иерархическом уровне
за счет эффекта интеграции и взаимодействия элементов информационной технологии, таких, как компьютерные комплексы,
компьютерные сети, интеллектуальные терминалы, комплекс
средств и методов организации массивов данных, кодирования,
поиска информации и др. [CD: Энциклопедия «Информационные
технологии в бизнесе»].
Информационная технология в теоретическом плане является прикладной наукой, а в практическом – инженерной деятельностью по проектированию и созданию конкретных технологических систем обработки данных.
В научном плане источниками информационной технологии
являются:
 системотехника;
 теория вычислительных систем;
 технологии программирования;
 теория баз данных;
 эргономика;
 дизайн и др. прикладные науки информационно- технологического профиля.
Существует иерархия определений ИТУ:
Технология  Информационная технология  Информационная технология управления.
В основе определения ИТУ лежат более общие понятия: технология – как основа всех технологий, информационная технология – как ее часть и, наконец, ИТУ – как часть понятия ИТ.
На становление современных информационных технологий
существенное влияние оказали три фактора:
1) широчайшее внедрение персональных компьютеров;
2) появление и развитие высокоскоростных компьютерных
сетей;
3) становление мощной программной индустрии.
8
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Информационная
технология
управления
Информационная
технология
Технология
Рис. 1. Иерархия определений технологий
9
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Взаимно переплетаясь и обогащаясь научными наработками
в смежных сферах, эти компоненты породили новые направления
в деле обработки информации и создали предпосылки для перехода к информационному обществу.
Новая информационная технология (НИТ)
В последние десять лет довольно популярным стало понятие
новая информационная технология. Наблюдаются различные
подходы к трактовке этого термина.
Под новыми информационными технологиями понимают совокупность внедряемых («встраиваемых») в системы организационного управления принципиально новых методов, способов и
средств обработки данных, представляющих собой целостные
технологические системы и обеспечивающих целенаправленное
создание обработки, передачу, хранение и отображение информационного продукта ( данных, идей, знаний) с наименьшими затратами и в соответствии с закономерностями той социальной
среды, где развивается эта информационная технология.
Новейшие информационные технологии – это специальные
термин, характеризующий использование новейших для данного
этапа развития достижений науки и техники в области информатизации. Понятие «новая» является относительным и может использоваться на определенном отрезке времени. Так называемую
«новизну» информационной технологии придает использование
принципиально новых методов и средств преобразования информации. Основными признаками НИТ на современном этапе являются: использование вычислительной техники, микроэлектроники, методов искусственного интеллекта, а также средств локальных и глобальных ( территориальных ) сетей.
Принципиальное значение современной информационной
технологии состоит в замене машинно-бумажного процесса обработки данных на безбумажный, в котором не только не используются промежуточные носители данных, но и снижается объем
фиксации данных на обычных документах.
В настоящее время информационная технология обрела три
наиболее характерные функции:
10
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1) персонализация вычислений на основе ПЭВМ и систем
интеллектуального интерфейса конечного пользователя с ПЭВМ;
2) использование баз данных и баз знаний;
3) применение вычислительных сетей.
Эти функции реализуются посредством создания универсальных и специализированных информационных (информационно-технических, информационно-технологических) систем и
комплексов.
Признанием того, что ИТ становится не только бурно растущей областью практической инженерной деятельности, но и научной дисциплиной, является появление в системе высшего образования нашей страны нового университетского научнообразовательного направления 511900 «Информационные технологии» с отнесением этого направления к группе «Естественные
науки и математика».
1.3. Классификация
информационных технологий
Классификация информационных технологий предназначена
для систематизации накопленных знаний о них с целью последующего решения задач исследования и практического применения. Под классификацией понимается процесс распределения
множества известных технологий на ряд подмножеств в соответствии с классификационными признаками и установленными
правилами.
Следует отметить, что становление и изучение информационных технологий находится на начальной стадии. Список технологий остается открытым. Поэтому не сложилось единого подхода к их классификации. Иногда деление на группы по какомулибо признаку является довольно условным, и классификационные множества не образуют полную группу.
Информационные технологии можно классифицировать по
следующим критериям:
 функционально-ориентированные технологии;
 предметно-ориентированные технологии;
 проблемно-ориентированные технологии.
11
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 1
Классификация информационных технологий
Традиционные
Новые информационные технологии
Электронная обработка данных
Автоматизация функций управления
По степени охвата
Поддержка принятия решений
задач управления
Электронный офис
Экспертная поддержка
Текстовые технологии
Табличные технологии
По классу реализуемых Технологии баз данных
технологических операций Графические технологии
Мультимедийные технологии
Гипертекстовые технологии
Пакетные
По типу пользовательского
Диалоговые
интерфейса
Сетевые
Локальные
По способу построения
Многоуровневые
сети
Распределенные
Сбора информации
Передачи информации
В соответствии
Накопления информации
с различием
информационных
Обработки информации
процессов
Хранения информации
Представления информации
Бухгалтерский учет
Менеджмент
По обслуживаемым
Налоговая деятельность
предметным областям
Страховая деятельность
Другие
Глобальные
По территории охвата
Региональные
(степени распространения)
Локальные
Функционально-ориентированные
По уровню ориентации
Предметно-ориентированные
Проблемно-ориентированные технологии
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
По способу реализации
в ИС
Проблемно-ориентированные технологии базируются на использовании:
 информационно-поисковых систем;
12
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
 баз данных и баз знаний;
 экспертных систем;
 систем автоматизации научных исследований;
 систем автоматизированного проектирования;
 систем автоматизации профессионального труда;
 систем автоматизации производства;
 обучающих систем;
 настольно-издательских систем;
 систем для перевода с одного языка на другой;
 телеконференций и др.
Проблемно-ориентированные технологии базируются на использовании:
 страховых, финансовых и банковских систем;
 медицинских систем;
 общего и специального профессионального обучения;
 средств массовой информации;
 средств социальной реабилитации;
 игровых и развлекательных систем;
 применений в быту.
По характеру преобладания обрабатываемой информации
выделяют следующие технологии:
 технологии безбумажной информатики (обработка документов);
 технологии искусственного интеллекта (обработка знаний);
 технологии мультимедиа (обработка разной информации).
По ориентации на компоненты информационных систем:
 сетевые технологии (базовое звено технологии – это аппаратная часть информационной системы);
 технологии бах данных и баз знаний (основной объект, на
который нацелена технология – собственно информация, правила
ее накопления, хранения и выдачи потребителям);
 технологии моделирования и технологии программирования математического и программного обеспечения).
По территории охвата (степени распространения):
 глобальные;
 локальные.
13
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Яркий пример глобальной технологии – технология Internet.
Ее глобальность проявляется в различных аспектах. Это распространение по всему миру, многоплановость (включает в себя другие технологии). Сложнее обстоит дело с причислением других
технологий к той или иной группе. Например, технология
Intranet, с одной стороны, ее конкретная реализация распространяется на ограниченную территорию, а с другой стороны, этой
технологией также пользуются по всему миру.
По характеру влияния на реализацию целей информационной
системы:
 основные;
 обеспечивающие.
Принципиально любая технология может быть признана основной. Например, в информационно-поисковых системах это
технология баз данных, в системах принятия решений – технология искусственного интеллекта и технология моделирования. Однако некоторые технологии носят ярко выраженный обеспечивающий характер – технология программирования, технология
защиты информации и др.
Перечень классификационных признаков и соответствующих
им классификационных группировок можно продолжать. Однако
они будут носить частный характер и интересны лишь при более
детальном исследовании вопроса. Представляется целесообразным охарактеризовать наиболее важные информационные технологии.
1.4. Структура ИТ
Структуру ИТ нагляднее всего представить в виде дерева (см.
рис. 2).
Уровень детализации направлен сверху вниз. Каждый нижестоящий уровень детализирует вышестоящий, за исключением
самого верхнего.
Более детально структуру ИТ с точки зрения процессного
подхода можно представить на рис. 2.
14
Рис. 2. Иерархически-процессная структура ИТ
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
15
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Пример
Рассмотрим наиболее простую технологию – технологию
подготовки текстового документа. Работа над текстом с помощью текстового редактора MS Word рассматривалась в курсе
«Информатика». Поэтому многие понятия и приемы работы с
текстом должны быть знакомы студентам, изучающим курс ИТУ.
Итак, целью текстовой технологии является получение информационного продукта – готового текстового документа, например, реферата или курсовой работы.
Для получения этого документа необходимо выполнить ряд
этапов, процедур, операций (см. рис. 3).
Начнем с уровня ИТ. Технология подготовки текстового документа выглядит следующим образом.
Исходная
информация
(черновик)
ИТ текста
Готовый
реферат
Рис. 3. Технология подготовки текстового документа
Если рассмотреть, как выглядит ИТ текста на уровне этапов –
как более детальное описание процесса создания текстового документа, то можно выделить четыре этапа (стадии):
– первый этап – первоначальный набор текста на клавиатуре
и помещение его в оперативную, а также в долговременную память. Главное условие – создать весь текст в виде заготовки (полуфабриката) и сохранить его в надежном месте, например, на
диске.
– второй этап – редактирование набранного на предыдущем
этапе документа и превращение его из полуфабриката в полноценный документ с точки зрения содержания,
– третий этап – форматирование отредактированного документа – приведение документа в полную готовность с точки зрения заданной формы, свойственной документу как реферату,
– четвертый этап – создание реферата в бумажном виде – печать и брошюрование.
Для еще более детального описания технологии создания
текстового документа требуется уточнить, например, как реали16
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
зуется этап редактирования. Для этого перейдем на следующий
уровень детализации – уровень операций. Тогда этап редактирования можно представить как последовательность следующих
операций: исправление орфографических ошибок, исправление
грамматических ошибок, исправление ошибок, связанных с некорректным использованием непечатаемых знаков (пробелов и
символов конца абзаца), и, наконец, структурное редактирование
с использованием понятия «фрагмента текста».
Если требуется еще более детальное описание указанной
технологии, то можно спуститься еще на один уровень – уровень
действия. В этом случае исправление любой ошибки, указанной
на вышестоящем уровне, можно реализовать с помощью одного
из трех возможных действий: удалить, вставить, заменить.
И, наконец, на самом элементарном, нижнем уровне иерархии структуры ИТ можно детализировать действия с помощью
цепочки элементарных операций. Например, удаление ошибочного знака в тексте можно описать с помощью таких элементарных операций, как указание точки ввода символа с помощью
щелчка левой кнопки мышки слева от данного символа и нажатия
клавиши delete на клавиатуре.
Основные выводы, связанные с рассмотрением данного примера, следующие.
1. Данная технология является единственно правильной в
смысле получения информационного продукта заданного качества и формы за минимальный период времени. Для данной технологии характерно то, что все этапы должны быть реализованы
последовательно, так как это описано выше, не перекрывая друг
друга. Специализация в любой деятельности, в том числе и в области компьютерной технологии, приводит к повышению качества и снижению времени изготовления продукта.
2. Данная технология может быть использована и при изготовлении других информационных продуктов: вычислительных
таблиц, диаграмм, графиков, баз данных, презентаций. Например,
вычислительная таблица, созданная с помощью табличного редактора MS Excel, на уровне этапов выглядит следующим образом:
 первоначальное создание вычислительной таблицы с зоной
исходных данных и зоной вычислений;
17
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
 редактирование вычислительной таблицы;
 форматирование вычислительной таблицы;
 использование вычислительной таблицы в режиме: «Если,
то … ».
3. Данная технология на самом элементарном уровне базируется на использовании таких устройств, как мышь и клавиатура,
что делает доступным освоение информационной технологии
любой сложности для широких слоев пользователей.
1.5. Тенденции развития
(взаимодействие с предметом «Информатика»)
ИТУ как дисциплина имеет тесные связи с двумя группами
дисциплин:
Первая группа – дисциплины информационно-математического профиля: информатика, математика, статистика, ИСУ и др.
Вторая группа – дисциплины экономического профиля – менеджмент, бухгалтерский учет, анализ и аудит, маркетинг и др.
С одной стороны, ИТУ является более высокой ступенью
предмета Информатика, так как оба предмета опираются на такие
базовые понятия, как информация, алгоритм, ИТ, ИС, компьютер,
программное обеспечение.
С другой стороны, ИТУ призвано «обслуживать» такие дисциплины, как менеджмент, бухгалтерский учет и др., которые определяют профиль специалиста. В этом случае требуется координация учебных программ основной дисциплины и программы
ИТУ.
В ряде случаев возникает вопрос: где должно быть место той
или иной учебной теме. Например, темы, связанные с офисными
технологиями, вначале раскрываются в курсе информатика, а затем углубляются в курсе ИТУ. Или сходные вопросы рассматриваются параллельно в курсе ИСУ и ИТУ.
Существует проблема координации между дисциплинами во
времени. Например, такая тема, как Презентационные технологии, которая раньше входила в состав ИТУ, может быть частью
курса информатики.
18
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1.6. Требования к уровню знаний студентов
Для успешного освоения дисциплины ИТУ необходимо выполнить требования теоретического и практического характера.
В теоретическом плане студент должен знать основные положения, концепции, термины, из которых состоит «скелет» курса ИТУ. Необходимо давать определения терминам, характеристики и рекомендации по использованию в практике. Знать историю ИТ, представлять сегодняшнюю ситуацию и тенденции
развития ее в будущем.
В практическом плане студент должен уметь применять ИТ
для получения результата в виде документа, который служит основой при принятии решения. При этом студент должен из спектра возможностей, которые существуют в ИТ, выбрать наиболее
эффективный и довести его до результата.
1.7. Контрольные вопросы
1. Дайте определение ИТУ.
2. Укажите цель, задачи, предмет и объект ИТУ.
3. В чем проявляется сходство и различие таких понятий, как
ИТ и ИС?
4.Что вкладывается в понятие «новые информационные технологии»?
5. Как классифицируются ИТ? Приведите примеры.
6. Опишите структуру ИТ. В чем проявляется иерархичность
структуры.
7. Опишите основные этапы подготовки документа (на примере текстового документа).
8. Какие особенности этапа редактирования можно отметить?
9. Какие особенности этапа форматирования можно отметить?
10. Почему рассматриваемая в пособии последовательность
является наиболее эффективной из возможных?
19
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Глава 2.
Офисные информационные технологии
2.1. Информационные технологии
обработки текстовой информации
В повседневной жизни нам часто приходится сталкиваться с
текстовой информацией. В виде текста может быть представлена
самая разнообразная информация, например, это все то, что было
напечатано на бумаге: книги, журналы, газеты, личные и официальные письма и записки, пригласительные билеты, программы
занятий, прайс-листы, визитные карточки, инструкции к бытовым
приборам, каталоги библиотек, видеотек и фонотек, отчеты и
многое другое.
Текстовая информация может возникать из самых различных
источников и иметь самую различную степень сложности по
форме представления. В зависимости от сложности формы представления текстовых сообщений для их обработки могут использоваться самые разнообразные информационные технологии.
Чаще всего на практике в качестве инструментального средства,
предназначенного для автоматизированной обработки текстовой
информации, используются текстовые редакторы (процессоры).
Текстовые редакторы (процессоры) представляют собой программный продукт, обеспечивающий пользователя специальными средствами, предназначенными для создания, обработки и
хранения текстовой информации.
В настоящее время наиболее распространенные редакторы,
используемые для автоматизированной работы с текстом, можно
разделить на несколько типов:
- простейшие редакторы текстов. Их основное предназначение – это создание и редактирование текстов. Этот тип текстовых редакторов, как правило, используется для работы с текстами
компьютерных программ. Примерами данного типа текстовых
редакторов могут служить – Блокнот – как компонент MS Windows vi, Norton Editor, Quick и т.д.
- интегрированные редакторы текстов. Эти редакторы
предназначены для работы с текстами сложной структуры. Такие
20
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
тексты структурно могут состоять из страниц различного формата, таблиц, абзацев различной структуры, графических изображений, иллюстраций и прочих элементов оформления текста, которые могут создаваться в других приложениях (программах) и переноситься в интегрированные редакторы текстов.
Примерами интегрированных редакторов текстов могут служить – Microsoft Word, Лексикон, Ami Pro и т.д.
- гипертекстовые редакторы. Основное предназначение
этих редакторов – работа с текстами, представленными в виде
иерархии текстовых фрагментов. Переход между текстовыми
фрагментами осуществляется по специально установленным
ссылкам, которые принято называть гиперссылки. Примерами
данного типа редакторов могут служить – FrontPage, Homesite,
HotDog и т.д.
- распознаватели текстов. Предназначены эти редакторы
для распознавания и редактирования текстовой информации прочитанной с бумажного носителя сканером. Наиболее широко используемым примером такого типа редактора является
FineReader.
- издательские системы. Используются для подготовки
книг, альбомов, журналов, газет. Издательские системы предназначены для верстки текста при размещении текста на страницах
создаваемого документа, вставке рисунков, использовании различных оформительских шрифтов и т.п. В целом же сегодня различия между мощными редакторами документов и издательскими системами не являются принципиальными. В качестве примеров таких издательских систем можно назвать Corel Ventura
Publisher, Adobe PageMaker, QuarkXPress.
- редакторы научных текстов. Особенность этого класса
редакторов в том, что они обеспечивают подготовку и редактирование научных текстов, содержащих большое количество математических формул, графиков, специальных символов и т.п. Современные текстовые редакторы включают в себя средства подготовки документов с формулами. Выбор того или иного
средства определяется соотношением обычного текста и формул.
Использование редакторов научных текстов оправдано тогда, когда подготавливаемый документ содержит много формул. Примером такого типа редактора является Tex, MathCAD.
21
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В целом можно отметить, что возможные различия между
текстовыми редакторами в настоящее время перестали быть
принципиальными. Тенденция в развитии текстовых редакторов
заключается в создании средств, позволяющих пользователю одновременно работать с текстами и фрагментами документа, содержащими объекты различной природы – таблицы, формулы,
рисунки, графики и т.п. Особенно четко эта тенденция прослеживается в развитии редакторов документов.
Текстовые технологии как средство автоматизации
Таким образом, от понятия «простой текст как объект обработки текстового редактора» мы приходим к понятию «текстовый документ как объект обработки текстового процессора».
Так как основные функции редактора Word рассматриваются
в курсе «Информатика», то при изучении возможностей данного
редактора, применительно к курсу ИТ, необходимо остановиться
на проблеме повышения эффективности работы над текстовым
документом. Дело в том, что, с одной стороны, при создании текстового документа возникает желание использовать «интеллектуальные» возможности Word для экономии времени при выполнении рутинных операций, а, с другой стороны, потенциальные
возможности редактора Word колоссальные. Исходя из этих установок, рассмотрим целый ряд текстовых технологий, основанных на использовании программных средств редактора Word, которые существенно сокращают время некоторых операций работы над текстом, при этом также существенно повышают качество
самого документа.
Общим лейтмотивом рассмотренных ниже приемов, средств,
операций является термин «автоматизация».
Рассмотрение будет строиться по принципу: от простого к
сложному:
 Поиск
 Замена
 Автозамена
 Шаблоны и Мастера
 Макросы
22
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Все приведенные средства направлены на реализацию технологии текстовых документов. При этом полезно будет обращаться к разделу «Введение», где обсуждался вопрос о структуре ИТ.
Поиск как операция позволяет быстро находить искомые
слова, фразы, термины в незнакомом тексте, созданном редактором Word. Специфика данной команды связана с тем, что она не
изменяет сам текст.
Команда Замена, с одной стороны, тесно связана с командой
Поиск, т.к. сама реализация замены как операция невозможна без
предварительного нахождения заданного текста.
Возможности команды Замена таковы, что с ее помощью
можно преобразовать исходный текст до неузнаваемости. Наиболее часто команда Замена применяется на стадии редактирования
для расшифровки сокращений, вводимых ранее на этапе первоначального создания документа. Кроме того, в документах старого типа, созданных редакторами типа Лексикон или Блокнот,
форматирование отступов и границ не соответствует требованиям Word. Поэтому для приведения в порядок формата таких документов можно использовать возможности команды Замена в
роли фильтра и преобразователя.
Команда Автозамена представлена в Word целым комплексом возможностей. Главным достоинством этой команды является возможность формировать индексную базу данных, в которой
заданы исходные слова и слова их заменяющие. Как и команда
Замена, команда Автозамена может быть использована как редактирующая операция, но используется не на стадии редактировании, а на стадии первоначального создания текстового документа при условии заранее созданной индексной базы данных.
Шаблоны и Мастера являются очень эффективными средствами при создании стандартных документов, используемых,
главным образом, в делопроизводстве. Технология, основанная
на использовании Шаблонов и Мастеров, предполагает, что стадии первоначального создания документа, а также его форматирования отсутствуют. Остается лишь отредактировать нужный
шаблон и, предварительно сохранив его на внешнем устройстве,
представить к его использованию.
И, наконец, наиболее мощное и перспективное средство, позволяющее существенно повысить отдачу от применения Word
23
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
при подготовке текста, – это использование Макросов. Идея
Макроса состоит в том, чтобы записать часто повторяющиеся
операции при обработке текста в ходе диалога пользователя с
программой Word в виде инструкций языка VBA (Visual Basic for
Applications), а затем многократно исполнять макрос, применительно к подобным реальным ситуациям. В отличие от предыдущих команд, макросы можно использовать при редактировании,
форматировании, а также на стадии создания готового документа.
Наибольший эффект при использовании макросов достигается
тогда, когда он востребован и (или) он выполняет большое количество различных операций над текстом. При этом знание языка
VBA не имеет значения.
Кроме всего вышеописанного в Word предусмотрена возможность поиска нужного фрагмента текста (символа, слова,
фразы) для последующего редактирования и даже автоматической замены найденного фрагмента на его новую редакцию. Эта
процедура осуществляется командами Найти и Заменить в меню
Правка. Если осуществляется только поиск (замена не требуется), то используется только команда Найти. При ее активизации
открывается окно Найти, имеющее текстовое поле для описания
отыскиваемого фрагмента. Кроме того, здесь указывается направление поиска (вперед, назад, везде), а также другие известные пользователю атрибуты искомого блока (шрифт, язык, регистр и т.п.), после чего необходимо щелкнуть на кнопке окна
Найти далее. Если пользователь не имеет подробных сведений
об атрибутах искомого текста, достаточно задать лишь описание
фрагмента в текстовом поле окна.
Команды Найти и Заменить, в принципе, взаимосвязаны.
Если пользователь после отыскания нужного фрагмента принимает решение об автоматической замене найденного фрагмента
на новую его редакцию, достаточно в окне Найти щелкнуть на
кнопке Заменить, и откроется диалоговое окно Заменить. Это
окно можно открыть и самостоятельно (не из окна Найти), активизируя команду Заменить в меню Правка. Диалоговое окно
Заменить отличается от окна Найти лишь наличием дополнительного текстового поля "Заменить на", куда помещается новая редакция фрагмента. Следует также иметь в виду. что при задании образца (как отыскиваемого, так и замещающего) необхо24
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
димо внимательно следить за правильностью записи, так как программа отыскивает фрагмент на основе полного семантического
соответствия (по абсолютному совпадению). Обратите внимание
на то, что программа не отыскивает (и, следовательно, не заменяет) фрагменты документа, находящиеся во внедренных объектах
(рисунках, диаграммах и т.п.).
2.2. Информационные технологии
табличных данных
Общие сведения
Это средство информационных технологий, позволяющее
решать целый комплекс задач:
1. Прежде всего, выполнение вычислений. Издавна многие
расчеты выполняются в табличной форме, особенно в области
делопроизводства: многочисленные расчетные ведомости, табуляграммы, сметы расходов и т. п. Кроме того, решение численными методами целого ряда математических задач удобно выполнять в табличной форме. Электронные таблицы представляют
собой удобный инструмент для автоматизации таких вычислений. Решение многих вычислительных задач на ЭВМ, которые
раньше можно было осуществить только путем программирования, стало возможно реализовать.
2. Математическое моделирование. Использование математических формул в ЭТ позволяет представить взаимосвязь между
различными параметрами некоторой реальной системы. Основное свойство ЭТ — мгновенный пересчет формул при изменении
значений входящих в них операндов. Благодаря этому свойству,
таблица представляет собой удобный инструмент для организации численного эксперимента:
— подбор параметров,
— прогноз поведения моделируемой системы,
— анализ зависимостей,
— планирование.
Дополнительные удобства для моделирования дает возможность графического представления данных (диаграммы);
3. Использование электронной таблицы в качестве базы данных. Конечно, по сравнению с СУБД электронные таблицы име25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ют меньшие возможности в этой области. Однако некоторые операции манипулирования данными, свойственные реляционным
СУБД, в них реализованы. Это поиск информации по заданным
условиям и сортировка информации.
В электронных таблицах предусмотрен также графический
режим работы, который дает возможность графического представления (в виде графиков, диаграмм) числовой информации,
содержащейся в таблице.
Основные типы данных:
 числа, как в обычном, так и в экспоненциальном формате,
 текст – последовательность символов, состоящая из букв,
цифр и пробелов,
 формулы. Формулы должны начинаться со знака равенства,
и могут включать в себя числа, имена ячеек, функции (математические, статистические, финансовые, текстовые, дата и
время и т.д.) и знаки математических операций.
Электронные таблицы просты в обращении, быстро осваиваются непрофессиональными пользователями компьютера и во
много раз упрощают и ускоряют работу бухгалтеров, экономистов, ученых.
Пользователям в процессе работы с информацией очень часто обрабатываемую информацию приходится представлять в виде
таблиц. Это имеет место при создании и ведении бухгалтерских
книг, банковских счетов, смет, ведомостей, при составлении планов и распределении ресурсов предприятий, при выполнении научных исследований. Стремление к автоматизации такого вида
работ привело к созданию специализированных программных
средств для обработки информации, представляемой в табличной
форме. Такие программные средства называют табличными
процессорами или электронными таблицами. Табличные процессоры позволяют не только создавать таблицы, но и автоматизировать обработку табличных данных. Созданные вначале для
выполнения только расчетных операций электронные таблицы по
мере их совершенствования оказались эффективными и при решении более сложных задач, например, таких как:
Виды преобразования:
 обработка статистических данных,
 оптимизация,
26
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
 прогнозирование и т.д.
Функции управления:
 менеджмент
 бухгалтерский учет и аудит
 экономический анализ
 маркетинг
 страховая деятельность
 финансы и кредит
 другие виды.
Этапы обработки табличных данных
При работе с табличными данными пользователь обычно
проходит ряд типичных этапов, которые характерны и для текстовых документов:
1. Первоначальное создание вычислительной таблицы в памяти компьютера. Сущность данного этапа заключается в разработке структуры табличной информации, установлении формы
размещения данных в элементах таблицы, вводе исходных данных, расчетных формул, функций и необходимой текстовой информации.
2. Редактирование таблицы. После выполнения пробных расчетов может возникнуть необходимость редактирования как исходных числовых данных, так и всех других компонентов информации, содержащейся в таблице.
3. Форматирование таблицы. Этот этап обеспечивает представление табличной информации в наиболее приемлемой для
пользователя форме.
4. Использование таблицы, т.е. обработка табличных данных с использованием формул и специальных функций. На
этом этапе у пользователя появляется возможность получить необходимые итоговые данные (например, в сметах и ведомостях),
установить численные значения данных, представленных в ячейках таблицы в виде формул. В ряде случаев возникает необходимость проведения аналитической обработки данных, например,
при решении задач по подбору параметра, обеспечивающего выполнение определенных условий, а также проведении оптимизационных исследований.
Кроме того, как правило, использование таблицы дополняется построением диаграмм и графиков, которые дают нагляд27
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ное представление о числовой информации, содержащейся в различных фрагментах таблицы.
В табличной технологии существуют, естественно, свои отличия от описанной ранее этапности реализации текстовой технологии. Например, первоначально таблицу можно создавать и в
редакторе Word, но в Excel они имеют вычислительный блок, состоящий из формул.
Заключительный этап табличной технологии также имеет
принципиальное отличие от такого же в текстовой технологии.
Готовая вычислительная таблица предназначена, главным образом, для проведения различных расчетов по схеме «Что, если»,
т.е. вводя различные исходные данные, можно сразу получать
выходные данные в таблице. Кроме того, результатом использования таблицы являются получаемые на основе данных таблицы
диаграммы и графики, которые в наглядной графической форме
показывают итоги табличных расчетов.
Технология факторного анализа методами
«что, если?» (What-if)
В экономическом управлении в условиях рынка исключительно важен принцип опережения, предвидения ситуации. С
этим связаны довольно сложные аналитические расчеты (методами прямого счета, математико-статистического анализа, оптимизации, графического моделирования тенденций и др.).
Весьма распространены также относительно простые методы
анализа, обобщенно называемые «что, если» и, как их варианты, – методы анализа чувствительности прогнозов, которые широко применяются в стратегическом менеджменте (финансовом,
маркетинговом, производственном).
Средства однофакторного анализа «что, если» позволяют построить одномерную таблицу чувствительности (таблицу с одним
входом), чтобы увидеть, как изменение значений одного фактора
будет влиять на интересующие нас данные. Эти средства являются основой технологий «Базовая однофакторная таблица» и «Однофакторная таблица в базе данных».
Средства двухфакторного анализа позволяют проанализировать одновременное влияние изменения двух факторов на интересующий нас показатель. Это является основой технологии
28
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
«Двухфакторная таблица» (таблица с двумя входами), которая
может использоваться автономно, а также как дополнение к ранее
составленным плановым или прогнозным таблицам (с целью анализа чувствительности ранее полученных прогнозов к двум факторам).
Метод двухфакторной таблицы
В двухфакторной модели имеются две клетки ввода: один
фактор расположен в левом столбце (фактор-столбец), второй – в
верхней строке (фактор-строка). На их пересечении не пустая
клетка, а клетка единственной формулы, связывающей оба фактора. Клетки ввода всегда лежат за пределами расчетной таблицы. Корректировка аналогична однофакторной модели.
ТЕХНОЛОГИИ КОРРЕЛЯЦИОННО-РЕГРЕССИОННОГО
АНАЛИЗА
Предпосылки корреляционно-регрессионного анализа
Экономические данные почти всегда представлены в виде
таблиц. Числовые данные, содержащиеся в таблицах, обычно
имеют между собой явные (известные) или неявные (скрытые)
связи.
Явно связаны показатели, которые получены методами прямого счета, т. е. вычислены по заранее известным формулам. Например, проценты выполнения плана, уровни, удельный вес, отклонения в сумме, отклонения в процентах, темпы роста, темпы
прироста, индексы и т.д.
Связи же второго типа заранее неизвестны. Однако люди
должны уметь объяснять и предсказывать (прогнозировать)
сложные явления для того, чтобы управлять ими. Поэтому специалисты с помощью наблюдений стремятся выявить скрытые
зависимости и выразить их в виде формул, т.е. математически
смоделировать явления или процессы. Одну из таких возможностей предоставляет корреляционно-регрессионный анализ.
Специалисты строят и используют математические модели
для трех обобщенных целей:
• для объяснения;
• для предсказания;
• для управления.
29
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Представление экономических и других данных в электронных таблицах в наши дни стало простым и естественным. Оснащение же электронных таблиц средствами корреляционнорегрессионного анализа способствует тому, что из группы сложных, глубоко научных и потому редко используемых, почти экзотических методов, корреляционно-регрессионный анализ превращается для специалиста в повседневный, эффективный и оперативный аналитический инструмент. Однако, в силу его
сложности, освоение его требует значительно больших знаний и
усилий, чем освоение простых электронных таблиц.
Пользуясь методами корреляционно-регрессионного анализа,
аналитики измеряют тесноту связей показателей с помощью коэффициента корреляции. При этом обнаруживаются связи, различные по силе (сильные, слабые, умеренные и др.) и различные
по направлению (прямые, обратные). Если связи окажутся существенными, то целесообразно будет найти их математическое выражение в виде регрессионной модели и оценить статистическую
значимость модели. В экономике значимое уравнение используется, как правило, для прогнозирования изучаемого явления или
показателя.
Поэтому регрессионный анализ называют основным методом
современной математической статистики для выявления неявных
и завуалированных связей между данными наблюдений. Электронные же таблицы делают такой анализ легко доступным. Из
множества видов этого анализа мы рассмотрим те, которые используются наиболее часто в качестве универсальных инструментов познания действительности. При этом предполагается,
что студент знаком с теоретическими основами корреляционнорегрессионного анализа из предшествующих учебных дисциплин.
Корреляционно-регрессионный анализ связей между переменными показывает, как один набор переменных (X) может
влиять на другой набор (У).
Таким образом, регрессионные вычисления и подбор хороших уравнений – это ценный, универсальный исследовательский
инструмент в самых разнообразных отраслях деловой и научной
деятельности (маркетинг, торговля, медицина и т. д.). Имея такой
инструмент на своем компьютере и усвоив технологию использо30
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
вания этого инструмента, можно применять его по мере необходимости, получая знание о скрытых связях, улучшая аналитическую поддержку принятия решений и повышая их обоснованность.
Этапы корреляционно-регрессионного анализа
Нулевой этап – это сбор данных. Как в строительстве нулевой цикл обеспечивает фундамент будущему зданию, так в корреляционно-регрессионном анализе решающую роль играет качество данных. Сбор данных создает фундамент прогнозам. Поэтому имеется ряд требований и правил, которые следует соблюдать
при сборе данных.
Данные должны быть наблюдаемыми, т.е. полученными в результате замера, а не расчета. Наблюдения следует спланировать.
Сколько необходимо данных для получения хорошего уравнения? По мнению одних статистиков, данных необходимо в 4-6
раз больше, чем число факторов, влияние которых хотят выразить математически, по мнению других – в 7-8 раз больше числа
факторов.
Чем больше неодинаковых (не повторяющихся) данных и
чем они однороднее, тем лучше получится уравнение, если связи
существенны. Подозрительные данные могут быть вызваны
ошибками наблюдений и экспериментов. Например, данные о
размерах заработка рабочих завода выражены трехзначными числами, но обнаружены одно пятизначное и одно однозначное числа – для упрощения анализа до начала решения такие данные рекомендуется отбрасывать (исключать из массива).
После подготовки данных начинается их обработка.
Первый этап – корреляционный анализ. Его цель – определить характер связи (прямая, обратная) и силу связи (связь отсутствует, связь слабая, умеренная, заметная, сильная, весьма сильная, полная связь). Корреляционный анализ создает информацию
о характере и степени выраженности связи (коэффициент корреляции), которая используется для отбора существенных факторов, а также для планирования эффективной последовательности
расчета параметров регрессионных уравнений. При одном факторе вычисляют коэффициент корреляции, а при наличии нескольких факторов строят корреляционную матрицу, из которой выяс31
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
няют два вида связей: (1) связи зависимой переменной с независимыми, (2) связи между самими независимыми.
Рассмотрение матрицы позволяет, во-первых, выявить факторы, действительно влияющие на исследуемую зависимую переменную, и выстроить (ранжировать) их по убыванию связи; вовторых, минимизировать число факторов в модели, исключив
часть факторов, которые сильно или функционально связаны с
другими факторами (речь идет о связях независимых переменных
между собой).
Известно, что наиболее надежными на практике бывают одно- и двухфакторные модели.
Если будет обнаружено, что два фактора имеют сильную или
полную связь между собой, то в регрессионное уравнение достаточно будет включить один из них. Почему? Приведем приблизительную и ненаучную аналогию: вы одновременно выслушиваете
двух различных и одинаково информированных информаторов,
говорящих об одном и том же. Скорей всего, что вы скажете им:
«Говорите по одному».
Пример из экономической практики: в одно регрессионное
уравнение нельзя одновременно включать переменные «Количество работающих» и «Производительность труда» как независимые (поскольку показатель производительности труда получают
делением выработки работников на количество работающих) –
здесь имеет место полная связь. Аналогично будут связаны также
показатели прибыли и издержек, поскольку прибыль вычисляют
вычитанием издержек из доходов. Исключение одной из каждой
пары названных переменных повысит значимость уравнения в
целом; при этом исключать следует показатель, полученный не
наблюдением (замером или счетом), а вычислением. Грамотные
специалисты, хорошо знающие связи показателей, проблемы такого рода устраняют еще на этапе сбора и подготовки данных.
Если же данные собраны беспорядочно, без предварительного
плана, модель оказывается ограниченной и практически мало надежной.
Второй этап – расчет параметров и построение регрессионных моделей. Здесь стремятся отыскать наиболее точную меру
выявленной связи, для того чтобы можно было прогнозировать,
32
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
предсказывать значения зависимой величины Y, если будут известны значения независимых величин X1, Х2, .... Хп.
Эту меру обобщенно выражают математической моделью
линейной множественной регрессионной зависимости:
ЭВМ вычисляет параметры модели: свободный член ао (константа, или пересечение) и коэффициенты bn (коэффициенты
регрессии). Величину Y называют откликом, а Х1, Х2., ..., Хп –
факторами или предикторами.
Осуществление второго этапа сильно зависит от выводов, которые получены при анализе корреляционной матрицы. Можно
значительно ускорить проведение регрессионного анализа и снизить затраты на исследование, если принять правильную стратегию поиска наилучшего уравнения. Для этого необходимо знать
основные и наиболее эффективные методы поиска наилучшего
уравнения (рассматриваются далее отдельным пунктом).
После получения каждого варианта уравнения обязательной
процедурой является оценка его статистической значимости, поскольку главная цель – получить уравнение наивысшей значимости, поэтому второй этап корреляционно-регрессионного анализа
неразрывно связан с третьим. Однако в связи с тем, что расчеты
выполняет ЭВМ, а решение на основе оценки значимости уравнения принимает исследователь (принять или отбросить уравнение), условно можно выделить третий этап этой человекомашинной технологии как интеллектуальный немашинный этап,
для которого почти все данные по оценке значимости уравнения
подготавливает ЭВМ.
На третьем этапе выясняют статистическую значимость, т.е.
пригодность постулируемой модели для использования ее в целях предсказания значений отклика. При этом программа уже
рассчитала по модели теоретические значения для ранее наблюдаемых значений зависимой величины и вычислила отклонения
теоретических значений от наблюдаемых значений. На основе
этого программа построила также ряд графиков, в т.ч. график
подборки (он иллюстрирует, насколько хорошо подобрана линия
регрессии к наблюденным данным) и график остатков. Исследователь должен рассмотреть эти графики. В остатках не должно
наблюдаться закономерности, т.е. корреляции с какими-либо значениями (если она есть, то в модель не включен какой-то законо33
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
мерно действующий, но не известный, скрытый фактор, о котором нет данных). Для оценки качества полученной модели программа вычислила также целый ряд коэффициентов, которые
обязан рассмотреть исследователь, сравнивая их с известными
статистическими критериями и оценивая модель с точки зрения
здравого смысла. На четвертом этапе корреляционно-регрессионного исследования, если полученная модель статистически значима, ее применяют для прогнозирования (предсказания), управления или объяснения.
Если же обнаружена незначимость, то модель отвергают,
предполагая, что истинной окажется какая-то другая форма связи, которую надо поискать. Например, с самого начала работы
(как бы по умолчанию) строилась и проверялась линейная регрессионная модель. Незначимость ее служит основанием для того, чтобы отвергнуть только линейную форму модели. Возможно,
что более подходящей будет нелинейная форма модели.
Инструментарий EXCEL и пример решения
множественной регрессионной задачи
В русифицированной версии EXCEL для корреляционнорегрессионного анализа используются средства специального
статистического модуля. Microsoft заказывала разработку этого
модуля фирме, специализирующейся на программном обеспечении математико-статистических задач. Модуль включает в себя
два вида средств математико-статистического анализа: функции и
инструменты. Статистические функции (80 функций) вызываются через окно Мастер функций. Функция КОРРЕЛ (расчет корреляции между двумя множествами данных) запрашивает два исходных множества (массива) данных и выдает коэффициент корреляции в ту клетку, куда был установлен курсор перед
обращением к функции. Вы можете использовать эту функцию в
простом (однофакторном) регрессионном анализе.
Множественный корреляционно-регрессионный анализ в основном ориентирован на средства дополнительного пакета Анализ данных. Активизация команды Сервис ¦ Анализ данных открывает окно Инструменты анализа, предоставляющее 19 статистических инструментальных средств. Среди них – Корреляция и
34
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Регрессия, непосредственно и эффективно поддерживающие простой и множественный корреляционно-регрессионный анализ.
С помощью инструмента Корреляция можно получить корреляционную матрицу парных коэффициентов за один прием, что
было проблемой в электронных таблицах других типов.
Технология решения линейной оптимизационной
задачи
Сущность методов оптимизации изучается в других учебных
дисциплинах, обычно ранее, поэтому здесь лишь «наводится
мост» между имеющимися знаниями и возможностями Excelтехнологии. При этом пример приводится без описания математической формулировки задачи, как это и делается в повседневной деловой практике использования Excel-оптимизатора специалистом, когда задача решается с целью быстрого получения и
использования результатов. Здесь показан процесс решения задачи, а не способы ее предшествующего (докомпьютерного) описания. В курсовой же, дипломной или научной работе вы должны
показать глубокое понимание теоретической сущности метода и
корректно описать математическую модель задачи, прежде чем
начнете анализировать результаты или технологию решения,
обусловленную сущностью метода и компьютерным инструментарием.
Электронные таблицы дают возможность пользователю решать оптимизационные задачи различного типа без затрат времени на описание и программирование. Если пользователь хорошо
понимает сущность стоящей перед ним задачи, ее тип и метод
решения, а также владеет специальным инструментарием электронной таблицы, то решение представляет собой удобную и эффективную процедуру.
На этапах ознакомления с условием задачи и планирования
решения, после ввода исходных данных, в диалоге с Excel пользователь указывает ячейку целевой функции и ее экстремум, задает ячейки для выдачи решения, вводит несложные арифметические формулы и устанавливает ограничения. Этот процесс, в
сущности, и является определением (описанием) задачи, в результате которого в Excel как бы по умолчанию создается математическая модель конкретной оптимизационной проблемы, ав35
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
томатически поддерживаемая имеющимися программными средствами.
На самом же деле диалоговые (интерфейсные) и программные средства, а также процесс определения задачи обусловлены
спецификой модели оптимизационной проблемы. Если задача
определена корректно, т. е. в соответствии с этой спецификой, то
после инициализации расчета будет получено решение; в противном случае будет выдано сообщение о невозможности получения
решения.
Программа предоставляет удобные средства для накопления
описаний оптимизационных проблем (моделей), а также для сохранения вариантов решений (на основе моделей) в виде трех типов отчетов стандартизованной формы или в виде сценариев. Это
обусловило широкое использование оптимизатора высококвалифицированными менеджерами-аналитиками для «проигрывания»
серии сценариев, т. е. для проектирования и исследования различных альтернатив решений.
Три признака оптимизационной задачи
Задачи, решаемые с помощью оптимизатора, имеют три характерных признака:
наличие (1) целевой ячейки,
(2) изменяемых ячеек,
(3) ограничивающих ячеек.
Имеется единственная целевая ячейка. В нее пользователь
должен ввести формулу, указав позднее в программном диалоге,
какой экстремум необходим (максимум или минимум). После завершения построения модели и инициализации расчета программа автоматически должна добиться для этой ячейки экстремального результата. Формула будет вычислять целевой показатель,
например, чистую прибыль или издержки, при автоматическом
варьировании значений других (изменяемых) ячеек. Для целевой
ячейки в программном диалоге (а не в самой ячейке) можно установить и конкретное целевое значение, если для его достижения
необходимо будет подбирать значения взаимосвязанных с ней
ячеек. Иными словами, возможно решение обратных задач типа
«Необходим миллион прибыли! Каким образом (how can) мы
можем этого добиться?». Первый сценарий: сколько ресурса для
этого потребуется при тех же ценах, или (второй сценарий) какой
36
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
для этого должна быть цена продукции при тех же ресурсах, или
(третий сценарий) какой должна быть цена ресурса при той же
цене продукции? Задачи такого типа относят к how саn-анализу.
В формуле целевой ячейки должны быть сделаны ссылки на
одну или более изменяемых ячеек, от значений которых зависит
результат. Они могут быть названы также неизвестными или переменными для решения. Функция Solver (Решить уравнение) устанавливает значения изменяемых ячеек так, чтобы найти для
формулы целевой ячейки оптимальное решение. В большинстве
версий электронных таблиц изменяемых ячеек может быть до 100
в одном решении.
Ограничивающих ячеек может быть не менее одной на каждую изменяемую ячейку. Может существовать и некоторое количество дополнительных ячеек ограничений, например, ограничение по объему ресурса и ограничения по спросу (минимальный
спрос, максимальный спрос). Общее же количество всех ячеек,
занятых под описание оптимизационной проблемы, в программе
Excel не может быть более 1000. Поэтому при описании задач
большой размерности следует стремиться экономно использовать
рабочее пространство электронной таблицы, компактно размещая
ячейки различных категорий.
Какие же типы задач подходят под эти признаки и, следовательно, могут решаться с помощью оптимизатора?
Задачи о перевозках: например, минимизация расходов по
доставке товаров с нескольких фабрик в несколько магазинов с
учетом спроса.
Задачи распределения рабочих мест: например, минимизация
расходов на содержание штата с соблюдением требований, определенных законодательством.
Управление ассортиментом товаров: извлечение максимальной прибыли с помощью варьирования ассортиментным набором
товаров (при соблюдении требований клиентов).
Аналогичная задача возникает при продаже товаров с разной
структурой затрат, рентабельностью и показателями спроса.
Замена или смешивание материалов: например, манипуляция
материалами с целью снижения себестоимости, поддержания необходимого уровня качества и соблюдения требований потребителей.
37
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Место оптимизатора в группе аналитических методов
Среди методов, включенных в банк аналитических методов
Excel, оптимизатор занимает особое место. Полезно сравнить его
с другими методами по математической сущности, алгоритмической сложности расчетов и аналитическим целям в поддержке
решений. Рассмотренные ранее однофакторный и двухфакторный
методы вариантного анализа «что, если» по математической
сущности и алгоритмической сложности не сопоставимы с методами оптимизационных расчетов. Анализ «что, если» базируется
на методах прямого счета (таблицы подстановки), прост для понимания и поэтому всегда присутствует в меню электронных
таблиц, т.е. входит в минимум загружаемых возможностей Excel.
В рекламно-протребительском смысле оптимизацию относят к
методам «что, если», однако программный инструментарий оптимизатора, в силу его сложности и объема, не входит в минимум
загружаемых возможностей электронной таблицы, а разворачивается особо, как надстройка.
Мощный инструмент Solver (Оптимизатор) обычно не применяется рядовыми пользователями Excel. Средства оптимизационных расчетов предназначены для высококвалифицированного
менеджера, владеющего математическими методами поиска оптимального решения сложной специальной проблемы.
Технологии анализа и прогнозирования
на основе трендов
Используемые концепции: математическое и графическое
моделирование рядов динамики.
Используемые инструменты Excel:
построитель рядов, мастер диаграмм, вставка тренда — Insert
Trend,
однофакторные табличные модели "что, если" — Data, Table
(Таблица подстановки);
описательные статистики (Descriptive statistics);
статистические
функции:
прогноз –
FORECAST
(ПРЕДСКАЗ), стандартное отклонение по выборочной совокупности – STDEV (СТАНДОТКЛОН), стандартное отклонение по
генеральной совокупности STDEP (СТАНДОТКЛОНП), число
38
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
наблюдений – COUNT (СЧЕТ), доверительный интервал –
CONFIDENCE (ДОВЕРИТ).
Предполагается, что студент уже знаком с сущностью статистического моделирования рядов динамики и основными формами трендов.
Методы корреляционного, регрессионного анализа и анализа
динамических рядов являются важным повседневным инструментарием современного менеджера-аналитика, имеющего на рабочем столе деловую офисную систему и в ее составе – табличный
процессор Excel. В новом классе задач, рассматриваемых в этой
теме, известен динамический ряд, состоящий только из двух элементов данных (времени и изменяющегося уровня показателя), и
нет никаких других данных о конкретных факторах. Когда желают
выяснить общую тенденцию изменения, не имея времени на поиск
данных об уровнях влияния отдельных факторов, то возникает необходимость прогнозировать на основе ряда динамики, искусственно принимая на роль единственного фактора числовые значения времени. Такой метод широко используется при анализе и
прогнозировании макроэкономических тенденций, а также в менеджменте и маркетинге, поскольку итоговый результат действия
главных факторов развития как бы обобщен временем.
Для того, чтобы выявить общую тенденцию развития и на ее
основе определить прогноз, анализ рядов динамики вполне достаточен. Но для управления изменениями (ускорения или замедления развития) необходим детальный анализ многих различных
факторов, оказывающих непосредственное влияние на изменения
показателя. В таких случаях вам помогут инструменты корреляционно-регрессионного анализа и анализа «что, если». Известно,
что к динамическим рядам корреляционный анализ не применим,
поскольку независимая переменная, т. е. время, изменяется не
случайно.
Анализ полученных трендов и прогнозирование
Любой тренд – это упрощение реальности, вынужденное "отрешение" от реально действовавших факторов, их отсечение. Поэтому конечный результат формального моделирования всегда
должен оцениваться пользователем с точки зрения здравого
смысла на основе неформального комплекса знаний об условиях
39
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
развития процесса, о допустимых предельных значениях показателя и т. п.
На одном наборе исходных данных можно получить до 9
уравнений трендов. Задача исследователя состоит в отборе наилучшего тренда, по которому можно было бы построить надежный прогноз. Менеджер, имеющий опыт моделирования трендов,
понимающий условия развития процесса и общий тип сценария
(оптимистический, реалистический, пессимистический), возможно, не станет перебирать все альтернативные типы, хорошо зная
традиционные зависимости, характерные для конкретных экономических показателей (доходов, прибыли, издержек, запасов и т.
п.). В противном случае необходимо исследовать максимум альтернатив для поиска уравнения с наивысшим значением коэффициента детерминации, приближающимся к единице.
В Excel для оценки качества уравнения тренда (проверки истинности тренда) автоматически выводится только коэффициент
детерминации (R2), что является недостатком программы.
2.3. Информационные технологии баз данных
Роль базы данных в экономике
База данных концентрирует в себе данные о производственной деятельности фирмы, включая такие функции, как сбыт, производство, снабжение. Кроме того, в базах данных сосредоточена
информация об использовании основных ресурсов предприятия,
таких как: основные средства, сырье и материалы, готовая продукция, персонал. Информация в базу данных может также поступать из внешнего окружения фирмы. Специалисты должны владеть основными технологическими операциями по работе в среде
баз данных. В базе данных собираются сведения о ежедневных
продажах, передаваемые торговыми агентами фирмы на главный
компьютер, или сведения о еженедельных поставках сырья.
Могут ежедневно по электронной почте поступать с биржи
сведения о курсе валют или котировках ценных бумаг, в том числе и акций этой фирмы, которые ежедневно корректируются в
соответствующем массиве базы данных.
Информация из базы данных поступает на вход компьютерных приложений (программ), таких, как текстовый процессор,
40
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
табличный процессор, электронная почта, компьютерные конференции и др. Любое компьютерное приложение автоматизированного офиса обеспечивает работникам связь друг с другом и с
другими фирмами.
Общие понятия
В базовом курсе «Информатика» данный информационный
объект и программные средства, предназначенные для его обработки, как правило, не рассматриваются. Поэтому вначале необходимо дать базовые сведения о базах данных и средствах их обработки.
Базы данных – совокупность предназначенных для машинной обработки данных, которая служит для удовлетворения нужд
большого количества пользователей (в рамках одной или нескольких организаций).
Более формальное определение базы данных (БД) – поименованная, целостная, единая система данных, организованная по
определенным правилам, которые предусматривают общие принципы описания, хранения и обработки данных.
База данных – это информационная модель, позволяющая
упорядоченно хранить данные о группе объектов, обладающих
одинаковым набором свойств. База данных состоит из записей.
Каждая запись содержит информацию об одном экземпляре. Например, каждая запись базы данных «Персонал предприятия» содержит информацию только об одном объекте — отдельном работнике.
Записи состоят из полей. Каждое поле содержит информацию
об одной характеристике экземпляра. Например, запись базы
данных «Персонал предприятия» состоит из следующих полей:
«ФИО», «Должность» и «стаж», и т.д., где наименования полей
характеризует конкретный объект.
Следует обратить внимание, что каждая запись состоит из
одинаковых полей. Некоторые поля могут быть не заполнены,
однако они все равно присутствуют в записи.
Информацию компьютерных баз данных обычно выводят на
экран в виде таблиц. Поэтому в литературе довольно часто вместо словосочетания «файл данных» используется словосочетание
«таблица данных» или просто «таблица».
41
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В простейшем случае источником информации для программы, работающей с базой данных, может быть вся таблица. Однако, как правило, пользователя интересует не вся информация, находящаяся в базе данных, а только какая-то ее часть. Он выбирает и просматривает только некоторые, удовлетворяющие его
запросу записи. Поэтому в модель базы данных помимо таблицы,
представляющей собой всю базу данных, было введено понятие
запроса, являющегося выборкой, т.е. группой записей базы данных.
Классификация баз данных
Реляционная база данных, по сути, представляет собой двумерную таблицу.
База данных
Иерархические
По структуре организации данных
Табличные
(реляционные)
Распределенные (используются в локальных
и глобальных
компьютерных сетях)
По способу
хранения данных
Централизованные
(на одном
компьютере)
Документальные
архивы
Фактографические
(картотеки)
По характеру хранимой информации
Рис. 4. Классификация баз данных
Столбцы таблицы называются полями: каждое поле характеризуется своим именем и топом данных. Поле БД – это столбец
таблицы, содержащий значения определенного свойства.
В реляционной БД используются четыре основных типа полей:
 Числовой,
 Символьный (слова, тексты, коды и т.д.),
42
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
 Дата (календарные даты в форме «день/месяц/год»),
 Логический (принимает два значения: «да» – «нет» или
«истина» – «ложь»).
Строки таблицы являются записями об объекте. Запись
БД – это строка таблицы, содержащая набор значения определенного свойства, размещенный в полях базы данных.
Программное обеспечение, предназначенное для работы с базами данных, называется системой управления базами данных
(СУБД). СУБД используются для упорядоченного хранения и обработки больших объемов информации.
СУБД организует хранение информации таким образом, чтобы ее было удобно:
 просматривать,
 пополнять,
 изменять,
 искать нужные сведения,
 делать любые выборки,
 осуществлять сортировку в любом порядке.
 хранение большого объема информации;
 быстрый поиск требуемой информации;
 добавление, удаление и изменение хранимой информации;
 вывод ее в удобном для человека виде.
Системы управления базами данных позволяют объединять
большие объемы информации и обрабатывать их, сортировать,
делать выборки по определенным критериям и т. п.
Современные СУБД дают возможность включать в них не
только текстовую и графическую информацию, но и звуковые
фрагменты и даже видеоклипы.
Простота использования СУБД позволяет создавать новые
базы данных, не прибегая к программированию, а пользуясь
только встроенными функциями. СУБД обеспечивают правильность, полноту и непротиворечивость данных, а также удобный
доступ к ним.
Популярные СУБД – FoxPro, Access for Windows, Paradox.
Для менее сложных применений вместо СУБД используются информационно-поисковые системы (ИПС), которые выполняют
следующие функции:
43
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Работа с базами данных является практической повседневной
необходимостью огромного числа специалистов самых разных
сфер деятельности. Такое разнообразие связано с различными
особенностями обработки и ведения баз данных, структурой их
расположения на компьютерах, включенных в сеть, а также существенными различиями в количестве информации, хранимой в
базах данных. В том случае, когда количество данных в базе не
слишком велико, может оказаться целесообразным использовать
более простые средства, например, табличный процессор Excel.
Табличный процессор позволяет выполнять достаточно большое
количество операций обработки и анализа баз данных простыми,
доступными средствами. В табличном процессоре MS Excel принята своя терминология: база данных здесь называется списком и
рассматривается как некий частный случай таблицы.
Средства MS Excel в сочетании с дополнительными возможностями программирования на языке VBA позволяют решать
сложные инженерные вычислительные задачи, а также организовывать обработку таблиц и баз данных в том случае, если количество информации, подлежащей учету и систематизации, не слишком велико (т.е. если число строк-записей в списке-таблице не
исчисляется тысячами).
Технология баз данных построена на принятой ранее этапности. Считается, что текст, таблица, база данных имеют общие
технологические свойства.
Этапами работы над базой данных являются:
– Проектирование структуры базы данных, т.е. определение
перечня полей, из которых состоит каждая запись таблицы, типов
и размеров полей (числовой, текстовый, логический и т.д.), определение ключевых полей для обеспечения необходимых связей
между данными и таблицами; Ввод данных в таблицах баз данных с помощью представляемой по умолчанию стандартной
формы в виде таблицы и с помощью экранных форм, специально
создаваемых пользователем;
– Редактирование созданной базы данных, созданной в табличной форме
– Форматирование базы данных.
– Получение базы данных в виде готового информационного
продукта. При этом подразумевается обработка данных, содер44
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
жащихся в таблицах, на основе запросов и на основе программы,
а также вывод информации из ЭВМ с использованием табличных
отчетов и прилагаемых к ним диаграмм и графиков.
Так как по форме, по структуре, реляционные базы данных
совпадают с табличными объектами, то первоначальный ввод базы данных в память компьютера, ее редактирование и форматирование полностью совпадает с аналогичными действиями по отношению к табличным объектам, рассмотренным выше.
Специфичными с точки зрения технологии для баз данных
являются процедуры использования их в диалоговом режиме для
получения различных отчетов.
Обработка данных, представленных в виде списков
При организации больших потоков информации – списков
почтовой рассылки, телефонов, торговых операций и т.п. – большую помощь могут оказать содержащиеся в Excel средства обработки списков.
Списком называется таблица, разделенная на столбцы-поля
и строки-записи. По сути, список представляет собой базу данных – организованное хранилище информации. Однако, учитывая особенности хранения данных в Excel, вместо термина "база
данных" при работе с табличным процессором используется термин "список".
Список – это набор строк с постоянными заголовками столбцов и последовательными данными, и для работы со всеми командами Excel по обработке списков необходимо руководствоваться определенными принципами:
1. Создаваемый список должен иметь постоянное количество
столбцов, каждый из которых в таком случае называется полем, а
имя столбца – его меткой.
2. Количество строк является переменным, чтобы позднее
можно было добавить, удалить или переставить записи.
3. В каждом столбце должна содержаться однотипная информация, и недопустимы пустые ячейки.
45
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Структура списка
Список состоит из трех основных структурных элементов:
 Записи подобны карточкам библиотечного каталога. Каждая запись должна содержать полное описание конкретного элемента.
 Поля – это отдельные категории, по которым упорядочена
информации в списке (отдельный столбец – отдельная категория).
 Заглавная строка состоит из заголовков столбцов и располагается в самом начале списка. Заголовки – это метки соответствующих полей. Excel использует их при сортировке, поиске, выдаче отчетов по спискам. Рекомендуется выделять заглавную
строку, отформатировав ее иначе, чем остальные данные. Не следует вставлять пустую строку между заглавной строкой и прочими строками списка, т.к. некоторые инструменты, например автофильтр, корректно работают только с непрерывными диапазонами.
В списке Excel каждый столбец – это поле, а каждая строка –
это запись.
Создание списка в рабочем листе Excel
При создании списка в Excel целесообразно использовать
следующую последовательность этапов:
- открыть новый лист. Лучше всего размещать списки на
отдельных листах, чтобы программа могла автоматически выделить данные при выполнении команд обработки списков;
- создать заголовки для каждого поля (столбца) в списке, задать их выравнивание и отформатировать жирным шрифтом. По
возможности лучше ограничиться небольшим числом полей, чтобы они были одновременно видны на экране;
- отформатировать находящиеся под заголовками ячейки в
соответствии с данными, которые должны в них храниться. Это
подразумевает наложение числовых форматов (денежных или
дат) и изменение выравнивания;
- ввести записи под заголовками. При этом следует соблюдать единый стиль заполнения, чтобы позднее взаимосвязанные
записи могли быть выделены в группы. Количество строк может
46
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
быть любым; в списке не должно быть пустых строк; нужно использовать единый формат для всех ячеек столбца;
- после окончания работы нужно сохранить книгу на диске.
Если список разрастается до сотен записей, следует подумать о
мерах предосторожности – хранении резервной копии в надежном месте. При вводе повторяющихся значений в списках удобно
использовать автозаполнение – вводимые слова распознаются и
автоматически завершаются. Чтобы воспользоваться этой возможностью, следует выполнить команду Параметры в меню
Сервис, затем выбрать вкладку Правка и установить флажок
Автозаполнение значений ячеек. При создании списков очень
удобным является использование специальных форм.
Сортировка и фильтрация данных в списке
Табличный процессор Excel предоставляет пользователю
удобное средство упорядочивания (сортировки), поиска (фильтрации) данных списка и создания отчетов на их основе. Сортировка данных списка (т.е. их перестановка в определенной заданной последовательности) может осуществляться в алфавитном,
числовом и хронологическом порядке. Фильтрация позволяет
осуществлять быстрый поиск и работу с определенными подмножествами данных без их перемещения или сортировки.
Фильтрация списка дает возможность выводить на экран
необходимое подмножество элементов списка. Если при обращении к команде Фильтр в меню Данные выбрать подкоманду Автофильтр, то Excel в метке каждого столбца помещает кнопку
окна списка. При раскрытии списка в каком-либо столбце выводится список всех уникальных элементов этого столбца. При выделении интересующего пользователя определенного элемента в
столбце будут помещены только те строки, которые содержат
выделенное значение – все остальные строки будут скрыты.
Итоги
Excel может автоматически вычислять промежуточные и общие итоги в списке. При вставке автоматических промежуточных
итогов Excel изменяет разметку списка, что позволяет отображать
и скрывать строки каждого промежуточного итога. Перед тем как
вставить промежуточные итоги, необходимо отсортировать спи47
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
сок, чтобы сгруппировать строки, по которым нужно подвести
итоги. После этого можно подсчитать промежуточные итоги любого столбца, содержащего числа.
В существующие группы суммируемых значений можно
вставлять промежуточные итоги для более мелких групп.
При добавлении в список промежуточных итогов разметка
списка изменяется таким образом, что становится видна его
структура. Щелкая знаки структуры 1 2 3 и кнопки со знаками «+» и «-», можно создать итоговый отчет, скрыв подробности и отобразив только итоги.
Отображение итоговых данных в виде диаграммы
Можно создать диаграмму, использующую только видимые
данные списка, содержащего промежуточные итоги. Если отобразить или скрыть подробности в структурированном списке,
диаграмма тоже будет обновлена для отображения или скрытия
соответствующих данных.
2.4. Информационные технологии презентаций
Общие сведения
Применение современной техники для презентаций стало
обычным при проведении семинаров, конференций и в ходе
учебного процесса. Традиционно для демонстрации используются 35-миллиметровые слайды и прозрачные пленки.
Программные средства для создания презентаций связаны с
уровнем качества презентаций. В этом смысле существует три
уровня (снизу вверх):
 «офисная презентация» – выполнена с использованием программы для создания презентаций, включенной в состав интегрированного офисного пакета, например MS Office,
 презентация, созданная на основе Flash-технологии,
 презентация, созданная на основе профессиональных графических пакетов, типа Corel Draw,
 презентация, созданная по телевизионным технологиям.
В дальнейшем, в связи с общей концепцией офисных технологий, будем рассматривать возможности презентационных технологий на базе пакета MS Office в виде специализированной
48
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
программы (презентационного процессора) Power Point. Основное его предназначение – представить данные в наглядной, красочной форме. Благодаря презентационному процессору введенные текстовые и числовые данные превращаются в профессионально выполненные слайды, наполненные диаграммами,
таблицами, графическими иллюстрациями и пригодные для плодотворной работы с аудиторией слушателей.
PowerPoint представляет собой графический программный
продукт, специально предназначенный для подготовки презентаций и слайд-фильмов. Он предоставляет пользователю все необходимое – мощные функции работы с текстом, включая обрисовку контура текста, средства для рисования, построение диаграмм,
широкий набор стандартных иллюстраций и т.п.
Естественно, чем выше уровень качества, тем более впечатляющая презентация получается, но при этом растет трудоемкость ее создания, а также стоимость. При этом важно отметить и
рост уровня квалификации персонала.
Облегчается ее освоение тем обстоятельством, что ее интерфейс во многом похож и даже совпадает с интерфейсом Word Excel. Кроме того, данные программы тесно «сотрудничают» в области обработки и обмена таких продуктов, как текст, таблица,
диаграмма, график, схема.
Этапы создания презентационных слайдов
Основные этапы презентационной технологии в главном совпадают с аналогичными технологиями, связанными с текстом,
таблицами и базами данных.
В данном случае это:
1. Первоначальное создание презентации в памяти компьютера.
2. Редактирование презентации.
3. Форматирование презентации.
4. Использование презентации.
Дадим характеристику каждого из названных этапов.
Первоначальное создание презентации можно выполнить одним из следующих способов:
 На основании шаблона Автосодержания
 На основании режима «Пустой презентации»
49
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
 На основании сочетания вышеназванных способов
 На основании готовой презентации
Далее рассмотрим первые три способа, т.к. четвертый способ
является сомнительным с этической точки зрения.
Наиболее простой и доступный способ связан с использованием подходящего шаблона, состоящего из заданного набора
слайдов, подобранных для раскрытия заданной темы презентации. Причем каждый слайд имеет заранее заданную структуру
объектов в виде полей заполнения, а общий шаблон – общее
оформление презентации.
Для создания презентации надо вызвать режим Мастер Автосодержания, с помощью которого выбирается тема презентации и
затем на основании заданного шаблона производится редактирование (заполнение) зон слайдов подготовленными конкретными
данными: текст, списки, таблицы, диаграммы, графики, схемы,
рисунки и т.д. На этом создание презентации заканчивается, и
она может быть продемонстрирована как готовый информационный продукт. Перед тем как демонстрировать презентацию, необходимо настроить способ управления показом (с помощью
мыши или автоматически с выдержкой времени), а также выбрать
режим смены слайдов на экране. При этом подразумевается, что
демонстрация презентации будет происходить на экране дисплея.
Достоинство данного способа создания презентации состоит
в том, что экономится время на проектирование структуры презентации как наиболее сложного, трудоемкого этапа. Кроме того,
отпадает необходимость в форматировании презентации, так как
это свойство заложено в понятие шаблона.
Недостатком выбранного способа является ограниченное количество тем презентации, а также их оформление.
Для преодоления этих недостатков предлагается способ, основанный на понятии «Пустая презентация». В этом случае проектирование структуры будущей презентации необходимо выполнить заранее до использования программы Power Point. Другими словами, необходимо выразить идею презентации в виде
макетов слайдов, изображенных, например, на бумаге. При этом
детально проектируется и каждый слайд с точки зрения количества объектов и их размещения на плоскости слайда.
50
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Затем для каждого будущего слайда с помощью режима
«Создать слайд» из библиотеки структур слайдов выбирается
подходящий, заполняется содержанием (информационными объектами) и данный процесс повторяется над следующим по списку
слайдом. Процесс создания презентации в содержательном смысле заканчивается при реализации последнего в списке слайда.
С точки зрения типовой технологии вышеназванные процедуры реализуют этап первоначального создания презентации.
После этого презентация может быть отредактирована. Это
либо редактирование отдельных элементов слайдов: текст, таблица, и т.д., либо структура презентации: перестановка, добавление, удаление слайдов из презентации.
Данные процедуры легко реализуются, так как основаны они
на подобных процедурах, рассмотренных в текстовых технологиях.
Следующий этап – этап форматирования презентации. По законам дизайна презентация должна иметь единый стиль, образ,
который распространяется на все слайды, включенные в презентацию.
Поэтому надо выбрать режим «Оформление презентации» и
выполнить его ко всей презентации.
Наконец, как и в предыдущем случае, надо настроить презентацию на демонстрацию и выполнить ее.
Достоинство данного способа заключается в широких возможностях по выбору тематики презентации.
Недостаток (если можно считать это недостатком) связан с
более высоким профессиональным уровнем в области компьютерных технологий, нежели по отношению к первому способу.
Третий способ презентационной технологии является сочетанием рассмотренных выше способов. Это наиболее оптимальный,
гибкий способ создания презентаций, так как включает в себя
преимущества рассмотренных ранее способов. Действительно,
если найти подходящий шаблон для презентации, пусть не совсем совпадающий по структуре – это уже существенная экономия времени. А степень несовпадения между шаблоном и презентацией может быть ликвидирована с помощью режима «Пустая
презентация».
51
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Еще одной особенностью презентационных технологий является тесная информационная связь между презентацией как информационным продуктом и компонентами, включаемыми в состав слайдов презентации. Во многих случаях презентация является вторичным информационным продуктом по отношению,
например, к курсовой или дипломной работе, которую необходимо публично защищать перед комиссией. В этом случае создание
презентации представляется как сборочное производство или
конвейер, на который подаются в нужное время и в нужном месте
детали и узлы, из которых собирается готовый информационный
продукт – презентация. В качестве деталей и узлов выступают
текст, таблицы, рисунки, диаграммы, графики, схемы, представляющие иллюстративный материал, на основе которого происходит защита.
Этот материал уже должен быть создан в основном документе – курсовой или дипломной работе. Если это так, то формирование содержания слайдов презентации облегчается существенно. В определенное поле слайда копируется через буфер обмена
соответствующий оригинал из первичного документа.
2.5. Информационные технологии
комплексных документов
Организуя совместную работу приложений Windows, можно
создавать комплексные документы, которые кроме текстовой информации содержат рисунки, графики, таблицы, сложные математические формулы и т.д. В совместной работе, интеграции
приложений можно выделить три механизма:
- Буфер промежуточного хранения (обмена) Clipboard;
- Технология OLE;
- Непосредственный обмен данными.
При создании сложных документов вставки можно выполнять тремя способами: статически, динамически и с помощью
ссылки на источник информации. При этом наиболее часто используется Буфер промежуточного хранения.
52
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2.5.1. Буфер промежуточного хранения, обмена
(CLIPBOARD)
Буфер промежуточного хранения, обмена (CLIPBOARD) –
область памяти, которую оболочка Windows выделяет для промежуточного хранения информации. Каждое приложение может
помещать туда данные и брать их оттуда. Данными могут быть
текст, рисунок, таблица или их фрагменты и т.д. Каждое приложение имеет доступ к Буферу обмена, что и делает возможным
обмен данными между приложениями.
Информация в Буфере обмена остается неизменной в течение
всего сеанса работы Windows, если в Буфер не направлена новая
информация. По окончании работы Windows информация в Буфере обмена исчезает. Если в Буфер направлена новая информация, то она полностью замещает старую.
На содержание Буфера обмена не оказывает влияние запуск и
завершение работы приложений, вставка содержимого буфера в
документ. Поэтому одни и те же данные можно вставлять в документы несколько раз.
Буфер обмена автоматически распознает вид передаваемой
информации и ее формат. Он выполняет по мере возможностей и
ее преобразование, обеспечивая доступность информации для
многих приложений. Преобразование производится в промежуточный формат, поддерживаемый всеми приложениями.
Принцип работы Буфера обмена состоит в следующем:
- Инструментальными средствами конкретного приложения
выделяется (маркируется) определенный фрагмент обрабатываемого документа;
- Выделенный фрагмент помещается на хранение в Буфер
обмена;
- Записанный в Буфере фрагмент вставляется либо в другое
место того же документа, либо в другой документ того же приложения, либо в документ другого приложения.
Во всех приложениях Windows, которые допускают использование Буфера обмена, схема работы с Буфером стандартизована. Для обмена предусмотрены следующие команды меню Правка (Windows 95(98, NT, 2000)) или Редактирование (Windows
v.3.X):
53
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
- Вырезать (Cut) – переместить выделенный фрагмент в Буфер обмена (и удалить его в исходном документе);
- Копировать (Copy) – скопировать выделенный фрагмент в
Буфер обмена (исходный документ не меняется);
- Вставить (Insert) – вставить содержимое буфера обмена в
текущий документ приложения.
Рассмотрим основные этапы работы с Буфером обмена.
1. Передача информации из документа в Буфер обмена. Перед выполнением команд Вырезать или Копировать нужно выделить фрагмент документа, иначе указанные команды будут недоступны (их названия в меню будут иметь серый цвет). Способ
выделения фрагмента определяется конкретным приложением.
При этом следует обратить внимание, что в команде Вырезать
совмещены две стандартные операции: удаление выделенного
фрагмента и помещение его в Буфер.
2. Вставка информации из Буфера обмена в документ. Информация вставляется по команде Вставить, но если Буфер обмена пуст, то команда Вставить недоступна. На появление информации в Буфере укажет изменение цвета этой команды (серый
цвет меняется на черный). Точка вставки определяется условиями
конкретного приложения и характером информации, помещенной
в Буфер обмена.
Например, графические редакторы вставляют графический
фрагмент в левый верхний угол рабочего поля. Перемещение
фрагмента в нужное место выполняется вручную. Текстовые
фрагменты всегда вставляются перед позицией текстового курсора.
В рамках Windows предусмотрена возможность получения
копии экрана в Буфере обмена. При этом можно:
- получить копию всего экрана, нажав клавишу [PrintScreen];
- получить копию только активного окна, нажав
[Alt]+[PrintScreen].
Затем эту картинку можно вставить в документ какого-либо
графического редактора, отредактировать и, если необходимо,
записать в файл.
Обмен информацией через Буфер обмена протекает скрыто,
поэтому иногда при работе с Буфером возникает необходимость
просмотра его содержимого. Для этого в Windows имеется специ54
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
альная программа обслуживания Буфера обмена, которая позволяет просмотреть содержимое Буфера, сохранить содержимое в
файле (или загрузить его из файла) и очистить Буфер обмена. Эту
программу можно вызвать из подчиненного меню Стандартные
пункта Главные меню Программы.
2.5.2. Технология OLE
С развитием технических и программных средств современных компьютеров встает задача объединения в одном документе
объектов разного происхождения и разной природы, например:
текст, фотографии, музыку, отрывки видеоизображений и т.д.
Поэтому для обработки таких сложных документов механизма
Буфера промежуточного обмена для непосредственного внедрения новых объектов явно недостаточно.
При работе в Windows для создания и обработки сложных
документов предлагается использовать более универсальный механизм, который называется Технология OLE (Object Linking and
Embedding – связь и внедрение объектов). Идея этой технологии
состоит в том, чтобы облегчить и сделать универсальным использование новейших возможностей (например: рисунки, музыку,
видео) при создании сложных документов.
В технологии OLE используются следующие термины:
Объект (object) – это любая форма данных, которая с помощью технологии OLE может быть включена в сложный документ. Эти данные могут представлять тексты, графические изображения, звуки, видеосигналы и т.д. При этом необязательно,
чтобы программа, принимающая объект, понимала его содержание – она должна его только воспроизводить. Если объект необходимо обработать, то автоматически вызывается программа, с
помощью которой этот объект был создан.
Внедрение (embedding). Вставляемый объект содержит все
необходимые для его обработки данные. Никакой связи с исходным файлом больше не существует, и объект полностью независим. При обработке вставленного объекта автоматически вызывается соответствующая программа и ей передаются необходимые данные.
Связывание (linking). При связывании объекта с документом
в документ поступают два различных типа информации: визуаль55
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ное представление информации и имя файла, в котором содержатся собственно данные внедряемого объекта.
OLE сервер (программа Server, обслуживающая программа,
серверное приложение). Под OLE серверами понимаются программы (приложения), которые могут предоставлять объекты в
распоряжение других программ (приложений). Например:
Paintbrush (Paint) и звукозаписывающее устройство выполняют
только роль OLE серверов.
OLE клиент (программа-пользователь, приложение-контейнер, приложение приемник информации, приложение-клиент).
Это прикладная программа (приложение), которая может принимать объекты в свои документы. Например: редакторы Write и
Word – это типичные OLE клиенты. Однако Word и Excel могут
выступать и как OLE серверы. Это расширяет возможности компоновки сложных документов.
Согласно терминологии технология OLE предоставляет две
возможности обработки объектов:
- Внедрив в документ приложения некий объект, созданный в
другом приложении, мы получаем не только сложный документ,
но и возможность редактировать этот объект средствами "родного" приложения;
- Можно установить связь некоего объекта с документом (например, рисунка), но при этом предоставить этому объекту (рисунку) возможность "жить" собственной жизнью, обслуживать
другие документы и т.п. (а заодно и сберечь память на диске).
Рассмотрим технику использования технологии OLE на примере двух универсальных способов:
1. Через Буфер промежуточного обмена при помощи меню
Правка – Специальная вставка;
2. Через меню Вставка – Объект.
Первым способом можно внедрить фрагмент документа или
внедрить и связать весь документ, а вторым способом внедрить
(внедрить и связать) только целый документ.
Использование Буфера обмена в технологии OLE
Использование Буфера обмена в технологии OLE практически ничем не отличается от его традиционного использования,
как универсального участка памяти компьютера для обмена ин56
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
формации между различными приложениями. Особенность состоит в том, что для вставки информации из Буфера обмена используется команда Специальная вставка из меню Правка (в
Windows v.3.X из меню Редактирование). В результате этого на
экране появится диалоговое окно, с помощью которого, в зависимости от некоторых условий, можно выполнить одну из трех
операций:
1) вставить содержимое Буфера обмена в свой документ как
часть этого документа;
2) внедрить содержимое Буфера обмена в документ как объект OLE сервера;
3) внедрить и связать документ, который находится в Буфере
обмена, с документом-контейнером.
Особенности использования. Возможность выполнить ту
или иную операцию зависит от ряда объективных и субъективных обстоятельств:
- опознан ли Windows в содержимом Буфера обмена документ OLE сервера,
- допускает ли OLE клиент (т.е. текущее приложение) ту или
иную форму вставки или связи,
- намерены ли Вы изменить формат вставляемого элемента и
т.д.
Технология выполнения. Для использования технология
OLE через меню Правка – Специальная вставка необходимо открыть приложение-источник информации, выделить в нем тот
участок, который необходимо переместить в приложение-приемник информации (приложение-контейнер или приложение OLEклиент). Затем командами меню Правка скопировать или вырезать этот участок информации в Буфер промежуточного хранения. Потом перейти в приложение-контейнер и вставить информацию через меню Правка – Специальная вставка.
Примечание. В некоторых случаях "классическая" команда
вставки содержимого Буфера обмена Правка – Вставить по умолчанию внедряет объект (т.е. выполняет роль одного из вариантов
технологии OLE Специальная вставка). Этот связано с тем, что
приложение-приемник информации не может преобразовать
вставляемые данные в "свой" внутренний формат и поэтому вы57
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
нуждено вставлять данные как объект. В этом мы убедились в
предыдущем параграфе.
Механизм окончания редактирования OLE объектов. В
зависимости от «уровня» OLE сервера чаще всего используется
два способа внедрения созданного объекта и возврата в OLE клиент
1. В простых серверах (например, Microsoft WordArt или
Microsoft Equation) достаточно после редактирования внедренного объекта щелкнуть мышью в окне основного документа. Сервер
закрывается и происходит возврат в документ OLE клиента.
2. В сложных серверах (например, Word) для возврата в основной документ необходимо выбрать пункт Обновить в меню
Файл или закрыть OLE сервер стандартным способом.
В ряде случаев при внедрении объектов достаточно перетащить выделенный объект из окна OLE сервера в окно OLE клиента.
2.5.3. Непосредственный обмен данными
Средства непосредственного обмена данными между приложениями Windows можно разделить на три категории:
1. Конвертирование (преобразование) файлов,
2. Импорт и экспорт данных,
3. Динамический обмен данными (DDE – Dynamic Data
Exchange).
Конвертирование файлов
Конвертированием обычно называют изменение формата
файла документа или его части. При конвертировании файл документа определенного типа, подготовленный средствами некоего приложения (возможно, в другой операционной системе) преобразуется приложением Windows в файл документ другого или
того же (или примерно того же) типа.
Аналогичные возможности конвертирования информации из
формата Word в другие доступные форматы можно выполнить и
через меню Сохранить Как, т.е. выполнить обратное преобразование документа «Документ Word – Текстовый файл».
Экспорт – импорт данных
Данная операция обработки файла документа предоставляет
возможность производить сложную обработку файлов из одного
58
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
формата в другой. Осуществляется пересылка данных из одного
файла в другой по определенным соглашениям. Данные могут
пересылаться между файлами разных типов, а также между файлами разных форматов. Например, экспорт-импорт следующих
пар файлов:
- файл базы данных .DBF (dBase или Foxpro) в файл MS Excel
.XLS,
- файл базы данных .MDB (MS Access) в текстовый файл
.TXT.
Это обеспечивает гибкость создания и пополнения баз данных из других источников. Аналогичные возможности предлагаются и при экспорте данных.
Динамический обмен данными (DDE)
DDE (Dynamic Data Exchange) – это специальный протокол
обмена данными между приложениями Windows, который позволяет автоматизировать подготовку однотипной информации с захватом необходимых данных из других файлов. Например, набор
и формирование стандартных документов типа писем или приглашений для большого числа адресатов. Необходимо набрать
один бланк стандартного письма, а затем тиражировать его, используя базу данных адресатов. Управление этим процессом
удобнее выполнять через меню Сервис – Слияние. Бланк документа в редакторе Word отличается от обыкновенного документа
только наличием специальных полей Слияния.
1. Набор бланка (шаблона) стандартного письма с вставкой
вместо фамилии адресата, которому направляется письмо, специального поля Слияния (MergeField) через меню Вставка Поле, в
котором определяется имя поля Слияния. При необходимости
можно добавить несколько полей Слияния и сформировать произвольный бланк письма.
2. Определение источника информации для формирования
писем для нескольких адресатов. Из этого источника данных будут заполняться поля Слияния.
3. Объединение заготовки письма с базой данных адресатов
для формирования и печати готовых писем для каждого адресата.
Осуществляется через пункт Объединить меню Сервис – Слияние. При этом предоставляется меню для уточнения процесса
59
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
слияния и корректировки набора записей, подпадающих под
слияние посредством установки Отбор записей.
В результате всех этих манипуляций формируется выходной
документ в отдельном окне редактора Word, содержащий все
письма для каждой записи базы данных в соответствии с условиями отбора. Остается проверить выходной документ и распечатать его стандартными средствами редактора. Данную возможность формирования стандартных писем эффективно использовать при количестве формируемых писем или другой
стандартной корреспонденции, превышающем 20 – 30 адресатов.
Кроме формирования стандартных писем, можно выполнять
и другие виды работ, связанные с подготовкой стандартной однотипной информацией, например, подготовка конвертов, индивидуальных карточек учета, счетов и прочее. В качестве источника
данных можно использоваться таблицы Word, Excel и другие базы данных (например, Foxpro).
2.6. Контрольные вопросы
1. Дайте характеристику программным средствам подготовки
текста.
2. В чем специфика информационных технологий подготовки
текстовых документов?
3. Какие средства автоматизации целесообразно использовать
в текстовых технологиях?
4. В чем особенность использования команд «Замена» и «Автозамена»?
5. В чем особенность использования Шаблонов и Мастеров?
6. В чем особенность использования макросов?
7. Распространяются ли средства автоматизации на другие
технологии создания офисных документов.
8. Какие задачи в области информационных технологий
можно решать с помощью табличных процессоров?
9. В чем проявляется сходство и отличие этапов табличной и
текстовой технологии?
10. В чем проявляется технология факторного анализа?
11. В чем проявляется технология корреляционнорегрессионного анализа?
60
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
12. Возможности MS Excel для реализации технология корреляционно-регрессионного анализа.
13. Что такое оптимизационные информационные технологии, используемые в табличных расчетах?
14. В чем проявляется технология прогнозирования на основе
трендов в табличных расчетах?
15. Роль баз данных в экономике.
16. Требования к базам данных.
17. Классификация баз данных.
18. Структура реляционных баз данных.
19. Этапы работы с базами данных.
20. Основные виды работ с базами данных; сортировка,
фильтрация, итоги – назначение, способы реализации.
21. Понятие презентаций. Область использования презентаций в экономике.
22. Способы создания презентаций.
23. Этапы информационной технологии, применяемых при
создании презентаций.
24. Какие особенности связаны с созданием сложных (комплексных) документов?
25. Роль буфера обмена.
26. Способы компоновки комплексных документов.
27. Технологии динамической вставки: OLE, DDL, DDE.
Глава 3.
Интеллектуальные аналитические
информационные технологии
Анализ бизнес-информации – основные принципы
Об анализе информации в последнее время говорят так много
и столько всего, что можно окончательно запутаться в проблеме.
Это хорошо, что многие обращают внимание на такую актуальную тему. Однако под этим термином каждый понимает то, что
ему нужно, часто не имея представления об общей картине проблемы. Фрагментарность в таком подходе является причиной того, что в большинстве случаев нет возможности понять, что про61
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
исходит и что делать. Все состоит из фрагментов, слабо связанных между собой и не имеющих общего стержня. Часто можно
слышать фразу «лоскутная автоматизация». С этой проблемой
уже неоднократно сталкивались многие и могут подтвердить, что
основная проблема при таком подходе состоит в том, что практически никогда невозможно увидеть картину в целом. С анализом
ситуация аналогичная.
Для того, чтобы было понятно место и назначение каждого
механизма анализа, давайте рассмотрим все это в целом. Будем
отталкиваться от того, как человек принимает решения. Поскольку объяснить, как рождается мысль, мы не в состоянии, сконцентрируемся на том, как можно в этом процессе использовать информационные технологии. Первый вариант: лицо, принимающее
решение (ЛПР), использует компьютер только как средство извлечения данных, а выводы делает уже самостоятельно. Для решения такого рода задач используются системы отчетности, многомерный анализ данных, диаграммы и прочие способы визуализации. Второй вариант: программа не только извлекает данные,
но и проводит различного рода предобработку, например, очистку, сглаживание и прочее. А к обработанным таким образом данным применяет математические методы анализа – кластеризацию, классификацию, регрессию и т.д. В этом случае ЛПР получает не сырые данные, а прошедшие серьезную обработку, т.е.
человек уже работает с моделями, подготовленными компьютером.
Благодаря тому, что в первом случае практически все, что
связано собственно с механизмами принятия решений, возлагается на человека, проблема с подбором адекватной модели и выбором методов обработки выносится за пределы механизмов анализа. Т.е. базой для принятия решения является либо инструкция
(например, каким образом можно реализовать механизмы реагирования на отклонения), либо интуиция. В некоторых случаях
этого вполне достаточно, но если ЛПР интересуют знания, находящиеся достаточно глубоко, если так можно выразиться, то просто механизмы извлечения данных тут не помогут. Необходима
более серьезная обработка. Это и есть тот самый второй случай.
Все применяемые механизмы предобработки и анализа позволяют ЛПР работать на более высоком уровне. Первый вариант хо62
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
рошо подходит для решения тактических и оперативных задач, а
второй для тиражирования знаний и решения стратегических
проблем.
Идеальным случаем была бы возможность применять оба
подхода к анализу. Они позволяют покрыть почти все потребности организации в анализе бизнес-информации. Варьируя методики в зависимости от задач, мы будем иметь возможность в любом случае выжать максимум из имеющейся информации.
Общая схема работы приведена ниже.
Рис. 5. Общая схема анализа бизнес-информации
63
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Часто при описании того или иного продукта, анализирующего бизнес-информацию, применяют термины типа рискменеджмент, прогнозирование, сегментация рынка. Но в действительности решения каждой из этих задач сводятся к применению одного из описанных ниже методов анализа. Например, прогнозирование – это задача регрессии, сегментация рынка – это
кластеризация, управление рисками – это комбинация кластеризации и классификации, возможно, и других методов. Поэтому
данный набор технологий позволяет решать большинство бизнесзадач. Фактически они являются атомарными (базовыми) элементами, из которых собирается решение той или иной задачи.
Теперь опишем отдельно каждый фрагмент схемы.
В качестве первичного источника данных должны выступать
базы данных систем управления предприятием, офисные документы, Интернет – необходимо использовать все сведения, которые могут пригодиться для принятия решения. Причем речь идет
не только о внутренней для организации информации, но и о
внешних данных (макроэкономические показатели, конкурентная
среда, демографические данные и т.п.).
Хотя в хранилище данных не реализуются технологии анализа, оно является той базой, на которой нужно строить аналитическую систему. В отсутствие хранилища данных на сбор и систематизацию необходимой для анализа информации будет уходить
большая часть времени, что в значительной степени сведет на нет
все достоинства анализа. Ведь одним из ключевых показателей
любой аналитической системы является возможность быстро получить результат.
Следующим элементом схемы является семантический слой.
Вне зависимости от того, каким образом будет анализироваться
информация, необходимо, чтобы она была понятна ЛПР. В большинстве случаев анализируемые данные располагаются в различных базах данных, а ЛПР не должен вникать в нюансы работы
с СУБД, поэтому требуется создать некий механизм, трансформирующий термины предметной области в вызовы механизмов
доступа к БД. Эту задачу и выполняет семантический слой. Желательно, чтобы он был один для всех приложений анализа, таким образом легче применять к задаче различные подходы.
64
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Системы отчетности предназначены для того, чтобы дать ответ на вопрос «что происходит». Первый вариант его использования: регулярные отчеты используются для контроля оперативной ситуации и анализа отклонений. Например, система ежедневно готовит отчеты об остатках продукции на складе, и когда
его значение меньше средней недельной продажи, необходимо
реагировать на это подготовкой заказа на поставку, т.е. в большинстве случаев это стандартизированные бизнес-операции. Чаще всего некоторые элементы этого подхода в том или ином виде
реализованы в компаниях (пусть даже просто на бумаге), однако
нельзя допускать, чтобы это был единственный из доступных
подходов к анализу данных. Второй вариант применения систем
отчетности: обработка нерегламентированных запросов. Когда
ЛПР хочет проверить какую-либо мысль (гипотезу), ему необходимо получить пищу для размышлений, подтверждающую либо
опровергающую идею. Так как эти мысли приходят спонтанно и
отсутствует точное представление о том, какого рода информация потребуется, необходим инструмент, позволяющий быстро и
в удобном виде эту информацию получить. Извлеченные данные
обычно представляются либо в виде таблиц, либо в виде графиков и диаграмм, хотя возможны и другие представления.
Хотя для построения систем отчетности можно применять
различные подходы, самый распространенный на сегодня – это
механизм OLAP. Основной идеей является представление информации в виде многомерных кубов, где оси представляют собой измерения (например, время, продукты, клиенты), а в ячейках помещаются показатели (например, сумма продаж, средняя
цена закупки). Пользователь манипулирует измерениями и получает информацию в нужном разрезе.
Благодаря простоте понимания, OLAP получил широкое распространение в качестве механизма анализа данных, но необходимо понимать, что его возможности в области более глубокого
анализа, например, прогнозирования, крайне ограничены. Основной проблемой при решении задач прогнозирования является вовсе не возможность извлечения интересующих данных в виде
таблиц и диаграмм, а построение адекватной модели. Дальше все
достаточно просто. На вход имеющейся модели подается новая
информация, пропускается через нее: результат – это и есть про65
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
гноз. Но построение модели является совершенно нетривиальной
задачей. Конечно, можно заложить в систему несколько готовых
и простых моделей, например, линейную регрессию или что-то
аналогичное, довольно часто именно так и поступают, но это
проблему не решает. Реальные задачи почти всегда выходят за
рамки таких простых моделей. А следовательно, такая модель
будет обнаруживать только явные зависимости, ценность обнаружения которых незначительна. Все известно и так. Или будут
строить слишком грубые прогнозы, что тоже совершенно неинтересно. Например, если вы будете при анализе курса акций на
фондовом рынке исходить из простого предположения, что завтра акции будут стоить столько же, сколько и сегодня, то в 90%
случаев вы угадаете. И насколько ценны такие знания? Интерес
для брокеров представляют только оставшиеся 10%. Примитивные модели в большинстве случаев дают результат примерно того же уровня.
Правильным подходом к построению моделей является их
пошаговое улучшение. Начав с первой, относительно грубой модели, необходимо по мере накопления новых данных и применения модели на практике улучшать ее. Собственно задача построения прогнозов и тому подобные вещи выходят за рамки механизмов систем отчетности, поэтому и не стоит ждать в этом
направлении положительных результатов при применении OLAP.
Для решения задач более глубокого анализа применяется совершенно другой набор технологий, объединенных под названием
Knowledge Discovery in Databases .
Knowledge Discovery in Databases (KDD) – это процесс преобразования данных к знаниям. KDD включает в себя вопросы
подготовки данных, выбора информативных признаков, очистки
данных, применения методов Data Mining (DM), постобработки
данных, интерпретации полученных результатов. Data Mining –
это процесс обнаружения в «сырых» данных ранее неизвестных,
нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных
сферах человеческой деятельности.
Привлекательность этого подхода заключается в том, что, вне
зависимости от предметной области, мы применяем одни и те же
операции:
66
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1. Извлечь данные. В нашем случае для этого нужен семантический слой.
2. Очистить данные. Применение для анализа «грязных» данных может полностью свести на нет применяемые в дальнейшем
механизмы анализа.
3. Трансформировать данные. Различные методы анализа
требуют данных, подготовленных в специальном виде. Например, где-то в качестве входов может использоваться только цифровая информация.
4. Провести, собственно, анализ – Data Mining.
5. Интерпретировать полученные результаты.
Это процесс повторяется итеративно.
Data Mining, в свою очередь, обеспечивает решение всего 6
задач – классификация, кластеризация, регрессия, ассоциация,
последовательность и анализ отклонений.
Это все, что необходимо сделать, чтобы автоматизировать
процесс извлечения знаний. Дальнейшие шаги уже делает эксперт, он же ЛПР.
3.1. Хранилища данных
Хранилище Данных (ХД)
 это централизованный фонд структурированного хранения и
быстрого поиска информации при Off-Line анализе информации;
 это предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию и неизменяемый набор
данных, предназначенный для поддержки принятия решений, и
его пользователи — это высший и средний менеджмент, аналитики, представители подразделений бизнес-анализа и маркетинга;
 это среда, состоящая из одной или более БД, спроектированная для доставки соответствующего и согласованного бизнесанализа (Business Intelligence, BI) во все бизнес-подразделения
организации;
 это инструмент управления, благодаря которому руководство получает доступ к информации, необходимой для принятия
обоснованных решений;
 это средство, которое помогает руководству принимать
стратегические решения, производить анализ огромных объемов
67
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
данных, открывать скрытые возможности и улучшать конкурентоспособность своего предприятия.
ХД собирает информацию из различных источников и рисует
исчерпывающую картину бизнес-деятельности организации. Такая
система преобразуют данные в согласованный, легко доступный
формат и распределяет их среди тех, кому они необходимы.
Цели и задачи хранилищ данных
Кроме определенной выше глобальной цели – создание единой модели данных, можно выделить т.н. «краткосрочные цели», которые дают немедленный выигрыш пользователям на каждом этапе реализации ХД. Вот несколько примеров краткосрочных целей.
Улучшение качества данных
Поскольку обычным недостатком СППР являются "грязные
данные", пользователь должен уделять внимание качеству своих
данных на каждом этапе реализации ХД. Очистка данных представляет собой проблему в организации Хранилищ: с одной стороны, предполагается, что ХД обеспечит чистые, интегрированные, соответствующие и согласованные данные, извлеченные из
множества источников; с другой стороны, есть расписание разработки, составленное в расчете на 6-12 месяцев. Практически невозможно достичь обеих целей одновременно, не идя на какиелибо компромиссы. Трудность в том, чтобы определиться с существом этих компромиссов.
Подготовка данных для СППР
Создание ХД позволяет произвести следующий этап автоматизации деятельности предприятия — подготовить данные для
систем поддержки принятия решений. Основным отличием деятельности по принятию решений от исполнительской деятельности, с точки зрения используемых данных, является потребность
во всестороннем видении процессов во всем многообразии параметров, от которых они зависят, за различные временные промежутки. Для создания систем поддержки принятия решений необходима полная, непротиворечивая информация за различные
временные промежутки, которая может быть, как обобщена (просуммирована или агрегирована другим способом), так и детализирована.
68
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Минимизация количества несовместимых отчетов
Другой распространенной проблемой сегодняшних сред
СППР является несовместимость отчетов. Несовместимые отчеты
в основном происходят от неправильного использования данных,
и первопричиной этого являются разногласия или непонимание
значения или содержимого данных.
Обеспечение возможности совместного доступа к данным
Если совместный доступ к данным является одной из задач
ХД, то необходимо включить туда некоторую очистку данных,
урегулирование разногласий по данным и компоненты средств
доступа, основанные на метаданных в качестве инструментов
достижения этой цели. Эти компоненты представляют собой
предварительные условия совместного доступа к данным. Двумя
другими существенными компонентами являются проектирование БД и организация доступа к ней.
Соединение исторических данных с текущими данными
Типичной задачей ХД является сохранение истории. Эта задача сопровождается своими проблемами. Исторические данные
редко хранятся в операционных системах, и даже если они там
хранятся, трудно найти трехлетнюю или пятилетнюю историю в
рамках одного файла.
Концепция хранилищ данных
Концепция определяет процесс сбора, отсеивания, предварительной обработки и накопления данных с целью долговременного хранения данных и предоставления результирующей информации пользователям в удобной форме для статистического анализа и создания аналитических отчетов. В основе концепции ХД
лежат две основополагающие идеи:
Интеграция ранее разъединенных детализированных (описывающих некоторые конкретные факты, свойства, события и
т.д.) данных в едином ХД : исторические архивы, данные из традиционных СОД, данные из внешних источников в едином ХД,
их согласование, и возможно, агрегация. Интегрированность означает, что, например, данные, полученные из различных источников, хранятся согласованно и централизованно.
Разделение наборов данных, используемых для операционной обработки и наборов данных, используемых для решения задач анализа, применяемых в системах поддержки принятия ре69
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
шений. Такое разделение возможно путем интеграции источников ранее разъединенных детализированных данных в едином
ХД, их согласования и, возможно, агрегации.
Цель концепции ХД
Цель концепции ХД – прояснить отличия в характеристиках
данных в операционных и аналитических системах, определить
требования к данным, помещаемым в целевую БД ХД, определить общие принципы и этапы её построения, основные источники данных, дать рекомендации по решению потенциальных проблем, возникающих при их выгрузке, очистке, согласовании,
транспортировке и загрузке в целевую БД.
Для правильного понимания данной концепции необходимо
понимание следующих принципиальных моментов, заключающихся в том, что концепция ХД:
– это не концепция анализа данных, скорее это концепция
подготовки данных для анализа;
– не предопределяет архитектуру целевой аналитической
системы. Она говорит о том, какие процессы должны выполняться в системе, но не о том, где конкретно и как эти процессы
должны выполняться;
– предполагает не просто единый логический взгляд на данные организации (как иногда это трактуется). Она предполагает
реализацию единого интегрированного источника данных.
Свойства данных
Билл Инмон (W. Inmon ), считающийся основателем нового
направления развития технологии БД, дал классическое определение информационного хранилища в 1990 г . Он охарактеризовал
его как “предметно ориентированные, интегрированные, неизменчивые, поддерживающие хронологию наборы данных, организованные для целей поддержки управления”, призванные выступать в
роли “единого и единственного источника истины”, обеспечивающего менеджеров и аналитиков достоверной информацией, необходимой для оперативного анализа и принятия решений.
В основе концепции Хранилищ Данных лежат две основополагающие идеи:
70
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
 Интеграция ранее разъединенных детализированных данных:
 исторические архивы,
 данные из традиционных СОД,
 данные из внешних источников
в едином Хранилище Данных, их согласование и, возможно,
агрегация.
 Разделение наборов данных, используемых для операционной обработки, и наборов данных, используемых для решения задач анализа.
Цель концепции Хранилищ Данных – прояснить отличия в
характеристиках данных в операционных и аналитических системах (таблица 2), определить требования к данным помещаемым
в целевую БД Хранилища Данных (таблица 3), определить общие
принципы и этапы её построения, основные источники данных,
дать рекомендации по решению потенциальных проблем возникающих при их выгрузке, очистке, согласовании, транспортировке и загрузке в целевую БД.
Таблица 2
Сравнение характеристик данных в информационных
системах, ориентированных на операционную
и аналитическую обработку данных
Характеристика
Частота обновления
Источники данных
Объемы хранимых данных
Возраст данных
Назначение
Операционные
Высокая частота, маленькими порциями
В основном внутренние
Аналитические
Малая частота, большими
порциями
В основном внешние
Сотни мегабайт, гигабайты Гигабайты и терабайты
Текущие (за период от нескольких месяцев до одного года)
Фиксация, оперативный
поиск и преобразование
данных
71
Текущие и исторические (за
период в несколько лет, десятки лет)
Хранение детализированных и агрегированных исторических данных, аналитическая обработка, прогнозирование и
моделирование
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 3
Основные требования к данным в Хранилище Данных
Предметная ори- Все данные о некотором предмете (бизнес-объекте) соентированность бираются (обычно из множества различных источников),
очищаются, согласовываются, дополняются, агрегируются и представляются в единой, удобной для их использования в бизнес анализе форме.
ИнтегрированВсе данные о разных бизнес-объектах взаимно согласоность
ваны и хранятся в едином общекорпоративном Хранилище
Неизменчивость Исходные (исторические) данные, после того как они
были согласованы, верифицированы и внесены в общекорпоративное Хранилище, остаются неизменными и
используются исключительно в режиме чтения
Поддержка хро- Данные хронологически структурированы и отражают
нологии
историю за достаточный для выполнения задач бизнесанализа и прогнозирования период времени.
В определённом смысле концепция Хранилищ Данных – это
концепция построения аналитической системы, но не концепция
её использования. Но данные собираются не для того чтобы храниться, они должны работать. Ответ на вопрос, как наилучшим
образом и наиболее полно использовать уже собранные и подготовленные для анализа данные, и дают различные концепции
анализа данных:
 Традиционный статический DSS.
 OLAP/ROLAP – динамический интерактивный многомерный анализ данных.
Традиционный статический DSS. Всего три-четыре года назад результатом работы любой аналитической системы являлись
регламентированные многостраничные отчеты и диаграммы. Но,
как правило, после просмотра такого отчета, у аналитика появлялся не готовый ответ, а новая серия вопросов. Однако если бы
ему захотелось получить ответ на новый, не предусмотренный
при проектировании системы вопрос, он мог ждать его часами, а
иногда и днями.
Каждый новый запрос в системах, реализуемых на основе
традиционных технологий статического анализа данных (табли72
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ца 4), должен быть сначала формально описан, передан программисту, запрограммирован и, наконец, выполнен. Но после того
как аналитик, наконец, получал долгожданный ответ, достаточно
часто оказывалось, что решение не могло ждать и оно уже принято, или, что ещё чаще, произошло взаимное непонимание и получен ответ совсем не на тот вопрос.
Таблица 4
Сравнение характеристик статического
и динамического анализа
Характеристика
Статический анализ
Типы вопросов
Сколько? Как? Когда?
Время отклика
Не регламентируется
Типичные операции Регламентированный
отчет, диаграмма
Уровень аналитиче- Средний
ских требований
Тип экранных форм В основном определенный заранее, регламентированный
Уровень агрегации Детализированные
и
данных
суммарные
Возраст данных
Исторические, текущие
и прогнозируемые
Типы запросов
В основном предсказуемые
Назначение
Регламентированная
аналитическая
обработка
Динамический анализ
Почему? Что будет, если?
Секунды
Последовательность
интерактивных отчетов, диаграмм, экранных форм. Динамическое изменение уровней агрегации и срезов
данных.
Высокий
Определяемый
лем
пользовате-
В основном суммарные
Исторические, текущие и
прогнозируемые
Непредсказуемые, от случаю
к случаю
Многопроходный
анализ,
моделирование и построение
прогнозов
Динамический интерактивный многомерный анализ данных
(OLAP/ROLAP). У истоков концепции многомерного динамического анализа OLAP стоит основоположник реляционного подхода Э.Кодд [3], сформулировавший 12 основных требований к
средствам реализации OLAP (см. следующий раздел пособия).
73
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Компоненты типичного ХД
Оперативные данные собираются из различных источников,
очищаются, интегрируются и складываются в реляционное ХД.
При этом они уже доступны для анализа при помощи различных
средств построения отчетов. Затем данные (полностью или частично) подготавливаются для OLAP-анализа. Они могут быть загружены в специальную БД OLAP или оставлены в реляционном
ХД. Важнейшим его элементом являются метаданные, т.е. информация о структуре, размещении и трансформации данных.
Благодаря им обеспечивается эффективное взаимодействие различных компонентов хранилища.
Без поддержки хронологии (наличия исторических данных)
нельзя говорить о решении задач прогнозирования и анализа тенденций. Но наиболее критичными и болезненными оказываются
вопросы, связанные с согласованием данных.
Основным требованием аналитика является даже не столько
оперативность, сколько достоверность ответа. Но достоверность,
в конечном счете, и определяется согласованностью. Пока не
проведена работа по взаимному согласованию значений данных
из различных источников, сложно говорить об их достоверности.
Практически в любой организации вопрос о согласованности
данных в различных информационных системах стоит чрезвычайно остро. И нередко менеджер сталкивается с ситуацией, когда на один и тот же вопрос различные системы могут дать и
обычно дают различные ответы. Это может быть связано с несинхронностью моментов модификации данных, отличиями в
трактовке одних и тех же событий, понятий и данных, изменением семантики данных в процессе развития предметной области,
элементарными ошибками при вводе и обработке, частичной утратой отдельных фрагментов архивов и т.д. Очевидно, что учесть
и заранее определить алгоритмы разрешения всех возможных
коллизий мало реально. Тем более, это нереально сделать в оперативном режиме, динамически, непосредственно в процессе
формирования ответа на запрос.
Структура информационной системы на основе ХД
ИАС ХД функционирует по следующему сценарию: по заданному регламенту в него собираются данные из различных источников – БД систем оперативной обработки. В ХД поддержи74
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
вается хронология: наравне с текущими хранятся исторические
данные с указанием времени, к которому они относятся. В результате необходимые доступные данные об объекте управления
собираются в одном месте, приводятся к единому формату, согласовываются и, в ряде случаев, агрегируются до минимально
требуемого уровня обобщения.
Несмотря на то, что ХД содержат заведомо избыточную информацию, которая и так имеется в базах или файлах оперативных систем, появление концепции ХД вызвано тем, что анализировать данные оперативных систем напрямую невозможно или
очень затруднительно. Это объясняется:
• разрозненностью данных (OLTP-системы, текстовые отчеты, xls-файлы);
• хранением их в форматах различных СУБД и в разных узлах корпоративной сети. Но даже если на предприятии все данные хранятся на центральном сервере БД (что бывает крайне редко), аналитик почти наверняка не разберется в их сложных, подчас запутанных структурах;
• сложные аналитические запросы к оперативной информации тормозят текущую работу компании, надолго блокируя таблицы и захватывая ресурсы сервера.
Data Mart – Витрины данных
Облегченным вариантом корпоративного ХД является Витрина Данных (киоск, секция, лавка, рынок, ВД) – это набор тематически связанных БД, содержащих информацию, относящуюся к
отдельным аспектам деятельности организации. По сути дела,
ВД – это облегченный вариант ХД, существенно меньше по объему, чем корпоративный ХД, и для его реализации не требуется
особо мощная вычислительная техника.
Концепция ВД была предложена Forrester Research в 1991 году. При этом главная идея заключалась в том, что ВД максимально приближены к конечному пользователю и содержат только
тематические подмножества заранее агрегированных данных, по
размерам гораздо меньшие, чем общекорпоративное ХД и, следовательно, требующие менее производительной техники для поддержания. Концепция ВД ориентирована исключительно на хранение, а не на обработку корпоративных данных. Она не предо75
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
пределяет архитектуру целевых аналитических систем, а только
создает поле деятельности для их функционирования, концентрируясь на требованиях к данным. Таким образом, она оставляет
свободу выбора во всем, что касается способов представления
данных в целевом ХД (реляционный, многомерный) и режимов
анализа данных хранилища.
В большинстве случае витрина данных – это аналитическая
структура, которая обычно поддерживает область работы одного
приложения, бизнес-процесса или отдела. Сотрудники отдела
обобщают требования к информации и приспосабливают каждую
витрину к своим нуждам. Затем они обеспечивают персонал, работающий с информацией, средствами интерактивной отчетности
(например, инструментами OLAP, средствами формирования незапланированных запросов или параметризованных отчетов). Эти
средства позволяют сотрудникам углубляться в данные и исследовать их пространственную структуру "вдоль и поперек", чтобы
выявить тренды и получить более детальную картину событий,
являющихся движущими силами тех процессов или задач, которыми эти сотрудники управляют.
Сравнение оперативных и аналитических баз данных
С точки зрения обеспечения требуемых данных различаются
оперативные (OLTP) и аналитические информационные приложения (OLAP), помогающие принимать бизнес-решения за счет
динамически производимых анализа, моделирования и/или прогнозирования данных:
• хранилище данных должно включать как внутренние
корпоративные данные, так и внешние данные. Основным источником информации, поступающей в оперативную БД, является деятельность корпорации, а для проведения анализа данных
требуется привлечение внешних источников информации (например, статистических отчетов);
• объем аналитических баз данных как минимум на порядок больше объема оперативных. Для оперативной обработки
требуются данные за несколько последних месяцев, а для проведения достоверных анализа и прогнозирования в ХД нужно иметь
информацию о деятельности корпорации и состоянии рынка на
протяжении нескольких лет;
76
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
• хранилище данных должно содержать единообразно
представленную и согласованную информацию, максимально
соответствующую содержанию оперативных БД. Необходима
компонента для извлечения и "очистки" информации из разных
источников. Во многих крупных корпорациях одновременно существуют несколько оперативных ИС с собственными БД (по историческим причинам). Оперативные БД могут содержать семантически эквивалентную информацию, представленную в разных
форматах, с разным указанием времени ее поступления, иногда
даже противоречивую;
• системы обработки данных (СОД) создаются в расчете
на решение конкретных задач. Информация из БД выбирается
часто и небольшими порциями. Обычно набор запросов к оперативной БД известен уже при проектировании. Набор запросов к
аналитической базе данных предсказать невозможно. ХД существуют, чтобы отвечать на нерегламентированные (ad hoc) запросы
аналитиков. Можно рассчитывать только на то, что запросы будут поступать не слишком часто и затрагивать большие объемы
информации. Размеры аналитической БД стимулируют использование запросов с агрегатами (сумма, минимальное, максимальное, среднее значение и т.д.);
• системы обработки данных по своей природе являются
сильно изменчивыми, что учитывается в используемых СУБД
(нормализованная структура БД, строки хранятся неупорядоченно, B-деревья для индексации, транзакционность). При малой изменчивости аналитических БД (только при загрузке данных) оказываются разумными упорядоченность массивов, более быстрые
методы индексации при массовой выборке, хранение заранее агрегированных данных;
• для СОД обычно хватает защиты информации на уровне таблиц. Информация аналитических БД настолько критична
для корпорации, что требуются большая грануляция защиты (индивидуальные права доступа к определенным строкам и/или
столбцам таблицы).
77
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Хранилища данных с возможностями Data Mining и
Exploration
ХД, поддерживающие технологию Data Mining (метод «добычи данных») и Exploration (метод исследования данных), являются гибридом классических Хранилищ. Такие Хранилища используются для выполнения мощной статистической обработки
данных, т.к. являются очень детальными, глубоко историческими
и оптимизированными для статистического анализа.
Кроме того, для таких Хранилищ характерна ориентация на
какой-либо проект. Это означает, что, в отличие от всех других
типов ХД, их перестают использовать сразу по завершении анализа, ради которого они создавались.
Еще одно важное отличие ХД с возможностями Data Mining /
Data Mining и Exploration заключается в том, что эти Хранилища
очень часто включают внешние данные. Такие данные очень полезны с точки зрения обеспечения бизнес-перспективы, которую
не так легко увидеть без их участия.
3.2. Информационные технологии
оперативной аналитической
обработки данных (OLAP)
OLAP (On-Line Analytical Processing) – это класс приложений
и технологий, предназначенных для оперативной аналитической
обработки многомерных данных (сбор, хранение, анализ) для
анализа деятельности корпорации и прогнозирования будущего
состояния с целью поддержки принятия управленческих решений. Технология OLAP применяется, чтобы упростить работу с
многоцелевыми накопленными данными о деятельности корпорации в прошлом и не погрязнуть в их большом объеме, а также
превратить набор количественных показателей в качественные,
позволяет аналитикам, менеджерам и управляющим сформировать свое собственное видение данных, используя быстрый, единообразный, оперативный доступ к разнообразным формам представления информации. Такие формы, полученные на основании
первичных данных, позволяют пользователю сформировать полноценное представление о деятельности предприятия.
78
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Функциональность OLAP как систем реализующих интеллектуальный анализ данных заключается в динамическом многомерном анализе консолидированных данных предприятия, направленном на поддержание следующих аналитических и навигационных видов деятельности пользователя:
• вычисления и моделирование, примененные к измерениям
и/или их конкретным элементам, использующие информацию об
иерархиях;
• анализ временных тенденций и взаимозависимостей показателей (анализ трендов), учет которых помогает повысить качество принимаемых оперативных и стратегических решений;
• формирование срезов многомерного представления для
просмотра на экране;
• переход к более глубоким уровням детализации;
• доступ к исходным данным;
• "вращение" многомерных представлений: перемещение измерений с целью формирования различных форм представления
данных на экране компьютера.
OLAP-технология является альтернативой традиционным методам анализа данных, основанным на различных системах реализации SQL-запросов к реляционной БД. OLAP-системы играют
важнейшую роль в анализе и планировании деятельности крупных предприятий и являются одним из направлений развития ИТ.
В основу кладутся требования людей, принимающих решения, к
предоставляемой информации, сложившиеся индивидуальные
особенности ведения дел и механизм принятия решения. С точки
зрения пользователя основное отличие OLAP-системы от ХД заключается: в предметной структурированности информации
(именно предметной, а не технической). Работая с OLAPприложением, пользователь применяет привычные категории и
показатели – виды материалов и готовой продукции, регионы
продаж, объем реализации, себестоимость, прибыль и т. п. А для
того чтобы сформировать любой, даже довольно сложный запрос,
пользователю не придется изучать SQL. При этом ответ на запрос
будет получен в течение всего нескольких секунд. Кроме того,
работая с OLAP-системой, экономист может пользоваться такими
привычными для себя инструментами, как электронные таблицы
или специальные средства построения отчетов.
79
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Разработка решений по управлению предприятием
Разработка решений по управлению предприятием попадает в разряд областей, наиболее сложно поддающихся автоматизации. Однако сегодня имеется возможность оказать помощь руководителю в разработке решений и, самое главное, значительно
ускорить сам процесс разработки решений, их отбора и принятия.
Фактически, руководители различных рангов получают принципиально новый инструмент для более эффективного принятия
управленческих решений.
На сегодняшний момент проблему понимания и установления взаимосвязей между агрегированными данными наилучшим
образом решают продукты, использующие многомерный оперативный анализ данных OLAP. Корпоративная аналитическая система, построенная на основе OLAP-технологии, позволяет различным категориям пользователей компании в реальном масштабе времени работать с обобщенной аналитической информацией
и эффективно ориентироваться в больших объемах данных.
OLAP-модули редко взаимодействуют с другими системами автоматизации, ведь БД последних зачастую имеют достаточно
своеобразный вид и набор специальных показателей.
Главная особенность аналитических БД (OLAP) – это
возможность формирования нерегламентированных запросов к
аналитической БД. Загрузка данных в систему производится из
оперативной БД предприятия. Корпоративная аналитическая система может состоять из нескольких модулей, каждый из которых
обрабатывает несколько информационных массивов, необходимых для проведения всестороннего анализа соответствующего
аспекта деятельности предприятия. Информационная модель, на
основе которой разработана информационная система, в полном
объеме описывает все аспекты предметной области и обеспечивает наглядность и простоту доступа к необходимым для анализа
данным.
Внешнее отображение информации в системе
Внешнее отображение информации в системе реализовано в
виде электронной таблицы или графика с использованием механизма двумерных сечений куба многомерной БД. Сечение определяется пользователем путем выбора двух независимых размерностей (ребер куба), значения которых будут представлены в
80
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
строках и столбцах электронной таблицы, и фиксации значений
всех других размерностей информационной модели. Интерфейс
предлагаемой системы представляет собой несколько экранных
форм, каждая из которых включает в себя электронную таблицу
или график.
OLAP – это не отдельно взятый программный продукт, не
язык программирования и даже не конкретная технология, это
совокупность концепций, принципов и требований, лежащих в
основе программных продуктов, облегчающих аналитикам доступ к данным. Термин OLAP очень популярен в настоящее время,
и OLAP-системой зачастую, но не совсем верно, называют любую DSS-систему, основанную на концепции ХД и обеспечивающую малое время выполнения (On-Line) аналитических запросов, независимо от того, используется ли многомерный анализ данных.
Преимущества OLAP:
• Предметная ориентированность – означает, что в кубах собрана информация по различным аспектам деятельности организации: закупкам, продажам и т.п. Это отличает базы OLAP от
оперативных БД, где данные организованы в соответствии с различными процессами, такими, как, например, оформление и выписка документов, оформление заказов и др.
• Многопользовательский режим работы – клиент-серверная
архитектура OLAP-продуктов обеспечивает одновременный доступ большого числа пользователей. При этом анализ производится одинаково быстро по всем аспектам информации независимо
от размера и сложности структуры БД.
• Прямой доступ к данным – позволяет пользователю видеть
сразу всю информацию, не отфильтрованную отчетами. То есть,
если пользователь видит документ, например, со странной датой
исполнения (накладная, датированная 5200 годом), то это означает, что такой документ реально существует в исходной (оперативной) базе.
• Сосредоточение необходимых данных в одном месте – это
положение отражает ту особенность, что вся аналитика, например, факта продажи (контрагент, менеджер, дата, вид сделки и
прочее) хранится в том же кубе и доступ к ней не требует допол81
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
нительного обращения к каким-то внешним источникам (справочникам и т.п.).
• Удобные средства доступа – просмотра и анализа деловой
информации. Пользователь получает интуитивно понятную модель данных, организуя их в виде многомерных кубов. Это позволяет ему проводить как сравнительный анализ показателей,
так и анализ различных сценариев по принципу "что – если", построенных на основе прогнозных и статистических данных компании.
• Удобная навигация по данным – как правило, с использование мышки.
• Перемещение по иерархиям внутри измерения (переход от
анализа по годам к анализу по кварталам, от анализа продаж по
менеджерам к анализу продаж по регионам и т.д.).
• Перемещение между измерениями (переход от анализа по
измерению «Время» к анализу по «Товарам» и т.д.).
• Разнообразные инструменты для обработки данных –
встроенные функции агрегации, ранжирования, сортировок, вычисления, правило Парето (80/20) и т.д.
• Визуализация информации – от того насколько удобно для
восприятия пользователя будут представлены срезы, зависит качество анализа информации.
• On-line функционирование – обеспечивают выявление ассоциаций, закономерностей, трендов, проведение классификации,
обобщения или детализации, составление прогнозов, т.е. предоставляет инструмент для управления предприятием в реальном
времени.
• Простота освоения и использования сводных таблиц – мало
найдется пользователей, которые не работали бы с Excel. Excel
как один из вариантов OLAP-клиента очень прост в использовании. Сводные таблицы Excel легко воспринимаются и требуют
незначительных навыков в работе с ними.
• Неизменность данных – позволяют формировать и в дальнейшем использовать для анализа массивы заранее обработанных
данных (предвычисленные индексы), потому что OLAP-системы
работают не с оперативными базами данных, а со стратегическими архивами, отличающимися низкой частотой обновления, интегрированностью, хронологичностью и предметной ориентиро82
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ванностью. Именно неизменность данных и позволяет вычислять
их промежуточное представление, ускоряющее анализ гигантских объемов информации.
• Хорошая оперативность – в отличие от классических методов поиска запросы формируются не на основе жестко заданных
(или требующих для модификации вмешательства программиста
и, следовательно, времени) форм, а с помощью гибких нерегламентированных подходов.
• Быстрая детализация итоговых данных – просматривая
сводные таблицы, пользователь видит сначала итоговые значения
показателей (например, за период или по группе), и в случае необходимости может их легко детализировать (например, по
2006 году, по первому кварталу).
• Высокая скорость формирования отчетов – скорость выполнения OLAP – в десятки раз отличается от обычных. Дело в
том, что в OLAP-кубах расчет необходимых данных происходит
заранее, и при формировании отчета пользователь ждет только
вывода данных. Любой сложности OLAP – отчеты строятся не
более 5 – 10 секунд.
• Высокая точность отчетов – многие сталкивались с «не состыковкой» данных: по вине дефекта учетной программы или изза того, что учет велся параллельно в нескольких учетных системах. Например, когда не совпадают итоговые значения в разных
разрезах. В OLAP-отчетах таких ситуаций не возникает. Поэтому
всем данным OLAP-отчета можно доверять.
• Возможность самостоятельного формирования нужных отчетов – в отличие от традиционных программ, которые выводят
таблицу строго определенной формы и содержания, OLAPтехнологии дают пользователю сформировать тот отчет, который
ему необходим в данный момент. Пользователь может развернуть
данные по произвольной аналитике, посмотреть их более или менее подробно (например, разложить по дням данные за месяц или
же посмотреть те же цифры поквартально), вывести или же убрать какие-то показатели, сформировать иерархические заголовки
таблицы и многое другое.
• Возможность сведения данных из разных баз – если в компании несколько подразделений с разной структурой БД и раз83
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ными учетными программами, то OLAP-отчетность позволяет
свести данные, консолидировать их.
• Отсутствие привлечения программистов на текущие задачи.
Для того чтобы пользоваться OLAP-отчетностью, необходимо
сформулировать один раз требования к ней. После этого специалист создаст механизмы наполнения ХД. На основании данных
пользователь может сам создавать необходимые отчеты. Один
отчет может заменять несколько отчетов простой системы. Легкость оперирования данными в OLAP–отчетах позволяет сэкономить деньги на создании многих обычных отчетов. Не требуется
оплачивать обучение, потому как пользоваться Excel могут практически все.
Недостатки OLAP
• слабая предрасположенность к произвольному дизайну
форм, т.к. OLAP-отчеты – это, как правило, сводные таблицы;
• выгрузка данных из баз в хранилище, разработка ХД, схемы
наполнения его данными – требует высокого уровня знаний специалиста;
• при своем внедрении требуют достаточно большого объема
дополнительных работ, прежде всего в области интеграции с
имеющимися бизнес-системами (например, производственными
системами, логистикой, системами складского и финансового
учета). С технической точки зрения это означает необходимость
разработки модулей сопряжения и переноса (преобразования)
данных из этих систем, а также правильно подобранной аппаратной платформы;
• их использование связано с созданием ХД, которые в отличие от традиционных систем автоматизации оптимизируются на
предоставление большого объема данных по различным аналитическим запросам. Причем во многих случаях эти данные проходят предварительную обработку в самих хранилищах с целью
уменьшения излишней детализации и увеличения скорости доступа;
• так как целью OLAP является быстрое предоставление разнообразной информации, подчас заранее не фиксированной, поэтому построение ХД должно производиться в изначально избыточном, с точки зрения классической теории построения реляционных БД, виде. Это связано с тем, что бизнес-системы
84
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
оптимизированы на ввод фиксированной информации и уменьшение объема данных (нормализация БД).
Предпосылки и причины появления OLAP
Глобализация экономики, повышение требовательности
клиентов, усиление конкурентной борьбы, процессы слияния
компаний, появление молодых, быстро развивающихся предприятий на волне электронной коммерции – все это требует маневренности и интеллектуализации бизнеса. Но для этого компаниям
нужно повышать качество и скорость принятия решений в рамках
своей деятельности, а также применять средства бизнес–
интеллекта для периодической реорганизации бизнес–процессов.
Вот почему все более востребованы сегодня комплексные методики анализа эффективности бизнеса.
Для большинства организаций характерно наличие многочисленных разрозненных источников данных; еще хуже то, что
источники эти часто содержат неактуальные, несогласованные
или просто недостоверные данные. А это ведет к принятию неэффективных, а то и неверных решений.
Помимо чисто технических проблем (организация доступа к
разным несогласованным источникам данных или консолидация
данных в одном источнике) имеются проблемы методические
(классификация и описание информации в терминах предметной
области, способы контроля и очистки данных), а также организационные (владение и санкционирование доступа к информации).
Исторически сложилось так, что до середины 90-х годов были наиболее развиты решения по автоматизации оперативной
деятельности (учет людских, материальных и финансовых ресурсов, регистрация различных операций и событий) – системы
транзакционной обработки данных (OLTP – On-Line Transaction
Processing), часто называемые оперативными системами. Эти
системы обеспечивают регистрацию некоторых фактов, их непродолжительное хранение и сохранение в архивах, обеспечивают решение лишь оперативных, в меньшей мере тактических, но
не обеспечивают решение стратегических задач, а потому не
удовлетворяет в полной мере потребности бизнеса.
Основу таких систем составляют системы управления реляционными базами данных, зачастую основанные на традици85
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
онном подходе – использовании уже построенных имеющихся
систем для поддержки принятия решений. Обычно пытались
строить просто систему запросов к оперативной системе и использовать полученные после интерпретации отчеты непосредственно для поддержки решений. Отчеты могли строиться на заказной базе, т.е. руководитель запрашивает отчет, и на регулярной, когда отчеты строятся по достижении некоторых событий
или времени.
Предназначение OLAP систем – в предоставлении информации для принятия решений. В основе концепции OLAP лежит
идея многомерной модели данных. OLAP является средством
оперативной аналитической обработки многомерных массивов
данных:
• позволяет значительно упростить и ускорить процесс подготовки и принятия решений руководящим персоналом;
• служит цели превращения данных в информацию;
• принципиально отличается от традиционного процесса поддержки принятия решений, основанного на рассмотрении структурированных отчетов.
Многомерность в OLAP-приложениях может быть разделена
на три уровня.
Три уровня многомерности в OLAP-приложениях:
• Многомерное представление данных – средства конечного пользователя, обеспечивающие многомерную визуализацию и
манипулирование данными; слой многомерного представления
абстрагирован от физической структуры данных и воспринимает
данные как многомерные.
• Многомерная обработка – средство (язык) формулирования многомерных запросов (традиционный реляционный язык
SQL здесь оказывается непригодным) и процессор, умеющий обработать и выполнить такой запрос.
• Многомерное хранение – средства физической организации данных, обеспечивающие эффективное выполнение многомерных запросов.
Первые два уровня в обязательном порядке присутствуют во
всех OLAP-средствах. Третий уровень, хотя и является широко
распространенным, не обязателен, так как данные для многомерного представления могут извлекаться и из обычных реляцион86
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ных структур; процессор многомерных запросов в этом случае
транслирует многомерные запросы в SQL-запросы, которые выполняются реляционной СУБД.
Теоретически средства OLAP можно применять и непосредственно к оперативным данным или их точным копиям (чтобы не
мешать оперативным пользователям). Но в этом случае существует определенный риск, поскольку будут анализироваться оперативные данные, которые напрямую для анализа непригодны.
Принципы проектирования и использования
многомерных БД
Многомерный подход возник практически одновременно и
параллельно с реляционным, но только начиная с 1993 г. интерес
к многомерным системам управления БД (МСУБД) начал приобретать всеобщий характер. Главное достоинство МСУБД состоит
в том, что они узко специализированы и область их применения –
интерактивная аналитическая обработка агрегированных исторических и прогнозируемых данных.
Многомерный анализ (Multi-dimensional analysis) – позволяет пользователям при работе с данными достичь глубокого понимания информации, хранящейся в БД. Многомерный подход к
анализу предоставляет аналитику широкие возможности моделирования данных в соответствии со сложившимся у него представлением о проблеме, снижая тем самым вероятность ошибочной интерпретации полученных результатов. Поскольку многомерная модель отображает информацию так, как большинство
людей ее себе представляют, то используется интуитивная навигация по БД. Кроме того, значительно упрощаются процедуры
отображения на экране необходимых аналитику подмножеств
данных, представления различных срезов информации, а также
процедура задания алгоритма вычислений. В силу того, что данные хранятся в многомерной БД, выполнение подобных операций
характеризуется гораздо более высокой скоростью и стабильной
производительностью (по сравнению с базами данных любой
другой структуры). Уникальное сочетание быстродействия и
простоты использования является одним из основных преимуществ многомерного анализа.
87
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Типы используемых данных
В системах анализа многомерных данных можно выделить
три основных типа данных, анализ которых позволяет производить прогнозирование бизнес-процессов.
Агрегированные данные – пользователя, занимающегося
анализом, редко интересуют детализированные данные. Более того, чем выше уровень пользователя (руководителя, управляющего, аналитика), тем выше уровень агрегации данных, используемых им для принятия решения.
Пример.
Имеется фирма по продаже компьютеров. Коммерческого
директора такой фирмы мало интересует вопрос: "Какого цвета
компьютеры успешнее всего продает менеджер Петров: черного
или серебристого?" Для него важно, какие модели и какие цвета
предпочитают в данном регионе. Его также мало интересует детализация на уровне контракта, часа или даже дня. Например, если выяснится, что Celeron серебристого цвета чаще покупают в
утренние часы, этот факт скорее заинтересует психиатра, а не
коммерческого аналитика. Для правильного формирования склада ему важна и необходима информация на уровне декады, месяца или даже квартала.
Исторические данные – Важнейшим свойством данных в
аналитических задачах является их исторический характер. После
того как зафиксировано, что Иванов в июне 2005 г . продал 2
компьютера Celeron и 12 компьютеров Pentium, данные об этом
событии становятся историческим (свершившимся) фактом. И
после того, как информация об этом факте получена, верифицирована и заведена в БД, она может быть сколько угодно раз считана оттуда, но уже не может и не должна быть изменена.
Историчность данных предполагает не только высокий уровень статичности (неизменности) как собственно данных (например: Иванов продал в 2005 г. 31 компьютер Celeron), так и их
взаимосвязей (например: в 2005 г. Петров работал в г. Ростов; в
2005 г. продавались компьютеры модели Celeron). А это, в свою
очередь, дает возможность использовать специализированные,
основанные на предположении о статичности данных и их взаимосвязей методы загрузки, хранения, индексации и выборки.
88
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прогнозируемые данные – когда говорится о неизменности
и статичности данных в аналитических системах, имеется в виду
неизменность исключительно исторических данных (данных,
описывающих уже произошедшие события). Существенным моментом является то, что такое предположение ни в коем случае
не распространяется на Прогнозируемые данные (данные о событии, которое еще не происходило).
Например, если строится прогноз об объеме продаж на сентябрь 2006 г. для менеджера Иванова, то, по мере поступления
фактических (исторических) данных за 2004 г., эта цифра будет
многократно изменяться и уточняться. Более того, достаточно
часто прогнозирование и моделирование затрагивает не только
будущие, еще не произошедшие, но и прошлые, уже свершившиеся события. Например, анализ: "а что будет (было бы)... если
(бы)..?", строится на предположении о том, что значения некоторых данных, в том числе и из прошлого, отличны от реальных. И
для ответа на вопрос: "Какой был бы прогноз по объему продаж
компьютеров Celeron для менеджера Иванова на сентябрь
2005 г., если бы объем продаж компьютеров Celeron в сентябре
2005 г. у него возрос на тот же процент, что объем продаж
Pentium" потребуется не только вычислить новое, еще не существующее значение Объема Продаж, для еще не наступившего сентября 2006 г., но и предварительно вычислить гипотетическое
значение Объема продаж за уже прошедший сентябрь 2005 г.
В свою очередь, к оперативным данным, отражающим состояние некоторой предметной области в данный текущий момент времени, не применимы такие понятия, как прошлое или
будущее. Для них существует единственное понятие – сейчас, а
их основное назначение – адекватное детализированное отображение текущих событий (изменений), происходящих в реальном
мире.
Пример.
Менеджер Иванов продал еще один компьютер Celeron; менеджера Иванова перевели из Ростовского филиала фирмы в Угличский.
Вместе с тем изменчивость оперативных данных ни в коем
случае не подразумевает их близость по свойствам к прогнозируемым данным. Между ними существует коренное различие.
89
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оперативным данным, в отличие от прогнозируемых, присуще
свойство общезначимости, и обычно все пользователи работают с
одним и тем же экземпляром данных. После того как в оперативную систему заведены данные о том, что Петров продал еще один
компьютер, эта информация сразу же должна стать доступной
всем заинтересованным в ней пользователям. Причем до тех пор,
пока это изменение не зафиксировано, никакой другой пользователь не имеет права изменять строку с информацией о продажах
Петрова.
Существенно иная ситуация с прогнозируемыми данными.
Они носят, скорее, личностный (индивидуальный) характер.
Вполне реальна ситуация, когда коммерческий директор фирмы и
управляющий региональным отделением одновременно решили
получить прогноз возможного объема продаж на 2006 г. для Иванова. Однако каждый из них делает собственный прогноз. Каждый из них может использовать свои функции прогнозирования,
и, даже если применяется один и тот же метод (или функция),
прогноз может основываться на различных исторических интервалах, и результаты, по всей вероятности, будут различны. Поэтому каждый из них работает с собственным экземпляром прогнозируемых данных (хотя эти данные и относятся формально к
одной и той же личности, виду деятельности и времени), и эти
данные не должны смешиваться. Конечно, вполне вероятно, что
один из этих вариантов будет принят в качестве плановых показателей для Иванова. Но после того как прогноз утвержден в качестве плана, данные просто перейдут в другую категорию и станут историческими.
12 основных правил OLAP- систем по Кодду
В 1993 Е.Ф. Кодд с партнерами опубликовали статью, инициированную компанией Arbor Software (сегодня это Hyperion
Solutions), озаглавленную «Обеспечение OLAP (оперативной
аналитической обработки) для пользователей – аналитиков», как
некий "мандат" информационной технологии.
90
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица 5
Правила оценки программных продуктов класса OLAP
1.
Многомерное концептуальное представление
данных
(MultiDimensional Conceptual
View)
2.
Прозрачность
(Transparency)
3.
Доступность
(Accessibility)
4.
Устойчивая производительность
(Consistent
Reporting Performance)
5.
Клиент – серверная архитектура (Client-Server
Architecture)
Концептуальное представление модели
данных в продукте OLAP должно быть
многомерным по своей природе, то есть
позволять аналитикам выполнять интуитивные операции "анализа вдоль и поперек" ("slice and dice"), вращения (rotate) и
размещения (pivot) направлений консолидации.
Пользователь не должен знать о том, какие
конкретные средства используются для
хранения и обработки данных, как данные
организованы и откуда берутся.
Аналитик должен иметь возможность выполнять анализ в рамках общей концептуальной схемы, но при этом данные могут
оставаться под управлением оставшихся
от старого наследства СУБД, будучи при
этом привязанными к общей аналитической модели. То есть инструментарий
OLAP должен накладывать свою логическую схему на физические массивы данных, выполняя все преобразования, требующиеся для обеспечения единого, согласованного и целостного взгляда
пользователя на информацию.
С увеличением числа измерений и размеров базы данных аналитики не должны
столкнуться с каким бы то ни было
уменьшением производительности. Устойчивая производительность необходима
для поддержания простоты использования
и свободы от усложнений, которые требуются для доведения OLAP до конечного
пользователя.
Большая часть данных, требующих оперативной аналитической обработки, хранится в мэйнфреймовых системах, а извлекается с персональных компьютеров. Поэтому одним из требований является
способность продуктов OLAP работать в
91
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
6.
Равноправие измерений
(Generic Dimensionality)
7.
Динамическая обработка разреженных матриц
(Dynamic Sparse Matrix
Handling)
8.
Поддержка многопользовательского режима
(Multi-User Support)
9.
Неограниченная
поддержка
кроссмерных
операций (Unrestricted
Cross-dimensional
Operations)
среде клиент-сервер. Главной идеей здесь
является то, что серверный компонент инструмента OLAP должен быть достаточно
интеллектуальным и обладать способностью строить общую концептуальную
схему на основе обобщения и консолидации различных логических и физических
схем корпоративных баз данных для обеспечения эффекта прозрачности.
Все измерения данных должны быть равноправны. Дополнительные характеристики могут быть предоставлены отдельным
измерениям, но поскольку все они симметричны, данная дополнительная функциональность может быть предоставлена
любому измерению. Базовая структура
данных, формулы и форматы отчетов не
должны опираться на какое-то одно измерение.
Инструмент OLAP должен обеспечивать
оптимальную обработку разреженных
матриц. Скорость доступа должна сохраняться вне зависимости от расположения
ячеек данных и быть постоянной величиной для моделей, имеющих разное число
измерений и различную разреженность
данных.
Зачастую несколько аналитиков имеют необходимость работать одновременно с одной аналитической моделью или создавать
различные модели на основе одних корпоративных данных. Инструмент OLAP должен предоставлять им конкурентный доступ, обеспечивать целостность и защиту
данных.
Вычисления и манипуляция данными по
любому числу измерений не должны запрещать или ограничивать любые отношения между ячейками данных. Преобразования, требующие произвольного определения,
должны
задаваться
на
функционально полном формульном языке.
92
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
10.
11.
12.
Интуитивное манипу- Переориентация направлений консолидалирование
данными ции, детализация данных в колонках и
(Intuitive
Data строках, агрегация и другие манипуляции,
Manipulation)
свойственные структуре иерархии направлений консолидации, должны выполняться
в максимально удобном, естественном и
комфортном пользовательском интерфейсе.
Гибкий механизм гене- Должны поддерживаться различные спорации отчетов (Flexible собы визуализации данных, то есть отчеты
Reporting)
должны представляться в любой возможной ориентации.
Неограниченное коли- Настоятельно рекомендуется допущение в
чество измерений и каждом серьезном OLAP инструменте как
уровней
агрегации минимум пятнадцати, а лучше двадцати,
(Unlimited Dimensions измерений в аналитической модели. Более
and Aggregation Levels) того, каждое из этих измерений должно
допускать практически неограниченное
количество определенных пользователем
уровней агрегации по любому измерению
Эти правила можно считать теоретическим базисом оперативной аналитической обработки.
Позднее Пендс (Nigel Pendse) и Крит (Richard Creeth), считая, что правила Кодда недостаточны для удовлетворительного
определения именно OLAP-систем, переработали их в так называемый тест FASMI (Fast Analysis of Shared Multidimensional
Information – быстрый анализ разделяемой многомерной информации), который более полно перечисляет требования к продуктам OLAP.
FASMI – это аббревиатура от названия каждого пункта теста:
• Fast (Быстрый) – означает, что система должна обеспечивать выдачу большинства ответов пользователям в пределах приблизительно пяти секунд. При этом самые простые запросы обрабатываются в течение одной секунды и очень немногие – более
20 секунд.
• Analysis (Анализ) – означает, что система может справляться с любым логическим и статистическим анализом, характерным для данного приложения, и обеспечивает его сохранение
93
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в виде, доступном для конечного пользователя. Хотя некоторое
"предварительное программирование" может быть необходимо,
вряд ли стоит считать, что это приемлемый подход, когда все
прикладные определения должны быть выполнены профессионалом на соответствующем языке.
• Shared (Разделяемый доступ) – означает, что система
осуществляет все требования защиты конфиденциальности (возможно до уровня ячейки) и, если множественный доступ для записи необходим, обеспечивает блокировку модификаций на соответствующем уровне. Не во всех приложениях есть необходимость обратной записи данных. Однако количество таких
приложений растет, и система должна быть способна обработать
множественные модификации своевременным, безопасным способом;
• Multidimensional (Многомерность) – ключевое требование. Система должна обеспечить многомерное концептуальное
представление данных, включая полную поддержку для иерархий
и множественных иерархий, поскольку это определенно наиболее
логичный способ анализировать бизнес организации. Минимальное число измерений, которые должны быть обработаны, не устанавливается, поскольку оно также зависит от приложения, и
большинство продуктов OLAP имеет достаточное количество измерений для тех рынков, на которые они нацелены;
• Information (Информация) – возможность обращаться к
любой нужной информации независимо от ее объема и места
хранения. Необходимая информация должна быть получена там,
где она необходима. Однако многое зависит от приложения.
Учитывая эти требования, OLAP-системы должны обеспечивать возможность получать нужную информацию, в каком бы
электронном ХД она ни находилась. OLAP-cистемы позволяют
формировать вместо традиционных запросов к БД «сколько, где,
когда» запросы типа: «почему, как и т.п.». Например:
• почему хорошо зарекомендовавшая себя система защиты от
НСД в корпоративной сети неэффективна;
• какие негативные последствия возможны при сверхурочной
работе пользователя;
• что следует из совместного появления ряда событий и т.п.
94
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Когда человек задает вопросы, он налагает ограничения,
формулируя вопросы во многих измерениях, поэтому процесс
анализа в многомерной модели приближен к реальности человеческого мышления. В таблице приведена сравнительная характеристика статического и динамического видов анализа данных.
Таблица 6
Сравнительная характеристика статического и
динамического видов анализа данных
Характеристика
Типы вопросов
Время отклика
Типичные операции
Статический анализ
Сколько? Как? Когда?
Не регламентируется
Регламентированный
отчет, таблица, диаграмм
Уровень анали- Средний
тических требований
Тип
экранных В основном, определенформ
ный заранее, регламентированный
Уровень агрега- Детализированные и
ции данных
суммарные
Возраст данных Текущие и прогнозируемые
Типы запросов
В основном, предсказуемые
Назначение
Регламентированная
аналитическая обработка
Динамический анализ
Почему? Что будет, если?
Секунды
Последовательность интерактивных отчетов, диаграмм,
экранных форм. Динамическое изменение уровней агрегации и срезов данных.
Высокий
Определяемый пользователем
В основном, суммарные
Исторические, текущие и
прогнозируемые
Непредсказуемые, от случаю
к случаю
Многопроходный анализ,
моделирование и построение
прогнозов
OLAP = Многомерное представление = Куб
Особое значение простота доступа к данным имеет для системных аналитиков, т.к. они особые потребители корпоративной
информации. Задача аналитика – находить закономерности в
больших массивах данных.
95
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Одиночные факты в БД могут заинтересовать предметного
специалиста, в компетенцию которого входит поиск конкретной
информации. Аналитику одной записи недостаточно – ему, к
примеру, могут понадобиться все аналогичные транзакции, например, за месяц, год. Заодно аналитик отбрасывает ненужные
ему подробности и потребляет данные, которые требуются для
работы, обязательно содержащие числовые значения – это обусловлено самой сущностью его деятельности. Итак, аналитику
нужно много данных, которые являются выборочными, а также
носят характер "набор атрибутов – число". Задачей аналитика является выявление стойких взаимосвязей между атрибутами и числовыми параметрами.
В основе OLAP лежит идея многомерной модели данных, в
которой на смену таким понятиям, как отношения и сущности,
приходят понятия измерений и кубов данных. Технология OLAP,
которую называют также интерактивной (диалоговой) аналитической обработкой, дает возможность на основе многомерной (гиперкубической) модели данных (в отличие от плоской реляционной модели данных) моделировать реальные структуры и связи,
которые исключительно важны для аналитических систем. Она
предназначена для создания мультипараметрических моделей с
целью более адекватно отражать реальные процессы. Технология
OLAP разрешает быстро изменять взгляды на данные в зависимости от выбранных параметров и обеспечить лицу, которое принимает решения, полную картину анализируемых ситуаций.
Измерение
С точки зрения анализа каждый анализируемый факт удобно
рассматривать как функцию от его характеристик. Например, производство изделия есть функция от материалов, станков, рабочих,
инженеров, технологов, управленцев, возможно, еще каких-то существенных параметров. Параметры такого типа носят название
измерений. Реляционная база данных, содержащая всю информацию о предметной области, превращается в ХД в терминах OLAP,
а процесс создания структуры аналитической системы сводится к
определению измерений и организации витрин данных.
Многомерный анализ
Одновременный анализ по нескольким измерениям определяется как многомерный анализ. По измерениям (осям) в мно96
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
гомерной модели откладывают основные факторы (атрибуты),
влияющие на деятельность предприятия, т.е. то, по чему ведется
анализ. В качестве одного из измерений используется время,
иными могут быть, например, изделия, филиалы компании и т.п.
Так получают многомерный куб (гиперкуб, метакуб, куб фактов),
который затем наполняется показателями деятельности предприятия (цены, продажи, план, прибыли, убытки и т.п.). Притом гиперкуб является концептуальной логической моделью организации данных, а не физической реализацией их хранения, поскольку храниться такие данные могут и в реляционных таблицах.
Гиперкуб (Hypercube)
На самом деле, с точки зрения строгой математики кубом такой массив будет далеко не всегда: у настоящего куба количество
элементов во всех измерениях должно быть одинаковым, а у кубов OLAP такого ограничения нет. Тем не менее, несмотря на эти
детали, термин гиперкуб (метакуб) ввиду своей краткости и образности стал общепринятым. Гиперкуб (Hypercube) – это умозрительная многомерная конструкция в многомерном пространстве, образованном плоскостями данных, которые важны для
деятельности предприятия. При этом сама OLAP-система выступает именно в роли гиперкуба, способного накапливать в себе
всю информацию, интересующую руководителя. В качестве ребер (осей) куба в таком случае выступают различные данные.
Пример.
Товар, цена производимого или конкурентного товара, регион, тип покупателя, компании-участники производственного
цикла, подрядчики при организации услуг, объемы продаж, география самой компании.
Кубы OLAP
Куб OLAP может быть и двух-, и трех-, и многомерным – в
зависимости от решаемой задачи. Особо опытным аналитикам
может понадобиться порядка 20 измерений - мощные OLAPпродукты именно на такое количество и рассчитаны. Более простые настольные приложения поддерживают 6 измерений. Измерения гиперкуба могут носить сложный характер, быть иерархическими, между ними могут быть установлены отношения.
97
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
На пересечениях осей – измерений (dimensions) – находятся
данные, количественно характеризующие процесс – меры
(measures): суммы и иные агрегатные функции (min, max, avg,
дисперсия, ср. отклонение и пр.).
Пример.
Объемы продаж в штуках или в денежном выражении, остатки на складе, издержки и т. п.
Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения
(уровней иерархии), где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему
измерению (различные уровни их детализации). В этом случае
становится возможным произвольный выбор желаемого уровня
детализации информации по каждому из измерений. Благодаря такой модели данных пользователи могут формулировать сложные
запросы, генерировать отчеты, получать подмножества данных.
Многомерное концептуальное представление является
наиболее естественным взглядом управляющего персонала на
объект управления. Оно представляет собой множественную перспективу, состоящую из нескольких независимых измерений,
вдоль которых могут быть проанализированы определенные совокупности данных. Одновременный анализ по нескольким измерениям данных определяется как многомерный анализ. Каждое
измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения, где каждый
вышестоящий уровень соответствует большей степени агрегации
данных по соответствующему измерению. Так, измерение Исполнитель может определяться направлением консолидации, состоящим из уровней обобщения «предприятие – подразделение –
отдел – служащий». Измерение Время может даже включать два
направления консолидации – «год – квартал – месяц – день» и
«неделя – день», поскольку счет времени по месяцам и по неделям несовместим. В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по
каждому из измерений. Операция спуска (drilling down) соответствует движению от высших ступеней консолидации к низшим;
98
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
на против, операция подъема (rolling up) означает движение от
низших уровней к высшим.
Рис. 6. Пример трехмерного куба
Пример.
На рис. 6 представлен трехмерный куб, где в качестве фактов
использованы суммы продаж, а в качестве измерений – время, товар и магазин, товары группируются по категориям, магазины – по
странам, а данные о времени совершения операций – по месяцам.
99
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рис. 7. Примеры срезов гиперкуба
Пример.
На рис. 7 изображены:
• слева – двумерный срез куба для одной меры Unit Sales
(продано штук) и двух "неразрезанных" измерений – Store (Магазин) и Время (Time);
• справа представлено лишь одно "неразрезанное" измерение – Store, но зато здесь отображаются значения нескольких
мер – Unit Sales (продано штук), Store Sales (сумма продажи) и
Store Cost (расходы магазина);
• внизу – двумерное представление куба, когда "неразрезанными" остаются более двух измерений. При этом на осях среза
(строках и столбцах) будут размещены два или более измерений
"разрезаемого" куба.
Поддержка многомерной модели данных и выполнение многомерного анализа данных осуществляются отдельным приложением или процессом, называемым OLAP-сервером. Клиентские
приложения могут запрашивать требуемое многомерное представление и в ответ получать те или иные данные. При этом
100
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
OLAP-серверы могут хранить многомерные данные разными
способами.
В процессе анализа пользователь может менять точку зрения
на данные (так называемая операция смены логического взгляда),
просматривая данные в различных разрезах и разрешая конкретные задачи. Над кубами могут выполняться различные операции,
включая прогнозирование и условное планирование (анализ типа
“что, если”). Причем операции выполняются над кубами, т.е.
произведение, например, даст в результате произведениегиперкуб, каждая ячейка которого является произведением ячеек
соответствующих гиперкубов-множителей.
Однако куб сам по себе для анализа не пригоден. Если еще
можно адекватно представить или изобразить трехмерный куб, то
с шести – или двенадцатимерным дело обстоит значительно хуже. Поэтому перед употреблением из многомерного куба извлекают обычные двумерные таблицы. Эта операция называется
"разрезанием" куба. Термин этот образный, аналитик как бы берет и "разрезает" измерения куба по интересующим его меткам.
Этим способом аналитик получает двумерный срез куба и с ним
работает. Соответственно, "неразрезанными", как правило, остаются только два измерения – по числу измерений таблицы. Бывает, "неразрезанным" остается только измерение – если куб содержит несколько видов числовых значений, они могут откладываться по одному из измерений таблицы.
Если внимательно всмотреться в таблицу, на основании которой был создан куб, можно заметить, что находящиеся в ней
данные, скорее всего, не являются первичными, а получены в результате суммирования по более мелким элементам. Например,
предприятие делится на производства, производства на цеха, цеха
на участки, и т.д. Станки можно объединять в группы оборудования и т.д. В терминах OLAP такие многоуровневые объединения
называются иерархиями. Средства OLAP дают возможность в
любой момент перейти на нужный уровень иерархии. Причем,
как правило, для одних и тех же элементов поддерживается несколько видов иерархий: например участок – цех – производство.
Исходные данные берутся из нижних уровней иерархий, а затем
суммируются для получения значений более высоких уровней.
Для того чтобы ускорить процесс перехода, просуммированные
101
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
значения для разных уровней хранятся в кубе. Таким образом, то,
что со стороны пользователя выглядит одним кубом, грубо говоря, состоит из множества более примитивных кубов.
Классификация OLAP по назначению
Обеспечивая многомерное концептуальное представление со
стороны пользовательского интерфейса к исходной БД, все продукты OLAP делятся на несколько классов по типу исходной БД.
Многомерный гиперкуб, используемый в OLAP-технологии, может быть реализован в рамках реляционной модели или существовать как отдельная база данных специальной многомерной
структуры
В настоящее время существует два типа OLAP-систем:
• универсальные, способные решать проблемы создания отчетов в любой из сфер,
• «отраслевые», ориентированные на использование лишь в
определенных областях.
В наших условиях реальный спрос на OLAP-системы сегодня
ощущается лишь в сфере банковских и финансовых решений. На
Западе же OLAP-системы получили широкое распространение
еще и в инженерных и научных учреждениях, где с их помощью
выявляются сложные связи различных параметров, в частности,
при проведении практических исследований.
Сегодня на отечественном рынке представлено достаточно
много OLAP-систем, цены за клиентскую лицензию которых колеблются в пределах $500 до $3000, в зависимости от уровня сложности и ориентации. Системы, ориентированные на использование
на крупных предприятиях с поддержкой многопользовательского
режима, могут стоить еще дороже. Впрочем, указанные цены касаются лишь стоимости самих программных продуктов. Как и любая
другая система автоматизации, OLAP для адекватной работы требует услуг интегратора (чья стоимость может многократно превышать цену самой системы), связанных с правильным отбором и настройкой источников данных для проведения анализа.
Таким образом, можно констатировать, что OLAP – удовольствие не из дешевых и по-настоящему эффективным станет лишь
при использовании его инструментов не только ведущим менеджером компании, но и его ближайшими подшефными. Что же ка102
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
сается длительности развертывания OLAP-системы, нужно быть
готовым к срокам внедрения от одного, двух месяцев до нескольких, в случае внедрения масштабных решений со «сложными»
источниками данных.
Таблица 7
Применение OLAP – систем
Продажи
Ключевой вопрос отдела сбыта любого предприятия:
"Какое количество изделий продано?", "На какую сумму
реализовано?" расширяются по мере усложнения бизнеса
и накопления исторических данных до некоторого множества факторов, или разрезов: регион поставок, в прошлом месяце, квартале, по сравнению с нынешним, через
канал сбыта А, по сравнению с каналом Б и т.д. Ответы
на подобные вопросы необходимы для принятия управленческих решений: об изменении ассортимента, цен, закрытии и открытии филиалов, расторжении и подписании
договоров с дилерами, проведении или прекращении рекламных кампаний и т.д.
Задача обратно противоположная анализу продаж. Многие предприятия закупают комплектующие и материалы
у поставщиков. Торговые предприятия закупают товары
для перепродажи. Возможных задач при анализе закупок
множество, от планирования денежных средств на основе
прошлого опыта до контроля размеров поставок различных поставщиков.
Движение де- Могут анализироваться денежные обороты безналичных
и наличных средств в разрезе бизнес-операций, контрнежных
агентов, валют и времени с целью оптимизации потоков,
средств
обеспечения ликвидности и т.д. Состав измерений сильно
зависит от особенностей бизнеса, отрасли и т.д.
Технологично построенная система отчетности есть не что
Финансовая
иное, как набор именованных показателей со значениями
отчетность
на дату, которые требуется сгруппировать и просуммировать в различных разрезах для получения конкретных отчетов. Когда это так, то отображение и печать отчетов наиболее просто и дешево реализуются в OLAP-системах. Некоторые страны уже перешли на такую технологию сбора
данных. В некоторых отечественных контролирующих орЗакупки
103
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Бюджет
Объемы производства
Потребление
расходных
материалов
Заработная
плата
Текучесть
кадров
на
предприятии
Пассажирские
перевозки
Грузовые перевозки
Простои
транспорта
(вагонов, самолетов, пароходов, грузовиков)
ганах существуют планы перехода от ГОСТовских стандартов отчетов с многоэтажными шапками и алгоритмами
типа "Итого, исключая строку 234 и включая строку 598 из
отчета №987" к системе по сбору показателей и выпуску
отчетов по OLAP-технологии
Одна из самых перспективных областей применения
OLAP-технологий – ни одна современная система бюджетирования не считается завершенной без наличия в ее
составе OLAP-инструментария для анализа бюджета.
Большинство бюджетных отчетов легко строятся на основе OLAP-систем. При этом отчеты отвечают на очень
широкую гамму вопросов: анализ структуры расходов и
доходов, сравнение расходов по определенным статьям у
разных подразделений, анализ динамики и тенденций
расходов на определенные статьи, анализ себестоимости
и прибыли.
Это еще один пример статистического анализа. Таким
образом, можно анализировать объемы выращенного картофеля, выплавленной стали, сваренного пива и пр.
Например, имеется завод, состоящий из десятков цехов, в
которых расходуются охлаждающие, промывочные жидкости, масла, ветошь, наждачная бумага – сотни наименований расходных материалов. Для точного планирования, оптимизации издержек требуется тщательный анализ
фактического потребления расходных материалов.
Анализ расходов на зарплату, сравнение расходов по специальностям, филиалам, людям, динамика фонда ЗП.
Анализ текучести кадров в отделе, цехе, филиале по
предприятию в целом в разрезе профессий, уровня образования, пола, возраста, времени.
Анализ количества проданных билетов и сумм в разрезе
сезонов, направлений, видов вагонов (классов), типов поездов (самолетов).
Анализ объемов перевозок, платы в разрезе сезонов, направлений, видов вагонов, грузов, грузоотправителей,
грузополучателей, станций отправления, станций получения.
Анализ времени простоя (полученных штрафов) в разрезе
причин (ремонт, отказ от погрузки-разгрузки), клиентов,
исполнителей, железнодорожных станций (вокзалов, гаражей, аэропортов), типов грузов.
104
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Выбор
недвижимости
(офисов,
складов,
квартир)
Маркетинг
Измерения - обычные для этого рынка: Город, Район, Количество комнат, Расстояние до метро, Этаж, Тип дома,
Дата и т.д. Фактов три -средняя цена, максимальная цена,
минимальная цена. Манипулируя измерениями, покупатель может определиться со своими возможностями, а
продавец проанализировать зависимости цен, динамику
цен и назначить правильную цену.
Под маркетинговым анализом имеется в виду только область анализа покупателей или клиентов-потребителей
услуг. Например, для розничной торговли задачей анализа является правильное позиционирование товара, выявление групп покупателей для целевой рекламы, оптимизация ассортимента. Например, если выясняется, что телефонами темно-серого цвета стоимостью более $500
пользуются исключительно мужчины старше 25 лет, то
стоит изобразить в рекламе таких телефонов вместо девушек одного преуспевающего бизнесмена. Это очень
грубый пример, но известно, что маркетинговый анализ
находится на грани между сложной наукой и малообъяснимым искусством. Поэтому задача OLAP в данном случае – дать пользователю инструмент быстрого получения
ответов на вопросы, интуитивно возникающие по ходу
анализа данных.
Перспективы использования аналитических информационных систем:
• в большинстве случаев применение OLAP даст возможность усовершенствовать действующую организационную схему;
• технологии OLAP могут компенсировать определенный недостаток знаний в предметной области или опыта по части построения моделей и их анализа. Но результат их внедрения показывает, что образование и опыт становятся еще более важными
факторами, чем раньше;
• применение OLAP наиболее эффективно при решении конкретных задач. Хотя средства такой обработки действительно позволяют автоматически выявлять закономерности в исследуемых
данных, тем не менее, ставить им конкретные цели необходимо;
• практически любой процесс можно изучить, понять и
улучшить с помощью методов OLAP. OLAP полезен везде, где
собраны данные;
105
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
• методы, используемые в настоящее время для OLAP, являются логическим развитием и обобщением аналитических подходов, известных уже на протяжении десятилетий;
• алгоритмы для OLAP могут быть сложными, однако их
применение, благодаря появлению новых программных средств,
значительно упростилось;
• методы OLAP разработаны специально для применения к
очень большим наборам данных, но и из наборов данных средних
или малых размеров тоже можно извлекать полезные сведения;
• дополнительные данные приносят пользу, только если содержат новые сведения о рассматриваемых показателях или целях. В иных случаях их привлечение может оказаться не только
бесполезным, но и вредным.
Таким образом, как следует из вышерассмотренного, результаты применения компьютерных аналитических технологий
представляют большую ценность для руководителей и аналитиков в их повседневной деятельности. Широкие возможности открываются и в области защиты информации. Поэтому перед разработчиками встает задача внедрения технологии OLAP в автоматизированные системы мониторинга, анализа и поддержки
принятия решений. В отличие от исследовательских приложений,
подобные системы должны ориентироваться на непрограммирующего пользователя и на решение конкретных проблем, которые оказываются довольно разнообразными и нередко требуют
применения различных подходов.
3.3. Контрольные вопросы
1. Основные принципы анализа деловой информации.
2. Схема анализа бизнес-информации.
3. Что такое Хранилище Данных (ХД): определение, цели и
задачи?
4. Концепция ХД.
5. Требования к ХД.
6. Сравнение традиционного (статического) и динамического
анализа.
106
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7. Структура информацонно-аналитической системы, основанной на ХД.
8. Что такое Витрины данных?
9. В чем отличие оперативных (OLTP) и аналитических
(OLAP) баз данных?
10. Что такое OLAP-технологии: определение, особенность?
11. В чем проявляются преимущества OLAP?
12. В чем проявляются недостатки OLAP?
13. Предпосылки и причины появления OLAP.
14. Основные правила OLAP-технологий по Кодду.
15. Основные правила OLAP-технологий по Пендсу и Криту.
16. Модель агрегации данных в OLAP-технологиях.
17. Структура данных в OLAP-технологиях: гиперкуб, срезы,
измерение, меры.
18. Классификация OLAP-технологий.
19. Применение OLAP-технологий.
107
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Литература
1. Автоматизированные информационные технологии в экономике: Учебник // М.И. Семенов, И.Т, Трубилин, В.И. Лойко,
Т.П. Барановская; под общ. ред. И.Т. Трубилина. – М.: Финансы
и статистика, 1999.
2. Велихов, Е.П. Новая информационная технология в школе
/ Е.П. Велихов // Информатика и образование. – 1986. – № 1.
3. Веревчеико, А.П. Информационные ресурсы для принятия
решения: учеб. пособие / А.П. Веревчеико, В.В. Горчаков,
И.В. Иванов, О.В. Голодова. – М.: Академический Проект; Екатерининбург: Деловая книга, 2002.
4. Грабауров, В.А. Информационные технологии в подготовке менеджеров / В.А. Грабауров. М.: Финансы и статистика, 2000.
5. Информационные системы и технологии в экономике и
управлении / под ред. В.В. Трофимова. – М., 2006.
6. Данчул, А.Н. Информационные технологии управления.
Компьютерный практикум. – М., 2006.
7. Информационные технологии моделирования процессов
управления экономикой / А.С. Гринберг. – М.: ЮНИТИ.
8. Информационные технологии управления / ред. Г.А. Титоренко. – М.: ЮНИТИ, 2005.
9. Информационные технологии управления: учебник для вузов / А. Саак, Е. Пахомов, В. Тюшняков. – СПб.: Питер, 2005.
10. Информационные технологии управления. Гриф УМО
ВУЗов России / А.Э. Саак. – СПб.: Питер, 2005.
11. Информатика: Учебник / под ред. проф. Н.В. Макаровой. – М.: Финансы и статистика, 1998.
12. Информатика. Том 3. Информационные технологии
управления. – 2003.
13. Исакова, А.И. Информационные технологии в экономике.
Курс лекций. Часть 1 / А.И. Исакова, С.О.Тимаков. – Томск:
ТУСУР, 2001.
108
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
14. Карминский,
А.М.
Информатизация
бизнеса
/ А.М. Карминский, П.В. Нестеров. – М.: Финансы и статистика,
1997.
15. Корнеев, И.К. Информационные технологии в управлении
/ И.К. Корнеев, В.А. Машурцев. – М.: ИНФРА-М, 2001.
16. Морозов, В.П. Гипертексты в экономике. Информационная технология моделирования: учеб. пособие / В.П. Морозов,
В.П. Тихомиров, Е.Ю. Хрусталев. – М.: Финансы и статистика,
1997.
17. Основы современных компьютерных технологий: учеб.
пособ. / под ред. проф. Хомоненко. – СПб.: КОРОНА принт,
1998.
18. Современные информационные технологии в делопроизводстве и управлении / В. Куперштейн. – 1999.
19. Фридланд, А.Я. Информатика и компьютерные технологии: Основные термины: Толковый словарь / А.Я. Фридланд. –
М.: ACT, 2003.
Информационные технологии табличных данных
20. Excel 2000 для Windows для "чайников" / Г. Харвей. – Киев: Диалектика,1999.
21. Excel 2003 для "чайников". Полный справочник / Г. Харвей. – Киев: Диалектика, 2004.
22. Excel 2003 для "чайников". Краткий справочник
/ Дж. Уокенбах, К. Банфилд. – Киев: Диалектика, 2004.
23. Excel 2003 для "чайников"/ Г. Харвей. – Киев: Диалектика, 2004.
24. Excel 2003. Библия пользователя / Дж. Уокенбах – Киев:
Диалектика, 2004.
25. Excel 2002. Библия пользователя
Б. Андердал – Киев: Диалектика, 2002.
/
Дж. Уокенбах,
26. Excel для бухгалтера в примерах / А.О. Коцюбинский,
С.В. Грошев. – Гросс Медиа, 2004.
109
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
27. Microsoft Excel 2002. Самоучитель / Курбатова Е.А. – Киев: Диалектика, 2003.
28. Microsoft Excel 2003. Самоучитель / Курбатова Е.А. – Киев: Диалектика, 2005.
29. Microsoft Excel 2003. Краткое руководство / Курбатова Е.А. – Киев: Диалектика, 2004.
30. Автоматизация и моделирование бизнес-процессов в
Excel / В. Пикуза, vpikuza@voliacable.com
31. Анализ данных в Microsoft Excel для "чайников"
/ С.Л. Нельсон – Киев: Диалектика, 2002.
32. Анализ данных с помощью Microsoft Excel / К. Берк,
П. Кэйри. – Вильямс, 2004.
33. Анализ данных в Excel: наглядный курс создания отчетов,
диаграмм и сводных таблиц / Д. Саймон. – Киев: Диалектика,
2004.
34. Бизнес-анализ с помощью Microsoft Excel / К. Карлберг;
2-е изд.; – М.: Вильямс, 2002.
35. Бизнес-анализ с помощью Microsoft Excel / К. Карлберг. –
Вильямс, 2005.
36. Булычев, Е.В. Обработка данных с помощью табличного
редактора EXCEL. Методическое пособие по курсу «Операционные системы и технологии программирования» / Е.В. Булычев,
А.А. Кудлаев. – М.: МИИГАиК, 2000.
37. Гарнаев, А.Ю. Использование MS Excel и VBA в экономике и финансах / А.Ю. Гарнаев. – СПб.: БХВ-Санкт-Петербург,
1999.
38. Графический анализ статистических данных в Microsoft
Excel 2000 / Э.В. Чекотовский. – М.: Вильямс, 2002.
39. Диаграммы в Excel / Дж. Уокенбах. – Киев: Диалектика,
2003.
40. Диаграммы в Excel. Краткое руководство / В.В. Александров. – Киев: Диалектика, 2004.
41. Додж, М. Эффективная работа с Microsoft Excel 97
/ М. Додж, К. Кината, К. Стинсон. – СПб, 2000.
110
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
42. Изучи Microsoft Excel 2002 за 10 минут / Д. Хабрейкен. –
М.: Вильямс, 2002.
43. Инженерные расчеты в Excel / Р.У. Ларсен. – М.: Вильямс, 2002.
44. Интенсивный курс программирования в Excel за выходные / П. Эйткен. – Киев: Диалектика, 2004.
45. Использование Microsoft Office Excel 2003. Специальное
издание / П. Блаттнер. – М.: Вильямс, 2004.
46. Лучшие методики применения
/ Л. Абдулазар. – Киев: Диалектика, 2005.
Excel
в
бизнесе
47. Лукасевич, И.Я. Анализ операций с ценными бумагами с
Microsoft Excel. – http://www.cfin.ru/finanalysis/inexcel
48. Лукасевич, И.Я. Финансовые вычисления в программной
среде EXCEL 5.0/7.0 / И.Я. Лукасевич // Финансы. – 1996. –
№ 11. – С. 60 – 64.
49. Моделирование с помощью Microsoft Excel и VBA: разработка систем поддержки принятия решений / К. Олбрайт. – М.:
Вильямс, 2005.
50. Научные вычисления в Microsoft Excel / А.Н. Васильев. –
Киев: Диалектика, 2004.
51. Овчаренко, Е.К. Финансово-экономические расчеты в
Excel / Е.К. Овчаренко, О.П. Ильина, Е.В. Балыбердин. – М.,
1999.
52. Освой самостоятельно Microsoft Excel 2000. 10 минут на
урок / Д. Фултон. – М.: Вильямс, 2000.
53. Подробное руководство по созданию формул в Excel 2002
/ Д. Уокенбах. – Киев: Диалектика, 2002.
54. Подробное руководство по созданию формул в Excel 2003
/ Д. Уокенбах. – Киев: Диалектика, 2004.
55. Применение VBA и макросов в
/ Б. Джелен, Т. Сирстад. – М.: Вильямс, 2005.
Microsoft
Excel
56. Профессиональное программирование на VBA в Excel
2002, Джон Уокенбах. – Киев: Диалектика, 2003.
111
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
57. Профессиональное программирование на VBA в Excel
2003, Джон Уокенбах. – Киев: Диалектика, 2005.
58. Скобара, В.В. Возможности EXCEL 7.0 для аудитора и
бухгалтера / В.В. Скобара, А.В. Скобара. – СПб.: Петро-БалтАудит, 1998.
59. Статистика для менеджеров с использованием Microsoft
Excel, 4-е изд. / Д.М. Левин, Д. Стефан, Т.С. Кребиль,
М.Л. Беренсон. – М.: Вильямс, 2005.
60. Статистический анализ в MS Excel. Профессиональная
работа / А.А. Минько. – Киев: Диалектика, 2004.
61. Управление данными с помощью
/ К. Карлберг. – М.: Вильямс, 2005.
Microsoft
Excel
62. Функции в Excel. Решение практических
/ Г.И. Сингаевская. – Киев: Диалектика, 2005.
задач
63. Экономическое моделирование в Microsoft Excel 6-е изд.
/ Д. Мур, Л.Р. Уэдерфорд. – М.: Вильямс, 2004.
64. Полезные советы по MS Office / С. Шляхтина // КомпьютерПресс. –2003. – № 5.
65. Полезные советы по MS
// КомпьютерПресс. –2003. – № 9.
Office
/
С. Шляхтина
66. Полезные советы по MS
// КомпьютерПресс. –2003. – № 10.
Office
/
С. Шляхтина
67. Полезные советы по MS
// КомпьютерПресс. –2003. № 11.
Office
/
С. Шляхтина
68. Полезные советы по MS
// КомпьютерПресс. –2004. – № 01.
Office
/
С. Шляхтина
69. Полезные советы по MS
// КомпьютерПресс. –2004. – № 02.
Office
/
С. Шляхтина
70. Полезные советы по MS
// КомпьютерПресс. –2004. – № 03.
Office
/
С. Шляхтина
71. Информационные технологии Microsoft в вашем бизнесе
www.microsoft.com/rus/
112
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
72. Советы по работе с
// КомпьютерПресс. –2002. № 5.
Microsoft
Office
/ О. Горнев
Аналитические информационные технологии
73. Киселев, М. Средства добычи знаний в бизнесе и финансах / М. Киселев, Е.Соломатин // Открытые системы. – № 4. –
1997.
74. Шапот, М. Интеллектуальный анализ данных в системах
поддержки принятия решений / М.Шапот // Открытые системы. –
№ 1. – 1998.
75. Альперович М. Microsoft SQL Server Хранилища данных
– Сегодня и завтра / М. Альперович // Компьютер-информ, 1997.
76. Решение проблемы комплексного оперативного анализа
информации хранилищ данных // С.Д. Коровкин, И.А. Левенец,
И.Д. Ратманова, В.А. Старых, Л.А.Щавелев // СУБД. – 1997 –
№ 5-6.
77. Оперативная аналитическая обработка данных: концепции и технологии / Л.В. Щавелёв. – www.olap.ru
78. Введение в базы данных: cредства Business Intelligence
/ А. Федоров, Н. Елманова – КомпьютерПресс 3'2001
79. Введение в OLAP Алексей Федоров, Наталия Елманова
// Компьютер-Пресс. – 2001. – № 4 –12; 2002. – № 1-2.
80. Интеллектуальный анализ данных и управление процессами / М. Шапот, В. Рощупкина // Открытые системы. – 1998. –
№ 04-05.
81. Интеллектуальный анализ данных в системах поддержки
принятия решений / М. Шапот // Открытые системы. – 1998. –
№ 01.
82. Аджиев, В. MineSet – визуальный инструмент аналитика
/ В. Аджиев // Открытые системы. – 1997. – № 3.
83. Киселев, М. Средства добычи знаний в бизнесе и финансах / М. Киселев, Е. Соломатин // Открытые системы. 1997. –
№ 4.
113
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
84. Коровкин, С.Д. Решение проблемы комплексного оперативного анализа информации хранилищ данных / С.Д. Коровкин,
И.А. Левенец, И.Д. Ратманова, В.А. Старых, Л.В. Щавелёв
// СУБД. – 1997. – № 5-6.
85. Кречетов, Н. Продукты для интеллектуального анализа
данных / Н. Кречетов, П. Иванов // ComputerWeek-Москва. –
1997. – № 14-15.
86. Пржиялковский, В.В. Сложный анализ данных большого
объема: новые перспективы компьютеризации / В.В. Пржиялковский // СУБД. – 1996. – № 4.
87. Раден, Н. Данные, данные и только данные / Н. Раден
// ComputerWeek-Москва. – 1996. – № 8.
88. Сахаров, А.А. Концепция построения и реализации информационных систем, ориентированных на анализ данных
/ А.А. Сахаров // СУБД. – 1996. – № 4.
89. Сахаров, А.А. Принципы проектирования и использования многомерных баз данных (на примере Oracle Express Server)
/ А.А. Сахаров // СУБД. – 1996. – № 3.
90. Туо, Дж. Инструменты для анализа информации на настольных ПК / Дж. Туо // ComputerWeek-Москва. – 1996. – № 38.
91. Туо, Дж. Каждому пользователю – свое представление
данных / Дж. Туо // ComputerWeek-Москва. – 1996. – № 38.
92. Han, J. OLAP Mining: An Integration of OLAP with Data
Mining. –
IFIP,
1997.
(ftp://ftp.fas.sfu.ca/pub/cs/han/kdd/olapm.ps.gz).
93. http://www.ccas.ru/pub/DataBase/Oracle/eaoug/user-touser/SidorovOLAP.htm "Подземелья" Oracle Express
94. http://www.bizcom.ru/win/bt/1998/nr3/14.htm OLAP в системах поддержки принятия решений для банков ( Журнал "Банковские технологии", 1998г. №3)
95. http://www.bizcom.ru/win/bt/1998/nr2/09.htm Технологии
хранилищ данных и оперативного анализа (OLAP) в банковских
системах поддержки принятия решений
114
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
96. http://www.cnit.nsu.ru/~buka/win/dict/dic_olap.htm Guide to
OLAP Terminology
97. http://www.pcweek.ru/kis/win/techno/firtex.html Фирменные
архитектуры хранилищ данных
98. http://www.osp.ru/dbms/1996/03/source/44.htm Принципы
проектирования и использования многомерных баз данных (на
примере Oracle Express Server), 12 основных требований к средствам реализации OLAP, сформулированные Ф. Коддом (Журнал
"СУБД"# 3/96 · стр. 44-59)
Сайты, посвященные OLAP-технологиям
и Хранилищам Данных
99. http://www.sgroves.demon.co.uk/justolap.htm Определение
OLAP (Olap definition)
100. http://www.olapreport.com Большое количество аналитических материалов по OLAP технологиям, новости etc.
101. http://www.olapcouncil.org White papers, cпецификация
MDAPI version 2.0, etc.
102. http://pwp.starnetinc.com/larryg/ Data Warehousing Information Center.
103. http://www.ioug.org/express/ Express SIG IOUG-A. Информация о продуктах семейства Oracle Express, новости, техническая информация, форум etc
115
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Содержание
Введение ............................................................................................. 3
Глава 1. Основы информационных технологий управления .. 4
1.1. Актуальность, цель, предмет и задачи ИТ ....................... 4
1.2. Определение ИТ .................................................................... 4
1.3. Классификация информационных технологий ............... 11
1.4. Структура ИТ .................................................................... 14
1.5. Тенденции развития (взаимодействие с предметом
«Информатика»)................................................................ 18
1.6. Требования к уровню знаний студентов .......................... 19
1.7. Контрольные вопросы ....................................................... 19
Глава 2. Офисные информационные технологии ................... 20
2.1. Информационные технологии обработки текстовой
информации ........................................................................ 20
2.2. Информационные технологии табличных данных ......... 25
2.3. Информационные технологии баз данных ....................... 40
2.4. Информационные технологии презентаций .................... 48
2.5. Информационные технологии комплексных
документов ......................................................................... 52
2.6. Контрольные вопросы ....................................................... 60
Глава 3. Интеллектуальные аналитические
информационные технологии ............................................... 61
3.1. Хранилища данных ............................................................. 67
3.2. Информационные технологии оперативной
аналитической обработки данных (OLAP) .................... 78
3.3. Контрольные вопросы ..................................................... 106
Литература..................................................................................... 108
116
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Учебное издание
Соловьев Анатолий Владиславович
Информационные технологии управления
Учебное пособие
Редактор, корректор А.А. Аладьева
Компьютерная верстка И.Н. Ивановой
Подписано в печать 27.10.2006 г. Формат 60×84/16.
Бумага тип. Усл. печ. л. 6,74. Уч.-изд. л. 5,5.
Тираж 150 экз. Заказ
.
Оригинал-макет подготовлен
в редакционно-издательском отделе ЯрГУ
Ярославский государственный университет
150000 Ярославль, ул. Советская, 14
Отпечатано
ООО «Ремдер» ЛР ИД № 06151 от 26.10.2001.
г. Ярославль, пр. Октября, 94, оф. 37
тел. (4852) 73-35-03, 58-03-48, факс 58-03-49.
117
Документ
Категория
Без категории
Просмотров
31
Размер файла
999 Кб
Теги
соловьева, 1068, информационные, технология, управления
1/--страниц
Пожаловаться на содержимое документа