close

Вход

Забыли?

вход по аккаунту

?

275.Журнал Сибирского федерального университета. Сер. Техника и технологии №1 2009

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Журнал Сибирского федерального университета
Journal of Siberian Federal University
2009
2 (1)
Техника и технологии
Engineering & Technologies
Редакционный совет
академик РАН Е.А.Ваганов
академик РАН К.С.Александров
академик РАН И.И.Гительзон
академик РАН В.Ф.Шабанов
чл.-к. РАН, д-р физ.-мат.наук
А.Г.Дегерменджи
чл.-к. РАН, д-р физ.-мат. наук
В.Л.Миронов
чл.-к. РАН, д-р техн. наук
Г.Л.Пашков
чл.-к. РАН, д-р физ.-мат. наук
В.В.Шайдуров
чл.-к. РАО, д-р физ.-мат. наук
В.С. Соколов
Editorial Advisory Board
Chairman:
Eugene A. Vaganov
Members:
Kirill S. Alexandrov
Josef J. Gitelzon
Vasily F. Shabanov
Andrey G. Degermendzhy
Valery L. Mironov
Gennady L. Pashkov
Vladimir V. Shaidurov
Veniamin S. Sokolov
Contents / СОДЕРЖАНИЕ
Michaƚ Drozdowicz, Maria Ganzha, Marcin Paprzycki,
Maciej Gawinecki and Alexander Legalov
Information Flow and Usage in an E-shop Operating within an
Agent-based E-commerce System
–3–
В.В. Асмус, А.А. Бучнев, В.П. Пяткин
Кластерный анализ и классификация с обучением многоспектральных данных дистанционного зондирования Земли
– 23 –
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев
Технология формирования обобщенного «И/ИЛИ» дерева
решения задач анализа изображений. Исследование скорости
сходимости процесса формирования обобщенного «И/ИЛИ»
дерева
– 32 –
Л.Ф. Ноженкова, А.А. Евсюков, А.И. Ноженков
Методы управления и геоинформационного моделирования в
технологии OLAP
– 49 –
Editorial Board:
Editor-in-Chief:
Mikhail I. Gladyshev
Founding Editor:
Vladimir I. Kolmakov
В.И. Половинкин
О точности кубатурных
С.Л. Соболева
формул
в
пространствах
– 59 –
Managing Editor:
Olga F. Alexandrova
Executive Editor for Engineering &
Technologies:
Vitaly S. Biront
Редактор И.А. Вейсиг Корректор Т.Е. Бастрыгина
Компьютерная верстка E.В. Гревцовой
Подписано в печать 29.12.2008 г. Формат 84х108/16. Усл. печ. л. 9,75.
Уч.-изд. л. 9,5. Бумага тип. Печать офсетная. Тираж 1000 экз. Заказ 1/068.
Отпечатано в ИПК СФУ. 660041 Красноярск, пр. Свободный, 79.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Editorial board for Engineering &
Technologies:
Yury D. Alashkevich
Viktor G. Anopchenko
Sergey M. Geraschenko
Gennadiy I. Gritsko
Lev V. Endjievsky
Sergey V. Kaverzin
Valery V. Kravtsov
Vladimir A. Kulagin
Sergey A. Mikhaylenko
Vladimir V. Moskvichev
Anatoli M. Sazonov
Vasiliy I. Panteleev
Sergey P. Pan’ko
Peter V. Polyakov
Viktor N. Timofeev
Galina A. Chiganova
Oleg Ostrovski
Harald Oye
Свидетельство о регистрации СМИ
ПИ № ФС77-28-722 от 29.06.2007 г.
М.Д.Рамазанов, Д.Я Рахматуллин, Л.З. Валеева,
Е.Л. Банникова
Решение интегральных уравнений на многопроцессорных
вычислительных системах
– 69 –
А.И. Рубан
Дисперсионные характеристики статических моделей стохастических объектов
– 88 –
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов
Исследование динамики спектральной яркости посевов
сельскохозяйственных культур в период вегетации на
территории Красноярского края
– 100 –
Н.А. Федорова
Интегро-интерполяционный метод решения плоской задачи
для композита, армированного семейством криволинейных
волокон
– 112 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Journal of Siberian Federal University. Engineering & Technologies 1 (2009 2), 3-22
УДК 004.942
Information Flow and Usage in an E-shop Operating within
an Agent-based E-commerce System
MichaÃl Drozdowicza , Maria Ganzhaa , Marcin Paprzyckia ,
Maciej Gawineckia and Alexander Legalovb∗
a
System Reserach Institute Polish Academy of Science,
Newelska 6, 01-447 Warsaw, Poland
b
Siberian Federal University,
79 Svobodny, Krasnoyarsk 660041 Russia1
Resived 01.08.2008, received in revised form 10.10.2008, accepted 10.03.2009
Utilization of software agents in e-commerce is a subject of a lot of interest. In our work we are developing
a complete agent-based e-commerce system in which agents play all major roles representing both buyers
and sellers. The aim of the paper is to describe flow and usage of information in a virtual e-shop operating
within the proposed e-commerce system.
Key words: agent-based e-commerce system, e-shop operating
1.
Introduction
Currently, we are developing a model agent-based e-commerce system. This system varies from
other work found in the literature at least in the following ways:
1. Typically, only price negotiation of a single item (or collection of items treated as subject of
a “single transaction”) is contemplated (even though the negotiation itself may follow a very
complicated set of rules; e.g. two stage negotiation found in [22]). Once the negotiation
is over, agents that participated in it complete their work and the process ends. We are
interested in a more realistic scenario when a number of items of a given product are placed
for sale one after another, e.g. 90 Canon EOS cameras are to be sold by an e-store.
2. Since a collection (sequence) of items is sold we treat price negotiations as a “discrete
process” in which buyers are “collected” and released together in a group to participate in a
price negotiation. While the negotiation takes place buyer(s) are allowed to communicate
only with seller(s). At the same time the next group of buyers is collected (as they arrive)
for the next negotiation. This process is similar to such forms of real-life auctions where
auctioneers gather in a room and stay in it until the auction ends.
3. Since multiple subsequent price negotiations (involving the same product; e.g. Canon EOS
cameras) take place, price negotiation mechanisms can be dynamically changed. For instance, first 55 items may be sold using English Auction, next 22 using iterative bargaining,
while the remaining 13 may be sold using fixed (bargain) price.
From this setup follows that we assume that shops in the system have to adapt to changing
market conditions; and change of price negotiation mechanism is an example of such adaptation.
∗
1
Corresponding author E-mail address: legalov@mail.ru
c Siberian Federal University. All rights reserved
°
–3–
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
Obviously, to achieve this goal they have to collect, store and later analyze information about
various events taking place in the shop. In this context, the aim of this paper is to describe
the flow of information in the system, with particular attention paid to processes taking place
within the e-shop. Note that we concentrate on that part of the system due to the fact that the
information flow within the client-side is much less involved and encompasses only three entities
(Buyer Agents, Client Agent and Client Decision Agent). Finally, we outline how the collected
data can be used in sales forecasting.
To this effect we proceed as follows. In the next section we summarize the main features of
the system. Next we follow with the description of the sources and the flow of information within
the system. Finally, we briefly illustrate how stored information can be utilized by the e-shop.
Note that this work is complementary to [10], where we describe in detail how information
is to be efficiently stored within the system. Thus readers may want to consider that source for
additional details.
2.
System description
The system under construction is a model agent-based virtual marketplace, where agents representing Buyers engage in price negotiations with agents representing Sellers. Here, instead of
focusing only on a single feature of e-commerce (e.g. price negotiations), which is often the case
in the literature [4, 24, 1, 20, 22, 8, 21] we consider the complete process that involves both the
Buyer and the Seller (as well as Wholesalers that provide products to e-stores). Thus, we start
from the moment when the User-Client expresses a desire to purchase a product, and follow the
chain of events until the purchase is made, or deemed impossible. Conceptualization of the proposed system has been represented as a use case diagram in Fig. 1. Since the detailed description
of the system can be found in [5, 15, 7, 23], and is out of scope of this paper, here, we only briefly
describe pertinent processes taking place in the system (and entities participating in them).
2.1.
Client subsystem
First, let us consider agents supporting the User-Client in her/his shopping needs. The Client
Agent (CA) is responsible for the direct support of the User-Client. Here, one can envision the
Client Agent as a role within, or a part of functionality of, a Personal Agent as conceptualized
by P. Maes in [21]. When the User-Client interacts with its CA (s)he describes the product (s)he
would like to buy, as well as conditions of purchase (e.g. the price and/or delivery time). In
order to fulfill the order the CA obtains a list of shops to be contacted. This is done by querying
a yellow-page (infomediary) agent called the Client Information Center (CIC ; see, [24, 19, 9] for
more details about the role and implementation of the CIC ). Obtained list of shops is adjusted on
the basis of trust considerations (see, [6, 12]). As a result, the CA interacts with the Gatekeeper
Agents (GAs), representing selected shops, to ensure that its Buyer Agents (BAs) participate in
price negotiations. After receiving offers from winning Buyer Agents, the CA communicates with
the Client Decision Agent (CDA) to determine which offers are acceptable and, among them,
which is “the best.” Note, that offers arrive asynchronously and have varying expiration dates
([15]), thus the decision making within the CDA has to include not only product-features like
price, but also reservation expiration and trust [12, 6]. If there exists a satisfactory offer and the
CDA decides to accept it, the CA finalizes the purchase. If no appropriate offer can be found,
the CDA decides course of further action, which may involve trying to negotiate for a better
–4–
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
price, or informing the User-Client that purchase under specified conditions is impossible.
Fig. 1. Use Case
2.2.
Shop subsystem
Activities that take place within the e-shop can be divided into four major parts:
1. selling products,
2. managing negotiation mechanism(s),
3. managing trust toward customers, and
4. managing product inventory.
• Selling products involves price negotiations and is handled by two agents:
– the Gatekeeper Agent (GA) that facilitates entrance of Buyer Agents (by inviting
agents to be sent in, or by creating them), registers incoming BAs (interested in
purchasing products), and starts the negotiation; as well as
– the Seller Agent (SeA) that represents the shop during the negotiation (for details of
the negotiation process see, [5, 3]).
– the Host Agent (HA) which supervises the negotiation and enforces protocol of the
specific negotiation that parties are engaged in; it also collects data about the negotiation process (see below)
Finalization of purchase as well as registering (and de-registering) products with the CIC,
and coordinating work of other agents in the e-shop is the duty of the Shop Agent (SA),
which should be viewed as the Manager of the e-store. In this role the SA is often passing
messages between agents that do not know each other (one of the important features of
agent systems is reduction of number of agents that know each-other directly to facilitate
agents system maintenance; see [26]).
–5–
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
• Managing price negotiation mechanisms is performed by the Shop Decision Agent (SDA),
and involves selecting the most appropriate negotiation mechanisms and their parameters,
as well as strategies for Seller Agents representing the store. Furthermore, the SDA is
responsible for adapting price negotiation mechanisms and their parameters to changing
market conditions.
• Managing of trust toward customers is also one of duties of the SDA. Trust is the main
parameter in (i) decision of admitting Buyer Agents to negotiations, and (ii) establishing
time of product reservation (to minimize potential losses caused by unreliable or malicious
customers; see, [6, 12]).
• Overseeing product stock levels is a task handled by a group of agents, supervised by the
Warehouse Agent (WA) that stores and manages information about current inventory and
about product reservations. Furthermore, the WA uses sales forecasts prepared by the SDA
to proactively ensure adequate supply of all products. Supply orders are carried out by
the Logistic Agent (LA) that interacts with a wholesaler-oriented equivalent of the CIC to
receive a list of wholesalers that sell specific products and dispatches requests for product
sale and delivery proposals using workers from a pool of Ordering Agents (OAs). More
details about the logistics subsystem can be found in [23, 13].
3.
Gathering and utilizing information
Let us now focus our attention on processes involved in generating, managing and utilizing flow
of information during the work of the system. Let us recall, that we are concerned primarily
with processes taking place within the e-shop. Obviously, generation of information is a result of
monitoring of the state of various entities within the system. Subsequently, generated information
has to be delivered to the SDA for storage and processing. Monitoring and delivery of resulting
data can be performed in several ways (see [10] for more details). In the process of selecting the
right approach for our system, we have considered the fact that as far as the SDA is concerned,
there are two sources of information:
1. Information originating from the inside of the e-shop—received either from/through the
SA or the WA agents, describing specific events related to the functioning of the e-shop;
e.g. buyer registration, negotiation closing, transaction finalization, restocking deliveries
etc. These messages have to provide a complete picture of activities of individual agents
within the system and thus should be promptly delivered to the SDA. Let us note that
most messages passed within the e-shop are rather small in size (even though there may
be a relatively large number of them; scaling with the size of activities in the shop), while
the SDA is the only receiver of collected data. Therefore, for the time being, we have
decided to utilize an active information source-based approach, i.e. change in the state of
the system or occurrence of an event result in a message, containing necessary information
about this event, sent to the monitoring module (the SDA).
2. Information originating outside of the e-shop—concerning number of shops selling a specific
product, and possibly, the number of queries concerning specific products received from
clients by the CIC. Since the CIC is not an active source of information, the SDA has to
be. Therefore it requests periodically the needed data from the CIC.
–6–
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
Keeping this in mind we can now discuss where in the system information is generated and
how it is used. Let us start from initial interactions with clients interested in making a purchase.
3.1.
3.1.1.
Before negotiations
Gatekeeper Agent interacting with Client and Buyer Agents
After the User-Client specifies its need, the Client Agent obtains from the CIC list of shops
that sell given product and adjusts it on the basis of its trust in them (here, trust information
provided by the CDA is utilized, see [6, 12]). As a result the CA interacts with representatives
of selected shops—their Gatekeeper Agents. The aim of this interaction is first, to find out if
the needed product is still available, and second, to establish if and how the Buyer Agent can
become involved in price negotiations. Note that the Buyer Agent is a lightweight, mobile agent
that is delegated by the Client Agent and migrates to the e-shop to represent the User-Client
in price negotiations. In the case when the CA is not able (not allowed by GA) to create its
own BA to take part in price negotiations, a BA could be created by the shop in response to a
client request. In both cases the Client Agent communicates with the Gatekeeper Agent. The
interaction is summarized as a sequence diagram in Fig. 2.
Fig. 2. Sequence Diagram of trust checking process
Below, we present code preparing message sent by the CA to initiate interactions with the
GA (process involves also checking hostility of the GA):
protected V e c t o r p r e p a r e R e q u e s t s ( ACLMessage r e q u e s t ) {
r e q u e s t = new ACLMessage ( ACLMessage .REQUEST) ;
request . addReceiver ( gatekeeper ) ;
r e q u e s t . s e t O n t o l o g y ( N e g o t i a t i o n O n t o l o g y .NAME) ;
r e q u e s t . s e t P r o t o c o l ( FIPANames . I n t e r a c t i o n P r o t o c o l .FIPA_REQUEST ) ;
r e q u e s t . s e t L a n g u a g e ( FIPANames . ContentLanguage . FIPA_SL2 ) ;
C h e c k H o s t i l i t y c h e c k = new C h e c k H o s t i l i t y ( ) ;
A c t i o n a c t = new A c t i o n ( g a t e k e e p e r , c h e c k ) ;
–7–
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
try {
cm . f i l l C o n t e n t ( r e q u e s t , a c t ) ;
}
catch ( E x c e p t i o n e ) {
i f ( l o g g e r . i s L o g g a b l e ( L e v e l .SEVERE) )
l o g g e r . l o g ( L e v e l . SEVERE, ’ ’ Cannot p r e p a r e r e q u e s t ’ ’ , e ) ;
r e q u e s t = null ;
}
return super . p r e p a r e R e q u e s t s ( r e q u e s t ) ;
}
What we can see in this snippet is:
1. CA defines the type of communicative massage—REQUEST
2. CA defines a receiver of this message—Gatekeeper
3. the receiver can “understand” this message based on the “NegotiationOntology” ontology
4. CA also defines a protocol of this communication, namely the FIPA_REQUEST protocol
5. the content language is based on the FIPA_SL2 specification
6. the request contains a CheckHostility action which denotes the operation of checking the
trust level of a given e-shop
Upon being contacted by the CA, the GA checks if that CA is trustful. Since the SDA has
access to the history of interactions with a given CA, it can utilize it to determine if: (a) to reject
CAs request to enter, (b) approve such request and allow the CA to send a BA, or (c) approve
request under condition that the BA will be created locally (if such option is available). On the
basis of assessment provided by the SDA, the GA sends a response to the CA. The following
code snippet represents actions undertaken by the GA.
protected ACLMessage h a n d l e R e q u e s t ( ACLMessage r e q u e s t )
throws R e f u s e E x c e p t i o n , F a i l u r e E x c e p t i o n , No tUnd erst oo dE xcep ti on
{
ACLMessage r e s p o n s e ;
S t r i n g team = h e l p e r . getSenderTeamId ( r e q u e s t ) ;
i f ( team == n u l l )
throw new UnknownTeamException ( n u l l ) . f i l l A C L M e s s a g e (cm , r e q u e s t ) ;
// Checking t r u s t
H o s t i l i t y C o n f i g u r a t i o n h o s t i l i t y=buyerMgr . g e t H o s t i l i t y ( ) ;
response = request . createReply ( ) ;
r e s p o n s e . s e t P e r f o r m a t i v e ( ACLMessage .INFORM) ;
R e s u l t r = new R e s u l t ( r e q u e s t A c t , h o s t i l i t y ) ;
try {
cm . f i l l C o n t e n t ( r e s p o n s e , r ) ;
}
catch ( E x c e p t i o n e ) {
throw new F a i l u r e E x c e p t i o n ( ’ ’ Cannot p r e p a r e r e s p o n s e ’ ’ ) ;
}
return r e s p o n s e ;
}
–8–
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
Here, we can see that the Gatekeeper Agent retrieves, from the request message, the id of the
Client. Next, it acquires its trust value and on its basis prepares an INFORM response message
by appropriately filling its contents. The decision specifies if a Buyer created by the Client can
migrate to the shop platform (the immigrantsAllowed flag) and if the platform allows creation
of buyers on behalf of the client (the creatingBuyersAllowed flag). In the future, such message
will also contain information about the life-timeout of the Buyer Agent (determined basis on
trust). Life-timeout is the length of a period of time after which an inactive BA will be removed
from the system.
Obviously, behavior of the CA depends on the received answer. First, let us note that
information contained in the answer is forwarded by the CA to the CDA for storage and further
processing. For instance, refusal of admission is an indicator of the level of trust used in the
given shop and may be used in the future to evaluate incoming proposals (see also [6, 12]). If
the CA is informed that it can send a BA to the store, it may do it (note that, based on trust
considerations (see [6, 12]), the CDA may decide to not to send an agent to a store if a very large
number of e-shops, selling a given product, is available. However, if the message informs that
only locally prepared BA can be used, the CA will confirm (or not) that it wants to utilize this
form of negotiation participation. Below you will find a snippet of code in which CA prepares
a message that asks for the BA to be created by the GA:
protected V e c t o r p r e p a r e R e q u e s t s ( ACLMessage r e q u e s t )
{
r e q u e s t = new ACLMessage ( ACLMessage .REQUEST) ;
request . addReceiver ( gatekeeper ) ;
r e q u e s t . s e t O n t o l o g y ( N e g o t i a t i o n O n t o l o g y .NAME) ;
r e q u e s t . s e t P r o t o c o l ( FIPANames . I n t e r a c t i o n P r o t o c o l .FIPA_REQUEST ) ;
r e q u e s t . s e t L a n g u a g e ( FIPANames . ContentLanguage . FIPA_SL2 ) ;
CreateBuyer c r e a t e = new CreateBuyer ( ) ;
A c t i o n a c t = new A c t i o n ( g a t e k e e p e r , c r e a t e ) ;
try {
cm . f i l l C o n t e n t ( r e q u e s t , a c t ) ;
}
catch ( E x c e p t i o n e ) {
}
return super . p r e p a r e R e q u e s t s ( r e q u e s t ) ;
}
In the case when the BA is sent, when it arrives at a shop, it communicates with the GA and
the GA checks (again) trust towards this BA. This is necessary because multiple representatives
of the CA can participate in negotiations (for different products) and their actions may negatively
affect the trust toward their owner. If the trust check is not successful, the BA receives a message
prepared as follows:
/∗ ∗
∗ Prepare REFUSE message and l e a v e i n { @ l i n k D a t a S t o r e }
∗ o b j e c t t o be s e n t .
∗ @param r e a s o n
∗ i s the reason to r e f u s e admitting f o r a n e g o t i a t i o n
∗/
protected void p r e p a r e R e f u s e R e s p o n s e ( R e f u s e E x c e p t i o n r e a s o n )
{
ACLMessage r e q u e s t =
( ACLMessage ) g e t D a t a S t o r e ( ) . g e t (REQUEST_KEY) ;
ACLMessage r e s p o n s e = r e q u e s t . c r e a t e R e p l y ( ) ;
–9–
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
r e s p o n s e . s e t P e r f o r m a t i v e ( ACLMessage . REFUSE ) ;
try {
cm . f i l l C o n t e n t ( r e s p o n s e , r e a s o n ) ;
} catch ( E x c e p t i o n e ) {
r e s p o n s e . s e t P e r f o r m a t i v e ( ACLMessage . FAILURE ) ;
}
g e t D a t a S t o r e ( ) . put (REPLY_KEY, r e s p o n s e ) ;
}
We can see here that the GA creates a new REFUSE message and fills it with a reason for
refusal based on the parameter passed to the method.
If the BA receives a refusal to be admitted to the negotiation, it finishes its operation, thus
removing itself from the shop’s platform. At the same time, positive trust check results in
BA being provided with the current negotiation protocol and template. The protocol module
defines the general set of rules and flow of the process of a specific negotiation. It is common for
all BAs and, therefore, can be passed to the incoming (and created) BA(s) by the Gatekeeper
Agent. Along with the protocol, BAs receive negotiation parameters (a negotiation template)
that customize the protocol to the specific negotiation. The template contains values such as
the starting price, bid increment, etc. (see [5, 3] for more details). At this moment both the
incoming and locally created BAs are in the same “stage of development” and request from their
correspondent CAs an appropriate negotiation strategy (matching the obtained protocol and
parameters of the negotiation).
In the following snippet we see how the BA handles receiving the negotiation template from
the GA.
private f i n a l ACLMessage
h a n d l e P r o d u c t I n f o r m a t i o n C h a n g e d ( ACLMessage i n f o r m )
{
ACLMessage r e q u e s t = i n f o r m . c r e a t e R e p l y ( ) ;
Result r ;
NegotiationTemplate template =
( NegotiationTemplate ) r . getValue ( ) ;
s t r a t e g y = getStrategy ( template ) ;
i f ( s t r a t e g y != n u l l ) {
r e q u e s t . s e t P e r f o r m a t i v e ( ACLMessage .REQUEST) ;
ConfirmReady c o n f i r m = new ConfirmReady ( t e m p l a t e . g e t I d ( ) ) ;
A c t i o n a c t = new A c t i o n ( r e c e i v e r , c o n f i r m ) ;
try {
cm . f i l l C o n t e n t ( r e q u e s t , a c t ) ;
}
catch ( E x c e p t i o n e ) {
l o g g e r . l o g ( L e v e l . SEVERE, ‘ ‘ Cannot p r e p a r e r e q u e s t ’ ’ , e ) ;
throw new SystemException ( e ) ;
}
i f ( l o g g e r . i s L o g g a b l e ( L e v e l . FINE ) )
l o g g e r . f i n e ( ‘ ‘ Confirming o f r e a d i n e s s
t o n e g o t i a t e about p r o d u c t < ’ ’ + g l o b a l P r o d u c t I d + ">" ) ;
}
else {
i f ( l o g g e r . i s L o g g a b l e ( L e v e l . FINE ) )
l o g g e r . f i n e ( ‘ ‘ Ca nc ell in g admission process , product < ’ ’
+ globalProductId + ‘‘> ’ ’ ) ;
– 10 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
r e q u e s t . s e t P e r f o r m a t i v e ( ACLMessage .CANCEL) ;
}
return r e q u e s t ;
}
First, the BA extracts the NegotiationTemplate content object from the message, second,
it retrieves a strategy for the template it received. Afterwards, it creates a confirmation response
using a REQUEST message containing a ConfirmReady action and sends it back to the GA. In the
case when the CA cannot prepare a strategy BA decides to cancel its admission to negotiation
(the CANCEL message).
The GA informs the SDA (via the SA; as the SDA and the GA do not know each-other
directly) about all incoming/created BAs. Appropriate message includes also information about
the product that the BA was interested in. This information is stored in the data mart and can
be used for demand prediction.
Note that when a product is asked for the first time (e.g. a BA arrives interested in an
Olympus E-520 camera) then such product has to be reserved for a negotiation (to assure that
negotiation can take place and after it is successful, there will be a product available for sale).
This is achieved by the GA communicating with the Warehouse Agent. Preparing a message to
the WA is achieved as follows:
protected f i n a l V e c t o r p r e p a r e R e q u e s t s ( ACLMessage r e q u e s t ) {
r e q u e s t = new ACLMessage ( ACLMessage .REQUEST) ;
r e q u e s t . a d d R e c e i v e r ( warehouse ) ;
r e q u e s t . s e t L a n g u a g e ( FIPANames . ContentLanguage . FIPA_SL0 ) ;
r e q u e s t . s e t O n t o l o g y ( N e g o t i a t i o n O n t o l o g y .NAME) ;
r e q u e s t . s e t P r o t o c o l ( FIPANames . I n t e r a c t i o n P r o t o c o l .FIPA_REQUEST ) ;
R e s e r v e P r o d u c t a c t i o n = new R e s e r v e P r o d u c t ( ) ;
action . setGlobalProductId ( globalProductId ) ;
action . setReleaseTime ( releaseTime ) ;
A c t i o n a c t = new A c t i o n ( warehouse , a c t i o n ) ;
try {
cm . f i l l C o n t e n t ( r e q u e s t , a c t ) ;
}
catch ( E x c e p t i o n e ) {
l o g g e r . l o g ( Logger . SEVERE,
‘ ‘ Problem while p r e p a r i n g r e q u e s t msg ’ ’ , e ) ;
throw new SystemException ( e ) ;
}
i f ( l o g g e r . i s L o g g a b l e ( L e v e l . FINE ) )
l o g g e r . f i n e ( ‘ ‘ Request f o r p r o d u c t < ’ ’+
globalProductId + ‘‘> r e s e r v a t i o n prepared ’ ’ ) ;
return super . p r e p a r e R e q u e s t s ( r e q u e s t ) ;
}
Here, we see that the GA creates a new message of the REQUEST communicative type, specifies
the receiver of the message to be the Warehouse Agent. The language of the content is set to
FIPA_SL0 and the ontology describing it is the “NegotiationOntology” ontology. The sender
specifies that the message is a part of a conversation adhering to the FIPA_REQUEST protocol.
The message is filled with the ReserveProduct action with the globalProductId parameter set
to the identifier of the product to be reserved and the ReleaseTime set to the period of time
long enough to perform the negotiation.
– 11 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
After receiving the message the WA checks if this product is available. If it is, the WA reserves
the product and sends to the GA the NegotitionTemplate and the NegotiationProtocol. It
is also possible that the WA informs the GA that the product is not available (it was sold out in
the meantime). For extended discussion of this and other cases, involving for example products
temporarily unavailable, see [5].
3.1.2.
Seller agent
Let us briefly note that a similar (modular) approach has been used in the case of the Seller Agent
(SeA). First, the SeA receives the same protocol and negotiation template as other negotiation
participants (since all of them are to participate in the same price negotiation). Second, a private
strategy module that defines the way it should handle the negotiation, as well as other private
data, such as the reserve price is provided. These modules are sent to the SeA by the SDA (via
the SA and the GA, as the SDA does not know the SeA directly).
Overall, we can say that, in terms of receiving and consuming information, BAs and SeAs
are the end destinations of strategy and template parameters, originating at the CDA (for client
strategy), the SDA and the WA (for the template and shop strategy).
3.1.3.
Gatekeeper Agent
As it was shown, the Gatekeeper Agent plays one of crucial roles in information management
within the shop. Therefore, to further clarify its functions, in Fig. 3 we present its use case. This
figure can be treated as a partial summary of the material presented thus far.
Fig. 3. Use case diagram of the Gatekeeper Agent
As we can see, the Gatekeeper Agent: (1) interacts with incoming Buyer Agents, and admits them to the negotiations (or rejects their attempt at entering the host), or interact with
ClientAgents and, on their request, creates Buyer Agents (or reject such requests), and provides
admitted / created Buyer Agents with the protocol and the current negotiation template; (2) in
appropriate moments releases selected Buyer and Seller agents to participate in price negotiations, and (3) manages updates of form (and specific details) of negotiations. To further formalize
– 12 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
the description of the Gatekeeper Agent in Fig. 4 we present its statechart diagram of activities
related specifically to supporting negotiations. For additional details concerning actions of the
GA see also [5, 11].
Fig. 4. Gatekeeper Agent negotiation related activity—statechart diagram
3.2.
Negotiation process
It should be obvious that during price negotiations BA(s) and/or SeA(s) post bids and as such
are key generators of information about the negotiation process. As described in [14, 16], the
negotiation process is managed by the Host Agent, which obtains from the Seller Agent a list
of Buyer Agents that are to participate in negotiations and assures that they proceed according
to the specified protocol (see also [4]). Since all information pertinent to a given negotiation
is available to the Host Agent (e.g. posted on its blackboard, see [25]), once the negotiation
is over it can pass it to the GA to be stored in, and utilized by, the e-shop. In [10] we have
provided a complete description of information related to negotiations stored by the e-shop. A
brief summary can be found in the next section and in section 4., where the list of selected tables
from the Data mart is presented.
3.3.
After a negotiation
One of the more “information rich” events happening in the e-shop is the end of a negotiation.
At this moment, the GA obtains from the Negotiation Host information about just completed
negotiation and sends it to the SA. The SA, in turn, forwards it to SDA for storing and processing.
The negotiation description contains the following information:
1. The unique negotiation identifier—generated by the WA during the negotiation preparation
(when product is reserved for negotiation; see above)
– 13 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
2. Identifier of the strategy passed to the Seller Agent—generated by the SDA when preparing
the negotiation template and strategy
3. Identifier of the template passed to the negotiation participants
4. Date and time of the beginning and the end of the negotiation
5. The amount of products offered
6. The list of BAs (and thus CAs) registered for the negotiation—including those who received
the negotiation template but rejected it or failed to accept it. For each BA the following
information is also specified:
(a) Date and time of providing the BA with the negotiation template.
(b) Date and time of the BA accepting the template if it occurred.
(c) A list of bids made by the client described by the time of the offer, amount offered to
buy, the price and a flag specifying if the bid was a winning offer.
Note that, due to performance reasons we have decided to include in this message the list of
bids (instead of recording them one by one). It is also important to stress that all information
which the Negotiation Host forwards to the GA should be marked as visible in the negotiation
protocol.
When the negotiation is successfully completed the SDA establishes length of reservation—
time during which the negotiated conditions, such as the price and amount of offered product, hold (here, the SA sends to the SDA the QUERY-REF about reservation duration—
getReservationDuration(ClientID), and awaits an answer). The reservation length is to be
calculated based on the level of trust towards the client represented by the BA. Currently, all
BAs receive reservation of the same length.
The reservation can end in three ways: (1) with confirmation of the purchase—SA receives a
message in which the CA confirms the purchase; (2) cancellation of the purchase—SA receives a
message about cancellation of the purchase; or (3) expiration of reservation—SA did not receive
the confirmation/cancellation message in time. Information about expiration of the reservation
the SA receives from the WA. The SA forwards to the SDA information about (either) end of
reservation, to create/update the trust profile of a given Client. The message describing the
finalization of the transaction contains the following information:
1. Identifier of the transaction
2. Transaction outcome i.e. confirmation, cancellation or expiration
3. Date and time of the event
4.
Information storing
The Shop Decision Agent is the decision-making entity within the shop subsystem. As already
mentioned, its main aims are: (1) managing of trust toward individual customers, including
the decision whether to admit (and possibly in what way) their representatives to negotiations;
(2) setting the product reservation deadline; (3) managing forms and parameters of price negotiations; and, (4) preparing sales forecasts for the automatic stock management. To fulfill these
goals, the SDA gathers, stores and processes data and knowledge generated within the e-store.
– 14 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
Note that the information flow in the system has been designed to allow the SDA to gather the
most detailed information about events occurring in the shop and ”remember” their complete
history. While this enables the SDA to make informed decisions, it also poses the danger of
running into a situation when the amount of collected data makes it impossible to effectively
process it. Therefore, we have decided to store data in a multi-dimensional data mart built
according to the star / fact constellation schema proposed in [18]. The detailed description of
this solution can be found in [10], in the following sections we only summarize selected tables
that the schema consists of.
4.1.
Bid Fact Table
The Bid Fact Table contains information about bids made during negotiations. Each row in the
table depicts a single bid and holds information about amount of the bid along with links to
the dimensions of: the client who made the bid, the product, the date and time of the offer,
the negotiation template and the ID of strategy used in the negotiation and the bid status, i.e.
whether the bid was above or below the negotiation minimum price and if it was a winning offer.
4.2.
Transaction Fact Table
The Transaction Fact Table is the largest fact table in the schema and contains information
about the complete sale process flow, for every transaction in the system (with the exception
of the bidding process persisted in the Bid Fact Table). This table is built on the basis of the
Accumulating Snapshot pattern ([18]) and describes transactions using series of boolean flags as
well as date and time dimension links that answer questions if and when the transaction passed
consecutive steps of the sales process.
4.3.
Negotiation Fact Table
Every row in the Negotiation Fact Table holds data describing a single negotiation such as the
negotiation end date and time, product, used strategy and template and the following metrics:
the amount of units offered, the starting and minimum prices, the quantity and value of the items
reserved in winning bids, quantity and value of the items actually purchased, the total number
of bids, the number of winning bids and the number of finished transactions.
4.4.
Supply Fact Table
The Supply Fact Table accumulates data about wholesale orders and deliveries of stock to the
shop’s warehouse: the amount of ordered and delivered product organized along the following
dimensions: the id of the wholesaler that carried out the order, the ordered product and references
to the date and time dimensions describing the order and delivery events.
4.5.
Inventory Snapshot Fact Table
The Inventory Snapshot Fact Table is a helper table aggregating information about stock levels
of products at daily granularity. This data is derived from the Negotiation and Supply Fact
tables to make accessing stock level information easier and more efficient.
– 15 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
5.
Information processing
Let us now discuss utilization of data stored by the e-shop. To start, in Table 5., we summarize
key areas in which we envision that information collected by the e-shop can be used. This list
is, obviously, not a comprehensive one. Rather, it is presented to indicate potential usefulness of
the proposed data management approach.
Table 1. Data mining aims and methods
Expected result
Length of the sales forecasting period
Forecasted sales amount
Estimated margin of the forecast
Amount of units offered
Evaluating the product price
Method used
Estimating the longest period for which the sales amount
time series is stationary using the P-value test
Double/triple exponential smoothing of the sales amount
time series
Mean absolute deviation between the initialized forecasting model and historical data
Moving average of maximum bid amount of units across
past negotiations
Derivative following method—adjusting the price according to the result of previous change
Using data stored in the data mart we have conceptualized and implemented, within the
SDA, a few simple decision-making processes related to determining negotiation parameters and
forecasting the sales volume. It should be noted that our goal was not to implement the complete
SDA functionality—we have not yet, for example, approached the challenge of managing trust. It
was also not our aim to perform a comparative analysis of possible solutions to the implemented
functionalities in search of an optimal method or algorithm. What we set out to do was to
show that the data gathered and stored by the SDA can be transformed into useful knowledge
to be used by other agents in the system—in our case the GA and the WA. Let us start with a
description of proposed approaches to knowledge extraction.
5.1.
Setting negotiation parameters
The outcome of the process of determining the shop’s negotiation parameters is the type of
negotiation protocol to be used for the sale of specific product, the strategy for the SeAs to follow
and a vector of parameters for both the strategy and protocol modules. The set of parameters
may differ from one type of negotiation procedure to another and at this point we have decided
to limit our scope to a simple multi-item English Auction without a reserved price and unlimited
bid step. In this case, the only parameters the SDA needs to evaluate are the starting unit price
of the product and the desired amount of product to be offered in a single negotiation.
5.1.1.
Evaluating the price
The obvious goal of modifying the price of products is to maximize the shop’s profit. A very
interesting comparison of a few methods of automatic price evaluation can be found in [17]. We
have decided to incorporate one of methods described there, namely the Derivative Following
Algorithm. According to [17], this method should perform reasonably well, especially in an
environment where all agents use the same method. It consists in setting the future price of
the product based on the change of profit that occurred after the previous price modification.
Initially, the price is selected randomly and after some period of time, it is increased or decreased
– 16 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
by some value. The decision whether to increase or decrease the price is random at first, then
it is determined by the result of comparing the change in profit between past two periods. If
the profit has increased due to the previous price change, then the price is modified in the same
direction. If the profit has decreased, the direction of price change is reversed. With every period,
the price modifier is exponentially decreased according to the following equation:
δn =
δn−1 (n0 + 1.0)
n0 + currentP eriod
(1)
where n0 = currentP eriod/10.
A slight modification of the method was introduced to take into account also the number of
clients registered in the shop looking for the specific product. The modification was meant to
handle cases where the drop in profit is caused by the overall drop in demand for the product.
Since the process of setting the price was based on information about the value of products sold,
past prices of the product and the number of clients registered as looking for it; this information
comes from the Sales and Demand fact tables (see [10]).
5.1.2.
Setting the number of offered units
The reason why setting this parameters in multi-item auctions is important is because the items
offered at a negotiation are reserved for the time of the auction—they cannot be offered at a
different one. This is a reason why the shop should not offer too many items at a time. On the
other hand, setting too small value can result in losing clients who want to buy a greater number
of items—being forced into taking part in consecutive negotiations may not be acceptable. We
have, therefore, decided to set the amount offered to the most probable amount of a single bid.
To determine how many items a single customer may bid, the moving average method has
been used, taking into account the maximum amount offered in a single bid in the course of past
negotiations. The data has been taken from the Sales Fact Table.
5.2.
Sales forecasting
Forecasting product sales has been realized by analyzing the time series of the amount of sales,
with the period length equal to the prediction horizon. The conditions determining the choice
of a method of analysis was the possible existence of both trend and seasonal fluctuations of the
data. Therefore, we have decided to use the exponential smoothing model ([2]).
The possible existence of seasonality in the data determined the use of triple exponential
smoothing. The problem with this method, however, is the amount of data needed to estimate
seasonal changes is large—it needs two complete cycles of the data to initialize these values.
This posed a problem in cases when the system has not yet accumulated enough sales data. To
overcome this challenge we have introduced several countermeasures. Firstly, the length of a cycle
of data was variable—seasonality can be analyzed on a weekly, monthly, quarterly, half-yearly or
yearly level depending on the amount of available data. Secondly, if we have insufficient data to
even perform a weekly seasonal analysis, the forecasting method is automatically switched from
triple to double exponential smoothing, which does not take seasonality into account and hence
does not pose any data amount requirements.
The forecast deviation, which is another parameter of the prediction message sent to the
WA by the SDA is simply calculated as the mean absolute deviation calculated basing on the
initialized model and the historical data used in the process.
– 17 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
The forecasting process uses the data about the amount of items sold (i.e. the reservations
which have been confirmed by the clients and the sales process finalized) taken from the Sales
Fact Table.
6.
Sample information utilization
6.1.
Test setup
We have performed several tests to establish usability of data processing methods described in
previous sections. To be able to accurately describe the input conditions of the test we have
developed a simple testbed, consisting of two agents “stubbing out” the parts of the system that
interact with the SDA:
1. the Shop Agent Stub—engaged in the same communication protocols as the SA, and
2. the Warehouse Agent Stub—a mock agent of the WA.
Thanks to this approach we were able to feed the SDA agent with exactly the information
we wanted output for, without the need of setting up complex relations between other agents in
the system—especially multiple clients. We could also more easily simulate compressed flow of
time.
To simulate the amount of items bought by clients we have incorporated a very simplistic
economic model. We have assumed that each client has a maximum price at which he/she will
buy the product. If the shop’s price is higher, than the client will simply resign. We have also
assumed that in each negotiation only one buyer can take part. With these assumptions all
negotiations consist of a single bid if the price is fine for the client and no bid if it is too high.
The client’s maximum price is calculated according to the normal distribution with the mean
value taken from the scenario definition file and possibly changing every day and the variance
being a certain percent of the mean value (the percentage constant across the experiment).
6.2.
Test scenario
In the test scenario used to check the SDA’s ability to adapt to changing conditions we have
made the following assumptions:
• The length of the simulation is 1200 days.
• The length of the forecast horizon is 3 days, so the total number of forecasting periods is
400.
• The shop under consideration is the only one selling the product (there is no competition).
• Clients always buy 10 items of the product if such quantity is sold by the shop.
• The mean price every client is prepared to pay for the product is generated based on a
normal distribution, with the mean of 5 and the variance 0.5. The relative variance of the
maximum price has been set to 0.2.
• The number of clients visiting the shop for the product has been generated for each day
according to the normal distribution with the mean rising linearly from 30 at the beginning
of the simulation to 60 at the end, with a relative variance of the mean value of 0.05.
– 18 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
In the Fig. 5 we depict the number of clients registering at the shop, while Fig. 6 shows the
results of a sample test of predicting sales.
Fig. 5. Test input data; number of registered agents (Y axis) in relation to a simulation day (X
axis)
Fig. 6. Test results; variation between predicted and actual sales over time
– 19 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
In this scenario we have tested the sales forecasting module. Its task was made difficult
not only by the rising trend of the input data and this data’s deviance but also by additional
deviance caused by the functioning of the price modification module. Despite those problems we
have managed to prevent stock shortages in 78% of periods with a mean amount of overstocked
product equal to 20% during overstocked periods. During the understocked periods, the mean
amount of the items not sold due to the product shortage was 10% of the sold quantity with the
median of 8%.
7.
Concluding remarks
In the paper we have presented a comprehensive picture of information management within the
e-store part of an agent-based e-commerce system. First, we introduced scenarios in which data
elements are generated. Next we have discussed flow of messages involved in leading to storing
this data in the e-shop’s knowledge base, as well as utilization of knowledge extracted from
it. Finally, samples of utilization of data stored in the central repository were presented and a
specific application experimentally evaluated through simulation. Currently the application is
further tested. In the next step we plan to start developing a larger portfolio of data mining
methods to be used within the context presented here.
References
[1] Agorics. http://www.agorics.com/Library/Auctions/
[2] Nistsematech e-handbook of Statistical Methods. http://www.itl.nist.gov/div898/
handbook/pmc/section4/pmc43.htm
[3] C. Bădică, A. Bădită, M. Ganzha and M. Paprzycki. Implementing Rule-Based Automated
Price Negotiation in an Agent System // Journal of Universal Computer Science (13(2)),
2007. P. 244-266.
[4] C. Bartolini, C. Preist, N. R. Jennings. A Software Framework for Automated Negotiation
// Proceedings of SELMAS’2004. LNCS 3390, Springer Verlag, 2005. P. 213–235.
[5] C. Bădică, A. Bădită, M. Ganzha and M. Paprzycki. Developing a Model Agent-based Ecommerce System // E-Service Intelligence—Methodologies, Technologies and Applications.
Springer, 2007. P. 555–578.
[6] C. Bădică, M. Ganzha, M. Gawinecki, P. Kobzdej and M. Paprzycki. Towards Trust Management in an Agent-based E-commerce System — Initial Considerations // Proceedings
of the MISSI 2006 Conference, WrocÃlaw University of Technology Press, WrocÃlaw, Poland,
2006. P. 225–236.
[7] C. Bădică, M. Ganzha,M. Gawinecki, P. Kobzdej, M. Paprzycki, M. Scafes and G.-G. Popa.
Managing Information and Time Flow in an Agent-based E-commerce System // Proceedings of the Fifth International Symposiom on Parallel and Distributed Computing, Los
Alamitos, CA, IEEE CS Press, 2006. P. 352–359.
– 20 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
[8] V. Chavez and P. Maes. Kasbah: An Agent Marketplace for Buying and Selling Goods. Proc.
of the First Int. Conf. on the Practical Application of Intelligent Agents and Multi-Agent
Technology. London, UK, 1996.
[9] M. Dominiak, W. Kuranowski, M. Gawinecki, M. Ganzha and M. Paprzycki. Efficient Matchmaking in an Agent-based Grid Resource Brokering System // Proceedings of the International Multiconference on Computer Science and Information Technology. PTI Press, 2006.
P. 327–335.
[10] M. Drozdowicz, M. Ganzha, M. Gawinecki, P. Kobzdej and M. Paprzycki. Designing and
implementing data mart for an agent-based E-commerce system // IADIS International
Journal on WWW/INTERNET, 2008.
[11] M. Ganzha, M. Gawinecki, P. Kobzdej and M. Paprzycki. Model Agent-based Ecommerce
System // Development of Multi-Agent Systems in Socio-Economic Environments. Placet,
Warsaw, Poland, 2008. in Polish.
[12] M. Ganzha, M. Gawinecki, P. Kobzdej, M. Paprzycki and C. Bădică. Functionalizing trust
in a model agent based e-commerce system // Proceedings of the 2006 Information Society
Multiconference, Josef Stefan Institute Press, 2006.P. 22–26.
[13] M. Ganzha, M. Gawinecki, P. Kobzdej, M. Paprzycki and T. Serzysko. Implementing Commodity Flow in an Agent-Based Model E-commerce System // Parallel Processing and
Applied Mathematics, LNCS. Berlin, Springer, 2008. P. 400–408.
[14] M. Ganzha and M. Paprzycki. Adapting Price Negotiations to an E-commerce System Scenario // Proceedings of the CISIM Conference. Los Alamitos, CA, IEEE CS Press, 2007.
P. 380–386.
[15] M. Gawinecki, M. Ganzha, P. Kobzdej, M. Paprzycki, C. Bădică, M. Scafes and G.-G.
Popa. Managing Information and Time Flow in an Agent-based E-commerce System //
Proceedings of the 5th International Symposiom on Parallel and Distributed Computing,
Los Alamitos, CA, 2006. P. 352–359.
[16] M. Gawinecki, P. Kobzdej, M. Ganzha and M. Paprzycki. Introducing interaction-based
auctions into a model agent-based e-commerce system—preliminary considerations // Proceedings of the EATIS Conference, ACM Digital Library, New York, NY, 2007.
[17] J. Kephart, J. Hanson and A. Greenwald. Dynamic Pricing by Software Agents // Computer
Networks. Vol. 32, 2000. P. 731–752.
[18] R. Kimball and M. Ross. The Data Warehouse Toolkit: The Complete Guide to Dimensional
Modeling, 2nd Edition. John Wiley & Sons, 2002.
[19] W. Kuranowski, M. Ganzha, M. Paprzycki and M. Dominiak. Development of Multi-Agent
Systems in Socio-Economic Environments // Software Agents as Resource Brokers in the
Grid. Placet, Warsaw, Poland, 2008. P. 369–391. in Polish
[20] K. Laudon and C. Traver. E-commerce. business. technology. society (2nd ed. Pearson
Addison-Wesley, 2004.
– 21 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
M. Drozdowicz, M. Ganzha, M. Paprzycki, M. Gawinecki, A. Legalov. Information Flow . . .
[21] P. Maes, R. H. Guttman and A. G. Moukas. Agents that Buy and Sell: Transforming
Commerce as we Know It // Communications of the ACM. Vol. 42(3), 1999. P. 81–91.
[22] D. Rolli and A. Eberhart. A Descriptive Auction Language. Electronic Markets – The International Journal, 2005.
[23] T. Serzysko, M. Gawinecki, P. Kobzdej, M. Ganzha and M. Paprzycki. Introducing Commodity Flow to an Agent-Based Model E-commerce System // Proceedings of the 2007 IAT
Conference, Los Alamitos, CA, IEEE Press, 2007. P. 294–298.
[24] D. Trastour, C. Bartolini and C. Preist. Semantic web support for the business-to-business ecommerce lifecycle // WWW ’02: Proceedings of the 11th international conference on World
Wide Web, Honolulu, Hawaii, USA, 2002. P. 89–98.http://acm.org/10.1145/511446.
511458
[25] K. Wasilewska, M. Gawinecki, M. Paprzycki, M. Ganzha and P. Kobzdej. Optimizing
blackboard implementation of agent-conducted auctions. IADIS International Journal on
WWW/INTERNET, 2008.
[26] M. Wooldridge. An Introduction to MultiAgent Systems. John Wiley & Sons, 2002.
– 22 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Journal of Siberian Federal University. Engineering & Technologies 1 (2009 2), 23-31
УДК 004.4:528.9
Кластерный анализ и классификация
с обучением многоспектральных данных
дистанционного зондирования Земли
В.В. Асмусa , А.А. Бучневb , В.П. Пяткинb∗
a
b
Научно-исследовательский центр “Планета”, РОСКОМГИДРОМЕТ
123242 Россия, Москва, Большой Предтеченский пер., 7
Институт вычислительной математики и математической геофизики СО РАН
630090 Россия, Новосибирск, пр. Лаврентьева, 61
Получена 15.11.2008, окончательный вариант 10.12.2008, принята к печати 10.03.2009
Рассматриваются вопросы, связанные с проблемой выбора адекватных алгоритмов распознавания
многоспектральных данных дистанционного зондирования Земли. Представлена система контролируемой классификации, основанная на стратегии максимального правдоподобия для нормально
распределенных векторов признаков. Описывается система кластерного анализа, включающая
алгоритм К-средних и метод анализа мод многомерной гистограммы.
Ключевые слова: дистанционное зондирование Земли, распознавание данных, контролируемая
классификация, неконтролируемая классификация, кластерный анализ, решающее правило, обучение классификатора, метод K-средних, многомерная гистограмма.
1.
Введение
Эффективность дистанционных исследований Земли из космоса во многом определяется
используемыми методами тематической обработки данных дистанционного зондирования
Земли (ДДЗЗ). При этом центральной при тематической обработке, безусловно, является система классификации. В модуль распознавания программного комплекса обработки
ДДЗЗ, разработанного в ИВМиМГ СО РАН совместно с НИЦ “Планета” Роскомгидромета
РФ, включены алгоритмы контролируемой и неконтролируемой классификации многоспектральных ДДЗЗ [1,2]. Центральный вопрос интерпретации ДДЗЗ (вопрос повышения качества дешифрирования) непосредственно связан с проблемой выбора адекватного алгоритма
распознавания. Возникающие при этом трудности обусловлены следующими причинами:
1. Структура реальных данных не соответствует модели данных, используемой в алгоритме распознавания. Например, невыполнение предположения о нормальном распределении векторов данных или невыполнение условия, что поле измерений является случайным.
Опыт показывает, что такие ситуации возникают при использовании данных в формате
JPEG, а также тогда, когда излучение от сканируемого объекта выходит за пределы динамического диапазона съемочной аппаратуры. В этих случаях приходится либо вообще отказываться от методов, требующих обращения ковариационных матриц, либо прибегать к
приемам, повышающим дисперсию данных (например, в описываемой ниже системе классификации к спектральным каналам с нулевой дисперсией возможно добавление гауссовского
шума с нулевым средним и единичной дисперсией).
2. Нерепрезентативность обучающих последовательностей: недостаточное количество
данных для восстановления параметров решающего правила; несоответствие обучающих
∗
1
Corresponding author E-mail address: pvp@ooi.sscc.ru
c Siberian Federal University. All rights reserved
°
– 23 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Асмус, А.А. Бучнев, В.П. Пяткин.
Кластерный анализ и классификация с обучением. . .
данных и данных, предъявляемых на распознавание (“загрязнение” выборок смешанными
векторами измерений, т.е. векторами, которые образуются при попадании в элемент разрешения съемочной системы нескольких природных объектов, неточное соответствие обучающих данных, получаемых с помощью кластеризации, истинным тематическим классам,
помехи аппаратуры, влияние атмосферных условий и т.п.) [2].
Таким образом, современный опыт автоматизированного распознавания ДДЗЗ показывает: заранее практически невозможно установить, какой алгоритм будет лучше с точки
зрения соотношения точности классификации и стоимости. Поэтому в распознающую систему целесообразно закладывать несколько алгоритмов и выбор оптимального алгоритма
проводить эмпирически на этапе обучения по результатам классификации тестовых данных. Выбранный алгоритм используется затем для распознавания всего набора векторов
измерений.
2.
Контролируемая классификация
Разработанная в ИВМиМГ СО РАН совместно с НИЦ “Планета” система контролируемой
классификации (классификации с обучением) ДДЗЗ в программном комплексе состоит из
семи классификаторов (один поэлементный классификатор и шесть объектных), основанных на использовании байесовской стратегии максимального правдоподобия, и двух объектных классификаторов, основанных на минимуме расстояния. Эта система является частью
программного комплекса по обработке ДДЗЗ [3].
2.1. Поэлементная классификация. Под элементом здесь понимается N -мерный вектор измерений (признаков) x = (x1 , . . . , xN )T , где N — число спектральных диапазонов.
Предполагается, что векторы x имеют в классе ωi нормальное распределение N (mi , Bi ) со
средним mi и ковариационной матрицей Bi . В этом случае байесовская стратегия максимального правдоподобия для поэлементного классификатора формулируется следующим
образом [4–6].
Пусть Ω = (ω1 , . . . , ωm ) — конечное множество классов, p(ωi ) — априорная вероятность
класса ωi . Тогда дискриминантная функция класса ωi имеет вид
gi (x) = ln(p(ωi )) − 0.5 ln(|Bi |) − 0.5(x − mi )T Bi−1 (x − mi ).
(1)
Классическое решающее правило для классификатора принимает следующий вид: вектор
x заносится в класс ωi , если gi (x) > gj (x) для всех j 6= i.
Для класса ωi следующим образом определим параметр Ti :
Ti = ln p(ωi ) − 0.5A(N, Q) − 0.5 ln |Bi |,
(2)
где A(N, Q) — критическое значение уровня Q распределения χ2 . Пусть ti — переменная,
значение которой зависит от параметра классификатора thr:

−∞,




Ti ,



m

 min
Ti ,
i=1
ti =
m


max Ti ,


µi=1
¶


m
P



Ti /m,
i=1
– 24 –
если thr = 1,
если thr = 2,
если thr = 3,
если thr = 4,
если thr = 5.
(3)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Асмус, А.А. Бучнев, В.П. Пяткин.
Кластерный анализ и классификация с обучением. . .
Тогда решающее правило для классификатора с учетом (3) принимает следующий вид [2]:
вектор x заносится в класс ωi , если gi (x) > gj (x) для всех j 6= i и gi (x) > ti (при ti =
= Ti это означает следующее ограничение расстояния Махалонобиса до центра класса:
(x−mi )T Bi−1 (x−mi ) < A(N, Q)). В противном случае вектор заносится в класс отклоненных
векторов (класс с номером m + 1).
Значения A(N, q) для размерности вектора N ≤ 30 находятся из статистических таблиц.
Например, для N = 4 и уровня Q = 0.05 (т. е. 5% векторов может быть отклонено) A = 9.488.
При N > 30 для нахождения значений A(N, Q) используется аппроксимация
Ã
χ21−Q (N )
≈N
2
+ u1−Q
1−
9N
r
2
9N
!3
,
(4)
где u1−Q — значение стандартизованной нормальной величины для вероятности 1 − Q (в
частности, для уровня Q = 0.05 значение u0.95 ≈ 1.645).
2.2. Объектная классификация. Под объектом мы понимаем блок смежных векторов квадратной или крестообразной формы. Поскольку физические размеры реально сканируемых пространственных объектов, как правило, больше разрешения съемочных систем,
между векторами данных существуют взаимосвязи. Использование информации подобного
рода дает возможность повысить точность классификации, если пытаться распознавать одновременно группу смежных векторов – объект в приведенном выше смысле. Рассмотрим
вектор (объект) X(x1 , . . . , xL )T , состоящий из смежных N −мерных векторов xi , i = 1, . . . , L
(например, в окрестности 3*3, 5*5,. . . элементов; мы работаем с объектами двух видов –
квадратными либо крестообразными). Решение об отнесении центрального элемента объекта тому или иному классу принимается на основе результата классификации всего объекта.
Такой подход порождает целое семейство решающих правил. Во-первых, это использование принципа голосования, т.е. независимая классификация элементов объекта и отнесение центрального элемента к тому классу, которому было отнесено большинство элементов объекта. Во-вторых, это применение текстурных операторов (простейший пример – описание объекта через вектор средних составляющих его элементов) с последующим отнесением центрального элемента классу, к которому был отнесен параметр,
характеризующий X. В-третьих, описание объекта случайным марковским полем, т. е.
p(X|ωi ) = p(x1 |x2 , . . . , xL ; ωi ) . . . p(xL |ωi ). В этом случае модель выглядит следующим образом. Пусть вектор x имеет в классе ωi нормальное распределение N (mi , Bi ) со средним mi
и ковариационной матрицей Bi . Тогда вектор также нормально распределен в классе ωi со
средним Mi размерности NL и ковариационной матрицей Ki размерности N L×N L. Оценка
этой матрицы при больших значениях NL (требуется очень большое количество обучающих
данных), а также ее обращение на практике трудно реализуемо. Поэтому введем упрощающие структурные предположения. Если считать, что корреляция между элементами объекта во всех зонах съемки одинакова, то ковариационную матрицу Ki можно представить в
виде прямого произведения матрицы пространственной корреляции Ri на ковариационную
L
Q
матрицу Bi . Если Ri является единичной, то p(X|ωi ) =
p(xi |ωi ) и мы имеем известное
i=1
решающее правило при предположении, что элементы объекта независимы. Более адекватные модели возникают при других предположениях о структуре корреляционных связей.
Например, вводя допущение о разделимости автокорреляционной функции элементов объекта по вертикали и горизонтали, получаем каузальную авторегрессионную модель первого
либо третьего порядка (в зависимости от формы объекта).
– 25 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Асмус, А.А. Бучнев, В.П. Пяткин.
Кластерный анализ и классификация с обучением. . .
Приведем алгоритмы работы некоторых объектных классификаторов. Предположим,
что векторы внутри блока независимы. Будем рассматривать векторы, составляющие объект X, как один вектор размерности NL. Тогда дискриминантная функция класса ωi имеет
вид
L
X
gi (X) = ln(p(ωi )) − 0.5L ln(|Bi |) − 0.5
(xl − mi )T Bi−1 (xl − mi ).
l=1
Решающее правило для данных классификаторов принимает следующий вид: центральный
элемент объекта X заносится в класс ωi , если gi (X) > gj (X) для всех j 6= i и gi (X) > ti . В
противном случае центральный элемент объекта заносится в класс отклоненных векторов.
Здесь ti определяется по (2) и (3) с A = A(LN, Q).
Снова считаем, что векторы внутри блока независимы. Классифицируется вектор x,
равный среднему по всем векторам объекта X:
L
x=
1X i
x.
L i=1
(5)
Дискриминантная функция класса ωi имеет вид
gi (X) = ln(p(ωi )) − 0.5L ln(|Bi |) − 0.5L(x − mi )T Bi−1 (x − mi ).
Решающее правило для данных классификаторов таково: центральный элемент объекта
X заносится в класс ωi , если gi (X) > gj (X) для всех j 6= i и gi (X) > ti . В противном
случае центральный элемент объекта заносится в класс отклоненных векторов. Здесь ti
определяется по (2) и (3).
Классифицируется средний вектор (5) блока в предположении, что векторы внутри блока независимы и ковариационные матрицы равны единичной. Фактически это объектные
классификаторы, решающие правила которых основаны на минимуме евклидова расстояния до центра класса. Дискриминантная функция класса ωi имеет вид
gi (X) = ln(p(ωi )) − 0.5(x − mi )T Bi−1 (x − mi ).
Решающее правило для данных классификаторов: центральный элемент объекта X заносится в класс ωi , если gi (X) > gj (X) для всех j 6= i и gi (X) > ti . В противном случае
центральный элемент объекта заносится в класс отклоненных векторов. Здесь ti = −A, где
A > 0 – число, задаваемое пользователем.
Система классификации содержит также объектные классификаторы, основанные на
модели каузального марковского случайного поля первого и третьего порядка.
2.3. Обучение и работа классификаторов. Необходимые для построения дискриминантных функций классов оценки статистических характеристик – векторов средних,
ковариационных матриц, коэффициентов пространственной корреляции между значениями координат соседних векторов в горизонтальном и вертикальном направлениях – определяются на основе векторов из обучающих выборок (полей). Кроме обучающих для каждого
класса может быть задан набор контрольных полей.
Все классификаторы могут использоваться в двух режимах – тестовом и рабочем. По
результатам работы классификаторов в тестовом режиме над векторами обучающих и контрольных полей рассчитываются матрица ошибок и оценки вероятностей правильной классификации. Известно (см., например, [4, 6]), что эти оценки для векторов из обучающих полей являются, в среднем, оптимистическими, а для векторов из контрольных полей также в
– 26 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Асмус, А.А. Бучнев, В.П. Пяткин.
Кластерный анализ и классификация с обучением. . .
среднем пессимистическими. Анализируя эти данные, можно оценить (проконтролировать)
качество обучения.
Как отмечалось выше, возможны ситуации, при которых нарушается условие о случайности поля измерений, следствием чего выступают нулевые дисперсии в некоторых каналах.
Тогда формулы типа (1) становятся неприменимыми, т. к. ковариационные матрицы B вырожденные. Для исправления подобных ситуаций в системе классификации предусмотрена
функция добавления к спектральным каналам с нулевой дисперсией гауссовского шума с
нулевым средним и единичной дисперсией.
Результатом работы классификаторов в рабочем режиме служит одноканальное (байтовое) изображение, значениями пикселов которого являются номера классов. Это изображение окрашивается в предопределенные цвета, которые в интерактивном режиме могут быть
заменены на цвета, определяемые пользователем. Кроме того, к этому изображению можно
применить функцию редактирования, которая определяется как уточнение карты классификации на основе учета контекста без изменения перечня ранее выделенных классов. Эта
функция может работать в двух режимах: в режиме Vote, при котором центральный пиксел окрестности 3*3 заменяется модой гистограммы окрестности, и в режиме Allsame,
при котором центральный пиксел такой же окрестности меняется только тогда, когда все
окружающие его пикселы имеют одинаковое значение.
Система контролируемой классификации имеет следующие характеристики: число обучающих образов – до 9, число классов – до 15, число обучающих и контрольных полей
в классе – до 10, размер каждого поля – до 50*50 векторов, размер объекта – от 1*1 до
11*11, размерность векторов данных не ограничивается. На рис. 1 представлена тематическая карта ледовой обстановки в восточном секторе Арктики, полученная с использованием
контролируемой классификации. В качестве распознаваемых изображений использовались
мозаики радиолокационных и радиометрических снимков с ИСЗ “Океан-О1”. Для выбора
тестовых участков использовалось цветосинтезированное изображение.
3.
Неконтролируемая классификация
Неконтролируемая классификация (кластерный анализ) в программном комплексе представлена двумя алгоритмами – методом K-средних и методом анализа мод многомерной
гистограммы [3].
3.1. Метод K-средних. Этот подход основан на итеративной процедуре отнесения векторов признаков классам по критерию минимума расстояния от вектора до центра класса.
Оптимальным считается такое разбиение входных векторов на кластеры, при котором внутриклассовый разброс не может быть уменьшен при переносе какого-либо вектора из одного
кластера в другой.
Алгоритм состоит в выполнении следующих шагов:
1. На основе заданного соотношения α чистых и смешанных векторов производится разделение векторов на чистые и смешанные. Под смешанными мы понимаем векторы, компоненты которых либо формируются за счет попадания в поле зрения съемочной аппаратуры
нескольких объектов, либо искажены влиянием фона. С этой целью вначале для исходного
набора векторов измерений рассчитывается градиентное изображение и одновременно строится гистограмма градиентов. Исходя из заданного α, по гистограмме определяется порог,
разделяющий векторы на смешанные и чистые.
2. Объединение чистых векторов в связные компоненты. На этом этапе все чистые век– 27 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Асмус, А.А. Бучнев, В.П. Пяткин.
Кластерный анализ и классификация с обучением. . .
торы объединяются в связные компоненты, которые последовательно нумеруются. Соответствующий алгоритм, идейно близкий к алгоритму заполнения областей с произвольной
границей по критерию связности [3], может выделять и нумеровать одновременно любое
количество многосвязных областей без ограничений на их форму и ширину контуров. Для
каждой связной компоненты вычисляется вектор средних.
Рис. 1
3. Итеративная кластеризация векторов средних. Начальные центры кластеров определяются по следующей схеме. В качестве первых двух центров берется пара векторов,
наиболее далеких друг от друга. Затем вся выборка делится на кластеры по критерию близости к выбранным центрам. В каждом кластере отыскивается вектор, наиболее далекий от
центра. Для всех таких векторов рассчитывается суммарное расстояние до всех центров. В
качестве нового центра берется вектор, для которого суммарное расстояние максимально,
и процедура распределения векторов по кластерам повторяется.
4. Распределение связных компонент по кластерам. На этом этапе связные компоненты
получают новые номера. Новый номер присваивается компоненте в соответствии с номером
кластера, в который попал вектор средних этой компоненты.
5. Кластеризация смешанных векторов. На завершающем этапе производится неитеративная кластеризация смешанных векторов по принципу минимума расстояния до центров
кластеров C1 , . . . , Ck . Смешанный вектор z будет отнесен к ближайшему кластеру ωi , если
– 28 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Асмус, А.А. Бучнев, В.П. Пяткин.
Кластерный анализ и классификация с обучением. . .
||Ci − z|| < 0.5 max ||Ci − Cl ||, i, l = 1, . . . , k, k 6= l.
Рис. 2
Рис. 3
Рис. 3 иллюстрирует результат работы кластеризации методом K-средних изображения, представленного на рис. 2. Рис. 3 демонстрирует результат работы алгоритма для следующих входных данных: количество выделяемых кластеров 15, соотношение количества
смешанных и чистых векторов α = 0.35.
3.2. Метод анализа мод многомерной гистограммы. В основе второго подхода
лежит предположение, что исходные данные являются выборкой из многомодового закона
распределения, причем векторы, отвечающие отдельной моде, образуют кластер. Таким образом, задача сводится к анализу мод многомерных гистограмм. В программный комплекс
включена реализация метода, описание основных шагов которого приведено в [3].
Гистограмма генерируется последовательным просмотром векторов данных и сравнением каждого вектора с текущим списком векторов. При этом либо изменяется соответствующее значение частоты, либо вектор добавляется в список. Для вычисления адресов
векторов в списке используется хэш-кодирование. Первым шагом модального анализа является поиск ближайших соседей данного вектора списка среди других векторов списка. По
определению вектор x есть ближайший сосед вектора y, если |xi − yi | ≤ 1 для i = 1, . . . , N.
Каждый из возможных ближайших соседей данного вектора x может быть получен из
него прибавлением вектора сдвига, компоненты которого принимают значения из множества {−1, 0, 1}. Алгоритмически i-й вектор сдвига, i = 1, 2, . . . , 3N − 1, можно получить,
уменьшив на 1 каждый из коэффициентов представления числа i в троичной системе счисления. Поскольку в реальной гистограмме присутствуют далеко не все ближайшие соседи,
то для эффективного их поиска векторы предварительно упорядочиваются в многомерные
бинарные деревья. В этом случае время поиска всех ближайших соседей данного вектора
становится пропорциональным числу реально существующих соседей. При построении дерева векторы x рассматриваются как N -мерные ключи. Вначале рассчитываются дисперсии
по всем координатам векторов и определяется координата j, имеющая максимальную дисперсию. Медианное значение выборки по этой координате используется в качестве ключа
для разделения множества векторов на два подмножества: в одно подмножество помещаются векторы, значение которых по координате j меньше порогового значения, а в другое
— векторы, у которых значение координаты превосходит порог. Каждое из полученных
подмножеств делится далее аналогичным образом.
– 29 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Асмус, А.А. Бучнев, В.П. Пяткин.
Кластерный анализ и классификация с обучением. . .
Далее проводится локализация мод гистограммы. Вначале каждому вектору на основе
анализа его ближайших соседей ставится в соответствие градиент. Вектору приписывается
номер вектора с максимальным значением градиента. Если градиент меньше нуля, то это
означает, что координаты вектора являются координатами локального максимума и вектору
приписывается его собственный номер. В итоге каждой моде гистограммы сопоставляется
ориентированный граф, корень которого соответствует точке моды. Если количество получаемых кластеров (количество локальных максимумов гистограммы) больше заданного
порога, то проводится сглаживание гистограммы. Сглаживание осуществляется либо путем
замены частоты h(x) вектора x на среднее значение частот его ближайших соседей, либо
путем уменьшения “разрешения” векторов данных, т. е. делением компонент векторов на 2.
На завершающем этапе выполняется раскраска ориентированного графа одним цветом,
т.е. всем вершинам графа присваивается значение, которое присвоено его корню.
Рис. 4
На рис. 4 приведен результат кластеризации исходного изображения (рис. 2) описанным
методом. Выделено 15 кластеров. Сравнивая рис. 3 и 4, можно заметить существенные различия: на рис. 3 лучше разделены сельскохозяйственные угодья, а на рис. 4 лучше “проработаны” водные поверхности (включая зоны паводкового затопления). Эти различия говорят
о том, что надежность результатов кластеризации часто можно оценить лишь сравнением
нескольких вариантов обработки.
4.
Заключение
Практика решения конкретных прикладных задач дистанционного зондирования Земли с
использованием предлагаемого подхода подтверждает его эффективность [2].
Работа выполнена частично при финансовой поддержке РФФИ (грант №07-07-00085).
– 30 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.В. Асмус, А.А. Бучнев, В.П. Пяткин.
Кластерный анализ и классификация с обучением. . .
Список литературы
[1] Remote Sensing: The Quantitative Approach // Edited by P.H. Swain and S.M. Davis. USA,
McGraw-Hill, Inc., 1978. – 396 p.
[2] Асмус В. В. Программно-аппаратный комплекс обработки спутниковых данных и его
применение для задач гидрометеорологии и мониторинга природной среды. Дис. д-ра
физ.-математ. наук. На правах рукописи. – М., 2002. – 75 с.
[3] Асмус В. В., Бучнев А. А., Пяткин В. П. Программный комплекс для обработки данных дистанционного зондирования Земли. Труды XXXII Международной конференции “Информационные технологии в науке, образовании, телекоммуникации и бизнесе,
IT+SE’2005”, приложение к журналу “Открытое образование”, 20-30 мая 2005, Украина,
Крым, Ялта-Гурзуф. С. 229–232.
[4] Дж. Ту, Р. Гонсалес. Принципы распознавания образов. – М.: Мир, 1978. – 411 с.
[5] Гонсалес Р., Вудс Р. Цифровая обработка изображений. – М.: Техносфера, 2005, – 1072 с.
[6] Marques de Sa J.P. Pattern Recognition: Concepts, Methods and Applications. SpringerVerlag, Berlin, Heidelberg, 2001, – 318 р.
The Cluster Analysis and Classification with Training of
Multispectral Data of Earth Remote Sensing
Vasily V. Asmusa , Alexey A. Buchnevb and Valery P. Pyuatkinb
a
b
Research center “Planeta”
7 Bolshoy Predtechensky, Moscow, 123242 Russia
Institute of Computational Mathematics and Mathematical Geophysics SB RAS
6 pr. Ak. Lavrentjeva, Novosibirsk, 630090 Russia
It is obtained questions, connected with the problem of choosing appropriate algorithms of recognition
of multispectral data of Earth remote sensing. It is submitted the system of supervised classification,
based on a strategy of maximum probability for vectors of indications having the normal distribution. It
is described the system of cluster analysis, including an algorithm for K-means method and analyzing
method of mode of multidimensional histogram.
Key words: Earth remote sensing, data recognition, supervised classification, unsupervised classification,
cluster analysis, decision rule, classifier training, K-means method, multidimensional histogram.
– 31 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Journal of Siberian Federal University. Engineering & Technologies 1 (2009 2), 32-48
УДК 004.891
Технология формирования обобщенного «И/ИЛИ» дерева решения задач анализа изображений. Исследование
скорости сходимости процесса формирования обобщенного «И/ИЛИ» дерева
А.А. Вовк∗ , Г.М. Цибульский, А.А. Латынцев
Сибирский федеральный университет,
660041 Россия, Красноярск, Свободный, 791
Получена 15.11.2008, окончательный вариант 21.11.2008, принята к печати 10.03.2009
Предложена новая технология построения «И/ИЛИ» дерева, позволяющая формировать базу
знаний и «И/ИЛИ» дерево экспертной системы пользователем-природоведом без компонента
«извлечение знаний». Разработан новый алгоритм построения обобщенного «И/ИЛИ» дерева,
основанный на объединении решающих «И» деревьев класса задач. Доказана сходимость такого процесса. Экспериментально проиллюстрирован процесс формирования обобщенного «И/ИЛИ»
дерева. Исследована сходимость процесса формирования «И/ИЛИ» дерева. Исследована скорость
сходимости экспериментального процесса и сопоставлена с теоретической оценкой скорости сходимости.
Ключевые слова: «И/ИЛИ» дерево, решающее дерево, база знаний, инженер знаний, извлечение
знаний, редукция задачи, объединение кластеров, объединение деревьев, пространство признаков,
анализ изображений.
Доминирующая в настоящее время технология корректировки базы знаний экспертной
системы поддерживается компонентом ЭС “извлечение знаний”, пользователем которой является когнитолог. При этом обобщенное дерево решения задач ЭС должно быть задано
априори [1]. В этих условиях актуальна разработка технологии формирования адекватной
базы знаний и соответствующего “И/ИЛИ” дерева, обеспечивающих соответствующую проблемную ориентацию ЭС, ориентированную на работу с пользователем-природоведом.
Постановка задачи
Описание цели представляет собой кластер, заданный в некотором признаковом пространстве X(x1 , x2 ,. . . ,x n ) значениями эталона E(e1 , e2 ,. . . ,e n ) и критерия компактности ε.
Пусть задано “И/ИЛИ” дерево, представляющее собой граф редукции исходной цели, полученной от пользователя, на подцели. Корневая вершина дерева соответствует описанию
исходной цели, т.е. кластеру в пространстве целей. Дочерние вершины каждой вершины
дерева соответствуют описаниям подцелей, для цели, описываемой данной вершиной. Концевые вершины, не имеющие дочерних вершин, соответствуют описаниям элементарных
целей, не разбиваемых на подцели.
Между ребрами “И/ИЛИ” дерева существуют отношения. Это отношения “И” и “ИЛИ”
в зависимости от того, должна ли быть достигнута только одна из подцелей текущей цели
или же несколько из них. В общем случае из вершины могут выходить ребра, находящиеся в
∗
1
Corresponding author E-mail address: alexysvovk@mail.ru
c Siberian Federal University. All rights reserved
°
– 32 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
отношении “И”, вместе с ребрами, находящимися в отношении “ИЛИ”. Всякое “И/ИЛИ” дерево можно привести к виду, когда каждая вершина имеет дочерние вершины либо только
типа “И”, либо только типа “ИЛИ”. Вершина, из которой выходят только “И” ребра, называется “И” вершиной. Вершина, из которой выходят только “ИЛИ” ребра, – “ИЛИ” вершиной.
Если из вершины выходит только одно ребро, то такую вершину можно считать как “И”
вершиной, так и “ИЛИ” вершиной. Для определенности такие вершины считаются “И” вершинами [2].
Достижением некоторой цели, заданной пользователем, является поддерево данного
“И/ИЛИ” дерева. Такое решающее дерево T определяется следующим образом:
• исходная задача P – это корень дерева T ;
• если P является “ИЛИ” вершиной, то в T содержится только одна из ее дочерних
вершин (из “И/ИЛИ” дерева) вместе со своим собственным решающим деревом;
• если P – это “И” вершина, то все ее дочерние вершины (из “И/ИЛИ” дерева) вместе
со своими решающими деревьями содержатся в T .
Решающее дерево для исходной цели выступает “И” деревом, т. к. все его вершины являются вершинами типа “И”. Если “И/ИЛИ” дерево априори не задано, процесс достижения
цели сводится к построению решающего “И” дерева.
Две цели относятся к одному классу целей тогда и только тогда, когда корневые вершины решающих деревьев для данных целей соответствуют одному и тому же кластеру в
пространстве целей. Задача данной работы – разработать технологию построения “И/ИЛИ”
дерева, обобщающего решающие “И” деревья для класса целей, путем многократного достижения целей данного класса.
Совпадающие кластеры
Пусть в некотором признаковом пространстве X(x1 , x2 ,. . . ,x n ) заданы два кластера A1 и
A2 своими эталонами E1 (e11 , e12 ,. . . ,e 1n ) и E2 (e21 , e22 ,. . . ,e 2n ) и критериями компактности
ε1 и ε2 .
Кластеры A1 и A2 называются совпадающими, если эталон каждого из них принадлежит
другому кластеру (рис. 1). То есть
ρ(E1 , E2 ) < min(ε1 , ε2 ),
где ρ(E1 , E2 ) – евклидово расстояние между E1 и E2 в пространстве X.
Рис. 1. Кластеры A1 и A2 совпадают
Объединенным кластером для пары совпадающих кластеров A1 и A2 называется кластер A3 , эталон E3 и критерий компактности ε3 которого рассчитываются по формулам:
E3 =
CA1 E1 + CA2 E2
,
CA1 + CA2
– 33 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
где CA1 и CA2 — весовые коэффициенты кластеров A1 и A2 ;
ε3 = max(ε1 + ρ(E1 , E3 ), ε2 + ρ(E1 , E3 )).
Весовой коэффициент (C) кластера A равен единице (CA = 1), если кластер A был найден в процессе достижения цели или был задан априори. Если кластер A был построен как объединенный для пары совпадающих кластеров A1 и A2 , то CA = CA1 + CA2 .
Рис. 2. Объединение совпадающих кластеров
Так как каждой вершине “И” дерева соответствует кластер, то вершины будем называть
совпадающими, если совпадают соответствующие им кластеры. Вершину A3 будем называть объединенной вершиной для совпадающих вершин A1 и A2 , если она соответствует
объединенному кластеру для совпадающих кластеров вершин A1 и A2 . Весовым коэффициентом вершины будем называть весовой коэффициент кластера, соответствующего данной
вершине. Для обозначения совпадающих вершин будем использовать знак “≈”.
Построение обобщенного “И/ИЛИ” дерева
Введем способ задания “И/ИЛИ” дерева. “И/ИЛИ” дерево G описывается тройкой G =
{GV , GE , GI }, где:
1) множество вершин G = {G1 , G2 , . . . , Gn },
где Gi – множество вершин i-го уровня дерева G, n – число уровней дерева G;
2) GE – множество ребер дерева G;
3) GI – множество двухуровневых “И” поддеревьев дерева G.
Рис. 3. “И/ИЛИ” дерево
Дерево, изображенное на рис. 3, описывается:
G = {GV , GE , GI },
где GV = {{A11 }, {B11 , B12 , B13 }, {C11 , C12 , C13 , C14 , C15 }},
– 34 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
GE = {(A11 , B11 ), (A11 , B12 ), (A11 , B13 ), (B11 , C11 ), (B11 , C12 ), (B12 , C13 ), (B12 , C14 ), (B13 , C15 )},
GI = {{B11 , B12 , B13 }, {C11 , C12 }, {C13 , C14 }}.
Приведем алгоритм объединения двух “И/ИЛИ” деревьев. Заметим, что “И” дерево является частным случаем “И/ИЛИ” дерева, следовательно, данный алгоритм применим и
для объединения “И” дерева с “И/ИЛИ” деревом.
=
Пусть заданы два дерева G1
=
({G11 , G12 , . . . , G1n }, G1E , G1I ) и G2
2
2
2
2
2
({G1 , G2 , . . . , Gn }, GE , GI ). Результатом работы алгоритма является “И/ИЛИ” дерево
G3 , обобщающее деревья G1 и G2 : G3 = ({G31 , G32 , . . . , G3n }, G3E , G3I ).
Суть алгоритма в последовательном просмотре уровней обоих деревьев и поиске совпадающих вершин на соответствующих уровнях. Если совпадающие вершины найдены, то для
каждой пары совпадающих вершин строится объединенная вершина. При этом вхождение
совпадающих вершин в множества G1E , G1I , G2E , G2I заменяется на построенную объединенную вершину. Результирующее дерево строится из объединенных вершин для совпадающих
вершин исходных деревьев, вершин, для которых не нашлось совпадающих, и всех ребер
исходных деревьев с учетом замены совпадающих вершин на объединенные вершины.
Рис. 4. Схема алгоритма объединения “И/ИЛИ” деревьев
Пример 1: Пусть заданы “И/ИЛИ” дерево G1 и “И” дерево G2 (рис. 5),
(A1 ≈ A2 ) И (B14 ≈ B21 ) И (C16 ≈ C21 ) И (C17 ≈ C22 ).
– 35 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
Рис. 5. “И/ИЛИ” дерево G1 и “И” дерево G2
В результате объединения деревьев получаем обобщенное “И/ИЛИ” дерево G3 (рис. 6).
Рис. 6. “И/ИЛИ” дерево G3
Сходимость процесса построения обобщенного “И/ИЛИ”
дерева
На каждом шаге объединения “И/ИЛИ” дерева с “И” деревом, в общем случае, могут изменяться:
1) структура “И/ИЛИ” дерева, а именно:
а) добавляться новые вершины,
б) образовываться новые “ИЛИ” ветви;
2) уже имеющиеся вершины, входящие в состав “И/ИЛИ” дерева.
Пусть G1 – обобщенное “И/ИЛИ” дерево, полученное посредством неоднократного объединения решающих “И” деревьев для целей данного класса. G2 – “И” дерево для новой
задачи данного класса.
Пусть A1 – вершина обобщенного “И/ИЛИ” дерева G1 , а A2 – вершина “И” дерева G2 , совпадающая с A1 . E1 – эталон кластера, соответствующего вершине A1 . E2 – эталон кластера,
соответствующего вершине A2 . Пусть A3 – объединенная вершина, которой соответствует
объединенный кластер, построенный для кластеров вершин A1 и A2 , E3 – эталон данного
кластера. Коэффициентом изменения вершины A1 при построении объединенной вершины
– 36 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
A3 для совпадающих вершин A1 и A2 будем называть величину
D(A1 , A2 ) = ρ(E1 , E3 ).
Пусть u(G1 , G2 ) – операция построения обобщенного “И/ИЛИ” дерева для двух “И/ИЛИ”
деревьев G1 и G2 . Операнды могут быть “И” деревьями, которые являются частным случаем
“И/ИЛИ” деревьев.
Пусть s(G) – функция, вычисляющая сумму весовых коэффициентов всех вершин дерева G.
Пусть q(G) – функция, вычисляющая количество вершин дерева G.
Тогда коэффициентом прироста дерева G1 при объединении его с деревом G2 назовем
величину
q(u(G1 , G2 )) − q(G1 )
d(G1 , G2 ) =
.
s(G1 )
Очевидно, что d(G1 , G2 ) ≥ 0.
Равенство d(G1 , G2 ) = 0 для “И/ИЛИ” дерева G1 и “И” дерева G2 говорит о том, что
в результате объединения деревьев G1 и G2 в полученном “И/ИЛИ” дереве не появились
новые узлы по сравнению с исходным “И/ИЛИ” деревом G1 .
Процесс построения обобщенного “И/ИЛИ” дерева для данного класса целей называется
сходящимся, если объединение данного “И/ИЛИ” дерева с решающим “И” деревом для
новой задачи того же класса удовлетворяет условиям:
1) коэффициент прироста обобщенного “И/ИЛИ” дерева d(G1 , G2 ) не превышает некоторую наперед заданную малую величину;
2) максимальный коэффициент изменения D(Ai , Aj ) по всем изменившимся вершинам
обобщенного “И/ИЛИ” дерева не превышает некоторую наперед заданную малую величину.
Сходимость процесса формирования обобщенного “И/ИЛИ” дерева означает, что на
некотором шаге объединения текущего “И/ИЛИ” дерева с очередным “И” деревом полученное “И/ИЛИ” дерево будет отличаться от текущего не более чем на требуемую величину.
То есть обобщенное “И/ИЛИ” дерево приобретет устойчивость.
Утверждение. Если для всех “И” деревьев Gi задач заданного класса существует
M ∈ N такое, что q(Gi ) ≤ M, т. е. количество вершин во всех возможных решающих
“И” деревьях задач данного класса не превышает наперед заданного числа, то процесс построения обобщенного “И/ИЛИ” дерева для данного класса задач сходится.
Доказательство:
1. Пусть G – обобщенное “И/ИЛИ” дерево для задач одного класса. Пусть Gn – решающее “И” дерево для задачи данного класса (n = 1, 2, . . .). Очевидно, что на первом этапе
построения обобщенного “И/ИЛИ” дерева G = G1 . Докажем, что lim d(G, Gn ) = 0.
n→∞
lim d(G, Gn ) = lim
n→∞
n→∞
q(u(G, Gn )) − q(G)
.
s(G)
Величина q(u(G, Gn )) − q(G) показывает, сколько новых узлов появилось в обобщенном
“И/ИЛИ” дереве G при объединении его с “И” деревом Gn . Так как у деревьев G и Gn
совпадают, по крайней мере, корневые вершины, то
q(u(G, Gn )) − q(G) ≤ q(G) + q(Gn ) − 1 − q(G) = q(Gn ) − 1 ≤ M − 1.
Тогда
lim
n→∞
q(u(G, Gn )) − q(G)
M −1
M −1
≤ lim
≤ lim
.
n→∞ s(G)
n→∞ n − 1
s(G)
– 37 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
Итак,
0 ≤ lim d(G, Gn ) ≤ lim
n→∞
n→∞
M −1
= 0,
n−1
следовательно: lim d(G, Gn ) = 0.
n→∞
2. Пусть An – кластер, соответствующий вершине обобщенного “И/ИЛИ” дерева G, построенный в результате объединения n совпадающих кластеров. En = (e1n , e2n , . . . , em
n ), εn
– его эталон и критерий компактности. Пусть A – кластер, соответствующий вершине решающего “И” дерева, совпадающий с An , E = (e1 , e2 , . . . , em ) – его эталон, ε – критерий
компактности. Докажем, что lim D(An , A) = 0.
n→∞
µ
¶
µ
¶
CAn En + CA E
nEn + E
lim D(An , A) = lim ρ En ,
= lim ρ En ,
=
n→∞
n→∞
n→∞
CA n + CA
n+1
v
v
um µ
um µ
¶2
¶
i
i
uX nein + ein − nein − ei 2
uX
nen + e
i
t
t
en −
= lim
=
= lim
n→∞
n→∞
n+1
n+1
i=1
i=1
v
u
u
= lim t
n→∞
1
n+1
m
X
v
u
u
2
(ein − ei ) ≤ lim t
n→∞
i=1
r
= lim
n→∞
m
1 X
2
(min(εn , ε)) =
n + 1 i=1
m
2
(min(εn , ε)) = 0.
n+1
Итак,
r
0 ≤ D(An , A) ≤ lim
n→∞
m
2
(min(εn , ε)) = 0,
n+1
следовательно, lim D(An , A) = 0.
n→∞
Утверждение доказано.
Следствие 1. Пусть G – обобщенное “И/ИЛИ” дерево, построенное в результате объединения n решающих “И” деревьев G1 , G2 ,. . . ,Gn для заданного класса задач. Если для
всех “И” деревьев Gi , i = 1, 2, . . ., n+1 задач заданного класса ∃M ∈ N такое, что q(Gi ) ≤ M,
то ∀ε > 0 выполняется d(G, Gn+1 ) < ε для n > Mε−1 , ∃n ∈ N.
Доказательство:
d(G, Gn+1 ) =
q(u(G, Gn )) − q(G)
q(G) + q(Gn+1 ) − 1 − q(G)
<
=
s(G)
n
=
M −1
M −1
q(Gn+1 ) − 1
<
< M −1 = ε.
n
n
ε
Итак, d(G, Gn+1 ) < ε.
Следствие доказано.
Суть следствия заключается в том, что если максимальное количество вершин во всех
возможных решающих “И” деревьях задач данного класса ограничено некоторым числом
M , то необходимая точность ε будет достигнута не более, чем за Mε−1 шагов.
Следствие 2. Пусть A0n – кластер, построенный в результате объединения n совпадающих кластеров A1 , A2 , . . ., An , En0 = (e1n , e2n , . . . , em
n ) – эталон кластера, соответствующего
данной вершине. Если для всех совпадающих вершин Aj , j = 1, 2, . . ., n + 1 ∃M ∈ R, такое,
¡ ¢2
что ρ(Ei , Ej ) < M, i 6= j, то ∀ε > 0 выполняется D(A0n , An+1 ) < ε для n > M
− 1.
ε
– 38 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
Доказательство:
µ
¶
µ
¶
CAn En0 + CA En+1
nEn0 + En+1
D(A0n , An+1 ) = ρ En0 ,
= ρ En0 ,
=
CA0n + CAn+1
n+1
v
v
um µ
¶2 u
¶2
m µ
i + ei
uX
uX
ne
nein + ein − nein − ein+1
n
n+1
t
t
i
=
en −
=
=
n+1
n+1
i=1
i=1
v
u
u
=t
m
¢2
1 X¡ i
en − ein+1 < M
n + 1 i=1
r
1
<M
n+1
s
¡ M ¢2
ε
1
−1+1
= ε.
D(A0n , An+1 )
Итак,
< ε.
Следствие доказано.
Суть следствия заключается в том, что если эталоны некоторого множества совпадающих между собой кластеров расположены внутри гиперсферы радиуса M
2 , то объединенный
¡ ¢2
кластер для кластеров данного множества станет устойчивым не более чем через M
−1
ε
шагов.
Теоретическая оценка сходимости основывается на требовании принадлежности решаемых задач одному классу: две задачи принадлежат одному классу задач тогда и только
тогда, когда совпадают корневые вершины решающих “И” деревьев данных задач. Такая
оценка является точной верхней гранью скорости сходимости, т. к. следует из предположения о минимальной схожести решающих “И” деревьев задач одного класса.
Постановка задачи экспериментального исследования
Задача экспериментального исследования – практически опробовать предложенную технологию формирования “И/ИЛИ” дерева. Цель эксперимента – проиллюстрировать процесс
формирования обобщенного “И/ИЛИ” дерева для задач пользователя; исследовать процесс наращивания данного “И/ИЛИ” дерева в результате объединения его с каждым вновь
построенным решающим “И” деревом для очередной задачи пользователя; исследовать скорость сходимости данного процесса и сравнить ее с теоретической оценкой скорости сходимости.
В качестве исходных данных для эксперимента был использован космофотоснимок
“Landsat TM” лесов Саян. На уровне пикселей данное изображение характеризуется 78 признаками (табл. 1). Изображение содержит 437536 точек. Цель пользователя-природоведа
состоит в выделении на данном изображении участков поверхности с необходимыми характеристиками. На поле анализируемого изображения пользователем задана выборка, элементы которой соответствуют текущей цели пользователя. Всего пользователем задано три
выборки (рис. 7).
– 39 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
Таблица 1. Множество признаков уровня пикселей
№ признака
1–6
7–12
13–18
19–24
25–30
31–36
37–42
43–48
49–54
55–60
61–66
67–72
73–78
Описание
Спектральные каналы LandSatT M
Variance 3x3
Variance 5x5
Variance 7x7
Skewness 3x3
Skewness 5x5
Skewness 7x7
Kurtosis 3x3
Kurtosis 5x5
Kurtosis 7x7
Mean Euclidean Distance 3x3
Mean Euclidean Distance 5x5
Mean Euclidean Distance 7x7
Рис. 7. Исходное изображение, выборки
Ход эксперимента
1. Вычисляются значения всех признаков уровня пикселей для всех элементов изображения.
2. Для каждой выборки и для “всего остального” (фона) вычисляются средние значения
и среднеквадратичные отклонения по каждому признаку уровня пикселей.
– 40 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
3. Определяются информативные признаки для отделения элементов каждой выборки от
фона таким образом, чтобы элементы каждой выборки и фон не пересекались. Наилучшим
образом элементы первой и второй выборки отделяются от фона по одному и тому же
набору признаков {10, 16, 22, 23} (табл. 2).
Таблица 2. Признаковое описание элементов выборок
№ выборки /
№ признака
1
Выборка 1
10
16
22
23
Выборка 2
10
16
22
23
Мин.
значение
2
Макс.
значение
3
Среднее
значение
4
Среднекв.
отклонение
5
1,000
6,333
9,088
3,891
91,000
231,927
569,731
144,625
18,369
27,466
47,339
17,300
13,294
22,843
66,484
18,494
0,278
2,167
3,862
2,653
134,944
281,490
229,594
49,480
14,449
22,221
30,729
11,874
21,425
28,470
34,334
8,280
4. Для элементов каждой выборки выполняется построение кластеров. Элементы каждой выборки разбиваются на 2 кластера (табл. 3, рис. 8).
Таблица 3. Разбиение элементов выборок на кластеры
№ выборки /
№ признака
Исходное кол-во
элементов в
выборке
Кол-во
элементов в
кластере
3
Процент элементов,
попадающих в
кластере
(кол.3/кол.2), %
4
Кол-во элементов
исх. изображения,
попадающих в
кластер
5
1
Выборка 1
1
2
1и2
Выборка 2
1
2
1и2
2
430
430
234
174
408
54,42
40,47
94,89
14912
54730
69642
346
346
285
51
336
82,37
14,74
97,11
34382
31458
65840
5. Построенные кластеры первой выборки разделяются между собой по 22-му признаку
(табл. 4). Кластеры второй выборки также разделяются между собой по 22-му признаку
(табл. 5). Таким образом, получены признаковые описания двух вершин P11 и P12 уровня
пикселей “И” дерева для первой выборки и P21 и P22 – для второй.
6. Выделяются все элементы изображения, значения которых удовлетворяют выявленным допустимым диапазонам значений для каждого из построенных кластеров каждой
выборки (рис. 9).
7. Из множества выделенных элементов удаляются пиксели, заведомо не образующие
– 41 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
пятна на поле изображения. То есть не образующие связные, по принципу 8-ми соседства,
области размером не менее 5 пикселей.
8. Для элементов каждого класса пикселей выделяются примитивы. Для каждого примитива вычисляются средние значения по каждому признаку уровня пикселей и среднее
значение по размеру образующихся примитивов.
Таблица 4. Признаковое описание кластеров 1-й выборки
№ выборки /
№ признака
1
Кластер 1
10
16
22
23
Кластер 2
10
16
22
23
Мин.
значение
2
Макс.
значение
3
Среднее
значение
4
1,000
6,333
9,088
3,891
91,000
44,693
51,243
144,625
18,369
20,970
27,146
17,300
1,000
6,333
51,243
3,891
91,000
116,917
243,669
144,625
18,369
50,302
105,860
17,300
Таблица 5. Признаковое описание кластеров 2-й выборки
№ выборки /
№ признака
1
Кластер 1
10
16
22
23
Кластер 2
10
16
22
23
Мин.
значение
2
Макс.
значение
3
Среднее
значение
4
0,278
2,167
3,862
2,653
134,944
17,373
18,955
49,480
14,449
7,856
10,102
11,874
0,278
3,257
18,955
2,653
134,944
98,293
84,830
49,480
14,449
36,916
46,909
11,874
Построено 991 примитив на элементах 1-го класса и 1643 – 2-го класса. Аналогично для
второй выборки: 449 примитивов на элементах 1-го класса и 1068 – 2-го класса. На основании полученных значений формируются эталоны классов примитивов и определяются их
критерии компактности.
9. Лучше всего (с коэффициентом критерия компактности k = 2, 11) выделенные классы примитивов первой выборки разделяются по 22-му признаку уровня пикселей (табл. 6).
Классы примитивов второй выборки наилучшим образом разделяются также по 22-му признаку (коэффициент критерия компактности k=2,3, табл. 7). Таким образом, получено признаковое описание вершин W11 и W12 уровня примитивов “И” дерева для первой выборки
и вершин W21 и W22 – для второй.
– 42 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
Рис. 8. Построенные 1-й и 2-й кластеры 1-й (а) и 2-й (б) выборок плоскости 16-го и 22-го
признаков
Рис. 9. Элементы 1-го кластера 1-й выборки на поле анализируемого изображения
Таблица 6. Описание классов примитивов 1-й выборки по 22-му признаку
№ класса
примитивов
1
2
Среднее
значение
29,782
102,469
Среднекв.
отклонение
7,436
26,939
Нижняя
граница
14,092
45,628
– 43 –
Верхняя
граница
45,472
159,310
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
Таблица 7. Описание классов примитивов 2-й выборки по 22-му признаку
№ класса
примитивов
1
2
Среднее
значение
13,109
49,359
Среднекв.
отклонение
2,473
13,305
Нижняя
граница
7,421
18,758
Верхняя
граница
18,797
79,961
10. После того как были классифицированы примитивы, обладающие свойствами выборочных данных, может быть начат процесс классификации образуемых ими сегментов
изображения. Вычисляются значения всех признаков для элементов изображения уровня
сегментов (табл. 8). Всего выявлен 1271 сегмент для примитивов первой выборки и 865 –
второй.
Таблица 8. Признаки уровня сегментов
№ признака
1,2
Обозначение
a, b
3
de
4
5
6
7
E
NP
NS
T
Наименование
Диаметры Фере
с углом наклона π/2
Эквивалентный
диаметр
Компактность
Периметр
Площадь
Отношение толщины
Описание
Длины сторон описанного
прямоугольника
Диаметр круглого эталона
эквивалентной площади
или периметра
N P 2 /N S
|DE|
|DB|
T = 4π(N S/N P 2 )
11. Сегменты изображения структурируются с помощью алгоритма ISODATA, с априори
не заданным числом классов и параметром 95 % точек, не меняющих свой класс при последующей итерации. Расчёт параметра В5 , характеризующего качество структурирования
данных, показал, что наилучшим образом выделенные сегменты для примитивов каждой
выборки в полной системе признаков данного уровня разделяются на 2 класса (рис. 10).
Рис. 10. Сегменты 1-го класса (темные) и 2-го класса (светлые) 1-й выборки
– 44 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
12. На основании полученных значений формируются эталоны классов сегментов каждой выборки и определяются их критерии компактности.
13. Лучше всего (с коэффициентом критерия компактности k = 1, 65) выделенные классы сегментов для первой выборки разделяются по 3-му признаку уровня сегментов (табл.
9). Классы сегментов для второй выборки лучше всего разделяются также по 3-му признаку (коэффициент критерия компактности k = 1, 99, табл. 10). Таким образом, получено
признаковое описание вершин S11 и S12 уровня сегментов “И” дерева для первой выборки
и S21 и S22 – для второй.
Таблица 9. Описание классов сегментов 1-й выборки по 3-му признаку уровня сегментов
№ класса
примитивов
1
2
Среднее
значение
12,585
41,748
Среднекв.
отклонение
7,021
10,608
Нижняя
граница
1,000
24,245
Верхняя
граница
24,170
59,251
Таблица 10. Описание классов сегментов 2-й выборки по 3-му признаку уровня сегментов
№ класса
примитивов
1
2
Среднее
значение
21,032
71,341
Среднекв.
отклонение
12,220
13,099
Нижняя
граница
0,000
45,274
Верхняя
граница
45,350
97,408
14. Рассчитав среднее значение по 3-му признаку уровня сегментов для сегментов обоих
классов для каждой выборки, получим значение по 3-му признаку для вершины K1 уровня
“класс сегментов” “И” дерева для первой выборки и K2 – для второй выборки (табл. 11).
Таблица 11. Описание вершин уровня “класс сегментов” по 3-му признаку уровня сегментов для каждой выборки
№ класса
примитивов
K1
K2
Среднее
значение
5,809
6,736
Среднекв.
отклонение
4,924
7,119
Нижняя
граница
0,885
0,000
Верхняя
граница
10,733
13,855
15. По найденным вершинам сформируем “И” деревья целей G1 и G2 для первой и второй
выборок (рис. 11).
16. В построенных деревьях присутствуют совпадающие вершины:
P11 ≈ P22 ,
W11 ≈ W22 ,
S11 ≈ S21 ,
K 1 ≈ K2 .
Для данных вершин построим объединенные вершины: P31 , W31 , S31 , K3 .
Сформируем обобщенное “И/ИЛИ” дерево G3 (рис. 11). Построенное дерево содержит в
себе решающие “И” деревья для целей, представленных обеими выборками, следовательно,
каждая из них может быть достигнута с помощью данного “И/ИЛИ” дерева.
17. Вычислим коэффициенты изменения вершин:
D(P11 , P22 ) = ρ(P11 , P31 ) = 13, 131;
D(S11 , S21 ) = ρ(S11 , S31 ) = 5, 531;
D(W11 , W22 ) = ρ(W11 , W31 ) = 9, 789;
D(K1 , K2 ) = ρ(K1 , K3 ) = 0, 477;
max D = D(P11 , P22 ) = 13, 131.
G1 ,G2
– 45 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
Вычислим коэффициент прироста дерева G1 при объединении с деревом G2 :
d(G1 , G2 ) =
q(u(G1 , G2 )) − q(G1 )
10 − 7
=
≈ 0, 429.
s(G1 )
7
Рис. 11. Построенные “И” деревья для первой и второй выборок, обобщенное “И/ИЛИ”
дерево, число в вершине – ее весовой коэффициент
18. Проделаем описанную процедуру для третьей выборки, в результате чего построим
“И” дерево G4 (рис. 12). В “И” дереве G4 и обобщенном “И/ИЛИ” дереве G3 совпадают
вершины:
P31 ≈ P42 , P21 ≈ P41 , W31 ≈ W42 , W21 ≈ W41 , S31 ≈ S41 , K3 ≈ K4 .
0
0
0
0
0
, K30 .
, W21
, W31
, S31
,P31
Для данных вершин построим объединенные вершины: P21
В результате объединения “И/ИЛИ” дерева G3 и “И” дерева G4 получим обобщенное
“И/ИЛИ” дерево G5 (рис. 12).
19. Вычислим коэффициенты изменения вершин:
0
0
D(P31 , P42 ) = ρ(P31 , P31
) = 3, 995; D(P21 , P41 ) = ρ(P21 , P21
) = 7, 147;
0
0
D(W31 , W42 ) = ρ(W31 , W31
) = 8, 927; D(W21 , W41 ) = ρ(W21 , W21
) = 3, 386;
0
D(S31 , S41 ) = ρ(S31 , S31
) = 0, 17; D(K3 , K4 ) = ρ(K3 , K30 ) = 0, 497;
max D = D(W31 , W42 ) = 8, 927.
G3 ,G4
Вычислим коэффициент прироста дерева G3 при объединении с деревом G4 :
d(G3 , G4 ) =
q(u(G3 , G4 )) − q(G3 )
11 − 7
=
≈ 0, 071.
s(G3 )
14
– 46 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
Рис. 12. Построенное “И” дерево для третьей выборки, обобщенное “И/ИЛИ” дерево для
трех выборок
Видно, что с увеличением числа операций объединения “И/ИЛИ” дерева с “И” деревьями, коэффициенты изменения вершин и прироста дерева уменьшаются. Исходя из оценки, данной в следствии 1, при максимальном количестве узлов в решающих “И” деревьях
M = 7 коэффициент прироста дерева достигнет заданной точности ε = 0, 01 не более
7−1
чем за 0,01
= 600 шагов. При этом на первом шаге d(G1 , G2 ) = 0, 429, а на втором уже
d(G3 , G4 ) = 0, 071. Это позволяет предположить, что требуемая точность ε = 0, 01 может
быть достигнута гораздо быстрее. Следовательно, решающие “И” деревья для задач одного
класса обладают большей степенью сходства, чем совпадение корневых вершин.
Выводы
1. Предложена новая технология построения обобщенного “И/ИЛИ” дерева решения, позволяющая формировать базу знаний и “И/ИЛИ” дерево ЭС пользователем-природоведом
без использования компонента “извлечение знаний”.
2. В рамках предложенного метода даны понятия совпадающих кластеров целей, совпадающих вершин дерева. Разработан новый алгоритм построения обобщенного “И/ИЛИ”
дерева, основанный на объединении “И” деревьев через совпадающие вершины.
3. Дано определение сходимости процесса формирования обобщенного “И/ИЛИ” дерева.
Доказано, что такой процесс сходится. Дана оценка скорости сходимости, которая является
точной верхней гранью скорости сходимости.
4. Экспериментально продемонстрирована работоспособность технологии построения
обобщенных “И/ИЛИ” деревьев путем многократного объединения решающих “И” деревьев.
5. Процесс построения обобщенного “И/ИЛИ” дерева проиллюстрирован на примере
решения задач анализа космофотоснимков лесов Саян, сформировано “И/ИЛИ” дерево,
исследована сходимость процесса формирования “И/ИЛИ” дерева.
6. Экспериментально установлено, что процесс формирования “И/ИЛИ” дерева для
класса задач сходится значительно быстрее приведенной точной верхней грани скорости
сходимости. Это указывает на наличие большего сходства между решающими “И” деревьями задач одного класса, чем совпадение корневых вершин.
– 47 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.А. Вовк, Г.М. Цибульский, А.А. Латынцев. Технология формирования обобщенного «И/ИЛИ» дерева . . .
Работа поддержана грантом РФФИ 07-01-00326 и аналитической целевой программой
Минобрнауки РПН.3.1.1.5349.
Список литературы
[1] Рассел С., Норвиг П. Искусственный интеллект: Современный подход. 2-е изд. М.: Вильямс, 2007. – 1424 с.
[2] Нильсон Н. Искусственный интеллект. Методы поиска решений. М.: Мир, 1973. – 272 с.
Technology of Forming "AND/OR"Solving Tree for Problems
of the Images Analysis. Research of Convergence Speed of
Process of Forming "AND/OR"Solving Tree
Alexey A. Vovk, Gennady M. Tsibulski and Andrey A. Latyntsev
Siberian Federal University
79 Svobodny, Krasnoyarsk, 660041 Russia
It is offered a new technology of forming "AND/OR"tree, allowing user-naturalist to form the knowledge
base and "AND/OR"a tree of expert system without using component «extraction of knowledge». The
new algorithm of forming "AND/OR"tree, based on uniting solving "AND"trees for class of problems, is
developed. Convergence of such process is proved. Process of forming "AND/OR"tree for are illustrated by
experiment. The estimation convergence speed is given. Convergence of process of forming "AND/OR"tree
is investigated. Convergence speed of experimental process is investigated and compared with theoretical
estimate of convergence speed.
Key words: «AND/OR» tree, decision tree, knowledge base, knowledge engineer, knowledge extraction,
problem reduction, clusters union, trees union, space of signs, image analysis.
– 48 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Journal of Siberian Federal University. Engineering & Technologies 1 (2009 2), 49-58
УДК 004.62:004.92
Методы управления и геоинформационного
моделирования в технологии OLAP
Л.Ф. Ноженкова∗ , А.А. Евсюков, А.И. Ноженков
Институт вычислительного моделирования СО РАН,
660036 Россия, Красноярск, Академгородок1
Получена 11.06.2008, окончательный вариант 15.10.2008, принята к печати 10.03.2009
Представлены методы оперативной аналитической обработки данных на основе интеллектуальных средств управления OLAP-моделированием. Предложены средства метаописания сложных
комплексов OLAP-моделей, что позволило реализовать управление расчетами и автоматизировать обработку данных с применением эвристик. Описаны средства оперативного тематического геоинформационного моделирования для визуализации результатов OLAP-анализа.
Ключевые слова: обработка данных, OLAP-анализ, OLAP-модель, геоинформационное моделирование.
Введение
Технология оперативной аналитической обработки многомерных данных OLAP (On-line
Analytical Processing) [1] – быстро развивающееся направление интеллектуального анализа
данных. На сегодняшний день существует достаточно большое количество программных
продуктов, реализующих функции OLAP-анализа. Такие крупные компании, как Hyperion
Solutions Corp., IBM, Oracle, Microsoft, Sybase, Panorama Software, Cognos Inc. и другие,
ведут разработки в этой области, их решения охватывают практически все существующие
задачи. Из отечественных разработчиков следует отметить BaseGroup Labs, Intersoft Lab., а
также Институт открытых систем при Ивановском городском энергетическом университете
и Институт вычислительного моделирования СО РАН. В программных продуктах реализованы различные способы хранения многомерных структур, средства быстрого извлечения и
представления информации, средства быстрого создания приложений. Тенденции развития
функциональности OLAP-продуктов в настоящий момент лежат в области создания продуктов класса data mining для постобработки данных, развития средств картографической
и трехмерной визуализации данных, веб-сервисов для OLAP-приложений, а также средств,
позволяющих расширить область применения OLAP за счет новых подходов к решению
сложных прикладных задач.
Наибольшее применение эта технология получила в бизнес-сфере для решения оперативных задач, каждая из которых, как правило, укладывается в рамки одного куба. При
этом классические OLAP-продукты малоэффективны для использования в задачах, где
необходим комплексный анализ данных, связанный с реализацией сложных аналитических
алгоритмов. Методы расчета аналитических показателей и решения задач планирования в
здравоохранении, образовании и других областях организационного управления представляют собой сложные многошаговые процессы анализа многомерных данных. Возникает
необходимость их поэтапной обработки средствами OLAP. Потребовался новый подход в
∗
1
Corresponding author E-mail address: expert@icm.krasn.ru
c Siberian Federal University. All rights reserved
°
– 49 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Л.Ф. Ноженкова, А.А. Евсюков, А.И. Ноженков. Методы управления . . .
OLAP-технологии, ориентированный на решение сложных аналитических задач, использующих связные многошаговые расчеты с множеством информационных объектов.
Применение OLAP-технологии для сложных территориально ориентированных задач
требует развития функций оперативного геоинформационного моделирования. Необходимо
не просто визуализировать результаты OLAP-анализа, но и отображать процесс оперативной обработки, выполнять динамическое формирование тематических картографических
слоев.
Новый подход к решению разнообразных задач с применением OLAP-технологии основан на построении комплексов так называемых OLAP-моделей [2–6]. В статье изложены
результаты работ по развитию технологии OLAP-моделирования в направлении наглядного представления сложных методик, автоматизации управления расчетами и оперативного
геоинформационного моделирования результатов. Представлены средства онтологического
описания сложных комплексов OLAP-моделей и управления расчетами, позволяющие автоматизировать применение экспертных методов, в частности эмпирических критериев согласования и балансировки расчетных показателей [7, 8]. Описаны методы оперативного геомоделирования результатов OLAP-анализа путем динамического формирования картографических слоев, основанные на картографической привязке многомерных данных OLAPсистемы к территориальным объектам ГИС [9, 10].
Построение управляемых комплексов OLAP-моделей
Новый подход в OLAP-технологии ориентирован на решение сложных аналитических задач,
использующих связные многошаговые расчеты с множеством информационных объектов,
представленных многомерными кубами данных. На рис. 1 схематически показан процесс решения сложной задачи путем реализации комплекса так называемых OLAP-моделей. Термин “OLAP-модель” введен для повышения наглядности описания сложных задач путем
разложения на более простые [3, 4].
Рис. 1. Схема построения комплексов OLAP-моделей
OLAP-модель строится пользователем и несет в себе описательную информацию о решении некоторой аналитической задачи. OLAP-модель M можно представить в виде
– 50 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Л.Ф. Ноженкова, А.А. Евсюков, А.И. Ноженков. Методы управления . . .
M = hX, G, Ψ(X, G), Q(G), I, J(G)i .
Здесь X – дискретное множество входных данных – витрина данных;
G = hD, F i – гиперкуб – модель логического многомерного представления данных, характеризующаяся двумя наборами параметров – измерениями и показателями;
D = hd1 , d2 , . . ., dm i – измерения гиперкуба: каждое измерение представляет собой упорядоченное множество значений определенного типа. Измерения могут быть организованы
в виде составной иерархии;
F = hf1 , f2 , . . ., fn i – показатели (меры) гиперкуба: каждый показатель представляет
множество значений, количественно характеризующих анализируемый процесс;
Ψ(X, G) – функции, описывающие построение элементов гиперкуба G: показателей F и
измерений D, исходя из множества входных данных
X;
D
E
0
0
Q(G) – операции над гиперкубом: Q = C(G, ϕ(F, µ(di ))), V (G, d1 . . . dn , R(G) , где
C(G, ϕ(F, µ(di ))) – агрегирование гиперкуба по иерархии атрибутов выбранного измерения
– преобразование G к гиперкубу меньшей мощности за счет агрегирования показателей
ϕ(F, µ(di )) с учетом отношения иерархической зависимости µ(di ) атрибутов измерения di .
В качестве функции ϕ агрегирования показателей могут выступать, например, min, max,
сумма и др.
0
0
V (G, d1 , . . . , dn ) – срез гиперкуба G по измерениям d1 , . . . , dn – операция получения под0
0
множества гиперкуба в результате фиксации подмножеств значений d1 , . . . , dn измерений
d1 , . . . , dn соответственно.
R(G) – операция поворота гиперкуба, которая изменяет порядок измерений в гиперкубе.
I = hT, K, L, H, γ(T, K, L, H)i – модель логического представления результатов вычисления OLAP-модели.
Она включает формы представления результатов модели: T – таблицы, K – кросстаблицы, L – диаграммы, H – карты и γ(T, K, L, H) – операции над ними: фильтрация,
сортировка таблиц, перемещение, ротация строк и столбцов таблицы, фильтрация, сортировка кросс-таблиц, группировка данных, сортировка, разбиение на сегменты диаграмм,
фильтрация карт.
J(G) = hT, α(T )i – операция сохранения гиперкуба в таблицу агрегатов. Операция применяется к представлению гиперкуба в виде таблицы, или кросс-таблицы.
α(T ) – преобразование наименований в код, наложение внешних ключей, удаление таблицы агрегатов перед вставкой данных – операции по трансформации таблицы агрегатов.
К характеристикам OLAP-модели относятся: мощность измерения, мощность, размерность и объем гиперкуба. Количество элементов измерения есть мощность измерения. Мощность гиперкуба – произведение мощностей его измерений. Объемом гиперкуба называется
произведение мощности куба и количества показателей.
OLAP-модель состоит из исходных данных – витрины данных, информационного куба, операций над ним и способов представления результатов вычисления. Важным моментом построения модели является возможность сохранения в источнике данных результатов
расчета. Такой подход позволяет применять поэтапный процесс анализа данных, то есть
анализировать ранее полученные результаты.
Для автоматизации поэтапного анализа модели объединяются в комплексы (см. рис. 2).
Перед созданием комплекса моделей задачу необходимо декомпозировать на подзадачи таким образом, чтобы каждая подзадача могла быть представлена OLAP-моделью [3]. В рамках одного расчета модели образуют последовательно выполняемую цепочку, при этом данные, рассчитанные одной моделью, в дальнейшем используются другими моделями. Таким
– 51 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Л.Ф. Ноженкова, А.А. Евсюков, А.И. Ноженков. Методы управления . . .
образом, OLAP-модели образуют комплекс моделей, а их связи осуществляются через наследование информации.
Рис. 2. Схема исполнения комплекса OLAP-моделей
Выполнение комплекса аналитических моделей сопровождается так называемым интерактивным аналитическим экспериментом, т. е. возможно вмешательство пользователя в
выполнение расчета для модификации параметров и настройки отдельной модели.
Рис. 3. OLAP-модели в задачах анализа и планирования медицинской помощи в
здравоохранении
– 52 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Л.Ф. Ноженкова, А.А. Евсюков, А.И. Ноженков. Методы управления . . .
На рис. 3 представлен фрагмент расчета комплекса OLAP-моделей для задачи формирования территориальной программы государственных гарантий оказания бесплатной
медицинской помощи жителям Красноярского края [7]. Это задача ежегодного планирования объемов и видов медицинской помощи в регионе. Для автоматизации этого процесса
построено более сорока OLAP-моделей. Формирование территориальных программ требует
многовариантных расчетов и балансировки показателей, рассчитываемых OLAP-моделями.
Чтобы повысить наглядность построения и расчета комплексов OLAP-моделей для
сложных задач, обеспечить управление расчетами и многовариантные расчеты, разработаны средства метаописания комплекса моделей с применением онтологии [8].
Онтология комплекса OLAP-моделей имеет вид
U = hW, Y, Ri, где W – описание моделей, Y – отношения между моделями, R – условия
применения и коррекции моделей.
Описание OLAP-модели задается в виде кортежа:
М: <витрина данных>; <назначение модели>; <результат>.
Описание каждой модели в базе знаний формируется автоматически, с помощью специально разработанного программного обеспечения, на основе системного описания модели,
которое формируется в процессе ее интерактивного создания.
Основной вид отношений между правилами – отношение информационной зависимости моделей M1 → M 2 – используется для построения цепочек расчета OLAP-моделей.
Дополнительно могут использоваться отношения альтернативности моделей, информационной независимости и др.
Условия применения моделей описываются с помощью правил следующего вида.
R1 : ЕСЛИ P (f1 , f2 , . . ., fn ), ТО ВЫПОЛНИТЬ М / ИЗМЕНИТЬ М
Здесь R1 – уникальное в базе знаний имя правила. f1 , f2 , . . ., fn – показатели, заданные
как результаты расчета какой-либо модели или заданные в витрине как исходные данные.
Каждый показатель представляет собой многомерный куб, описанный в витрине данных
соответствующей OLAP-модели. Предикат P задается в виде логико-лингвистического выражения. Операция ВЫПОЛНИТЬ М в правой части правила R1 интерпретируется как
выполнение расчета OLAP-модели M . Если в процессе логического вывода правило R1
применяется, то это приводит к расчету показателей – результатов модели M . Как следствие, должны быть пересчитаны все информационно зависимые OLAP-модели. Операция
ИЗМЕНИТЬ М в правой части правила интерпретируется как переход к интерактивному
процессу коррекции модели M .
В качестве примера рассмотрим правило:
R1: ЕСЛИ (Объем финансирования расчетный < Объем финансирования выделенный)
И (Нормативы объемов помощи на тысячу населения ≤ Нормативы объемов помощи на
тысячу населения РФ)
ТО ВЫПОЛНИТЬ Увеличить обеспеченность медпомощи в сельских районах
Интерпретация этого правила заключается в том, что многомерные показатели Объем финансирования расчетный, Объем финансирования выделенный, Нормативы объемов
помощи на тысячу населения, Нормативы объемов помощи на тысячу населения РФ скалярно сравниваются по измерениям – в данном случае по видам и профилям медицинской
помощи. Действие в правой части правила заключается в выполнении OLAP-модели Увеличить обеспеченность медпомощи в сельских районах.
Алгоритмы формирования и расчета комплексов OLAP-моделей реализованы на основе использования представленного в базе знаний онтологического метаописания OLAP– 53 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Л.Ф. Ноженкова, А.А. Евсюков, А.И. Ноженков. Методы управления . . .
моделей. Управление процессом расчета выполняется на основе правил, а также с учетом
действий пользователя. Пользователь может интерактивно изменить или заменить любую
OLAP-модель, вследствие чего изменяется системное представление OLAP-модели. Пользователь также может изменить условия ее применения, изменив метаописание в базе знаний.
Процедура логического вывода учитывает оба варианта. При этом автоматически исследуются возможные изменения расчета и строятся новые цепочки моделей для расчета показателей.
Средства оперативного географического моделирования
В основе механизма динамической связи многомерных данных OLAP-системы к пространственной информации ГИС лежит картографическая привязка данных, позволяющая устанавливать соответствие между результатами оперативного аналитического моделирования
и географическими объектами [9].
На основе таблиц источника данных OLAP-системы осуществляется построение информационного гиперкуба, формируются аналитические объекты, описывающие предметную
область: показатели и измерения. Для осуществления картографической привязки в гиперˆ
кубе выделим географическое измерение d.
Для построения тематической карты зафиксируем значения измерений di ⊆ D : di 6=
ˆ i = 1, m и из F выберем показатель, который будет отображаться на карте: f ∗ =
6= d,
ˆ . . . , d∗ ), где d∗ , d∗ , . . . , d∗ – фиксированные значения измерений (метки),
f ∗ (d∗1 , d∗2 , . . . , d,
m
m
1 2
ˆ
кроме d, которое не фиксировано и соответственно может принимать любое значение из
своей области определения. Построение множества значений показателя f ∗ определим как
операцию среза над гиперкубом данных G по всем фиксированным измерениям.
Для отображения значений показателя f ∗ определим электронную карту H = hL, Si,
где L = {L1 , L2 , . . ., Lp } – множество картографических слоев; S = (s1 , s2 , . . . , sq ) – упорядоченное множество значений свойств отображения карты.
Слой Li определяется как Li = hOi , Ti , Ai (Oi , Ti ), Pi i , где Oi = (o1i , o2i , . . . , ofi i ) – упорядоченное множество территориальных объектов заданного типа;
Ti = (t1i , t2i , . . . , tgi i ) – упорядоченное множество атрибутивных свойств слоя – полей атрибутивной таблицы Ai ;
Ai (Oi , Ti ) – атрибутивная таблица, элементы которой aj,k
определены значениями из
i
набора Ti для каждого объекта из Oi , здесь j = 1, fi определяет строки таблицы, а k = 1, gi
– столбцы таблицы (поля);
Pi = hBi , Ci i – легенда слоя, здесь Bi = (b1i , b2i , . . . , bvi i ) – упорядоченное множество
i
значений свойств слоя, Ci = (c1i , c2i , . . . , cw
i ) – упорядоченное множество классов разбиения
множества объектов Oi слоя Li .
Привязка географического измерения dˆ осуществляется к одному или нескольким картографическим слоям. Пусть L0 ⊆ L – подмножество слоев, к которым осуществляется привязка, и мощность его |L0 = l|. Каждый слой содержит атрибутивную таблицу A0i , i = 1, l,
k∗
в одном из полей таблицы ti i , ki∗ ∈ [1, gi ] хранится множество идентификаторов объектов
j,k∗
слоя. Если значение идентификатора ai i ∈ d, j = 1, fi , то к объекту oji можно построить
картографическую привязку значения показателя f ∗ . Используя картографическую привязку данных, устанавливается соответствие между территориальными объектами карты и
ˆ
географическим измерением гиперкуба d.
– 54 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Л.Ф. Ноженкова, А.А. Евсюков, А.И. Ноженков. Методы управления . . .
Чтобы значения показателя f ∗ отобразить в виде тематической карты, необходимо построить легенду тех слоев, к объектам которых выполнена картографическая привязка.
При построении легенды используются методы тематического картографирования, позволяющие объекты слоя разбить на классы на основе соответствующих значений анализируемого показателя. Для того чтобы на карте различать объекты разных классов, для каждого
класса задается ряд настроек отображения: цвет объектов, цвет контура и тип заливки объектов для площадного слоя, условное обозначение (символ) объектов для точечного слоя,
состояние (видимые, скрытые или мигающие объекты). Построенная в результате картографической привязки многомерных данных тематическая карта является отображением
значений анализируемого показателя f ∗ из среза гиперкуба данных по всем измерениям,
ˆ
кроме географического измерения d.
Помимо инструментов построения легенды для представления результатов OLAPанализа в программную реализацию средств оперативного геомоделирования включен блок
управления многомерными данными. Блок управления включает в себя список аналитических показателей, доступных для построения тематических карт, а также фильтр многомерных данных. При изменении анализируемого показателя и фиксированных измерений
происходит переформирование классов привязанных к многомерным данным слоев и выполняется построение тематической карты.
На рис. 4 представлен пример построения тематической карты: отображена рождаемость
населения по территориям Красноярского края. Картографическая привязка данных осуществлена к картографическим слоям “города” и “районы”. Территориальным объектам со
светлой раскраской соответствуют более низкие показатели рождаемости, раскрашенным
темнее – более высокие.
Рис. 4. Отображение рождаемости в Красноярском крае
Для реализации оперативной работы с территориальными объектами, меняющими свое
местоположение, предлагается метод динамического формирования картографических слоев на основе содержимого таблиц из источников данных OLAP-системы и топографических
– 55 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Л.Ф. Ноженкова, А.А. Евсюков, А.И. Ноженков. Методы управления . . .
картографических слоев [9]. Наполнение формируемого слоя – его пространственная и атрибутивная информация – создается на основе содержания выбранной таблицы источника
данных OLAP-системы. Обозначим выбранную таблицу T . Для решения задачи динамического формирования новых картографических слоев разработаны алгоритмы получения
пространственной информации, позволяющие найти координаты точек для построения объектов нового точечного, линейного и площадного слоев на основе значений координат таблицы из источника данных OLAP-системы или соответствия объектам слоя из топографической основы карты. Если географические координаты содержатся непосредственно в
таблице T , то их можно использовать для формирования нового слоя. При отсутствии необходимой информации о местоположении объектов в таблицах источников данных OLAPсистемы предлагается формировать координаты точек нового слоя на основе картографической привязки к слоям из топографической основы карты. Для этого необходимо установить
соответствие между полем таблицы T и полем атрибутивной таблицы слоя привязки. Для
совпадающих значений формируется объект нового слоя, при этом используются координаты соответствующего ему объекта слоя карты. Атрибутивной информацией слоя является
таблица, полученная из строк таблицы T , по которым сформированы объекты нового слоя.
Отметим, что можно динамически сформировать и визуализировать одновременно несколько картографических слоев. ГИС позволяет производить с динамически сформированными
слоями те же операции, что и со слоями из топографической основы карты, включая применение методов тематического картографирования.
Рассмотрим пример динамического формирования картографических слоев на основе
оперативного аналитического моделирования. На рис. 5 изображен фрагмент карты Большемуртинского района Красноярского края. Тематическая карта дает представление о планах реорганизации сети медицинских учреждений. Для визуализации планирования реорганизации сети медицинских учреждений каждому учреждению присваивается статус: “без
изменений”, “модифицировано”, “закрыто”, “открыто”. Динамически формируются слои медицинских учреждений на основе информации об их принадлежности населенным пунктам [10].
Рис. 5. Планирование реорганизации сети медицинских учреждений
Обозначения:
– центральные районные больницы,
– амбулатории,
– участковые больницы,
– фельдшерско-акушерские пункты, • – населенные пункты.
Для формирования новых слоев могут быть использованы таблицы агрегатов, содержа– 56 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Л.Ф. Ноженкова, А.А. Евсюков, А.И. Ноженков. Методы управления . . .
щие агрегированные данные, прошедшие предварительную обработку. Это позволяет сформировать новый слой не только на основе собранных статистических данных, но и на основе
аналитических результатов. Использование таблиц агрегатов для динамического формирования картографических слоев является отличительной особенностью средств оперативного
геомоделирования в OLAP-системе по сравнению с традиционными геоинформационными
системами.
Заключение
Средства управления OLAP-моделированием позволяют наглядно представлять процесс
построения и выполнения комплекса OLAP-моделей, редактировать алгоритм расчета и
интерактивно управлять процессом. Обеспечивается возможность не только автоматизировать расчетные задачи, но и реализовать эвристические и эмпирические методы, как,
например, согласование результатов расчета нормативов объемов медицинской помощи и
нормативов финансирования в планировании медицинской помощи.
На основе интеграции OLAP и ГИС реализована технология оперативного геомоделирования для решения территориально ориентированных задач в реальном времени. Интеграция ГИС и OLAP-системы способствует повышению наглядности представления результатов аналитической обработки данных, сочетая ее с геомоделированием. Возможности
динамической связи картографических объектов с многомерными данными существенно
расширяют функциональность как OLAP-системы, так и встроенной в систему ГИС. В результате интеграции OLAP-система приобретает дополнительные возможности наглядного
представления многомерных данных, ГИС – инструментарий формирования аналитических
запросов для построения тематических карт.
Средства управления OLAP-моделированием и оперативного геомоделирования нашли
применение в решении таких важных задач здравоохранения, как анализ сети медицинских
учреждений, ежегодное планирование медицинской помощи, анализ состояния социальной
помощи и многих других. Средства оперативного геомоделирования применяются также
в системах поддержки принятия решений по предупреждению природных и техногенных
чрезвычайных ситуаций [11].
Работа выполнена при поддержке гранта Президента для ведущих научных школ №
НШ-3431.2008.9.
Список литературы
[1] Codd, E.F. Providing OLAP. On-line Analytical Processing to User-Analists: An IT
Mandate / E.F. Codd, S.B. Codd. – C. T. Salley, E. F. Codd & Associates, 1993.
[2] Виноградов К.А. Информационные технологии в управлении региональным здравоохранением / К.А. Виноградов, Е.Е. Корчагин, М.И. Никитина, Л.Ф. Ноженкова. –
Красноярск.: КМИАЦ, 2004. – 312 с.
[3] Вайнштейн Ю.В. Планирование медицинской помощи с применением аналитических
OLAP-моделей / Ю.В. Вайнштейн // Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика". – Приложение №8470, 9(II). –
Томск: ТГУ, 2004. – С. 16-22.
– 57 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Л.Ф. Ноженкова, А.А. Евсюков, А.И. Ноженков. Методы управления . . .
[4] Ишенин П.П. Инструментальные средства построения комплексов моделей и аналитических приложений в OLAP-технологии: автореф. дис. канд. техн. наук: 05.13.11. /
П.П. Ишенин. – Красноярск: ИВМ СО РАН, 2006. – 24 с.
[5] Ноженкова Л.Ф. Технологические решения в системах поддержки территориального
управления / Л.Ф. Ноженкова // Врач и информационные технологии. – 2004. – №12.
[6] Жучков Д.В. Применение технологии хранилищ данных в территориальных органах
управления здравоохранением / Д.В. Жучков // Материалы IV Всероссийской конференции молодых ученых по математическому моделированию и информационным
технологиям. – Красноярск: ИВМ СО РАН, 2003.
[7] Ноженков А.И. Формирование территориальных программ медицинской помощи на
основе интеллектуальных средств управления OLAP-моделированием: автореф. дис.
канд. техн. наук: 05.13.01. / А.И. Ноженков. – Красноярск: ИВМ СО РАН, 2007. – 20
с.
[8] Ноженков А.И. Интеллектуальные средства OLAP-моделирования в задачах планирования медицинской помощи // Открытое образование (Приложение). – Красноярск:
ООО “Экспресс-Офсет”. – 2006. – С. 156-160.
[9] Евсюков А.А. Средства оперативного геомоделирования в информационноаналитических системах: автореф. дис. канд. техн. наук: 05.13.11. / А.А. Евсюков. –
Красноярск: ИВМ СО РАН, 2007. – 23 с.
[10] Евсюков А.А. Оперативное геомоделирование сети медицинских учреждений / А.А.
Евсюков, Л.Ф. Ноженкова // Вестник КрасГАУ, № 13. – Красноярск: КрасГАУ, 2006.
– С.114-118.
[11] Ноженкова Л.Ф. Средства построения систем поддержки принятия решений по предупреждению и ликвидации ЧС / Л.Ф. Ноженкова, С.В. Исаев, В.В. Ничепорчук,
А.А. Евсюков, Р.В. Морозов, А.А. Марков// Проблемы безопасности и чрезвычайных
ситуаций. №4. – М.: 2008. – С. 46–54.
Methods for Control and Geoinformation Modeling in
OLAP-Technology
Ludmila F. Nozhenkova, Alexander A. Evsyukov
and Alexander I. Nozhenkov
Institute of Computational Modeling SB RAS
Akademgorodok, Krasnoyarsk, 660036 Russia
In this paper, on-line analytical processing methods based on intellectual control means for OLAPmodeling are presented. Meta-description means of complex OLAP-model systems are suggested,
that allows automating of calculation control and data processing with using of heuristics. On-line
geoinformation modeling facilities to visualize the results of OLAP-analysis are described.
Key words: data processing, OLAP-analysis, OLAP-model, geoinformation modeling.
– 58 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Journal of Siberian Federal University. Engineering & Technologies 1 (2009 2), 59-68
УДК 517.518.87
О точности кубатурных формул
в пространствах C.Л. Соболева
В.И. Половинкин∗
Сибирский федеральный университет
660041 Россия, Красноярск, Свободный, 791
Получена 01.05.2008, окончательный вариант 03.06.2008, принята к печати 10.03.2009
Устанавливаются условия, необходимые и достаточные для того, чтобы функционалы ошибок
кубатурных формул были ограничены в пространствах типа Lm
p , соответствующих рассматриваемым множествам интегрируемых функций, заданных на ограниченных подмножествах цилиндрических и конических поверхностей.
Ключевые слова: кубатурные формулы, функционалы ошибок, пространства Lm
p , приближенное
вычисление интегралов.
Большинство работ С.Л. Соболева по теории кубатурных формул, в частности монографии [1, 2], посвящены оценкам погрешностей приближенного интегрирования функций f
через ||f ||Lm
. Также через эти полунормы оцениваются погрешности интегрирования и
p (Ω)
в работах других авторов, например в [3] и [4].
У исследований подобного рода может быть следующий недостаток. От рассматриваемых кубатурных формул требуют, чтобы они были точны на множестве многочленов степени ниже m P m , т. е. их функционалы ошибок l должны были удовлетворять условиям
(l, P ) = 0
при P ∈ P m .
(1)
Однако множество рассматриваемых интегрируемых функций может не содержать всего P m , и требование выполнения условия (1) в ряде случаев представляется завышенным.
Например, при интегрировании многомерных периодических функций, порождающих проe m (A), где A — невырожденная квадратная матрица, требование (1) можно застранства L
2
менить условием точности соответствующей кубатурной формулы на константах.
В работах [3–5] от исследуемых кубатурных формул не требовалась формально точность
на P m . Однако в них алгоритмы интегрирования опираются на суммирование формул,
удовлетворяющих условиям типа (1).
Тем не менее там удалось построить асимптотически оптимальные последовательности
кубатурных формул в соответствующих пространствах типа Lm
p .
В этой статье доказывается и применяется к теории кубатурных формул следующий
результат.
Tеорема 1. Пусть H — замкнутое подпространство пространства Wpm (Ω), линейный
функционал l ограничен на H. Тогда для того, чтобы существовала постоянная K такая,
что
|(l, f )| ≤ K||f ||Lm
при f ∈ H,
(2)
p (Ω)
необходимо и достаточно выполнение следующих условий:
(l, P ) = 0
∗
1
при
P ∈ P m (H),
где
Corresponding author E-mail address: stany6@yandex.ru
c Siberian Federal University. All rights reserved
°
– 59 –
P m (H) = P m ∩ H.
(3)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Половинкин. О точности кубатурных формул в пространствах C. Л. Соболева
Далее будут приведены примеры пространств H и соответствующих им P m (H), в частности, связанных с функциями, заданными на ограниченных множествах цилиндрических
и конических поверхностей.
Теорема 1, как и некоторые примеры пространств H, рассматриваемые в этой работе,
были опубликованы ранее в статье [6]. Доказательство этой теоремы, приводимое здесь,
отлично от доказательства в [6] и, по сравнению с ним, короче.
Полученные ниже результаты применимы непосредственно к теории приближенного интегрирования, если в формулах (2) и (3) l считать функционалами ошибок кубатурных
формул, т. е. определенными равенствами
Z
(l, f ) =
f (x)dx −
N
X
ck f (xk ).
(4)
k=1
Ω
Здесь и далее: Ω — ограниченная область n-мерного арифметического пространства векторов x = (x1 , . . . , xn ); xk — точки из замыкания Ω, ck — постоянные, k = 1, . . . , N = 1, N .
Условие (3) в случае функционалов (4) равносильно точности соответствующих кубатурных формул на многочленах из P m (H). Если A, B — подпространства некоторого линейного
топологического пространства X, то будем обозначать A+B = {x : x = a+b, a ∈ A, b ∈ B}.
Следующие две теоремы [7] относительно целей настоящей работы имеют вспомогательное значение.
Tеорема 2. Пусть A — замкнуто, а B — конечномерно. Тогда A + B — замкнутое
подпространство
Tеорема 3. Предположим, что A и B — такие замкнутые подпространства банахова
пространства X, что X = A + B. Тогда при некоторой постоянной γ ≥ 0 каждый вектор
x ∈ X допускает представление в виде
x = a + b, где a ∈ A, b ∈ B и ||a||X + ||b||X ≤ γ||x||X .
Приведем необходимые сведения [1, 8], относящиеся к пространствам С.Л. Соболева
Wpm (Ω). Здесь и далее: p, m — числа, p ∈ [1, ∞), m — натуральное.
Wpm (Ω) — линейное пространство функций f, заданных в Ω, обладающих там всеми
обобщенными производными порядка m c конечной полунормой
||f ||Lm
= ||f (x)||Lm
= ||f (x1 , . . . , xn )||Lm
=
p (Ω)
p (Ω)
p (Ω)
 
Z
n
n µ
X
 X
···
=
Ω
j1 =1
jm =1
m
∂ f
∂xj1 · · · ∂xjm
1/p

¶2 p/2

(x)  dx .
(5)
Оно становится линейным нормированным пространством, если задать проекционный
оператор Π, проектирующий Wpm (Ω) на все P m , в P m ввести норму || · ||P m и положить
i1/p
h
.
||f ||Wpm (Ω) = ||Πf ||pP m + ||f ||pLm (Ω)
p
(6)
Считаем далее Π выбранным так, что пространство Wpm (Ω) полно.
В любом конечномерном пространстве все нормы эквивалентны. Отсюда следует, как
увидим из доказательства теоремы 1, что конкретный вид Π не имеет значения.
– 60 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Половинкин. О точности кубатурных формул в пространствах C. Л. Соболева
Доказательство теоремы 1. Необходимость условий (3) для теоремы, а в случае
P m (H) = P m
(7)
и их достаточность, вытекают непосредственно из формул (5) и (6).
Предположим, что: H — замкнутое подпространство Wpm (Ω), не удовлетворяющее равенству (7); l — линейный ограниченный функционал на H.
Будем доказывать достаточность условия (3) в теореме. Предположим, что оно выполняется.
Определим в Wpm (Ω) подпространство H = H + P m . Оно замкнуто по теореме 2, а
поскольку Wpm (Ω) предполагается банаховым, то и полно.
Продолжим l с H на H до функционала l, полагая при
x = a + P, a ∈ H, P ∈ P m
(l, x) = (l, a).
(8)
Непосредственно проверяется, что функционал l будет линейным.
Пусть γ — постоянная, существование которой утверждает теорема 3, соответствующая
в ней A = H, B = P m . Тогда при x вида (8) получим
|(l, x)| = |(l, a)| ≤ ||l||H ∗ ||a||H = ||l||H ∗ ||a||H ≤ γ||l||H ∗ ||x||H .
(9)
Здесь H ∗ — сопряженное пространство H.
Из неравенств (9) следует ограниченность l в H. Так как P m (H) = P m , и теорема для
H, удовлетворяющих равенству (7), верна, то существует постоянная K — такая, что
|(l, x)| ≤ K||x||Lm
p (Ω)
при
x ∈ H.
(10)
Но
(l, f ) = (l, f ) при
f = x ∈ H.
Отсюда, и из неравенств (10) вытекает оценка (2) при P m (H) 6= P m .
Следовательно, теорема верна.
Замечание 1. Если проекционный оператор Π из определения нормированного пространства Wpm (Ω) отображает H в P m (H), то справедливость теоремы 1 вытекает непосредственно из формулы (6).
Пусть pm > n, область Ω c замыканием Ω и проекционный оператор Π, определяющий нормы (6), таковы, что пространства Wpm (Ω) полны и справедлива теорема вложения
Соболева из Wpm (Ω) в C(Ω), где C(Ω) — пространство непрерывных в Ω функций f c
||f ||C(Ω) = max{|f (x)|}.
x∈Ω
Класс областей Ω, для которых существует оператор Π с данными свойствами, является
широким, причем за Π можно брать шаровые проекционные операторы [1, 8]. При таких Π
норма (6) на линейном пространстве Wpm (Ω) эквивалентна следующей
||f ||Wpm (Ω)
1/p

Z
=  |f (x)|p dx + ||f ||pLm (Ω)  .
p
Ω
– 61 –
(11)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Половинкин. О точности кубатурных формул в пространствах C. Л. Соболева
При этих условиях функционалы ошибок кубатурных формул l вида (4) будут ограничены в Wpm (Ω) и, если они удовлетворяют условиям (3), то будет определена следующая
норма
||l||Lm∗
= sup {|(l, f )|}/||f ||Lm
,
p (H)
p (Ω)
f ∈H\0
а погрешность вычислений по соответствующей l кубатурной формулы оценивается так
|(l, f )| ≤ ||l||Lpm∗ (H) ||f ||Lm
p (Ω)
при
f ∈ H.
(12)
Для использования неравенств (12) при оценках погрешностей приближенного интегрирования функций из H необходимо описать множество P m (H) и убедиться, что на нем
соответствующие кубатурные формулы точны.
Сказанное сейчас может быть обобщено на весовые и эрмитовы (содержащие значения
производных) кубатурные формулы.
Замечание 2. Теорема 1 остается верной, если в ее формулировке Wpm (Ω) заменить
на пространство из тех же элементов с нормой, эквивалентной (6), например, на Wpm (Ω) c
нормой (11).
Оставшаяся часть статьи будет посвящена, главным образом, описанию P m (H) для различных пространств H интегрируемых функций.
Следующий пример при n = 2 связан с функциями, заданными на цилиндрических
поверхностях в трехмерном пространстве.
Пример 1. Пусть натуральное число s < n; ai , i = 1, n — положительные числа; Ω =
Ω(a1 , . . . , an ) = {(x1 , . . . , xn ) : |xi | < ai , i = 1, n}; Ds = {(x1 , . . . , xn ) : |xi | < ai , i = s + 1, n}.
Через H обозначим подпространство W2m (Ω), образованное сужениями на Ω функций,
заданных на Ds , периодических там с периодами 2ai по переменным xi , i = 1, s, имеющих
во всех ограниченных областях Ds обобщенные производные порядка m.
Tеорема 4. Если H — пространство из примера 1, то P m (H) — совокупность многочленов из P m , зависящих только от переменных xi , i = s + 1, m.
Доказательство. Введем переменные y = (x1 , . . . , xs ) и z = (xs+1 , . . . , xn ).
Если многочлены из P m зависят только от z, то они принадлежат P m (H). Покажем,
что других элементов P m нет.
Пусть многочлен P ∈ P m . Тогда его можно записать в виде
X
P (x) =
y β Pβ (z),
(13)
|β|<m
где β = (β1 , . . . , βs ), |β| = β1 + · · · + βs , y β = xβ1 1 · · · · · xβs s , Pβ — многочлены степени не
выше m − |β1 | − 1.
Обозначим через µ = (µ1 , . . . , µs ) некоторый вектор-индекс, соответствующий ненулевому слагаемому в сумме (13) с наибольшей степенью относительно y.
Предположим, что P ∈ P m (H) и |µ| > 0. Тогда некоторая координата µ > 0. Для
определенности будем считать, что µ1 6= 0. Другие случаи координат µ, не равных 0, могут
быть рассмотрены аналогично.
Из периодичности P по переменной x1 с периодом 2a1 следует, что должно выполняться
равенство
¯
¯
¯
¯
∂ |µ|−1
∂ |µ|−1
¯
¯
=
.
(14)
µ1 −1
µ1 −1
µ2
µ2
µs P (x)¯¯
µs P (x)¯¯
∂x1
∂x1
∂x2 · · · xs
∂x2 · · · xs
x =−a
x =a
1
1
– 62 –
1
1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Половинкин. О точности кубатурных формул в пространствах C. Л. Соболева
Значения производных из формулы (14) на слагаемых правой части равенства (13) при
β 6= µ равны 0, а если β = µ, являются нечетными функциями относительно пeременной
x1 . Следовательно Pµ (z) = 0, когда µ 6= 0.
Отсюда следует теорема 4.
Замечание 3. Аналогично примеру 1 рассматривается случай периодических по всем
переменным xi функций с периодом 2ai , i = 1, n, заданных в области Ω из этого примера.
В нем P m (H) состоят лишь из констант.
Следующее ниже обобщение теоремы 4 посвящено лишь двумерному случаю.
Пример 2. Пусть числа a1 , a2 > 0; α, β — функции, заданные на (−∞, ∞), непрерывные там с периодом 2a1 и удовлетворяющие неравенствам
α(x) ≤ −a2 < a2 ≤ β(x) при x ∈ (∞, ∞)
D = {(x, y) : α(x) < y < β(x)}; Ω0 = {(x, y) : |x| < a1 , α(x) < y < β(x)}.
Через H0 обозначим подпространство Wpm (Ω0 ), образованное сужением на Ω0 функций,
заданных на D, периодических на нем с периодом 2a1 по переменной x, обладающих суммируемыми в степени p обобщенными производными порядка m в любой ограниченной
области из D.
Tеорема 5. P m (H0 ) состоит из многочленов, зависящих от переменной y.
Доказательство. Многочлены, зависящие только от y, степени ниже m, принадлежат
P (H0 ).
С другой стороны, многочлены, зависящие от x, не могут принадлежать P m (H0 ), так
как из включения
m
Ω = Ω(a1 , a2 ) = {(x, y) : |x| < a1 , |y| < a2 } ⊂ Ω0
(15)
вытекает, что P m (H0 ) ⊂ P m (H), где H — пространство из теоремы 4, соответствующее
области Ω в формуле 15.
Поэтому, из теоремы 4 следует теорема 5.
Следующий далее пример связан с задачами приближенного интегрирования функций,
заданных на секторах.
Пример 3. Множества P m , как и пространства Wpm (Ω), будем считать состоящими из
функций двух переменных — x, y.
p
Введем полярные координаты r, ϕ : r = x2 + y 2 , x = r cos ϕ, y = r sin ϕ, а многочлены
P (x, y) ∈ P m будем обозначать P {r, ϕ}.
Считаем a, b, ψ такими числами, что 0 ≤ a < b, ϕ ∈ (0, π).
Положим: D — совокупность {r, ϕ}, у которых a < r < b; Ω — множество точек {r, ϕ} ∈
∈ D, где ϕ ∈ (−ψ, ψ).
Через H обозначим подпространство Wpm (Ω), образованное сужениями на Ω функций,
заданных в D, периодических там с периодом 2ψ по полярной координате ϕ, имеющих
в любой ограниченной области из D суммируемые в степени p обобщенные производные
порядка m.
Tеорема 6. а) Пусть γ, n — натуральные числа, не имеющие общих делителей
ψ=
γ
π,
n
0 < γ < n.
– 63 –
(16)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Половинкин. О точности кубатурных формул в пространствах C. Л. Соболева
Тогда P m (H) состоит из многочленов следующего вида
P {r, ϕ} = Q(r) +
m−1
X
rk ηk (ϕ),
k=1
где
[(m−1)/2]
X
Q(r) =
cj r2j ,
(17)
j=0
ηk (ϕ) = 0
при
k < n,
[k/n] h
ηk (ϕ) =
X
i
t,k
µt,k
1 cos(tnϕ) + µ2 sin(tnϕ) ,
t=1
t,k
cj , j = 0, [(m − 1)/2], µt,k
1 , µ2 k = 1, m − 1, t = 1, [k/n] — постоянные.
б) При ψ, не имеющих вида (16), P m (H) состоит из многочленов вида (17).
Доказательство. Пусть многочлен P m (H). Представим его в виде
P {r, ϕ} =
m−1
X
rk Pk (ϕ),
(18)
k=0
где Pk (ϕ), k = 0, m − 1, однородные тригонометрические многочлены относительно совокупности cos ϕ, sin ϕ степеней k.
Лемма 1. Pk (ϕ), k = 0, m − 1, периодичны по ϕ с периодом 2ψ.
Доказательство. Утверждение леммы очевидно при k = 0. Будем считать k > 0.
Рассмотрим вначале случай k = m − 1.
Пусть P ∈ P m−1 (H). Тогда P периодичен по полярному углу с периодом 2ψ. Поэтому
¯
¯
¯
¯
∂ m−1
∂ m−1
¯
P {r, ϕ}¯
=
P {r, ϕ}¯¯
(19)
m−1
∂rm−1
∂r
ϕ=τ
ϕ=τ +2m
при всех τ ∈ (∞, ∞). Отсюда и из равенства (18) следует
Pm−1 (τ ) = Pm−1 (τ )(τ + 2ψ).
(20)
Так же как равенства (20) и (19) получаем
¯
¯
¤¯
¤¯
∂ m−2 £
∂ m−2 £
m−1
m−1
¯
¯
P
{r,
ϕ}
−
r
P
(ϕ)
=
P
{r,
ϕ}
−
r
P
(ϕ)
m−1
m−1
¯
¯
∂rm−2
∂rm−2
ϕ=τ
ϕ=τ +2ψ
Pm−2 (τ ) = Pm−2 (τ )(τ + 2ψ).
(21)
Далее, последовательно вычитая из P многочлены высших степеней из правых частей равенств (18) и дифференцируя, аналогично выводу формул (20) и (21) находим индукцией
по k, что
Pk (τ ) = Pk (τ + 2ψ), k = 1, m − 1.
Следовательно, лемма верна.
– 64 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Половинкин. О точности кубатурных формул в пространствах C. Л. Соболева
Применяя к однородным тригонометрическим многочленам степени k, суммой которых
являются Pk , k = 2, m − 1, k − 1 раз формулы тригонометрии
2 sin A cos B = sin(A + B) + sin(A − B), 2 cos A cos B = cos(A + B) + cos(A − B),
2 sin A sin B = cos(A − B) − cos(A + B),
можно Pk представить в виде
Pk (ϕ) = ck +
k
X
[aks cos(sϕ) + bks sin(sϕ)],
(22)
s=1
где ck , aks , bks , s = 1, k — постоянные. Представление (22) верно и при k = 1 с c1 = 0.
Будем далее опираться на известные свойства преобразования Фурье F обобщенных
функций [9]. Аргументами оригинала и изображения будут ϕ, x.
Обозначим: F (Pk ) = P k .
Так как F (1) = 2πδ(x) и
F (sin(sϕ)) = −iπ[δ(x + s) − δ(x − s)], F (cos(sϕ)) = π[δ(x + s) − δ(x − s)],
где δ — обобщенная функция Дирака, то, применяя преобразование Фурье к обеим частям
равенств (22), находим, что
s
X
P k (x) =
λks δ(x − s),
(23)
k=−s
где
λks ,
s = −k, k — постоянные. Отсюда имеем
e
2πiψx
P k (x) =
s
X
λks e2πisψ δ(x − s).
(24)
k=−s
Лемма показывает, что
P k (x) = e2πiψx P k (x).
(25)
Из равенств (23) и (24) следует, что формула (25) может быть справедлива, если при
всех s = −k, k таких, что λks 6= 0, выполняется
e2πisψ = 1.
(26)
Пусть выполняются условия (16). В этом случае формула (26) верна тогда и только
тогда, когда sψn−1 — целое число. Отсюда и из равенства (23) получим
k=[k/n]
X
P k (x) =
λktn δ(x − tn ).
t=−[k/n]
Если k ≥ n, то формулу (27) можно преобразовать к виду
[k/n]
k
P k (x) = µ F (1) +
X
t,k
[µt,k
1 F (cos(tnϕ)) + µ2 F (sin(tnϕ))],
t=1
t,k
где µk , µt,k
1 , µ2 , t = 1, [k/n] — постоянные.
– 65 –
(27)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Половинкин. О точности кубатурных формул в пространствах C. Л. Соболева
Следовательно,
[k/n]
Pk (ϕ) = µk
X
t,k
[µt,k
1 cos(tnϕ) + µ2 sin(tnϕ)].
(28)
t=1
Заметим попутно, что из вывода формулы (28) не видно непосредственно, что в ней
t,k
числа µk , µt,k
являются действительными. Они не могут быть не действительными
1 , µ2
потому, что правая часть ее действительна, как равная Pk (ϕ), а совокупность функций,
состоящая из cos(tnϕ), sin(tnϕ), t = 1, [k/n] и 1 линейно независима на любом интервале.
Если k < n, то из формулы (27) вытекает, что Pk — константы µk из формулы (28).
Когда k — нечетные, эти µk = 0, так как rk не являются многочленами.
Непосредственно проверяется, что все слагаемые правой части формулы (28) — периодические функции ϕ с периодом 2ψ, где ψ — величины из (16).
Аналогично устанавливается теорема в случае "б". При этом учитывается, что в нем
равенство (26) не выполняется при целых s.
Следовательно, теорема верна.
Замечание 4. Так как в формуле (16) n ≥ 2, то при ψ из нее, как и в случае "б" теоремы,
P m (H) не содержит однородных многочленов степени 1. Поэтому при m > 1 P m (H) 6= P m .
Замечание 5. При n ≥ m и ψ вида (16) P m (H) состоит из многочленов вида (17).
Пример 4. Пусть m = 3, ψ = 2−1 . Тогда P m (H) состоит по теореме 6 из многочленов
P {r, ϕ} = A + Br2 + (C cos(2ϕ) + D sin(2ϕ))r2 , A, B, C, D − const.
(29)
Непосредственно проверяется, что множество многочленов вида (29) — это совокупность
многочленов от x, y степени не выше 2, не содержащих одночленов первой степени.
Замечание 6. Аналогично тому, как в двумерном случае была получена теорема 5, теорема 6 может быть обобщена с рассматриваемых в ней областей Ω на области Ω0 , заданные
ниже с помощью периодических с периодом 2ψ, ψ ∈ (0, π), непрерывных и неотрицательных
на всей числовой оси функций α, β следующих видов:
а) Ω — множество точек {r, ϕ} таких, что α(ϕ) < r < β(ϕ), |ϕ| < ψ. При этом предполагаем, что max α(ϕ) <
min β(ϕ).
ϕ∈(−∞,∞)
ϕ∈(−∞,∞)
б) Ω0 — совокупность {r, ϕ} ∈ Ω, у которых |ϕ| < ψ.
Считаем область Ω далее такой, что при
pm > n
(30)
верна теорема вложения из Wpm (Ω) в C(Ω). Предполагаем, что числа p и m удовлетворяют
(30).
Tеорема 7. Пусть множество η ⊂ Ω не лежит на гиперповерхности порядка ниже
m; H — множество функций из Wpm (Ω), равных 0 на η. Тогда P m (H) = 0.
Данная теорема является непосредственным следствием того обстоятельства, что условие на η из нее необходимо и достаточно, чтобы не существовало элемента P m \0, равного
нулю на η [10]. Условие (30) — необходимо, чтобы были определены значения функций из
Wpm (Ω) в точках η.
Следствие. Если l — функционал ошибок кубатурной формулы вида (4), H — пространство из теоремы 7, то оценки вида (2) всегда существуют при любых l такого вида.
Замечание 7. Оценки погрешностей приближенного интегрирования функций из пространства H с P m (H) имеют следующий недостаток.
– 66 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Половинкин. О точности кубатурных формул в пространствах C. Л. Соболева
Даже незначительные изменения коэффициентов кубатурных формул (например, связанные с округлением десятичных дробей, выражающих их значения), точных на многочленах из P m (H), могут нарушать эту точность. Также малая погрешность вычислений
значений интегрируемых функций в узлах формул может сделать невозможным пользоваться для оценок погрешностей неравенствами вида (2).
Этого недостатка нет у H при P m (H) = 0, например, H из теоремы 7.
Интегрируемые функции f обычно не принадлежат P m . В этих случаях для получения
оценок приближенного интегрирования вида (2) можно выбирать H, содержащие f такими,
что P m (H) = 0. В некоторых случаях перед применением кубатурных формул можно из f
вычесть многочлен, после чего она будет принадлежать H с P m (H) = 0.
Пример 5. Пусть Ω, a1 , . . . , an — область и числа из теоремы 4, H — множество периодических функций из замечания 3, pm > n, x0 — некоторый узел кубатурной формулы,
соответствующей функционалу ошибок l вида (4). Так как mes Ω = 2n a1 · · · · · an и
Z
Z
n
0
f (x)dx = 2 a1 · · · · · an f (x ) + [f (x) − f (x0 )]dx,
Ω
Ω
то, если совершить переход от пространства H к его подпространству H0 = {g : g ∈ H,
g(x0 ) = 0} с P m (H0 ) = 0 из теоремы 4, получим при некоторой постоянной K оценку
|(l(x), f (x) − f (x0 ))| ≤ K||f (x) − f (x0 )||Lm
= K||f ||Lm
,
p (Ω)
p (Ω)
которая будет корректна относительно малых изменений ck , f (xk ), k = 1, N .
Замечание 8. Важными задачами, связанными с работами С. Л. Соболева по теории
приближенного интегрирования, являются проблемы построения последовательностей решетчатых кубатурных формул, зависящих от шага сетки узлов h, асимтотически оптимальных в подпространствах H пространств Lm
p (Ω) [1–5]. Последовательности функционалов
ошибок таких формул {lh } называются асимптотически оптимальными в H.
Пусть {lh } — асимптотически оптимальна в H, ∆h — разностные операторы с носителями, принадлежащими множествам узлов кубатурных формул, соответствующих lh , равные
0 на P m . Тогда, если числа λ(h) достаточно малы по абсолютной величине, то {lh +λ(h)∆h }
будет асимптотически оптимальной в H.
Теорема 1 позволяет указанным выше способом строить новые асимптотически оптимальные последовательности кубатурных формул в H, если ∆h равны 0 на P m (H). Следовательно, её применение позволяет при m > 1, так как тогда P m шире P m (H), расширить класс асимптотически оптимальных последовательностей кубатурных формул, если
H 6= Lm
p (Ω).
Замечание 9. В списке литературы работы [6] название статьи [5] было приведено
неточно. В нем вместо слова "решетчатых" было написано "развертывающихся".
Работа поддержана аналитической целевой программой Министерства образования и
науки РПН.3.1.1.5349, РФФИ, грант № 07-01-00326.
Автор благодарит к.ф.-м.н. Сидорову Т. В. за помощь при подготовке текста этой статьи.
Список литературы
[1] Соболев С.Л. Введение в теорию кубатурных формул / С.Л. Соболев. – М.: Наука,
1974.
– 67 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.И. Половинкин. О точности кубатурных формул в пространствах C. Л. Соболева
[2] Соболев С.Л. Кубатурные формулы / С.Л. Соболев, В.Л. Васкевич. – Новосибирск:
Изд-во ин-та математики СО РАН, 1996.
[3] Половинкин В.И. Декартовы произведения формул прямоугольников и формул с регулярным пограничным слоем / В.И. Половинкин // Пятое советско-чехословацкое
совещание по применению методов теории функций и функционального анализа к задачам математической физики: материалы совещания. – Новосибирск: Изд-во Ин-та
математики СО АН СССР, 1978. С. 248–250.
[4] Носков М.В. Приближенное интегрирование функций, периодических по некоторым
переменным / М.В. Носков // Теоремы вложения и их приложения. № 1. – Новосибирск:
Изд-во Ин-та математики СО АН СССР, 1982. – С. 93–102.
[5] Носков М.В. Асимптотически оптимальные кубатурные формулы на решетчатых поверхностях / М.В. Носков // Применение функционального анализа к уравнениям в
частных производных. – Новосибирск: Изд-во Ин-та математики СО АН СССР, 1983.
– № 2. – С. 103–112.
[6] Половинкин В.И. Об интегрировании функций, заданных на линейных многообразиях
пространств С.Л. Соболева / В.И. Половинкин // Труды КГТУ. Красноярск: ИПЦ
КГТУ, 2006. № 2–3. – С. 204–208.
[7] Рудин У. Функциональный анализ / У. Рудин. – М.: Мир, 1975.
[8] Соболев С.Л. Некоторые применения функционального анализа в математической физике / С.Л. Соболев. – М.: Наука, 1988.
[9] Брычков Ю.А. Интегральные преобразования обобщенных функций / Ю.А. Брычков,
А.П. Прудников. – М.: Наука, 1977.
[10] Мысовских И.П. Интерполяционные кубатурные формулы / И.П. Мысовских. – М.:
Наука, 1981.
On Exactness of Cubature Formulas in S. L. Sobolev Spaces
Vladimir I. Polovinkin
Siberian Federal University
79 Svobodny, Krasnoyarsk, 660041 Russia
It is established conditions which are necessary and sufficient in order that error functionals of cubature
formulas will be limited in spaces Lm
p , corresponding to considered sets of integrable functions, defined
on limited subsets of cylindrical and conal surfaces.
Key words: cubature formulae, error funtionals, Lm
p spaces, approximate calculation of integrals.
– 68 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Journal of Siberian Federal University. Engineering & Technologies 1 (2009 2), 69-87
УДК 517.518.87
Решение интегральных уравнений
на многопроцессорных вычислительных системах
М.Д. Рамазанов∗ , Д.Я. Рахматуллин,
Л.З. Валеева, Е.Л. Банникова
Институт математики с ВЦ УНЦ РАН
450077 Россия, Уфа, Чернышевского, 1121
Получена 24.06.2008, окончательный вариант 28.07.2008, принята к печати 10.03.2009
Рассматриваются уравнения Фредгольма по областям различных форм. Приводится описание
алгоритма приближенного вычисления интегралов с использованием многопроцессорной техники.
Ключевые слова: многопроцессорные системы, приближенное вычисление интегралов, многопроцессорная техника.
1.
Введение
Мы рассматриваем уравнения Фредгольма второго рода
Z
u(x) − dyK(x, y)u(y) = f (x),
(1)
Ω
записанные для функций двух переменных в ограниченной области произвольной формы,
Ω b R2 . Граница области Γ = ∂Ω, функции K(x, y), f (x) и решение предполагаются гладкими, М раз непрерывно дифференцируемыми по своим аргументам. Норма интегрального
оператора в пространстве C(Ω) считается малой, чтобы можно было применить метод поR
следовательных приближений, max dy|K(x, y)| = θ < 1. Тогда существует единственное
x∈Ω Ω
решение – непрерывная функция, u ∈ C(Ω), и
Z
u(x) = lim us (x),
s→∞
us (x) = f (x) +
dyK(x, y)us−1 (y),
u0 = f (x).
(2)
Ω
Из самого вида интегрального уравнения (1) следует гладкость этого решения, u ∈
C M (Ω). А итерационное равенство (2) позволяет обосновать равномерную ограниченность
C M (Ω)−норм последовательности {us (x)|s = 1, 2...}.
Z
X
M
|Dxα K(x, y)| + kf kC M ≤ K.
kus kC ≤ kus−1 kC · max dy
x∈Ω
Ω
|α≤m|
Это дает возможность в вычислениях интегрального члена итерационного равенcтва (2)
использовать кубатурные формулы с равномерными оценками в C M (Ω)− пространствах.
Мы применим решетчатые кубатурные формулы с ограниченным пограничным слоем порядка М (ОПС-формулы). При наложенных ограничениях они являются асимптотически
∗
1
Corresponding author E-mail address: ramazanov@yandex.ru
c Siberian Federal University. All rights reserved
°
– 69 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
оптимальными в нормах пространств Wpm и C m с любым m < M (в конкретной, одной из
эквивалентных, нормировке и, конечно, с m > n/p). Порядок приближения интегрального слагаемого этими формулами – O(hm ) с соответствующей примененному пространству
наилучшей константой при этом порядке.
Отметим также, что эти формулы условно ненасыщаемы для всех m < M , то есть
формулы остаются асимптотически оптимальными при любой промежуточной гладкости
m ∈ (0, M ), и мы можем работать с ними для K(x, y) и f (x) из классов C m , получая
соответственно решения этой же гладкости.
В общем случае область произвольной формы задается равенством
Ω = {x|Φ(x) > 0}. Мы предполагаем, что Φ ∈ C M (R2 ), множество {x|Φ(x) > 0} является
ограниченным, а DΦ(x) 6= 0 при Φ(x) = 0, что обеспечивает гладкость границы. Для удобства программной реализации мы накладываем дополнительные условия |DΦ(x)| = 1 при
Φ(x) = 0, достигая его заменой первоначального Φ(x) на Φ(x)/|DΦ(x)|.
Решетку узлов кубатурной формулы возьмем кубической {hk|k ∈ Zn , h ∈ R+ , h → 0}.
Интегральное слагаемое итерационного процесса (2) заменяется кубатурной формулой
X
ck (h)K(hj, hk)us (hk)
hn
k∈Zn , ρ(hk,Ω)≤Lh
с некоторым L > 4M.
ОПС-свойство этой формулы означает, что для ρ(hk, R2 \ Ω) > Lh коэффициенты равны
единице, ck (h) ≡ 1. Заметим, что если f ∈ C0M (Ω), K ∈ C0M (Ω × Ω), то все коэффициенты
формулы можно взять равными единице, при этом пограничный слой будет отсутствовать.
Тогда и решение получится из класса C0M (Ω). Мы применяем этот вариант в вычислительных экспериментах при оценке объема работы по вспомогательным расчетам.
Выбранный нами алгоритм последовательных приближений позволяет полностью распараллелить расчеты на каждой отдельной итерации. Поэтому мы можем применить многопроцессорные вычислительные системы. Конкретно расчеты проводились на МВС-15000ВМ
и МВС-50К Межведомственного Суперкомпьютерного Центра РАН.
Идея применения решетчатых кубатурных формул для приближения интегралов по областям произвольных форм заключается в локализации вычислений при помощи разбиения
области на более простые и преобразовании границ этих локальных областей в плоские – координатные гиперплоскости. Алгоритм локализации (предложенный А.Н. Игнатьевым [1])
и реализующая алгоритм программа автоматического разбиения области описаны в п. 3.
Эта программа составлена Л.З. Валеевой [2]. А программа для вычисления интегрального
слагаемого составлена Е.Л. Банниковой [3], ее описание и анализ работы приведены в п. 4.
Алгоритм приближенного вычисления интегралов дан Д.Я. Рахматуллиным [4], описание
приведено в п. 2. Следует отметить, что в описании алгоритма Д.Я. Рахматуллина наложено условие выпуклости области интегрирования. Однако оно было использовано им только
для упрощения разбиения области на подобласти более простых форм. Эта проблема локализации решается в общем виде в п. 3 без требования выпуклости области Ω = {x|Φ(x) > 0},
что и применено в п. 4 в алгоритме и программе численного решения интегральных уравнений. В основе решетчатых кубатурных формул лежит алгоритм формул С.Л. Соболева
– кубатурных формул с регулярным пограничным слоем (РПС-формул) [5] и алгоритм построения ОПС-формул для локальных областей М.Д. Рамазанова [6].
Метод последовательных приближений разбивает вычисление решения интегрального
уравнения на отдельные временные такты. Это мешает полному распараллеливанию алгоритма (естественному для вычисления интеграла по ОПС-формулам). Впоследствии мы
– 70 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
намереваемся преодолеть эту трудность записью приближенных решений рядами Неймана
с одновременными расчетами членами этих рядов, обеспечивающими заданную точность
приближения решения уравнения (1).
В п. 5 мы подводим итоги исследований по результатам вычислительных экспериментов
и даем общие рекомендации по применению разработанных программ.
2.
Алгоритм и программа приближенного вычисления
интегралов в n-мерном случае
2.1. Постановка задачи
Пусть задана ограниченная область Ω ⊂ Rn с гладкой границей Γ ∈ C m .
fpm (Q), p > 1, m > n , периодических функций,
Рассмотрим пространство Соболева W
p
интегрируемых с p-ой степенью вместе с производными до m-го порядка включительно, в
одной из эквивалентных норм:
¯
¯p  p1
¯
¯
X
¯
¯
¡
¢
p
2 m/2 2πixk ¯ 
¯

:= |g0 | +
dx ¯
,
gk 1 + |2πk|
e
¯
Q
¯k∈Zn \{0}
¯

kgkW
f m (Q)
p
Z
Z
g(x)e−2πixk dx,
gk :=
Q
где Q — единичный гиперкуб: Q := {x : xi ∈ [0; 1), i = 1, n}. Взяв это пространство за
fpm (Ω) с нормой
основу, построим новое пространство W
kf kW
f m (Ω) :=
p
inf
kgkW
f m (Q) .
p
g|Ω = f |Ω ,
fpm (Q)
g∈W
fpm (Ω) по области Ω. Мы
Требуется вычислить интеграл произвольной функции f ∈ W
решаем эту задачу путем приближения интеграла решетчатыми кубатурными формулами
с ограниченным пограничным слоем (ОПС-формулами). Поясним эти термины.
Решетчатыми кубатурными формулами называются кубатурные формулы, узлы которых совпадают с узлами некоторой решетки. Мы будем рассматривать последовательности
формул, соответствующие последовательностям кубических решеток со сгущающимися узлами {hk}k∈Zn , h → 0 :
X
ck (h)f (hk), h → 0.
KhΩ (f ) = hn
hk∈Ω
Здесь за знак суммы вынесен масштабный множитель hn , равный объему элементарной
(наименьшей) ячейки, образуемой узлами решетки.
Кубатурная формула обладает ограниченным пограничным слоем, если ее коэффициенты равномерно ограничены по k и h :
∃ L1 :
sup |ck (h)| < L1 ,
k, h
а в глубине области все коэффициенты равны единице:
∃ L2 :
∀h, k : ρ(hk, Rn \Ω)>L2 h ⇒ ck (h) = 1.
– 71 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
Для решения данной задачи создан алгоритм, позволяющий вычислить коэффициенты
кубатурной формулы, приближающей точное значение интеграла с погрешностью порядка
hm .
2.2. Алгоритм
Зададимся произвольным целым числом M, таким что M > np . Ниже мы приведем
алгоритм (см. [4–9]) вычисления
формулы, оптимальной по порядку на каждом
³ кубатурной
´
fpm (Ω) с m = n , M , т.е. универсально оптимальной по порядку на этом
из пространств W
p
классе пространств.
Учитывая оценки
° °
m
∃ C1 : °lhΩ °(W
f m (Q))∗ >C1 h
f m (Ω))∗ >C1 kl∞ k(W
p
p
для оптимальности по порядку достаточно иметь оценки сверху:
∃ C2 :
m
klhΩ k(W
f m (Ω))∗ 6C2 h ,
p
h → 0.
По следующей теореме универсально оптимальные по порядку кубатурные формулы с
ОПС являются универсально асимптотически оптимальными.
Теорема (М. Д. Рамазанов). Кубатурная формула с ОПС асимптотически оптимальна на каждом пространстве из множества
n
o
fpm (Ω))
W
m ∈ (m1 , m2 ),
p ∈ (p1 , p2 )
тогда и только тогда, когда она оптимальна на каждом из них по порядку, при
n
p < m1 < m2 < M, 1 < p1 < p2 < ∞.
В технических целях наложим дополнительные ограничения на условия задачи. Пусть
Ω — выпуклая область, лежащая внутри единичного гиперкуба вместе с замыканием: Ω ⊂
⊂ int Q, а параметр h стремится к нулю по одной из последовательностей, каждый член
которой можно представить в виде N −1 , где N ∈ N+ .
Алгоритм основан на сведении задачи интегрирования по области с гладкой границей к
нескольким однотипным задачам интегрирования по единичному гиперкубу. Для нашей области всегда можно подобрать специальное разбиение единицы — конечный набор функций
(будем называть их срезывающими), удовлетворяющий условиям:
1) они являются периодическими с основным периодом Q и в сумме составляют функцию, тождественно равную единице в фиксированной окрестности Ω̂ области Ω, целиком
лежащей в гиперкубе Q (периодически продолженной с основным периодом Q);
e M (Q);
2) они принадлежат пространству C
3) носитель одной из срезывающих функций лежит полностью внутри области Ω, не
пересекаясь с ее границей; пересечение носителя каждой из остальных срезывающих функций с границей ∂ Ω непусто и проектируется взаимно однозначно и гладко (класса C M ) на
одну из координатных гиперплоскостей;
Примем количество срезывающих функций за T + 1. Обозначим их как
{ϕτ (x)}T
τ =0 ,
T
X
ϕτ (x)|x∈Ω̂ ≡ 1.
τ =0
Функцию ϕ0 (x) подберем так, чтобы множество точек Eϕ0 , где она равна единице, находилось не ближе, чем на некотором расстоянии ε0 от границы области:
ρ(Eϕ0 , Rn \Ω)> ε0 ,
Eϕ0 := {x : ϕ0 (x) ≡ 1}.
– 72 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
Конкретный способ построения функций разбиения единицы приведем ниже.
Введем обозначения Υτ := supp ϕτ ∩ Ω и Γτ := supp ϕτ ∩ Γ.
R
Интеграл Ω dxf (x) можно представить в виде суммы интегралов:
Z
dxf (x) ≡
Ω
T Z
X
dx ϕτ (x)f (x).
Υτ
τ =0
Для удобства и универсальности программной реализации область Ω будем задавать
неявно — как множество точек, где неотрицательна гладкая функция Φ(x) :
Ω := {x : Φ(x)>0},
Φ(x) ∈ C M (Q).
При этом граница задается как
Γ := {x : Φ(x) = 0}.
Пусть градиент функции Φ(x) на границе не обращается в нуль:
∇Φ(x)|Γ 6= 0.
Наложенных на Φ(x) условий достаточно для того, чтобы уравнение для каждого из
участков границы в достаточно малой окрестности каждой точки границы можно было
разрешить относительно координаты, задающей направление, ортогональное гиперплоскости, на которую мы гладко проектируем Γτ :
∀τ ∃ jτ , ∃ γτ (x̂jτ ) :
Γτ ≡ {x ∈ Υτ : xjτ = γτ (x̂jτ )},
где x̂jτ := (x1 , . . . , xjτ −1 , xjτ +1 , . . . , xn ).
Если каждой области Υτ сопоставить функционал погрешности
X
cτk (h)δ(x − hk),
lhΥτ (x) := χΥτ (x) −
hk ∈ Υτ ,
k ∈ Zn
то общий функционал погрешности можно собрать из таких функционалов так:
lhΩ (x) :=
T
X
ϕτ (x)lhΥτ (x).
τ =0
При этом коэффициенты ck (h) функционала погрешности lhΩ (x) получаются следующим
образом:
T
X
ck (h) =
ϕτ (x)cτk (h).
τ =0
Так как в определении функционала погрешности lhΩ (x) каждый функционал lhΥτ (x)
умножен на срезывающую функцию ϕτ (x), мы можем в дальнейшем произвольно доопределять lhΥτ (x) вне supp ϕτ (x), не изменяя итоговой суммы.
Для того чтобы функционал погрешности lhΩ (x) был оптимальным по порядку в
m
f
Wp (Ω), достаточно оптимальности по порядку каждого из функционалов lhΥτ (x). Необходимо подобрать для каждого τ коэффициенты cτk (h) так, чтобы выполнялись оценки
m
klhΥτ k(W
f m (Ω))∗ ³O(h ).
p
– 73 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
Приведем результат, полученный в предположении, что уравнение для границы Γτ задается функцией, выражающей последнюю координату вектора x через остальные:
Γτ := {x ∈ Υτ : xn = γ(x0 )},
x0 := (x1 , . . . , xn−1 ),
и выполняется xn >γ(x0 ), ∀x ∈ Υτ .
Искомые коэффициенты:
 P
Pmin{k −σ−z,M +1}
M +1 1 PM +1 i−1 Pmin{kn −σ−1,M +1}

vzi r=1 n
vrp , kn >2 + σ

p=1 p
i=1 η
z=1
cτk :=
,

 0,
kn 61 + σ.
где vij — элементы матрицы, обратной к матрице, составленной из элементов определителя
Вандермонда.
Эту формулу для ускорения вычислений лучше переписать в виде:
 P
PM
min{tn ,M }

Rtn −i l=0 η l ṽil , tn >0

i=0
,
cτt (h) =

 0,
tn < 0
t0 := k 0 , tn := kn − σ − 2;
ṽij := vi+1, j+1 , i, j = 0, M ; Ri :=
M
X
i
1 X
ṽjp ,
p + 1 j=0
p=0
i = 0..M .
Для практической реализации алгоритма необходимо построить T + 1 срезывающих
PT
функций {ϕτ (x)}T
τ =0 ,
τ =0 ϕτ (x)|x∈Ω̂ ≡ 1, удовлетворяющих наложенным выше условиям.
Так как в алгоритме фактически используются лишь внутренние узлы области Ω, можно
не следить за разбиением единицы вне области и не соблюдать условие периодичности
срезывающих функций. То же касается и подынтегральной функции f (x) — она не обязана
быть периодичной и определенной вне области Ω.
Разбиение единицы произведем в два этапа. Вначале построим центральную срезывающую функцию ϕ0 (x), затем построим разбиение единицы для гиперкуба Q:
PT
{ψτ (x)}T
τ =1 ,
τ =1 ψτ (x)|x∈Q ≡ 1. И, наконец, получим окончательный вид срезывающих функций: ϕτ (x) := ψτ (x)(1 − ϕ0 (x)), τ = 1..T.
PT
PT
PT
При этом τ =0 ϕt (x) ≡ ϕ0 (x) + τ =1 ϕτ (x) ≡ ϕ0 (x) + (1 − ϕ0 (x))
τ =1 ψτ (x) ≡ 1, x ∈ Q.
Нам понадобится вспомогательная функция ξ(t) :


 R0, t < 0 R
t
1
ξ(t) :=
z(t)dt/ 0 z(t)dt, z(t) = (t(1 − t))M ,
06t < 1.
0

 1, 16t.
Центральную срезывающую функцию ϕ0 (x) зададим так:
¶
µ
ε1
Φ(x)
−
,
ϕ0 (x) := ξ
ε2 − ε1
ε2 − ε1
где Φ(x) — функция, задающая область Ω.

 0, Φ(x)6ε1
Тогда ϕ0 (x) =
p ∈ (0, 1), ε1 < Φ(x) < ε2 .

1, ε2 6Φ(x).
– 74 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
Таким образом, конкретный вид функции ϕ0 (x) зависит как от способа задания области
Ω, так и от параметров ε1 и ε2 .
Построим функции {ψτ (x)}T
τ =1 . Потребуем, чтобы центр гиперкуба Q принадлежал области Ω. Тогда, учитывая выпуклость области, можно построить ровно 2n срезывающих
функций (по числу граней гиперкуба), удовлетворяющих условиям, наложенным на них
выше. Далее будем считать T ≡ 2n.
Для удобства будем нумеровать координатные оси от 0 до n − 1, а систему функций
{ψτ (x)}2n
τ =1 заменим на систему
{ψ̃dim,dir (x)}dim=0..n−1, dir=±1 .
Первый индекс dim (от dimension) означает размерность, второй индекс dir (от direction)
— направление (отрицательное или положительное). Будем строить систему срезывающих
функций так, чтобы функция ψ̃dim,dir (x) «опиралась» на грань гиперкуба Q, ортогональную
оси xdim , и такой, чтобы xdim ≡ dir+1
для любой точки x, принадлежащей этой грани.
2
Под выражением «ψ̃dim,dir (x) опирается на грань» имеется в виду то, что соответствующая
срезывающая функция ϕ̃dim,dir (x), определяемая из
ϕ̃dim,dir (x) := ψ̃dim,dir (x)(1 − ϕ0 (x)),
dim = 0..n − 1, dir = ±1,
должна гладко и взаимнооднозначно проектировать вырезаемый ей участок границы области Ω на координатную плоскость, содержащую эту грань.
Зададим вначале разбиение единицы для двумерного случая. Введем вспомогательные
функции:
ψ̂(t, x) := ξ(xt)ξ((1 − t)x),
b
b
(1 − c)b
A−1 (t, b, c) := − t + b, A1 (t, b, c) := t −
.
c
c
c
Рассмотрим плоскость {x0 , x1 }. Зададим разбиение единицы:
ψ̃0,−1 (x0 , x1 ) := ψ̂(x1 , A−1 (x0 , b, c)),
ψ̃0,1 (x0 , x1 ) := ψ̂(x1 , A1 (x0 , b, c))ψ̃1,−1 (x0 , x1 ) + ψ̃1,1 (x0 , x1 ) :=
:= 1 − (ψ̃0,−1 (x0 , x1 ) + ψ̃0,1 (x0 , x1 )).
Основой для построения разбиения единицы в многомерном случае будут двумерные
разбиения во всевозможных координатных плоскостях. В n-мерном пространстве таких
плоскостей ровно n(n−1)
— число сочетаний из n по 2.
2
Каждую из плоскостей {xi , xj } будем разбивать двумя функциями:
ψ̆i,j := ψ̃i,−1 (xi , xj ) + ψ̃i,1 (xi , xj ),
ψ̆j,i := ψ̃j,−1 (xi , xj ) + ψ̃j,1 (xi , xj ).
Имеем:


ψ̆0,1









ψ̆0,n−1




 ψ̆1,2



ψ̆1,n−1












ψ̆n−2,n−1
+
...
+
+
...
+
...
...
+
ψ̆1,0
=1
ψ̆n−1,0
ψ̆2,1
=1
=1
ψ̆n−1,1
=1
ψ̆n−1,n−2
= 1.
– 75 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
n(n−1)
Перемножив левые части этих уравнений, получим выражение с 2 2
слагаемыми.
Каждое из этих слагаемых представляет собой функцию n переменных и может быть использовано в качестве одной из многомерных функций разбиения единицы. Однако количество слагаемых может быть очень велико — в десятимерном случае их 245 ≈ 35 · 1012 штук.
Сгруппируем
их в n слагаемых следующим образом:

˜
0

ψ̃
:=
Ψ̆
0

n−1 ,



˜
 ψ̃1 := Ψ̆1n−1 ,



 ˜

Ψ̆0i := ψ̆0,1 ψ̆0,2 . . . ψ̆0,i ,
 ψ̃2 := 1 − Ψ̆02 − Ψ̆12 ,
˜
, где Ψ̆1i := ψ̆1,0 ψ̆1,2 . . . ψ̆1,i ,
ψ̃3 := Ψ̆02 + Ψ̆12 − Ψ̆03 − Ψ̆13 ,



i = 0..n − 1.

...




˜

ψ̃n−1 := Ψ̆0n−2 + Ψ̆1n−2 − Ψ̆0n−1 − Ψ̆1n−1 ,



˜
Каждая из полученных функций ψ̃i легко разбивается на два слагаемых в зависимости
от знака выражения (xi − 0.5). Таким образом, получаем необходимые 2n функций ψτ разбиения единицы для гиперкуба Q, дающие искомую систему срезывающих функций. Для
наглядности приведем их на одном графике для n = 2, M = 2, b = 6, c = 0.5 (рис. 1).
Рис. 1. Функции {ϕτ }2n
τ =1
2.3. Программа
Программа “CubaInt” [10], предназначенная для вычисления многомерных интегралов по
ограниченным выпуклым областям с гладкими границами, тестировалась при следующих
параметрах:
– 76 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
1. n от 2 до 10.
2. f (x) =
Pn
i=1
ai xbi i .
3. M от 2 до 6.
4. N от 10 до 105 , где N – количество точек решетки на ребре единичного куба Q. При
этом шаг h = N −1 .
5. Ω = {x : Φ(x) = 0, Φ(x) = 1 −
Pn
i=1 ci (xi
− 0.5)di }.
6. P от 1 до 1000.
Для примера возьмем a
=
(2, 1, 2, 1, ..., 2, 1),
b
=
(2, 4, 2, 4..., 2, 4),c
=
(6.25, 39.0625, ..., 6.25, 39.0625), d = (2, 4, 2, 4..., 2, 4),
Точность вычислений рассчитывалась по устойчивости десятичных знаков в ответе при
уменьшении параметра h. Независимыми параметрами являются n, M, N и P . Приведем
некоторые результаты экспериментов.
Таблица 1. n = 2, порядки теоретических и экспериментальных погрешностей
Таблица 2. n = 3, порядки теоретических и экспериментальных погрешностей
Таблица 3. n = 5, порядки теоретических и экспериментальных погрешностей
– 77 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
В табл. 1–3 показаны порядки абсолютных погрешностей, полученных как при непосредственных вычислениях, так и при теоретической оценке. Как видно, результаты вычислений примерно соответствуют ожидаемым теоретически, уступая им, в основном, по
двум причинам. Во-первых, при малом количестве точек N и большом M фактическая
толщина пограничного слоя не обеспечивает нужных для обоснования теоретической точности свойств (вмещать 2M узлов). Во-вторых, при использовании типа long double с 18
значащими цифрами нет возможности увеличить точность выше 18-го порядка. Также не
следует забывать, что при расчете теоретической погрешности мы не учитывали норму
подынтегральной функции, которая может ухудшить результат.
Перейдем теперь к анализу быстроты счета и качества распараллеливания программы.
Для этого введем понятия ускорения и эффективности программы:
SP =
T1
,
TP
EP =
SP
,
P
где TP — время, за которое задача выполняется на P процессорах.
На рис. 2 показаны отклонения экспериментальных ускорений SP (темные ломаные) от
идеальных ускорений (светлые прямые).
Рис. 2. Ускорение вычислений
Как видно, эффективность распараллеливания постепенно падает с увеличением числа
процессоров. Это связано, в первую очередь, с особенностями распределения вычислительной работы по процессорам. Каждый процессор получает примерно одинаковое количество
узлов, однако вычислительная сложность в разных узлах различна. В результате процессоры не всегда загружаются равномерно, особенно при сложной форме области.
3.
Построение разбиения области интегрирования
3.1. Постановка задачи
Проблема вычисления интегралов по многомерным областям решается путем приближения интеграла решетчатыми кубатурными формулами с ограниченным пограничным слоем
– 78 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
(ОПС–формулы [4,5]). Этот алгоритм предусматривает вычисление интеграла как суммы
локальных интегралов по областям более простых форм, которые являются подобластями
Ω.
Пусть семейство {Ωτ }T
τ =0 образует покрытые области Ω. Это взаимно пересекающиеся открытые области с кусочно-гладкими границами, удовлетворяющие главному свойству: часть границы Г, попавшая в Ωτ может быть задана явной формулой, выражающей одну из координат однозначной функцией класса C M от остальных координат,
xsj = γj (x1 , ..., xsj−1 , xsj+1 , ...xn ).
Такую систему подобластей можно выбрать с помощью разбиения единицы. Это коT
нечный набор финитных функций {ϕτ }τ =0 , сумма которых тождественно равна единице:
T
P
ϕτ (x) ≡ 1, для x ∈ Q. У нас они принадлежат пространству C̃ M (Q).
τ =0
Для каждой функции ϕτ строится своя кубатурная формула.
Таким образом, итоговая кубатурная формула для области Ω выглядит следующим обT
P
P τ
ck (h)ϕτ (hk)f (hk), Ωτ = Ω ∩ suppϕτ .
разом: KhΩ (h) =
τ =0 kh∈Ω
То есть приближение интеграла кубатурной формулой сводится к приближению интеграла суммированием кубатурных формул более простого вида.
Наша цель – создать программу, которая автоматически разбивает области произвольных форм на нужные подобласти. Эта задача решена для произвольных двумерных ограниченных областей с гладкими границами.
3.2. Описание алгоритма
Дадим описание конструктивного алгоритма разбиения единицы для такой области Ω.
В общем случае расположенная в единичном кубе Q = [0, 1)n область Ω задается следующим образом: Ω = {x|Φ(x) > 0} ⊂ Q, Φ(x) ∈ C M ([0, 1]n ). Ее граница Г={x|Φ(x) = 0}.
Достаточным условием гладкости границы является условие DΦ(x)| 6= 0.
Для дальнейших построений будем использовать вспомогательную функцию ξ(t), определенную в п. 2.
Разбиение единицы проведем в два этапа. Сначала построим центральную срезывающую
функцию ϕ0 (x), затем приграничные срезывающие функции. Получим окончательный вид
T
P
срезывающих функций: ϕτ (x) = ψτ (x)(1 − ϕ0 (x)), τ = 1..T и
ϕτ ≡ 1 в некоторой окрестτ =0
ности Ω.
1
Центральную срезывающую функцию зададим как в п. 2: ϕ0 (x) = ξ( εΦ(x)
− ε2ε−ε
). Па2 −ε1
1
раметры ε1 и ε2 подбираются исходя из условия, чтобы функция ϕ0 (x) была сосредоточена
в Ω и равна 0 в некоторой окрестности границы Г.
Мы решаем задачу для двумерных областей Ω.
Возьмем простейшую область – круг, лежащий в единичном квадрате, со следующими
значениями параметров ε1=0.2, ε2=0.5, α =0.3, β=0.05, M=3.
4
P
Наше разбиение единицы имеет следующий вид: ϕ0 (y) +
ϕτ (y) = ϕ0 (y) + (1−
τ =1
−ϕ0 (y))(ψ1 (y2 ) + ψ2 (y2 ) + ψ3 (y) + ψ4 (y)) = 1, где функции ψτ (y) можно задать следую), ψ2 (y2 ) = ξ(−y2 − 1−α−β
), ψ3 (y) = ξ(y1 − 1−α−β
) · (1−
щим образом: ψ1 (y2 ) = ξ(y2 − 1−α−β
β
β
β
1−α−β
))
β
· (1 − ψ1 (y2 ) − ψ2 (y2 )), где α и β подбирают4
P
ся в зависимости от ширины пограничного слоя. Причем
ψτ = 1 на носителе функции
−ψ1 (y2 ) − ψ2 (y2 )), ψ4 (y) = (1 − ξ(y1 −
τ =1
– 79 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
Рис. 3. Область {y|Φ1 (y) > 0}
(1 − ϕ0 (E)), тогда и
4
P
τ =0
ϕτ (y) = 1, y ∈ [0, 1]2 .
Таким образом, функции {ϕτ }4τ =0 – искомые срезывающие функции для круга.
Если бы это был n-мерный шар, то количество срезывающих функций было бы равно
2n+1, где n – размерность пространства. Для круга их было 4 (вместе с центральной – 5).
Перейдем к построению разбиения единицы для произвольной двумерной области с гладкой границей.
∇Φ(y)
Сделаем замену переменных x = |∇Φ(y)|
. Она является гладким отображением приграничной полоски, в которой 1 − ϕ0 (x) 6= 0, на единичную сферу, |y| = 1. А в переменных y
P
применим функции ψτ (y),
ψτ (y)||y|=1 = 1.
Приведем примеры разбиения единицы для некоторых невыпуклых областей. На
рис. 4 изображено разбиение для области {x|Φ2 (x) > 0} с границей Φ2 (x) = 1−
p
2
2
1 −0.5) (x2 −0.5)
− 8(x1 − 0.5)2 + 8(x2 − 0.5)2 + ((x2(x
2
2 2 = 0 с параметрами ε1=0.2, ε2=0.5, α
1 −0.5) +(x2 −0.5) )
=0.3, β=0.05, M=3.
Рис. 4. Область Φ2 (x) > 0
Следует отметить, что предложенный алгоритм получения разбиения единицы универсален. Он не зависит от формы и расположения области.
Например, повернем область, заданную на рис. 4, на 1 радиан. Тогда уравнение границы
запишется в следующем виде:
– 80 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
Φ3 (x) = 1 −
+
p
8(x1 − 0.5)2 + 8(x2 − 0.5)2 +
2(x1 − 0.5)(x2 − 0.5) sin(1) + cos(1)((x1 − 0.5)2 − (x2 − 0.5)2 )2
= 0.
((x1 − 0.5)2 + (x2 − 0.5)2 )2
Заметим, что разбиение единицы автоматически подстроилось под новую форму области
(относительно декартовой системы координат) (рис. 5).
Рис. 5. Область Φ3 (x) > 0
Проиллюстрируем результат еще несколькими примерами разбиения невыпуклых обла1
стей более сложных форм. На рис. 6 изображена область с границей Φ4 (x) = 16
− 625((x1 −
2
2
2
2
4
2
2
0.5) +(x2 −0.7) )((x1 −0.2) +(x2 −0.2) )·((x1 −0.4) +(x2 −0.9) )++(x1 −0.4) +(x2 −0.6)2 = 0.
Рис. 6. Двусвязная область {x|Φ4 (x) > 0}
Φ5 (x) =
1
2
2
4
4
− 150((x1 −0.3) + (x2 −0.7) )((x1 −0.2) + (x2 −0.2) ) = 0
16
На рис. 8 и 9 изображены соответственно области
q
2
2
Φ6 (x) = 16 (x1 −0.5) + (x2 −0.5) − 5+
– 81 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
Рис. 7. Область {x|Φ5 (x) > 0}
Рис. 8. Область {x|Φ6 (x) > 0}
4
+
2
2
4
(x1 −0.5)((x1 −0.5) + −10(x1 −0.5) (x2 −0.5) + 5(x2 −0.5) )
2
2
5
((x1 −0.5) + (x2 −0.5) ) 2
=0
и
2
2
Φ7 (x) = ((x1 −0.4) + (x2 −0.4) ) −
16
2
2
2
((x1 −0.4) + (x2 −0.4) ) − ((4x1 −0.9) +
3
9
2
2
2
+(4x2 −0.9) − −1) · ((4x1 −0.9) + (4x2 −0.9) ) = 0
2
3.3. Описание программы
По изложенному алгоритму была создана программа на языке программирования С++,
подробно закомментированная. Перед ее использованием необходимо провести вспомогательные действия: подсчитать производные границы области интегрирования Ω, которые
необходимы для вычисления градиента.
Входными данными в программе являются гладкость функции М, ширина пограничного слоя α и β, параметры ε1 и ε2 и количество точек N на стороне единичного квадрата.
Главный цикл программы пробегает по всем узлам решетки, и для каждой срезывающей
функции рисуется свой график по точкам. Координаты точек записываются в соответствующий текстовый файл, а рисунок выводится на экран.
– 82 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
Рис. 9. Область {x|Φ7 (x) > 0}
4.
Решение интегральных уравнений
4.1. Алгоритм
Напомним постановку задачи.
Пусть в области Ω̄ ⊂ R2 задана функция f (x) и функция K(x, y). Наша задача – найти
функцию u(x), удовлетворяющую уравнению
Z
K(x, y)u(y)dy = f (x), x ∈ Ω̄ ⊂ R2 .
u(x) −
Ω
Здесь Ω – ограниченная замкнутая область с гладкой границей, лежащая внутри единичного квадрата (0, 1)2 , K ∈ C M (Ω̄ × Ω̄) и f ∈ C M (Ω̄).
В связи с тем, что изначально планировалось применение многопроцессорной вычислительной техники, необходимо было использовать такие алгоритмы численного решения
интегральных уравнений, при распараллеливании которых не возникнут трудности. Для
решения данного уравнения был выбран итерационный метод, позволяющий получить относительно простые численные алгоритмы решения интегральных уравнений. Предположим, что ||K||C(Ω̄×Ω̄) = θ < 1. Можно применить метод последовательных приближений.
За начальное приближение берется u0 (x) = f (x). Последующие приближения строятся по
R
рекуррентной формуле us+1 (x) = f (x) + K(x, y)us (y)dy, s = 1, 2, .... Последовательность
Ω
функций {us (x)} является приближением к искомому решению данного уравнения в норме
пространства C(Ω̄). Было показано, что решение интегрального уравнения u(x) обладает
той же гладкостью, что ядро интегрального оператора и правая часть уравнения.
При численной реализации этого метода для вычисления интеграла на каждой итерации используется решетчатая кубатурная формула с ограниченным пограничным слоем
(ОПС-формула) (см. п. 2). Для приближенного вычисления интеграла создан алгоритм (см.
[5,7,8]), который позволяет вычислить коэффициенты кубатурной формулы, приближающей точное значение интеграла с погрешностью порядка (h/α)m , m – гладкость интегрируемой функции, α – параметр локализации области интегрирования (см. п. 3).
Отметим, что выбор решетчатых кубатурных формул позволяет достичь необходимой
универсальности и единообразия в интегрировании по областям произвольных форм вследствие того, что последовательности решеток не зависят от форм областей интегрирования.
– 83 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
А использование ОПС–формул позволяет использовать алгоритмы вычисления коэффициентов формул с хорошими и теоретически обоснованными аппроксимационными свойствами.
4.2. Описание программы
В этой части рассмотрена возможность применения решетчатых кубатурных формул к
решению интегральных уравнений с произвольной формой области интегрирования. Исходя из изложенных алгоритмов была написана программа численного решения интегрального уравнения вида (1). Программа написана на языке С++ с использованием библиотеки параллельных функций MPI. Методом последовательных приближений вычисляется
последовательность {us }, сходящаяся к точному решению данного интегрального уравнения. Процесс вычисления заканчивается при выполнении условия ||us − us−1 || ≤ ε, где
||u|| = max |u(x)|, ε – заранее заданная точность.
x
Входные данные программы:
1. Область интегрирования Ω, которая задается в неявном виде: Ω̄ = {x|Φ(x) > 0},
Φ(x) ∈ C M (Q), Ω̄ ⊂ (0, 1)2 .
2. Функция K(x1 , y1 , x2 , y2 ), max |K(x, y)| < 1.
x,y
3. Функция f (x1 , x2 ).
4. Шаг кубической решетки h < 0.01, он задается как h = 1/N , где N – натуральное
число.
5. Параметры срезывающих функций.
6. Параметр гладкости M .
7. Количество процессоров P .
Приближенным решением интегрального уравнения является результат последней итерации, который выводится в виде табличного значения функции us (x) в узлах x = hk ∈
∈ Ω̄ ⊂ R2 .
Программа тестировалась на суперкомпьютерах МВС-15000ВМ и МВС-50К Межведомственного Суперкомпьютерного Центра РАН.
Приведем результаты вычислительного эксперимента решения интегрального уравнения
с выпуклой областью интегрирования [3]. Для того чтобы иметь возможность сравнения
с точным решением уравнения, мы задавались функцией, которая должна быть точным
решением, и по ней вычислялась правая часть уравнения. Вычислительный эксперимент
проводился с этой правой частью.
Расчеты проводились со следующими данными. В качестве точного решения была взята
функция ū(x) = (x1 − x2 )5 .
1. K(x, y) = (x1 y1 + x2 y2 )3 .
2. f (x) = (x1 − x2 )5 − (0.00099x31 + 0.0007x2 x21 − 0.00059x22 x1 − 0.00093x12 ).
2
3. Область интегрирования Ω̄ = {x|Φ1 (x) > 0}, Φ1 (x) = 1 − ((x1 − 0.5)/0.4) −
4
− ((x2 − 0.5)/0.4) , (рис. 10).
4. Шаг кубической решетки h = 1/N , N = 200, 300.
5. Гладкость M = 2, 3.
6. Параметры срезывающих функций , ε2 = 0.5, α = 0.1, β = 0.05.
7. Количество процессоров 100-1000.
Теоретическая ожидаемая точность – O(hM ), без учета влияния ширины пограничного
слоя, в данном примере M =2, h = 1/200, ожидаемая точность – 10−5 .
Точность вычислений рассчитывалась двумя способами. Сравнением с известным точным решением (погрешность обозначена ε0 ) и по правилу Рунге – по устойчивости десятич– 84 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
Рис. 10. Область Φ1 (x) > 0
ных знаков в ответе при уменьшении h (погрешность обозначена ε).
В табл. 4 приведены результаты вычислительного эксперимента.
Таблица 4. Достигнутая точность при учтенной гладкости M = 2
k - номер итерации
1
2
3
4
h = 1/200
ε
0.0987
0.000776
0.0000268
0.00000310
h = 1/300
ε
0.0988
0.000778
0.0000269
0.00000310
В табл. 4 точность рассчитывалась по устойчивости десятичных знаков. При сравнении
результата последней итерации с точным решением ū(x) = (x1 − x2 )5 получили совпадение
5-6 знаков после запятой.
Следует отметить, что программа предназначена для интегральных уравнений вида (1)
с произвольной формой области интегрирования. В связи с чем был проведен вычислительный эксперимент для невыпуклой
области. Приведем результаты тестирования для
p
области Φ2 (x) > 0, Φ2 (x) = 1 − 8(x1 − 0.5)2 + 8(x2 − 0.5)2 + +(2(x1 − 0.5)(x2 − 0.5) sin(1) +
cos(1)((x1 − 0.5)2 − (x2 − 0.5)2 )2 )/((x1 − 0.5)2 + (x2 − 0.5)2 )2 , изображенной на рис. 5, с
параметрами срезывающих функций: ε1 = 0.1, ε2 = 0.5, α = 0.1, β = 0.05.
Точность рассчитывалась по устойчивости десятичных знаков. Получили, что теоретически ожидаемая точность (h/α)M порядка 10−5 достигается на пятой итерации при
N = 250, M = 3, α = 0.1.
Далее приведем анализ эффективности распараллеливания. В табл. 5 указано время
работы программы на разном количестве процессоров и подсчитаны ускорение и эффективность.
Таблица 5. Время счета (с) при разном числе Р процессоров, h = 1/200, M = 2.
Достигнутая точность 10−5
P
TP
Sp
Ep
10
230
10
1
20
127
18
0.9
30
93
24.7
0.8
– 85 –
40
75
36
0.8
50
63
42.6
0.72
100
36
63.8
0.63
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
На графике (рис. 11) изображена зависимость ускорения от количества процессоров.
100
80
60
s
40
20
0
0
20
40
60
80
100
p
Ideal
Experiment
Рис. 11. Зависимость ускорения от количества процессоров
5.
Заключение
Суммируем выводы по описанным выше программам.
Создана программа приближенного интегрирования “CubaInt”. Анализ скорости работы программы показал, что эффективность распараллеливания снижается с увеличением
числа процессоров, и это связано с, вообще говоря, различной сложностью вычисления коэффициентов кубатурной формулы в разных узлах. Отметим, что даже в случае идеальной
эффективности программы нет смысла увеличивать размерность пространства выше 10 и
количество узлов выше 1012 .
Разработан алгоритм автоматического разбиения двумерных областей произвольных
форм с гладкими границами на подобласти и создана программа, реализующая этот алгоритм. Этот алгоритм позволяет построить разбиение и в n-мерном случае (даже для
несвязных и не односвязных областей). Однако метод не подходит для областей с кусочногладкими границами.
Для наглядности показаны картинки только для двумерного случая, для размерностей
больше 3 осложняется иллюстрация результатов, но алгоритм также работает. Результаты
опубликованы в [2].
И наконец, оправдано применение ОПС-формул для численного решения интегральных уравнений. Применение итерационного метода в сочетании с решетчатой кубатурной
ОПС-формулой позволяет достичь точности порядка 10−5 за 5-6 итераций. Отметим, что
этот алгоритм решения интегральных уравнений позволяет хорошо распараллелить вычислительную программу для применения многопроцессорных вычислительных систем. На
данный момент эффективность распараллеливания около 63 %. Это связано с тем, что
количество последовательных операций становится сравнимым с количеством параллельных операций и значительная часть процессоров простаивает. В дальнейшем планируется
повысить эту эффективность путем внесения изменений в алгоритм.
Работа выполнена при поддержке Программы № 14 Президиума РАН, Программы целевых расходов Президиума РАН «Поддержка молодых ученых» и Российского фонда фун– 86 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
М.Д. Рамазанов, Д.Я. Рахматуллин, Л.З. Валеева, Е.Л. Банникова. Решение интегральных уравнений . . .
даментальных исследований (№ 06-01-00597).
Список литературы
[1] Игнатьев А.Н. Универсальный алгоритм вычисления интегралов по ограниченным областям с гладкими границами. Кубатурные формулы и их приложения. Уфа: ИМВЦ
УНЦ РАН, 1996. С. 21–31.
[2] Валеева Л.З. Применение локализации алгоритма кубатурных формул для решения
интегральных уравнений. Сб. статей II Межд. конференции "Математическое и компьютерное моделирование естественнонаучных и социальных проблем". Пенза, 2008.
С. 14-17.
[3] Банникова Е.Л. Программа численного решения интегральных уравнений Фредгольма
второго рода “IntUr”. Свидетельство №10418 от 15.04.2008.
[4] Рахматуллин Д.Я. Интегрирование функций по выпуклым областям на многопроцессорных вычислительных системах: Автореф. дис... канд. физ.-мат. наук. - Уфа: ИМВЦ
УНЦ РАН, 2006. - 22 с.
[5] Рамазанов М.Д. Теория решетчатых кубатурных формул с ограниченным пограничным слоем. Препринт 2007-1 – Уфа: ИМВЦ УНЦ РАН, 2007. – 105 с.
[6] Рамазанов М.Д. Лекции по теории кубатурных формул. Уфа: Изд-во БашГУ, 1973.
177 с.
[7] Соболев С.Л., Васкевич В.Л. Кубатурные формулы. Новосибирск: Изд-во ИМ СО РАН,
1996. 484 с. С. 254—263.
[8] Рахматуллин Д.Я. Вычисление интегралов по многомерным областям на многопроцессорных вычислительных системах // Вычислительные технологии. Т. 11, 3, 2006.
С. 118-125.
[9] M.D.Ramazanov To the Lp -Theory of Sobolev Formulas //Siberian advances in
mathematics. 1999. Vol. 9, N 1. P. 99-125.
[10] Рахматуллин Д.Я. Программа интегрирования по многомерным областям “CubaInt”.
Свидетельство № 2007614331 от 10.10.2007.
Solving of Integral Equations
on Multiprocessing Computing Systems
Marat D. Ramazanov, Djangir Y. Rakhmatullin,
Leysan Z. Valeeva and Ekaterina L. Bannikova
Institute of Mathematics with Computing Centre
112 Chernyshevsky str., Ufa, 450077 Russia
It is described Fredholm equations for the various forms of domains. It is reduced the description of the
algorithm of approximate calculation of integrals using multiprocessing technology.
Key words: multiprocessing systems, approximate calculation of integrals, multiprocessing technology.
– 87 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Journal of Siberian Federal University. Engineering & Technologies 1 (2009 2), 88-99
УДК 681.5.015
Дисперсионные характеристики
статических моделей
стохастических объектов
А.И. Рубан∗
Сибирский федеральный университет,
660041 Россия, Красноярск, Свободный, 791
Получена 15.05.2008, окончательный вариант 15.06.2008, принята к печати 10.03.2009
Построены дисперсионные характеристики, определяющие качество статических параметрических моделей стохастических объектов, и найдены их оценки при предположении, что условная
дисперсия выхода постоянна. Параметрические модели, нелинейные по каналу "вход-выход" , но
линейные относительно оптимизируемых параметров. Показано, что непараметрическая оценка регрессии близка к объективно существующей идеальной модели и по оценкам дисперсионных
характеристик можно следить за изменением качества субоптимальных параметрических моделей при подборе их структуры. На тестовых численных примерах произведено сравнение качества непараметрической и параметрической моделей при различном уровне помех.
Ключевые слова: дисперсионная идентификация, статическая параметрическая модель, стохастический объект, непараметрическая оценка регрессии.
Введение
Рассматриваем объект, который имеет один вход X и один выход Y. X и Y являются
непрерывными случайными величинами. Особое место среди идеализированных характеристик (моделей) стохастического объекта занимает регрессия
Z∞
M {Y |x} ≡= η(x) =
yf (y|x)dy,
(1)
−∞
которая представляет собой среднюю зависимость между выходом и входом объекта [1, 2].
Регрессия η(X) удовлетворяет критерию минимума среднего квадратического отклонения выходов объекта и модели
η(X) = arg min MY,X {(Y − η̄(X))2 }.
η̄(X)
(2)
Минимальное значение оптимизируемого в (2) квадратичного показателя
D1 = MY,X {(Y − η(X))2 }
(3)
названо в [1, 2] средней условной дисперсией. Там же введена средняя дисперсия
регрессии
D2 = MX {(η(X) − mY )2 }
(4)
∗
1
Corresponding author E-mail address: ai-rouban@mail.ru; rouban@mail.ru
c Siberian Federal University. All rights reserved
°
– 88 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А. И. Рубан. Дисперсионные характеристики статических моделей стохастических объектов
и приведена теорема о разложении дисперсии выхода объекта DY = MY {(Y − mY )2 } на
сумму дисперсий D1 и D2 :
DY = D1 + D2 ≡ MY,X {(Y − η(X))2 } + MX {(η(X) − mY )2 }.
(5)
В дальнейшем для упрощения записи формул убираем индексы операторов математического ожидания M {·}, где были указаны случайные величины, по которым ведется
усреднение.
На основе средней дисперсии регрессии D2 строится [1, 2] безразмерная характеристика
– дисперсионное отношение
p
ηY |X = D2 /DY ,
(6)
которое принадлежит интервалу [0; 1]. Показано также, что дисперсионное отношение равно
коэффициенту корреляции между выходом объекта и выходом модели в виде регрессии:
ηY |X ≡ RY |η(X) =
M {[Y − mY ][η(X) − mη(X) ]}
,
σY ση(X)
(7)
√
√
где mY , mη(X) –– математические ожидания, причём mη(X) = mY ; σY = DY , ση(X) = D2
–– средние квадратические отклонения. Кроме того, квадрат нормированного коэффициY )(X−mX )}
ента корреляции rY X = M {(Y −m
между Y и X не превосходит квадрата дисперσY σX
сионного отношения
2
rXY
≤ ηY2 |X .
(8)
Дисперсионное отношение ηY |X достигает предельных значений в следующих случаях.
ηY |X = 0, если выход объекта Y не зависит от входа X. Обратное утверждение верно не
всегда.
ηY |X = 1, если Y и X связаны жесткой зависимостью в виде функции Y = =(X). Тогда
M {Y |X} = =(X). В этом случае другие воздействия (кроме X) не влияют на выход Y и
D1 = 0 (т. е. D2 = DY ).
Неравенство (8) позволило [1, 2] построить характеристику
v
s
u 2
u ηY |X − rY2 X
r2
γY |X = t
= 1 − 2Y X
(9)
2
ηY |X
ηY |X
которая названа относительной степенью нелинейности по каналу вход X выход Y и
находится в интервале [0; 1]. По её величине можно судить о степени линейности (или нелинейности) истинных усреднённых характеристик объекта или, как говорят, "о линейности
(или нелинейности) объекта". При γY |X = 0 объект линейный, при γY |X = 1 –– нелинейный.
В работах [3, 4] на основе использования непараметрической оценки Розенблатта -—
Парзена для плотностей распределения вероятностей [5, 6] построены сравнительно простые
и эффективные оценки вышеуказанных дисперсионных характеристик.
Постановка задачи
При разработке моделей объектов стремятся построить хорошие — субоптимальные –
параметрические нелинейные модели и количественно оценить их качество. При этом все
вычисления должны быть выполнены на основе одной реализации синхронных измерений
– 89 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А. И. Рубан. Дисперсионные характеристики статических моделей стохастических объектов
входа и выхода объекта. Вычислительная схема количественного оценивания теоретических
характеристик качества линейной (по каналу "вход-выход") параметрической модели на
основе экспериментальных данных построена в [3, 4, 6]. В основе решения лежит использование состоятельной непараметрической оценки регрессии. В этой оценке важно "хорошо"
настроить (для каждой конкретной реализации измерений входа и выхода объекта) так
называемый коэффициент размытости. После его получения мы располагаем хорошей по
своей сути (состоятельной "в статистическом смысле слова") моделью. Её в дальнейшем
можно применять (и это часто с успехом делают) при решении достаточно сложных проблем, например, при синтезе эффективных алгоритмов: классификации в распознавании
образов, адаптивного оптимального управления, глобальной оптимизации.
Наряду с несомненным достоинством непараметрической оценки регрессии (за счёт универсализма и состоятельности) она имеет недостатки. Первый из них состоит в том, что
при расчёте её (даже для каждого фиксированного X = x значения входа) приходится
непрерывно "перелопачивать" выборку (экспериментальные данные). Во-вторых, оценка
представляет собой "универсальный вычислитель" , который позволяет практически для
любого стохастического объекта на основе "синхронных" измерений его входа и выхода вычислять однозначную высокого качества статическую модель без привлечения априорной
информации. Непараметрической модели в таком специфичном виде нельзя придать физический смысл и очень трудно в неё включить априорную информацию о ранее полученных
параметрических моделях. Её трудно адаптировать к изменяющимся условиям, и она не
обладает прогнозирующим свойством.
Человечество на протяжении всей своей истории с успехом применяет субоптимальные
параметрические модели и не спешит заменять их другими моделями, да и острой необходимости в этом не существует. Параметрические модели удобны при адаптации к изменяющимся условиям и при прогнозировании свойств объектов. По этой причине возникает
проблема количественного оценивания качества предлагаемых исследователем параметрических нелинейных моделей. В представленной работе предложен путь решения этой проблемы. Общая схема та же, что и при оценивании качества линейных (по каналу вход-выход
объекта) параметрических моделей [3, 4, 6].
В предлагаемой работе построены теоретические статистические характеристики (дисперсионные характеристики) и вычислительные алгоритмы их оценивания (на основе измерений входа и выхода объекта). На численных примерах продемонстрирована правильность
предложенного способа оценивания качества получаемых моделей.
Дисперсионные характеристики параметрических моделей
Построим дисперсионные характеристики нелинейных параметрических статических моделей стохастических объектов. Берём за основу широко распространённую параметрическую
нелинейную (по каналу вход–выход) модель объекта с линейными параметрами
Ye = α0 +
m
X
αj ϕj (X),
j=1
– 90 –
(10)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А. И. Рубан. Дисперсионные характеристики статических моделей стохастических объектов
параметры α0 , α1 , . . . , αm которой найдены из критерия минимума среднего квадратичm
P
ᾱj ϕj (X)
ного отклонения выхода объекта Y и модели ᾱ0 +
j=1
α0 , α1 , . . . , αm = arg
min
ᾱ0 ,ᾱ1 ,...,ᾱm
M {[Y − ᾱ0 −
m
X
ᾱj ϕj (X)]2 }.
(11)
j=1
Модель (10) субоптимальная, т. е. она оптимальная (в смысле квадратичного критерия
(11)) по параметрам в классе моделей выбранной структуры.
Как и для регрессии справедлива теорема о разложении дисперсии выхода объекта на две дисперсионные компоненты:
DY = M {(Y − Ye )2 } + M {(Ye − mY )2 } ≡ D1,парам + D2,парам .
(12)
Средняя дисперсия D2,парам = M {(Ye − mY )2 } характеризует ту часть дисперсии DY
выхода объекта Y, которая вызвана влиянием входной переменной X, и это влияние описано
с помощью субоптимальной модели (10).
Если объект полностью описан моделью (10) (т. е. нет дополнительных воздействий на
объект и нет дополнительной стохастичности внутри объекта; в этом случае Y = Ye ), то
D1,парам = 0 и D2,парам = DY .
Если объект никак не описан моделью (10), то D1,парам = DY и одновременно
D2,парам = 0.
По аналогии с дисперсионным отношением (6), в котором использована оптимальная
модель в виде регрессии η(X) введём дисперсионное отношение, основанное на применении
субоптимальной модели Ye (10),
s
ηY |X,парам =
D2 , парам
.
D{Y }
(13)
Оно также лежит в интервале [0; 1] и равно нормированному коэффициенту корреляции
RY |Ye между выходами объекта и модели (10) (RY |Ye называют часто множественным коэффициентом корреляции):
ηY |X,парам ≡ RY |Ye =
M {[Y − mY ][Ye − mY ]}
,
σY σYe
(14)
q
где M {Ye } = mY , σYe = MX {[Ye − mY ]2 }.
Для дисперсионных отношений (6), (13) справедливо неравенство:
ηY |X,парам ≤ ηY |X .
(15)
Об улучшении качества субоптимальной параметрической модели Ye можно судить по
приближению ηY |X,парам к ηY |X , что эквивалентно приближению D2,парам к D2 .
Введём коэффициент
s
s
ηY |X,парам
D2,парам
M {[Ye − mY ]2 }
λYe ⇔η =
≡
≡
,
(16)
ηY |X
D2
M {(η(X) − mY )2 }
– 91 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А. И. Рубан. Дисперсионные характеристики статических моделей стохастических объектов
который характеризует степень близости параметрической модели Ye = α0 +
m
P
αj ϕj (X) и регрессии η(X). Заметим, что λYe ⇔η представляет собой усреднённую
+
j=1
дисперсионную характеристику.
Если коэффициент λYe ⇔η равен единице, то обе модели в среднем одинаково хорошо
описывают объект, т. е. субоптимальная параметрическая модель (10) достигла своих предельных свойств –– она лучшая.
Если коэффициент λYe ⇔η меньше единицы, то параметрическая модель хуже регрессии
и есть необходимость улучшать параметрическую модель за счёт замены одних базисных
функций ϕj (X) другими или добавления новых базисных функций.
Если даже λYe ⇔η = 1, то это не означает, что объект хорошо описан с помощью построенной модели Ye . Можно лишь утверждать, что в среднем качество описания объекта
на основе субоптимальной параметрической модели Ye и на основе регрессии одинаковое.
Если же при этом одинаковые дисперсионные отношения ηY |X,парам = ηY |X меньше единицы, то для получения лучшей модели необходимо кроме выбранных входов использовать
дополнительные входные воздействия объекта и заново строить модель.
Используем также относительный коэффициент корреляции между выбранной параметрической моделью и регрессией:
M {[Ye − mY ][η(X) − mY ]}
q
<Ye ⇔η = q
.
M {[Ye − mY ]2 }
M {[η(X) − mY ]2 }
(17)
Модуль этого коэффициента корреляции |<Ye ⇔η | по своей сути эквивалентен коэффициенту
λYe ⇔η .
Непараметрическая оценка регрессии
Исходной информацией служит независимая выборка: (xi , yi ), i = 1, n. Считаем, что
условная дисперсия выхода объекта является постоянной (не зависит от входа): D{Y |x} ≡
≡ MY {[Y − η(x)]2 |X = x} = const. Эта гипотеза похожа на используемое в методе наименьших квадратов предположение, что измерения выхода объекта "равноточные".
Состоятельная оценка регрессии, построенная на основе использования непараметрической оценки условной плотности распределения вероятности [5, 6],
¡
¢
µ
¶
µ
¶
n
i
X
K x−x
x − xi
x − xi
h
M̂ {Y |x} ≡ ηn (x) =
KN
(18)
yi , KN
= P
´
³
n
h
h
x−xj
i=1
K
h
j=1
относится к классу универсальных оценок. Здесь K(·) –– ядро, h –– коэффициент размытости. Ядра лучше брать усечёнными (в целях существенного сокращения объема вычислений) и достаточной степени гладкости, например параболическим:
½
0.75(1 − z 2 ), |z| ≤ 1,
K(z) =
0,
1 ≤ |z|.
Оценка (18) представляет собой выпуклую комбинацию измерений yi выхода объекта. Веса KN (·) в этой выпуклой комбинации определяются входом объекта. Чем ближе
измерение xi к значению x, для которого рассчитывается оценка ηn (x), тем значение нормированного колоколообразного ядра KN (·) больше.
– 92 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А. И. Рубан. Дисперсионные характеристики статических моделей стохастических объектов
Коэффициент размытости h вычисляется из решения экстремальной задачи, в которой
квадратичный показатель соответствия выхода объекта и выхода модели на системе экспериментальных точек построен либо "методом скользящего экзамена":
I1 =
n
X
h
i=1
µ
n
X
(yi − η̄n (xi ))2 = min, η̄n (xi ) =
KN
j=1,j6=i
xi − xj
h
¶
yj ,
(19)
либо прямым разбиением выборки на две части (по одной строится оценка регрессии, а по
другой —– минимизируемый показатель):
I2 =
X
(yi − ηn2 (xi ))2 = min, ηn2 (x) =
h
i∈Mn1
X
µ
KN
j∈Mn2
x − xj
h
¶
yj .
(20)
Здесь номера первой части выборки образуют множество Mn1 мощности n1 и аналогично
номера второй части выборки образуют множество Mn2 мощности n2 . Примером множеств
Mn1 и Mn2 служат нечётные и чётные номера измерений в упорядоченной по xi выборке:
(xi , yi ), i = 1, n.
При равномерных отсчётах по оси x, т. е. при xi+1 − xi = ∆, i = 1, n − 1, целесообразно перейти от размерного коэффициента размытости h ядра к безразмерному β = ∆/h,
лежащему в интервале [0; 1] :
µ
KN
x − xj
h
¶
µ
= KN
∆ x − xj
h ∆
¶
µ
= KN
β
x − xj
∆
¶
.
При построении непараметрической оценки регрессии теперь необходимо настраивать коэффициент β по вышеуказанным критериям.
Оценивание дисперсионных характеристик
Предположение, что условная дисперсия D{Y |x} = const, приводит к тому, что при
расчёте математических ожиданий M {ψ(X, Y )} на основе экспериментальных данных
(xi , yi ), i = 1, n надо перейти к обычному оператору "среднего арифметического":
n
M {ψ(X, Y )} ⇒ M̂ {ψ(X, Y )} ≡
1X
ψ(xi , yi ).
n i=1
Оценка является несмещённой, состоятельной, асимптотически нормально распределённой (при сравнительно слабых ограничениях для усредняемых переменных).
Вычисляем оценку дисперсионного отношения (6):
s
η̂Y |X =
v
uP
u n (η (x ) − m̂ )2
u
n i
Y
D̂2
u
= u i=1P
,
t n
D̂Y
2
(yi − m̂Y )
(21)
i=1
n
D̂2 =
n
n
1X
1X
1X
(ηn (xi ) − m̂Y )2 , m̂Y =
yi , D̂Y =
(yi − m̂Y )2 .
n i=1
n i=1
n i=1
– 93 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А. И. Рубан. Дисперсионные характеристики статических моделей стохастических объектов
Оценка дисперсионного отношения (13), основанного на применении оценки субоптимальной модели
ŷ(x) = α̂0 +
m
X
α̂j ϕj (x) (т. е.
ŷi ≡ ŷ(xi ) = α̂0 +
j=1
m
X
α̂j ϕj (xi ), i = 1, n),
(22)
j=1
имеет вид:
s
η̂Y |X,парам =
v
uP
u n (ŷ − m̂ )2
u
i
Y
D̂2,парам
u
= u i=1
,
n
tP
D̂Y
(yi − m̂Y )2
(23)
i=1
где оптимальные параметры α̂0 , α̂1 , . . . , α̂m которой найдены из критерия наименьших
квадратов [7]:
α̂0 , α̂1 , . . . , α̂m = arg
min
ᾱ0 ,ᾱ1 ,...,ᾱm
n
m
X
1X
[yi − ᾱ0 −
ᾱj ϕj (xi )]2 ,
n i=1
j=1
(24)
т. е. параметры удовлетворяют системе линейных уравнений
n
m
n
X
1X
1X
[yi − α̂0 −
α̂j ϕj (xi )] ≡
[yi − ŷi ] = 0,
n i=1
n i=1
j=1
n
m
n
X
1X
1X
ϕl (xi )[yi − α̂0 −
α̂j ϕj (xi )] ≡
ϕl (xi )[yi − ŷi ] = 0, l = 1, m.
n i=1
n i=1
j=1
(25)
ŷ(x) является оценкой параметрической модели (10), а α̂0 , α̂1 , . . . , α̂m –– это оценки соответствующих параметров этой модели.
Теорема (12) (о разложении дисперсии выхода объекта на две дисперсионные компоненты) справедлива и для оценок соответствующих дисперсий:
D̂Y = D̂1,парам + D̂2,парам .
Оценки D̂Y , D̂2,парам приведены в (21), а D̂1,парам =
1
n
n
P
i=1
(26)
[yi − ŷi ]2 . При доказательстве
используются условия оптимальности параметров (25).
Оценка коэффициента (16)
v
u P
s
u n [ŷ − m̂ ]2
u
i
Y
η̂Y |X,парам
D̂2,парам
u i=1
=
=uP
λ̂Ye ⇔η =
t n
η̂Y |X
D̂2
[η (x ) − m̂ ]2
i=1
n
i
(27)
Y
характеризует степень близости выходов субоптимальной параметрической модели (22) и
оптимальной непараметрической модели —- оценки регрессии M̂ {Y |xi } ≡ ηn (xi ), i = 1, n.
Оценка относительного коэффициента корреляции (17)
n
P
ˆe
s
<
Y ⇔η =
(ŷi − m̂Y )(ηn (xi ) − m̂Y )
s
n
n
P
P
2
(ŷi − m̂Y )
(ηn (xi ) − m̂Y )2
i=1
i=1
i=1
– 94 –
(28)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А. И. Рубан. Дисперсионные характеристики статических моделей стохастических объектов
также представляет собой коэффициент взаимосвязи между субоптимальной параметрической моделью (22) и непараметрической оценкой регрессии.
Процесс обработки информации при сравнении качества непараметрической и параметрической моделей представлен на рис. 1.
Рис. 1. Схема расчета характеристик близости непараметрической и параметрической
статистических моделей стохастических объектов
Пример
В выборке (xi , yi ), i = 1, 100, входа и выхода объекта значения входа xi берутся последовательно из диапазона [0; 10] на равных друг от друга интервалах ∆. Каждое значение
выхода yi равно сумме значений выбранной сигнальной части φ(xi ) и помехи:
yi = φ(xi ) + σξi , φ(xi ) = |xi − 5| + cos xi + 3 sin 2xi − |xi − 2|.
(29)
Здесь σ –– среднеквадратичное уклонение аддитивной помехи, ρ –– отношение "шумсигнал" , ξi –– значение генератора нормально распределённой помехи с нулевым математическим ожиданием и единичной дисперсией. Величина ρ равна отношению интервала
изменения помехи к интервалу a изменения сигнальной части выхода имитируемого объекта. При нормально распределённой помехе интервал изменения её обычно берётся равным
ρa
6σ. В этом случае ρ = 6σ
a , и тогда среднеквадратичное уклонение помехи σ = 6 определяется величиной отношения "шум-сигнал" ρ, которая варьируется от 0.01 до 2 (что
– 95 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А. И. Рубан. Дисперсионные характеристики статических моделей стохастических объектов
соответствует интервалу от 1 до 200%) на приводимых ниже графиках для дисперсионных
характеристик.
При аддитивной равномерно распределённой в интервале [−θ, θ] помехе слагаемое в (29),
соответствующее помехе, имеет вид θζi , ζi –– значение генератора равномерно распределёнρa
ной в интервале [−1; 1] помехи. Тогда ρ = 2θ
a и θ = 2 .
Рис. 2. Фрагмент поведения (при 100 %-й помехе) непараметрической модели ηn (x) и
первого варианта параметрической модели ỹn (x) (слева), а также зависимость оценок
дисперсионных характеристик от уровня ρ стохастичности объекта
Первый вариант. Структура выбранной параметрической модели имеет вид ye(x) =
= α0 + α1 |x − 5|. В ней присутствует постоянная компонента α0 и базисная функция |x − 5|
с параметром α1 . При наличии экспериментальных данных, представленных в левой части
рис. 2 для 100 %-й нормально распределённой помехи, из квадратичного критерия рассчитаны параметры модели yen (x) = −2.973 + 0.803|x − 5|. По тем же экспериментальным данным
настроена (при этом оптимальный коэффициент размытости β = 0.12) непараметрическая
оценка регрессии ηn (x). Она даже визуально существенно лучше оптимальной параметрической модели. Непараметрическая модель близка к сигнальной части выхода объекта
φ(x).
На этом же рисунке представлено поведение оценок всех основных дисперсионных характеристик при изменении отношения "шум-сигнал" ρ от 1 до 200%. Оценка D̂2 дисперсии
регрессии слабо меняется, что указывает на хорошее качество непараметрической оценки
регрессии и при высоком уровне помех.
Параметрическая и непараметрическая оценки регрессии далеки друг от друга, и λ̂Ye ⇔η
ˆe
близка к нулю. Оценка относительного коэффициента корреляции <
между этими моY ⇔η
делями тоже невелика, но больше λ̂Ye ⇔η . Оценка дисперсионного отношения для регрессии
η̂Y |X существенно больше дисперсионного отношения η̂Y |X,парам для параметрической модели. Сравнительно большая величина оценки дисперсионного отношения η̂Y |X для регрессии подтверждает высокое качество непараметрической оценки регрессии.
Второй вариант. Модель ye(x) = α0 + α1 |x − 5| + α2 cos x имеет две базисные функции,
которые взяты из набора базисных функций, присутствующих в сигнальной части выхода
объекта (29). При 100 %-й нормально распределённой помехе оценка субоптимальной параметрической модели yen (x) = −3.002 + 0.911|x − 5| + 0.748 cos x и непараметрическая оценка
регрессии (при оптимальном коэффициенте размытости β = 0.11) представлены в левой
части рис. 3.
Из рис. 3 видно, что параметрическая оценка регрессии находится ближе к непараметрической, чем в прошлом эксперименте. В случае 10 %-й помехи оценка коэффициента их
ˆe
близости λ̂Ye ⇔η поднимается с 0.1 (рис. 2) до 0.23, а величина оценки <
Y ⇔η коэффициента
корреляции возрастает с 0.3 до 0.48.
– 96 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А. И. Рубан. Дисперсионные характеристики статических моделей стохастических объектов
Рис. 3. Фрагмент поведения (при 100 %-й помехе) непараметрической модели ηn (x) и
второго варианта параметрической модели ỹn (x) (слева), а также зависимость оценок
дисперсионных характеристик от уровня ρ стохастичности объекта
Третий вариант. Параметрическая модель является более сложной и включает три
базисные функции (специально из того же набора базисных функций, которые присутствуют в сигнальной части при имитации объекта): ye(x) = α0 + α1 |x − 5| + α2 cos x + α3 sin 2x. Её
конкретный численный вариант при 100 %-й нормально распределённой помехе имеет вид:
yen (x) = −1.273 + 0.892|x − 5| + 0.757 cos x + 2.571 sin 2x. Непараметрическая оценка регрессии
имеет оптимальный коэффициент β = 0.11. Эти модели представлены в левой части рис. 4.
Рис. 4. Фрагмент поведения (при 100 %-й помехе) непараметрической модели ηn (x) и
третьего варианта параметрической модели ỹn (x) (слева), а также зависимость оценок
дисперсионных характеристик от уровня ρ стохастичности объекта
Качество параметрической модели возросло. Это подтверждает и возрастание оценок
для дисперсионного отношения η̂Y |X,парам , для коэффициента близости λ̂Ye ⇔η непараметрической и параметрической моделей и для относительного коэффициента корреляции
ˆe
<
Y ⇔η между моделями.
Четвёртый вариант. Параметрическая модель ye(x) = α0 +α1 |x−5|+α2 cos x+α3 sin 2x+
+α4 |x−2| по структуре совпадает с сигнальной частью выхода объекта (при его имитации).
На рис. 5 при величине помехи 100 % оптимальная модель yen (x) = 0.172 + 0.988|x − 5|+
+0.856 cos x + 2.796 sin 2x − 1.117|x − 2|. Она фактически накрывает сигнальную часть выхода. Отклонение вызвано только влиянием помехи. В непараметрической оценке регрессии
оптимальный коэффициент размытости β = 0.10.
Как следует из рис. 5, при небольшом уровне помех параметрическая оценка бывает
даже лучше непараметрической, при этом оценка λ̂Ye ⇔η несколько выше 1. Оценка относиˆe
тельного коэффициента корреляции <
тоже близка к 1, но никогда не превышает её. Все
Y ⇔η
дисперсионные характеристики говорят о наилучшем выборе структуры параметрической
модели. С ростом уровня помех непараметрическая оценка всё-таки лучше параметрической.
– 97 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А. И. Рубан. Дисперсионные характеристики статических моделей стохастических объектов
Рис. 5. Фрагмент поведения (при 100 %-й помехе) непараметрической модели ηn (x) и
четвертого варианта параметрической модели ỹn (x) (слева), а также зависимость оценок
дисперсионных характеристик от уровня ρ стохастичности объекта
Анализ всех численных результатов показывает, что оценка относительного коэффициˆe
ента корреляции <
Y ⇔η имеет несколько меньшую чувствительность к изменению близости
непараметрической и параметрической оценок регрессии по отношению к λ̂Ye ⇔η .
Автор благодарен научному сотруднику М. А. Меретилову за выполненные численные
расчёты.
Заключение
−
→
В многомерном случае (когда объект имеет несколько входов X и один выход Y ) все
вышеприведенные дисперсионные характеристики сохраняются. В них лишь скалярную
−
→
случайную величину X надо заменить на векторную X . Расчеты всех оценок (особенно
непараметрической оценки регрессии), естественно, усложняются, но главная идея остаётся
неизменной.
Вышеприведённая схема анализа моделей стохастических объектов применима и к нелинейным (по каналу "вход-выход" и по параметрам) параметрическим субоптимальным мо→
−
делям Ye = α0 +=(−
α , X), оптимальные параметры α0 , →
α которых удовлетворяют критерию
наименьших квадратов.
Все приведённые результаты справедливы для так называемого гомоскедастичного
варианта, т. е. когда условная дисперсия выхода D{Y |x} является постоянной величиной.
Это условие было выполнено в численных примерах при имитации объекта за счёт представления выхода объекта в виде суммы сигнальной части (некоторой функции от входа)
и помехи, дисперсия которой постоянная для всех значений из рассматриваемого диапазона изменения входа. Гомоскедастичность нарушается, например, если вход объекта
измеряется с аддитивной помехой (даже с постоянной дисперсией). Гетероскедастичные
случаи [2] требуют специальных исследований, но общая идея сохраняется.
Для практики важно рассмотрение проблемы построения робастных (крепких по отношению к выбросам измерений) непараметрических и параметрических моделей и сравнения
их качества. Дисперсионные характеристики при этом надо заменить на модульные, установить закономерности между ними и построить их оценки. Общий подход, предложенный
в данной работе, переносится и на робастные модели.
Результаты могут быть распространены и на динамические стохастические объекты.
– 98 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А. И. Рубан. Дисперсионные характеристики статических моделей стохастических объектов
Список литературы
[1] Райбман Н. С., Чадеев В. М. Построение моделей процессов производства. М.: Энергия,
1975. 376 с.
[2] Дисперсионная идентификация / Под ред. Н. С. Райбмана. М.: Наука, 1981. 336 с.
[3] Рубан А. И. Непараметрическая дисперсионная идентификация // Изв. АН СССР. Техническая кибернетика. 1989. № 3. С. 212.
[4] Rouban A. I. Nonparametric dispersing identification // Advances in Modeling & Analysis:
Series D. Mathematical Tools; General Computer Tools. France: A.M.S.E. 1998. Vol. 1. №2.
P. 43–50.
[5] Рубан А. И. Идентификация стохастических объектов на основе непараметрического
подхода // Автоматика и телемеханика. 1979. №11. С. 106–118.
[6] Рубан А. И. Методы анализа данных: учеб. пособие. 2-е изд., испр. и доп. Красноярск:
ИПЦ КГТУ, 2004. 319 с. (Глава 4)
[7] Себер Дж. Линейный регрессионный анализ. М.: Мир, 1980. 456 с.
The Dispersing Characteristics
of Static Models of Stochastic Objects
Anatoly I. Rouban
Siberian Federal University
79 Svobodny, Krasnoyarsk, 660041 Russia
The dispersing characteristics determining quality of static parametrical models of stochastic objects are
constructed, and their estimations are found at the assumption, that the conditional variance of an
output is constant. Parametrical models are nonlinear on the channel "input – output" but they are
linear concerning optimized parameters. It is shown that the nonparametric estimation of regression is
close to objectively existing ideal model and according to dispersing characteristics it is possible to keep
up with change of quality of suboptimal parametrical models at selection of their structure. Quality of
nonparametric and parametrical models compared on several numerical tests with various level of noise.
Key words: dispersing identification, static parametrical model, stochastic object, a nonparametric
estimation for regression.
– 99 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Journal of Siberian Federal University. Engineering & Technologies 1 (2009 2), 100-111
УДК 551.507:631.10
Исследование динамики спектральной яркости посевов
сельскохозяйственных культур в период вегетации
на территории Красноярского края
А.Ф. Сидько, И.Ю. Пугачева∗ , А.П. Шевырногов
Институт биофизики СО РАН
660036 Россия, Красноярск, Академгородок, 50-501
Получена 20.11.2008, окончательный вариант 15.12.2008, принята к печати 10.03.2009
На основании анализа дистанционных полевых и космических измерений спектральных коэффициентов яркости (СКЯ) посевов сельскохозяйственных культур в период вегетации показана
возможность оценки структурных изменений, происходящих в растениях исследуемых посевов
в ближней инфракрасной области спектра (λ = 760 − 820 нм). Создана электронная база скорректированных спектральных данных СКЯ исследуемых посевов сельскохозяйственных культур.
Показано, что динамика значений СКЯ отражает картину морфофизиологических изменений
посевов в период их вегетации. Отсутствие или избыток влаги в растениях приводит к структурным изменениям фитоэлементов растений, что существенно сказывается на их отражательной способности, особенно в ближней инфракрасной области спектра. Данная тенденция наблюдалась одновременно на всех полях в период их исследований. Установлено, что в выделенных
классах имеется возможность использования тонких спектральных отличий для изучения пространственного распределения различных видов растительности и ее экологического состояния.
Показано, что выделенные контрасты могут быть эффективно использованы для получения полезной информации при обработке космических изображений, которым присущ высокий уровень
естественных помех (изменение оптической толщины атмосферы, облачность, изменение угла
визирования сканера, изменение высоты Солнца, высокая неоднородность подстилающей поверхности).
Ключевые слова: дистанционное зондирование, спектральный коэффициент яркости, база спектральных данных, сельскохозяйственные культуры.
Введение
Первостепенной задачей спутникового и аэрокосмического мониторинга посевов сельскохозяйственных (с/х) культур является идентификация угодий, определение видового состава посевов и морфофизиологических изменений. Сложность идентификации растительных
объектов на спутниковых снимках заключается в том, что в течение вегетационного периода в процессе роста и развития растения претерпевают значительные изменения [1-4].
Требуемая информация в необходимых объемах может быть получена только на основе
использования данных дистанционного зондирования.
Несмотря на большое разнообразие форм и видов растений, посевов с/х культур, они
обладают схожими спектрами яркости, отражения и поглощения. Это обусловлено в значительной мере поглощательной способностью фитопигментов хлорофилла, каротиноидов и
других пигментов в области ФАР (фотосинтетически активной радиации λ = 380 − 750 нм),
∗
1
Corresponding author E-mail address: irina.pugacheva@mail.ru
c Siberian Federal University. All rights reserved
°
– 100 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов. Исследование динамики спектральной яркости . . .
так как последние в наибольшей степени влияют на форму и динамику их спектральной
яркости [7-13].
Современные геоинформационные системы сбора и обработки космических снимков
растительных покровов суши используют спектральные портреты наземных измерений,
не учитывающие их сезонные изменения и состояние растительности. Благодаря наличию портативных спектрофотометров и ежедневно пополняемому банку данных спутника
MODIS/Terra (начиная с 1999 г.) стало возможным использование спектрофотометрической
информации для оценки физиологических и биологических параметров посевов сельскохозяйственных культур в течение всего периода вегетации.
Несмотря на определенные успехи в области применения дистанционных методов при
оценке состояния посевов с/х культур, следует заметить, что сдерживающим фактором в их
развитии является отсутствие комплексного экспериментального материала, полученного в
полевых условиях в течение всего вегетационного периода. Неполные данные не позволяют
надежно определять связи между спектрами отражения и фенологическими и биометрическими параметрами растительных покровов.
Эффективным решением проблемы оценки динамики спектральной яркости посевов различных видов культур и площадей их произрастания при дешифрировании космических
снимков стало практическое применение научной программы “Зеленая волна”, ведущейся
в Институте биофизики СО РАН. Эта программа предназначена для развития методов
непрерывного анализа пространственной структуры, состояния и продуктивности биоценозов суши. Основой служат измерения распределения фитопигментов и биомассы в биосфере
оптическими датчиками, располагаемыми на космических носителях и на земле [13, 14].
Настоящая статья посвящена изложению результатов наземных и космических измерений динамики отражательной способности посевов с/х культур в период их активной вегетации для получения и хранения эталонного банка первичных спектральных данных. Это
позволяет отслеживать динамику происходящих процессов в растениях, получения достоверных карт произрастания и распределения различных видов посевов, морфофизиологических изменений растений, а электронный формат представления результатов обеспечивает
их наглядность, в том числе и на территории Красноярского края.
Методика и объекты исследования
Исследование динамики спектральных коэффициентов яркости посевов пшеницы, ячменя
и овса проводилось в комплексе с морфофизиологическими параметрами растений посевов
регулярно на протяжении 15 лет [6-10].
Подспутниковые исследования. В качестве модельных посевов использовались:
пшеница (Triticum acstivum L.) сортов Скала, Равнина, Богарная, Иртышанка, ячмень
(Hordeum disticxon L.) сорта Винер и овес (Owena sativa L.) сортов Мутант и Орел.
Выбор этих объектов обусловлен следующими соображениями: культуры пшеница, ячмень и овес считаются основными зерновыми культурами, высеваемыми и культивируемыми на большей территории нашей страны. Эти культуры к настоящему времени достаточно хорошо изучены с физиологической и биологической точек зрения. Посевы с/х культур
являются удобными модельными объектами для изучения их спектральной яркости и отражательной способности дистанционными методами [2–11].
Регистрация спектров яркости посевов, от всходов до момента созревания, производилась полевым двухлучевым спектрофотометром, разработанным в Институте биофизики
– 101 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов. Исследование динамики спектральной яркости . . .
СО РАН. Регистрация спектров яркости производилась с 10 до 17 ч с одних и тех же точек
и в одинаковом направлении визирования. Спектрофотометр устанавливали на платформе
автовышки на высоте 2–18 м. Измерения проводились, как правило, в надир. Угол зрения
прибора менялся от 10 до 100 . Измерение спектров производилось в спектральном диапазоне
от 400 до 850 нм со спектральным разрешением ± 2 нм. Дневной ход СКЯ растений практически не менялся [2, 4]. Временной интервал регистрации спектров СКЯ посевов составлял
2–4 сут [6–10]. С учетом неоднородности посевов и для получения более полной картины о
распределении СКЯ (ρλ ) по исследуемому полю регистрировали от 20 до 30 спектров, по
которым рассчитывали средние значения, при этом ошибка в определении (ρλ ) по одному
массиву не превышала (1 ± 1.5)% [6–11].
Спутниковые данные. Изучение динамики отражения посевов пшеницы, овса, ячменя
в течение вегетационного периода проводилось по спутниковой информации MODIS/Terra
(продукт MOD09GHK). Исследование основывалось на данных видимых (459-479 нм (3 канал), 545-565 нм (4 канал), 620-670 нм (1 канал)) и ближнем инфракрасном (841-876 нм (2
канал)) каналах с пространственным разрешением 500 м. В качестве тестовых участков выбраны с/х поля, расположенные на территории Балахтинского района Красноярского края.
Размеры данных участков составляют 490 га (посев пшеницы), 325 га (посев овса), 250 га
(посев ячменя), что позволяет выделять их на снимках с 500-метровым пространственным
разрешением. Для определения пространственных координат полей использовались картосхемы расположения посевов в масштабе 1 : 25 000, пространственная информация снимка,
полученного 20 июня 2000 г. спутником Landsat7 ETM+ с пространственным разрешением
30 м. Расчет значений отражения контуров растительности проводился с помощью программного обеспечения ENVI 4.0.
Полученные наземные и спутниковые данные экспортировались в Microsoft Excel для
проведения статистической обработки и визуализации данных путем построения трехмерных графиков. В ходе статистической обработки рассчитывали следующие параметры:
среднее значение отражения контура, доверительный интервал для среднего при статистической значимости (p-уровень) равной 0,05.
Результаты и обсуждение
Ранее проведенные исследования показали, что изменения значений СКЯ посевов сельскохозяйственных культур в течение периода вегетации имеют высокую информативность.
Анализ спектров коэффициентов яркости посевов, полученных в ходе экспериментов, выявил, что в области длин волн 550–740 нм они имеют наибольшие изменения за весь период
вегетации по сравнению с другими участками спектра и существенно зависят от содержания хлорофилла "а" в исследуемых культурах (область красной полосы поглощения хлорофилла "a" λмах = 680 нм). Это, прежде всего, обусловлено интенсивными процессами
накопления и разрушения хлорофилла в растениях, что может служить показателем оценки
происходящих в них изменений [6, 8–14] (рис. 1).
Особенно значимыми являются коэффициенты яркости в области красной полосы поглощения хлорофилла, что может служить ключом для дешифрирования космических спектральных изображений. Изменение содержания хлорофилла в фитоэлементах четко проявляется в кривых СКЯ исследуемых культур в области красной полосы поглощения фитопигментов. Было установлено, что изменение содержания хлорофилла в фитоэлементах
посевов в течение периода вегетации тесно связано с величиной хлорофилльного потенциала
– 102 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов. Исследование динамики спектральной яркости . . .
посевов S(t).
Рис. 1. Динамика СКЯ посева пшеницы (сорт Равнина)
Величина хлорофилльного потенциала посевов за определенный период вегетации, который определяется величиной поглощенного света растениями в области красной полосы
поглощения хлорофилла (λmax = 680 нм), рассчитывается по форме кривой СКЯ посевов
злаковых культур может служить индикатором их физиологического состояния и потенциальной биологической продуктивности растений [2, 4–10].
Z730
S = (ρ730 (t) + ρ550 (t)) −
ρ(λ, t)dλ,
(1)
550
где ρ550 и ρ730 – средние значений СКЯ посева при λ = 550 и λ = 730 нм, с λmax = 680 нм, t –
границы временного интервала. Расчеты и взаимосвязь величины S(t) с физиологическими
параметрами растений посевов подробно описаны в работе [8].
Рассчитываемая величина хлорофилльного потенциала посевов по форме кривой СКЯ
посевов злаковых культур может служить индикатором их физиологического состояния и
потенциальной биологической продуктивности растений [6, 8–14].
Одновременно было установлено, что значения СКЯ растений зависят от физиологического состояния наземной фитомассы (листовой индекс, сухой и сырой вес растений с
единицы площади поверхности и др.), коэффициента проективного покрытия почвы и ее
увлажненности. Таким образом, изучение спектров отражения растений на предварительном этапе исследований в полевых условиях позволило получить общую картину изменений
отражательной способности посева в течение всего периода вегетации, а также спланировать эксперименты, проводимые в полевых натурных условиях.
Морфофизиологические изменения посевов
В результате обработки полученных в полевых условиях значений СКЯ посевов был
сформирован банк данных. Зарегистрированные спектры яркости были оцифрованы и занесены в специально разработанную базу данных “Информационная база данных спектров
яркости сельскохозяйственных культур” в среде Microsoft Access, которая позволила упорядочить хранение данных, облегчить их ввод, поиск и обработку. База данных содержит
сведения о дате регистрации посевов, спектральном разрешении, значениях СКЯ.
Динамика спектральной яркости посевов типичных культур (пшеница, ячмень и овес) за весь вегетационный период представлена на рис. 1, 2 и 3.
– 103 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов. Исследование динамики спектральной яркости . . .
Рис. 2. Динамика СКЯ посева ячменя (сорт Виннер)
Рис. 3. Динамика СКЯ посева овса (сорт Мутант)
Анализ результатов показал, что динамика СКЯ различных посевов имеет схожую форму. На всех трех представленных рисунках можно отметить следующую характерную особенность, а именно — в период с середины июля и до конца августа наблюдается характерный провал в длинноволновой области спектра λ = 760 − 820 нм. Эти изменения в СКЯ
можно объяснить климатическими условиями, когда в районе исследований наблюдалась
засуха в течение 30 дней, приведшая к угнетению посевов. Отсутствие влаги в растениях
приводит к структурным изменениям фитоэлементов растений, что существенно сказывается на их отражательной способности, особенно в ближней инфракрасной области спектра.
Данная тенденция наблюдалась одновременно на всех 10 исследуемых полях. Следовательно, представленная сезонная динамика спектральной яркости посевов может служить для
диагностики их физиологического состояния.
Определение видового состава исследуемых посевов
Наиболее целесообразным при определении видового состава культур представляется
выбор системы кодирования спектров растительности непосредственно по значениям СКЯ
для выбранных длин волн. Возможно представление спектра яркости растительности в
– 104 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов. Исследование динамики спектральной яркости . . .
виде многомерного вектора со значениями ρλ в определенном интервале длин волн. Однако
увеличение числа СКЯ, используемых для кодирования спектров, не только не повышает
точность классификации (распознавания), но даже приводит к ее уменьшению. Минимум
ошибки классификации растительности получается при числе СКЯ порядка 3–5 [1, 6].
Качественный выбор длин волн может быть сделан по виду и форме спектров отражения
различных природных образований. Этот вывод может быть обоснован расчетами энтропии
для различных длин волн и объектов [1].
Hλ = −
n
X
Pi log2 Pi ,
(2)
i=1
где Pi — вероятность получения значения ρλ в интервале от ρi до ρi+1 , при этом весь
интервал ρλ от 0 до 1 разбит на n состояний с шагом ∆ρ (например, ∆ρ = 0.005,
∆ρ = 0.01 ÷ 0.03). Величина энтропии (Hλ ) будет зависеть от соотношения различных
видов спектра ρλ . При выборе наиболее характерных длин волн следует стремиться к тому,
чтобы возможная ошибка в интервале длин волн ∆λ не привела к серьезному искажению
dρ
оценки СКЯ, для чего рассчитывается зависимость производной γ = dλ
.
Результаты вычислений γ и расчет энтропии показали, что для различных длин волн в
одномерной системе кодирования спектров, наиболее оптимальная информативность СКЯ
определяется 3-5 длинами волн, если при выборе длин волн принять в качестве предельно
допустимого значения γ = 0, 00125 [1].
При этом наиболее характерными длинами волн для класса растительности в диапазоне
400 < λ < 840 нм будут следующие волны: 400, 550, 660÷680 и 800÷820 нм. Поэтому в работе будут рассматриваться значения коэффициентов спектральной яркости на указанных
длинах волн.
Рис. 4. Спектры яркости СКЯ посевов ячменя – 1, овса – 3, пшеницы – 4, многолетней
травы (тимофеевка) – 2 в последней декаде июня месяца
На рис. 4 представлены кривые СКЯ различных посевов и разнотравья, которые регистрировались в конце июня месяца. В этот период развития (выход в трубку) высота
– 105 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов. Исследование динамики спектральной яркости . . .
растений посевов достигает 20-30 см, и они имеют ярко-зеленую окраску. Растения наиболее близки по своим оптическим свойствам, и их трудно различить по спектрам отражения. Спектральная яркость посевов описывается почти одинаковыми по характеру кривыми
СКЯ.
Рис. 5. Сезонные изменения спектральных коэффициентов яркости посева ячменя (1),
овса (2) и пшеницы (3) на четырех длинах волн с указанием доверительных интервалов
при уровне значимости p = 0, 05.
По мере развития растений (стадия кущения и колошения) увеличивается их вегетативная масса, идет процесс накопления хлорофилла, каротиноидов и других пигментов.
Растет поглощение лучистой энергии растениями, за счет этого начинает уменьшаться их
спектральная яркость. В этот период кривые СКЯ посевов начинают расходиться и доверительные интервалы уже не перекрываются (рис. 5). Особенно сильное увеличение яркости
наблюдается в области спектра 620–720 нм, что объясняется разрушением и уменьшением
– 106 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов. Исследование динамики спектральной яркости . . .
содержания хлорофилла в растениях. Растения к концу вегетации полностью пожелтели, в
колосе налилось зерно, хлорофилл в растениях почти полностью отсутствует [7, 9–12].
На завершающей стадии вегетации растений доверительные интервалы уже не перекрываются, а интервалы различия между значениями СКЯ исследуемых культур увеличиваются. Это наглядно видно на рис. 5, где показаны доверительные интервалы кривых сезонных
изменений значений СКЯ посевов для четырех длин волн (λ = 460, 550, 680 и 800 нм) при
уровне значимости p = 0, 05.
В этот период развития посевов в длинноволновой области спектра λ = 800 нм доверительные интервалы СКЯ всех культур начинают расходиться и полностью не перекрывают друг друга. Аналогичная картина наблюдается и для других длин волн, и степень
расхождения достигает своего максимума (рис. 5) [7, 9–15]. Исключение составляет лишь
длинноволновая область спектра, коэффициент яркости в которой уменьшается к концу
вегетации, где отражение определяется структурой растений (содержание влаги). Наибольшие различия наблюдаются в августе месяце.
Динамика спектральной яркости посевов типичных культур по видам (пшеница, ячмень
и овес) за весь вегетационный период представлена на рис. 6, 7 и 8. Рисунки получены в
результате обработки информационной базы спектральных данных и представлены в трехмерной системе координат.
В ходе обработки электронной базы спектров яркости посевов выделилось несколько
спектральных классов, которым соответствуют определенные спектральные характеристики (рис. 6–8), показывающие зависимость СКЯ от длины волны. На этих графиках можно
увидеть, что в ближней инфракрасной области наблюдается высокая степень отражения
солнечной энергии. Для сравнения используются наземные данные по пшенице, траве, овсу, ячменю за этот же период времени (рис. 4 и 5).
Рис. 6. Динамика СКЯ посева пшеницы, полученная по данным полевых наземных
измерений
Анализ и сопоставление полученных результатов по отражательной способности посевов
показал, что динамика СКЯ в период вегетации различных посевов имеет схожую форму
(рис. 6–8). На всех трех рисунках можно отметить следующую характерную особенность:
процесс созревания таких культур, как ячмень и овес, опережает пшеницу. То есть процесс
разрушения хлорофилла у пшеницы запаздывает (λ = 680 нм) на 10-12 дней. Это более
наглядно отражено на рис. 5.
– 107 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов. Исследование динамики спектральной яркости . . .
Рис. 7. Динамика СКЯ посева ячменя, полученная по данным полевых наземных
измерений
Рис. 8. Динамика СКЯ посева овса, полученная по данным полевых наземных измерений
Рис. 9. Динамика отражения посева пшеницы, полученная по спутниковым данным
– 108 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов. Исследование динамики спектральной яркости . . .
Данная тенденция наблюдалась одновременно на других исследуемых полях. Следовательно, представленная сезонная динамика спектральной яркости посевов может служить
для диагностики их видового состава и физиологического состояния растений.
В результате обработки данных спутника MODIS/Terra получена динамика отражения (r) посевов пшеницы, овса, ячменя для четырех длин волн 469, 555, 645, 859 нм.
Указанные длины волн являются средними значениями выбранных спектральных каналов
MODIS/Terra. На рис. 9 представлена динамика отражения посева пшеницы, полученная по
данным спутника MODIS/ Terra. Эти данные являются основой для дальнейшего изучения
связи спутниковой информации и наземных измерений.
В результате проведенного исследования показано, что по динамике отражательной способности, полученной наземными дистанционными методами и по спутниковым снимкам
MODIS/Terra, можно выделить тонкие структуры, характерные для определенных видов
культур посевов, которые могут быть использованы для определения видового состава растений.
Спектрофотометрическая информация, полученная по спутниковым данным, различных видов посевов с/х культур может быть применена для построения имитационных моделей, которые могут служить для научно обоснованных прогнозов динамики пространственного распределения видового состава растительного покрова. Таким образом, из проведенной работы можно сделать вывод, что имеется возможность использования тонких
спектральных отличий в определенных областях спектра отражения, для изучения пространственного распределения различных видов растительности и ее экологического состояния. Полученные результаты спутниковой информации MODIS показывают возможность
ее использования для оценки морфофизиологического состояния сельскохозяйственных посевов при применении наземной спектрометрической калибровки.
Выделенные контрасты могут быть эффективно использованы для получения полезной
информации при обработке космических изображений, которым присущ высокий уровень
естественных помех (изменение оптической толщины атмосферы, облачность, изменение
угла визирования сканера, изменение высоты Солнца, высокая неоднородность подстилающей поверхности).
Анализ и обработка электронной базы спектрофотометрической информации, полученной на основании космических и полевых наземных измерений динамики СКЯ различных
видов посевов сельскохозяйственных культур в период их вегетации, позволяют сделать
следующие выводы:
1. Показано, что динамика спектральной яркости посевов позволяет судить о морфофизиологических изменениях в фитоэлементах исследуемых культур.
2. Динамика спектральной яркости отражает изменения климатических условий в районах проводимых исследований.
3. Создан электронный банк данных спектральных характеристик различных видов посевов сельскохозяйственных культур в период их вегетации.
4. Полученные изображения MODIS/Terra позволяют выделять малоразмерные участки
местности, занятые сельскохозяйственными насаждениями.
5. Полученные результаты спутниковой информации MODIS/Terra показывают возможность применении наземной спектрометрической калибровки.
– 109 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов. Исследование динамики спектральной яркости . . .
6. Из анализа полученных спектральных кривых в выделенных классах видна возможность использования тонких спектральных отличий для изучения пространственного
распределения различных видов растительности и ее экологического состояния.
7. Показано, что выделенные контрасты могут быть эффективно использованы для получения полезной информации при обработке космических изображений, которым
присущ высокий уровень естественных помех (изменение оптической толщины атмосферы, облачность, изменение угла визирования сканера, изменение высоты Солнца,
высокая неоднородность подстилающей поверхности).
Работа выполнена при поддержке грантами ККФН-РФФИ (№ 07-05-96807), РФФИ
(№ 09-07-00026), Фонда содействия отечественной науке, ККФН (№ 18G158), Программы
Президиума СО РАН № 23 «Биоразнообразие», раздел 34.
Список литературы
[1] Кондратьев К.Я., Федченко П.П. Спектральная отражательная способность и распознавание растительности. Л.: Гидрометеоиздат, 1982. 216 с.
[2] Кочубей С.М., Кобец Н.И., Шадчина Т.М. Спектральные свойства растений как основа
методов дистанционной диагностики. Киев: Наукова думка, 1990. 135 с.
[3] Кочубей С.М., Шадчина Т.М., Кобец Н.И., Дмитриева В.В. Связь отражательных характеристик листьев озимой пшеницы с содержанием в них азота и хлорофилла в течение вегетации // Физиол. и биохим. культ. растений. 1988. Т. 20. № 6. С. 530-534.
[4] Рачкулик В.Н., Ситникова М.В. Отражательные свойства и состояние растительных
покровов. Л.: Гидрометеоиздат, 1981. 267 с.
[5] Сидько А.Ф. Аппаратура высокого разрешения и результаты исследования растительности и водных поверхностей // В кн. Очерки экологической биофизики. / Под ред.
Т.Г. Воловой. Новосибирск: Наука, 2003. С. 356-370.
[6] Кринов Е.А. Спектральная отражательная способность природных образований. М.:
Изд-во АН СССР, 1947. 270 с.
[7] Сидько А.Ф., Моисеева Н.П., Соколов В. И. Изучение связи сезонной динамики СКЯ
некоторых сортов пшеницы с физиологическими параметрами растений // Исследование Земли из космоса. 1982. № 6. С. 58-62.
[8] Сидько А.Ф., Филимонов В.С., Сидько Ф.Я., Рубцов И.Д. Полевой двухлучевой дифференциальный спектрофотометр // Журнал прикладной спектрофотометрии. 1976,
т. 29, вып. 5. С 943-948.
[9] Сидько А.Ф., Шевырногов П.П. Спектральная яркость растений, как основа дистанционной диагностики посевов сельскохозяйственных культур // ДАН, 1997, т. 354, № 1.
С. 120-122.
[10] Сидько А.Ф., Шевырногов А.П. Изучение сезонной зависимости спектральной яркости
посевов сельскохозяйственных культур от содержания хлорофилла и физиологических
параметров растений // Исследование Земли из космоса. 1998, № 3. С. 96-105.
– 110 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
А.Ф. Сидько, И.Ю. Пугачева, А.П. Шевырногов. Исследование динамики спектральной яркости . . .
[11] Сидько А.Ф. Дистанционный метод определения хлорофилльного фотосинтетического
потенциала посевов сельскохозяйственных культур на примере пшеницы, ячменя и овса
// Известия Академии наук, Серия биологическая. 2004 г. № 5. С. 547-555.
[12] Сидько Ф.Я., Соколов В.И., Сидько А.Ф., Филимонов В.С. О связи спектральной яркости посевов пшеницы с ее физиологическими параметрами и урожайностью. //Изв.
СО АН СССР. Сер. биол. наук. 1985. Выл. 3. С. 35-38.
[13] Терсков И.А., Сидько А.Ф., Соколов В.И., Филимонов В.С. Некоторые результаты исследований спектральной яркости посевов с/х культур и лесных сообществ // Космические исследования природных комплексов Сибири и Дальнего Востока. Новосибирск:
Наука, 1983. С. 126-131.
[14] Shevyrnogov A.P. and A.F. Sid’ko. Ground truth methods as a part of space mapping of
inland water phytopigment dynamics // Adv. Space Res. Vol. 22. No. 5. pp. 705-708, 1998.
[15] Шевырногов А.П., Сухинин А.И., Кашкин В.Б., Сидько А.Ф., Высоцкая Г.С. Научная
программа “Зеленая волна” как средство изучения растительности Красноярского края
космическими средствами // Сибирский экологический журнал, 1996, №5. C. 363-372.
[16] Сидько А.Ф., Пугачева И.Ю., Шевырногов А.П. Исследование динамики спектральной яркости посевов сельскохозяйственных культур в период вегетации на территории
Красноярского края // ДАН. 2008, том 419, № 3. C. 417-420.
Investigation of the Spectral Brightness Dynamics of
Agricultural Crops during Vegetation Period at the
Krasnoyarsk Territory
Alexander F. Sid‘ko, Irina Y. Pugacheva and Anatoly P. Shevyrnogov
Institute of Biophysics SB RAS
50-50 Akademgorodok, Krasnoyarsk, 660036 Russia
Based on the analysis of remote field and satellite measurements of agricultural crops spectral brightness
during vegetation period, the possibility was demonstrated of estimating the structural changes in the
near infrared zone (λ = 760 − 820 nm) of the plants of the crops being studied. The electronic data
base was made containing the corrected spectral brightness data of the studied agricultural crops. It was
shown that the dynamics of spectral brightness values reflects the pattern of morphophysiological changes
in the crops during their vegetation period. The lack or excess of moisture in plants leads to structural
changes in plant phytoelements, which has a considerable effect on their reflectance, especially in the
near infrared spectrum region. This trend was observed simultaneously for all studied fields during the
period of research. It was stated that, with regard to the classes singled out, it is possible to use subtle
spectral differences for studying spatial distribution and ecological state of various types of vegetation.
It was shown that the distinguished contrasts can be effectively used for getting useful information when
processing satellite images that have a high level of natural interference (alteration of atmosphere optical
thickness, cloudiness, alteration of scanner viewing angle, sun height variation, high inhomogeneity of
underlying surface).
Key words: remote sounding, spectral factor of brightness, base of the spectral brightness data, agricultural
crops.
– 111 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Journal of Siberian Federal University. Engineering & Technologies 1 (2009 2), 112-120
УДК 539.3+539.4
Интегро-интерполяционный метод
решения плоской задачи для композита,
армированного семейством криволинейных волокон
Н.А. Федорова∗
Сибирский федеральный университет,
660041 Россия, Красноярск, Свободный, 791
Получена 10.05.2008, окончательный вариант 17.06.2008, принята к печати 10.03.2009
Построена разрешающая система уравнений плоской задачи для среды, армированной семейством
криволинейных волокон. Задача сформулирована в перемещениях для семейства равнонапряженных волокон, когда угол армирования задан как известная функция координат. Показано, что
система может быть записана в дивергентной форме относительно перемещений. На основе
метода Ритца получена численная схема, адаптированная к особенностям рассматриваемой задачи.
Ключевые слова: композит, криволинейные волокна, армирование.
1.
Введение
При исследовании напряженно-деформированного состояния плоских конструкций из волокнистых композитов, используемых в авиастроении, судостроении, машиностроении,
строительстве, в основном ограничиваются случаями прямолинейных структур армирования. В ряде работ, например [1],[2], [3], было показано, что использование сложных криволинейных структур армирования может приводить к эффективным конструкциям по расходу
арматуры, по жесткости и прочности. В данной работе исследуется случай армирования
одним семейством криволинейных волокон.
2.
Постановка задачи
Рассмотрим плоскую задачу упругости для среды, армированной одним семейством волокон. Пусть армирование выполнено волокнами постоянного поперечного сечения. Для описания композита используется структурная модель [4]. Введем обозначения: интенсивность
армирования семейства волокон ω1 (x, y), компонент тензора деформаций εij (x, y), деформацию в волокнах семейства ε1 (x, y), напряжение в волокнах семейства – σ1 (x, y), осредненные
напряжения обозначим через σij (x, y), где x, y – декартовы координаты, ϕ(x, y) – угол армирования, индексы i, j = 1, 2. В дальнейшем при обращении к перечисленным функциям
для краткости аргументы будем опускать. Тогда структурную модель запишем в виде:
∗
1
(ω1 l11 ),1 + (ω1 l12 ),2 = 0,
(1)
2
2
ε11 l11
+ ε22 l12
+ 2ε12 l11 l12 = ε01 ,
(2)
ε11 ,22 + ε22 ,11 = 2ε12 ,12 .
(3)
Corresponding author E-mail address: ran@akadem.ru
c Siberian Federal University. All rights reserved
°
– 112 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Федорова. Интегро-интерполяционный метод решения плоской задачи для композита . . .
Использованы обозначения: εT1 = α1a T, ε01 = ε1 + εT1 , l11 = cos ϕ1 , l12 = sin ϕ1 , α1a − коэффициент линейного расширения материала семейства волокон, T = const (T − температура,
заданная в единицах Си). Символы ,1 ,,2 означают частное дифференцирование по координатам x, y соответственно. Правая часть в (2) учитывает как случай равнодеформированного
волокна (ε1 = const, ε01 = const + εT1 ), так и случай нерастяжимого (ε1 = 0, ε01 = εT1 ) .
Заметим, что уравнение (1) – это условие постоянства сечений волокон, (2) – деформация в волокнах семейства, правая часть уравнения учитывает деформации εT1 , вызванные
постоянным полем температур, (3) – уравнение совместности деформаций.
Осредненные напряжения σij (x, y) запишем в виде:
c
σij = (1 − ω1 )σij
+ σk ω1 l1i l1j .
(4)
Соотношения (4) есть определение силы, действующей на слой композитов как суммы сил,
создаваемых связующим материалом, и сил, создаваемых армирующими слоями. В (4) напряжения в связующем определяются по формулам:
c
σii
=
E
E
c
(εii + νεjj − αc (1 + ν)T ), σij
=
εij , (j = 3 − i, i = 1, 2).
2
(1 − ν )
(1 + ν)
Здесь E, ν, αc – соответственно модуль Юнга, коэффициент Пуассона и коэффициент температурного расширения связующего материала, E1 − модуль Юнга волокна. Напряжения
σij должны удовлетворять уравнениям равновесия:
σ1i,1 + σi2,2 = bi ,
(i = 1, 2).
(5)
Правые части в (5)
bi = −((1 − ω1 )ρc + ω1 ρ1 )fi
являются компонентами массовой распределенной нагрузки по направлениям прямоугольной декартовой системы координат; ρc , ρ1 − массовые плотности материалов связующего и
волокона ; fi − компоненты удельной распределенной нагрузки, действующей на единицу
массы.
К системе (1) – (5) присоединяются граничные условия на контуре. Уравнение контура Γ
задано в параметрическом виде: x = ϕ(s), y = ψ(s), s−некоторый параметр. Пусть на контуре Γp заданы статические условия с нормальными и касательными усилиями pn (s), pτ (s)
соответственно:
σ11 n21 + σ22 n22 + 2σ12 n1 n2 = pn (s), (σ22 − σ11 )n1 n2 + σ12 (n21 − n22 ) = pτ (s).
(6)
На другой части контура Γu заданы кинематические условия для перемещений u1 , u2 :
u1 (Γu ) = u01 (s),
u2 (Γu ) = u02 (s).
(7)
В (6) pn (s), pτ (s)− известные функции, n1 = cos β, n2 = sin β, β− угол, задающий направление внешней нормали к Γp . С учетом (4) граничные условия (6) принимают вид
ω1 σ1 cos2 (ϕ − β) + (1 − ω1 )[m3 (ε11 + νε22 − LT ) cos2 β +
+m3 (ε22 + νε11 − LT ) sin2 β + m4 ε12 sin β cos β] = pn (s),
ω1 σ1 sin 2(ϕ1 − β) + (1 − ω1 )m3 (ε22 − ε11 + ν(ε11 − ε22 )) sin 2β +
+2(1 − ω1 )m4 ε12 cos 2β = 2pτ (s).
– 113 –
(8)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Федорова. Интегро-интерполяционный метод решения плоской задачи для композита . . .
В (8) использованы обозначения для констант
LT = αc (1 + ν)T, m3 = Em1 , m4 = Em2 , m1 =
1
1
, m2 =
.
1 − ν2
1+ν
Интенсивность ω1 задаем на той части Γω контура, где волокно входит в конструкцию:
ω1 (Γω ) = ω1∗ (s).
(9)
Ограничение для интенсивности армирования имеет вид
0 < ω1 ≤ 0, 7.
3.
Семейство равнонапряженных волокон
Тогда правая часть в (2) примет вид ε01 = ε1 + εT1 , напряжение в волокне σ1 = Const. В
этом случае система (1),(2),(3) – замкнутая система восьми уравнений относительно восьми
неизвестных
ω1 , ϕ, σ11 , σ22 , σ12 , ε11 , ε22 , ε12 .
Переформулируем названную систему в перемещениях, выразив напряжения через деформации, а деформации через перемещения, используя соотношения Коши. К системе присоединим граничные условия на контуре Γu : u(Γu ) = u(s) либо граничные условия (6), где
деформации выражены через перемещения.
При подстановке напряжений через перемещения в уравнения равновесия нужно вычислить следующие выражения:
(σ1 ω1 cos2 ϕ),1 + (σ1 ω1 cos ϕ sin ϕ),2 ,
(σ1 ω1 cos ϕ sin ϕ),1 + (σ1 ω1 sin2 ϕ),2 .
При их вычислении выделяем слагаемые вида
(ω1 cos ϕ),1 + (ω1 sin ϕ),2 ,
которые в силу условия постоянства сечений волокон (1) равны нулю, что упрощает данные
выражения, и они становятся соответственно равными:
σ1 ω1 (cos ϕ(cos ϕ),1 + sin ϕ(cos ϕ),2 )
σ1 ω1 (cos ϕ(sin ϕ),1 + sin ϕ(sin ϕ),2 ).
Для формулировки системы удобно ввести z = tg ϕ(x, y). Тогда производные от функции, задающей угол армирования, вычисляем по формулам
ϕ,1 =
z,1
z,2
; ϕ,2 =
.
2
1+z
1 + z2
– 114 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Федорова. Интегро-интерполяционный метод решения плоской задачи для композита . . .
В итоге система для равнонапряженного семейства волокон относительно искомых переменных ω1 , ϕ, u1 , u2 записывается в виде:
z,1
z,2
+
) = 0,
2
1+z
1 + z2
1
1
u1,2 + u1,1 + u2,1 − zu2,2 − ε01 ( + z) = 0,
z
z
1
ωm3 (u1 ,11 + νu2 ,21 ) + ωm4 (u1 ,22 + u2 ,12 ) + m3 (−ω1 ,1 )(u1 ,1 + νu2 ,2 − LT ) +
2
z
1
z2
+ m4 (−ω1 ,2 )(u1 ,2 + u2 ,1 ) + σ1 ω1 (−
(z
)
−
(z,2 )) = b1 ,
,1
2
(1 + z 2 )2
(1 + z 2 )2
1
ωm3 (u2 ,22 + νu1 ,12 ) + ωm4 (u1 ,21 + u2 ,11 ) + m3 (−ω1 ,2 )(u2 ,2 + νu1 ,1 − LT ) +
2
1
z
1
+ m4 (−ω1,1 )(u1,2 + u2,1 ) + σ1 ω1 (
(z,1 ) +
(z,2 )) = b2 .
2
(1 + z 2 )2
(1 + z 2 )2
ω1 ,1 + zω1 ,2 + ω1 (−z
(10)
(11)
(12)
(13)
В системе использованы обозначения ω = 1 − ω1 .
Первые два уравнения системы содержат производные только первого порядка, поэтому
чтобы исследовать тип системы, продифференцируем эти уравнения по одной из координат.
Затем построим характеристический многочлен [5] для данной системы
P (λ) = det(A11 λ2 + 2A12 λ + A22 ),
где

A11

A12
z

 0

=
 0

0
ω1
1 + z2
0
1


 0
=
 0

0
−
zω1
1 + z2
0
0
0
1
z
ωm3
0
0
0



1 
,
0 


ωm4
2

0

 0
−z 


m4  , A22 = 
) 
ω(νm3 +
 0
2 
0
0
0
0
1
0
0
0
0
ωm4
2
0

0
0 

.
0 
0
m4
0
ωm3
)
0
ω(νm3 +
2
При исследовании типа системы установили, что характеристический многочлен (полином) тождественно равен нулю, что означает вырождение типа системы. Ее решение представляет определенные трудности и требует специального подхода. В данной работе находим частные решения после введения угла армирования как заданной функции координат,
что позволяет определить интенсивность армирования из уравнения (10). Уравнение (11)
рассматриваем после вычисления u1 , u2 как ограничение на условие равнонапряженности.
Решаем уравнения (12),(13) совместно как систему относительно u1 , u2 . Ее характеристический полином имеет вид
0
0
P (λ) = det(A11 λ2 + 2A12 λ + A22 ),
где
µ
A11 =
ωm3
0
0
0, 5ωm4
– 115 –
¶
,
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Федорова. Интегро-интерполяционный метод решения плоской задачи для композита . . .
µ
12
A
=
0
ω(νm3 + 0, 5m4 )
ω(νm3 + 0, 5m4 )
0
¶
µ
22
,A
=
0, 5ωm4
0
0
ωm3
¶
.
Уравнение P (λ) = 0 после подстановки m3 , m4 через модуль Юнга E и коэффициент
Пуассона ν запишется после некоторых упрощений как биквадратное уравнение
λ4 +
3ν 2 − 1 + 10ν 2
λ + 1 = 0.
2(ν − 1)
Находим четыре корня биквадратного уравнения:
q
√
−(ν − 1)(3ν 2 − 1 + 10ν) ± 9ν 4 + 78ν 2 + 60ν 2 − 15 + 12ν)
λk = ±
, (k = 1, 4).
2(ν − 1)
Исследование выражения под радикалом (9ν 4 + 78ν 2 + 60ν 2 − 15 + 12ν) как функции от ν
показало, что оно имеет отрицательный знак на интервале [0; 0, 38]. Это означает, что корни
λk – комплексно сопряженные на этом интервале. Рассматриваемая система (12), (13) имеет
эллиптический тип. Заметим, что для многих материалов коэффициент Пуассона принимают равным от 0, 25 до 0, 3 [6],[7]. Следовательно, возможные значения коэффициентов
Пуассона попадают в указанный интервал, где корни λk − комплексно сопряженные. Для
построения численной схемы запишем оба уравнения в дивергентном виде. Предварительно
введем следующие обозначения:
y1 = ω1 (x, y), y2 = z(x, y), z1 = (1 − y1 )m3 , z2 = (1 − y1 )m4 /2.
(14)
Здесь y1 , y2 − известные функции координат, u1 , u2 − неизвестные функции. Заметим выполнение следующих соотношений для слагаемых, входящих в первое уравнение
(1 − y1 )m3 u1 ,11 + m3 (−y1 ,1 )u1 ,1 = (z1 u1 ,1 ),1 ,
(1 − y1 )m3 νu2 ,11 + m3 (−y1 ,1 )νu2 ,1 = (νz1 u2 ,2 ),1 ,
(1 − y1 )
m4 u1,22 +
2
(1 − y1 )
m4 u2 ,12 +
2
1
m4 (−y1 ,2 )u1,2 = (z2 u1,2 ),2 ,
2
1
m4 (−y1 ,2 )u2 ,1 = (z2 u2 ,1 ),2 .
2
В итоге оно запишется
(z1 u1 ,1 ),1 + (νz1 u2 ,2 ),1 + (z2 u1 ,2 ),2 + (z2 u2 ,1 ),2 + F1 = 0,
F1 = −b1 + m3 y1 ,1 LT + σ1 y1 (−
(15)
2
y2
y2
y2 ,1 −
y2 ).
2
2
(1 + y2 )
(1 + y22 )2 ,2
Используем соотношения для второго уравнения
(1 − y1 )m3 u2 ,22 + m3 (−y1 ,1 )u2 ,2 = (z1 u2 ,2 ),2 ,
(1 − y1 )m3 νu1 ,12 + m3 (−y1 ,2 )νu1 ,1 = (νz1 u1 ,1 ),2 ,
(1 − y1 )
m4 u1 ,12 +
2
(1 − y1 )
m4 u2 ,11 +
2
В итоге второе уравнение запишется
1
m4 (−y1 ,2 )u1 ,2 = (z2 u1 ,2 ),1 ,
2
1
m4 (−y1 ,2 )u2 ,1 = (z2 u2 ,1 ),1 .
2
(z1 u2,2 ),2 + (νz1 u1,1 ),2 + (z2 u1,2 ),1 + (z2 u2,1 ),1 + F2 = 0,
´
³
y2
1
y2 ,1 +
y2 ,2 .
F2 = −b2 + m3 y1 ,2 LT + σ1 y1
2
2
2
2
(1 + y2 )
(1 + y2 )
– 116 –
(16)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Федорова. Интегро-интерполяционный метод решения плоской задачи для композита . . .
4.
Краевая задача для прямоугольной пластинки
Пусть граничный контур Γ− граница G, где G− прямоугольная пластинка со сторонами,
параллельными координатным осям G = {(x1 , x2 )|, 0 ≤ xi ≤ di , i = 1, 2}. В этом случае
определенный выше угол β = π/2. Кинематические условия (7) не меняются. Статические
условия (6) после замены компонент деформации на перемещения по формулам Коши примут вид
σ1 ω1 z 2
1 + z 2 + LT ,
u2,2 + νu1,1 =
ωm3
σ1 ω1 z
2pτ (s) +
2(1 + z 2 )
u1 ,2 + νu2 ,1 =
.
−ω
pn (s) −
(17)
При построении разностной схемы для системы (15),(16) поставим задачу отыскания вектора u = (u1 , u2 ) с граничными условиями на контуре в общем виде
z1 u1 ,1 + z1 νu2 ,2 = −f1 (x1 , 0),
(18)
z2 u1 ,2 + z2 u2 ,1 = −f1 (0, x2 ),
z2 u1 ,1 + z1 νu2 ,2 = −f2 (x1 , d1 ),
z2 u1 ,2 + z2 u2 ,1 = −f2 (d2 , x2 ).
5.
Свойства дифференциального оператора поставленной задачи
Покажем, что оператор является симметричным и положительно определенным. В качестве
области определения оператора L вводится линеал функций, являющихся непрерывными
вместе со своими первыми и вторыми производными в замкнутой области G и удовлетворяющих граничным условиям (18).
Выпишем функционал I(u, v) = (Lu, v) + (F, v)
ZZh
i
∂
∂u1
∂
∂u2
∂
∂u1
∂
∂u2
I(u, v) =
(z1
)v1 +
(z1 ν
)v1 +
(z2
)v1 +
(z2
)v1 +F1 v1 dx1 dx2 +
∂x1
∂x1
∂x1
∂x2
∂x2
∂x2
∂x2
∂x1
G
ZZh
i
∂u2
∂
∂u1
∂
∂u1
∂
∂u2
∂
(z1
)v2 +
(z1 ν
)v2 +
(z2
)v2 +
(z2
)v2 + F2 v2 dx1 dx2 ,
+
∂x2
∂x2
∂x2
∂x1
∂x1
∂x2
∂x1
∂x1
G
где u = (u1 , u2 ), v = (v1 , v2 ), F = (F1 , F2 ).
Используя тождества, возникающие при нахождении интеграла по частям, например,
∂
∂u1
∂
∂u1
∂u1 ∂v1
(z1
)v1 =
(z1 v1
) + z1
,
∂x1
∂x1
∂x1
∂x1
∂x1 ∂x1
запишем функционал в виде
ZZh
∂u1 ∂v1
∂u2 ∂v1
∂u1 ∂v1
∂u2 ∂v1
∂u2 ∂v2
I(u, v) =
z1
+ z1 ν
+ z2
+ z2
+ z1
+
∂x1 ∂x1
∂x2 ∂x1
∂x2 ∂x2
∂x1 ∂x2
∂x2 ∂x2
G
– 117 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Федорова. Интегро-интерполяционный метод решения плоской задачи для композита . . .
i
∂u1 ∂v2
∂u1 ∂v2
∂u2 ∂v2
+ z2
+ z2
+ F1 v1 + F2 v2 dx1 dx2 +
∂x1 ∂x2
∂x2 ∂x1
∂x1 ∂x1
Z d1 h
i
f1 (x1 , 0)v1 + f1 (x1 , d2 )v1 + f2 (x1 , 0)v2 + f2 (x1 , d2 )v2 dx1 +
+
+z1 ν
(19)
0
Z
d2
+
h
i
f1 (0, x2 )u1 + f1 (d1 , x2 )u1 + f2 (0, x2 )u2 + f2 (d1 , x2 )u2 dx2 .
0
Из формул (19) легко видеть, что при замене u и v I(u, v) = I(v, u), т. е. функционал
симметричен.
Исследуем свойство положительной определенности оператора L, выпишем (Lu, u) :
Z Z h
∂u1 2
∂u2 2
∂u1 2
∂u2 2
∂u2 ∂u1
L(u, u) =
z1 (
) + z1 (
) + z2 (
) + z2 (
) + z2
+
∂x1
∂x2
∂x2
∂x1
∂x1 ∂x2
G
∂u2 ∂u1
∂u1 ∂u1 i
∂u1 ∂u2
+z2
+ z1 ν
+ z1 ν
dx1 dx2 =
∂x2 ∂x1
∂x2 ∂x1
∂x1 ∂x2
Z Z h
∂u1 2
∂u2 2
∂u1 ∂u2
∂u1
∂u2 2 i
=
z1 (
) + z1 (
) + 2z1 ν
+ z2 (
+
) dx1 dx2 .
∂x1
∂x2
∂x1 ∂x2
∂x1
∂x2
G
Покажем, что (Lu, u) ≥ 0 для любого u, принадлежащего заданному линеалу функций.
Действительно,
∂u1
∂u2 2
z2 (
+
) ≥ 0,
∂x1
∂x2
поскольку z2 > 0, что следует из соотношений (14) и ограничений на значения интенсивностей армирования, аналогично z1 > 0. Выражение
z1 (
если
∂u1 2
∂u2 2
∂u1 ∂u2
) + z1 (
) + 2z1 ν
≥ 0,
∂x1
∂x2
∂x1 ∂x2
³
∂u1 ∂u2
∂u1 ∂u2
∂u2 2
1 2
> 0. В противном случае, если
< 0, тогда z1 ( ∂u
∂x1 ) + ( ∂x2 ) −
∂x1 ∂x2
∂x1 ∂x2
¯ ∂u ∂u ¯´
³ ∂u
³¯ ∂u ¯ ¯ ∂u ¯´2
∂u1 ∂u2 ´
∂u2 2
¯ 1 2¯
¯ 1¯ ¯ 2¯
1 2
−2ν|
| ≥ z1 (
) +(
) − 2¯
¯ = z1 ¯
¯−¯
¯ ≥ 0.
∂x1 ∂x2
∂x1
∂x2
∂x1 ∂x2
∂x1
∂x2
Оценка следует из того, что коэффициент Пуассона 0 < ν < 1.
Установили, что дифференциальный оператор поставленной плоской задачи упругости
для среды, армированной одним семейством волокон, является симметричным и положительно определенным. Следовательно, применим метод Ритца.
6.
Построение разностной схемы
Решение задачи (15), (16) с граничными условиями (18) в силу дивергентной формы записи
системы, Lu + F = 0, где L− дифференциальный оператор системы, F− правая часть,
должно доставлять минимум следующему функционалу
I(u, u) = (Lu, u) + (F, u),
где u = (u1 , u2 ), F = (F1 , F2 ). Выпишем этот функционал. Согласно методу Ритца [8] аппроксимируем пространство W12 (G), в котором ищутся решения, конечномерным подпространством V и назовем приближенным решением задачи вектор u = (v1 , v2 ),
– 118 –
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Федорова. Интегро-интерполяционный метод решения плоской задачи для композита . . .
vi ∈ V, который минимизирует функционал I(u, u) на пространстве V. Этот функционал
можно преобразовать так:
Z d1 Z d2
(F1 u1 + F2 u1 )dx1 dx2 +
I(u, u) = W (u) +
0
Z
0
d1
[f1 (x1 , 0)u1 + f1 (x1 , d2 )u1 + f2 (x1 , 0)u2 + f2 (x1 , d2 )u2 ]dx1 +
+
0
Z
+
d2
[f1 (0, x2 )u1 + f1 (d1 , x2 )u1 + f2 (0, x2 )u2 + f2 (d1 , x2 )u2 ]dx2 ,
(20)
0
где W (u)− энергия упругой деформации преобразуется к виду
Z Z
1
W (u) =
[z1 ((u1 ,1 )2 + (u2 ,2 )2 ) + z2 ((u1 ,2 )2 + (u2 ,1 )2 ) +
2
G
+2z1 νu1 ,1 u2 ,2 + 2z2 u2 ,1 u1 ,2 ]dx1 dx2 .
(21)
Введем в области G прямоугольную равномерную сетку. Разобьем область на прямоугольные ячейки со сторонами h1 , h2 и вершинами в узлах сетки. Каждую ячейку в свою
очередь разобьем прямой, проходящей через ее противоположные вершины, на два треугольника. Обозначим левые верхние треугольники через ∆+ [i], а правые нижние – через
∆− [i]. В качестве подпространства V пространства W12 (G) возьмем пространство непрерывных в области и линейных над каждым треугольником ∆± [i] функций.
Приближенное решение задачи (15),(16) будем искать в виде u = (v1 , v2 ) :
vi =
N1 X
N2
X
yij1 j2 ηj1 j2 ,
(22)
j1 =0 j2 =0
где ηj1 j2 − базис пространства V. В качестве базиса в V можно взять совокупность непрерывных в G, линейных над каждым треугольником ∆± [i] функций, каждая из которых
отлична от нуля лишь в одном узле сетки. При выбранном базисе коэффициенты yij1 j2 в
(22) имеют значение приближенного решения в узлах сетки.
Дифференцируя I(u, u) по переменным yij1 j2 и приравнивая первые производные нулю,
получим следующую систему алгебраических уравнений для определения значений решения в узлах сетки yij1 j2 :
1
(z1 v1x1 )x1 + ((z1 νv2x2 )x1 + (z1 νv2x2 )x1 ) +
2
1
−1
+(z2 v1 x2 )x2 + ((z2 v2 x1 )x2 + (z2 v2 x1 )x2 ) =
Φ1 (x1 , x2 ),
2
h1 h2
1
(z1 v2 x2 )x2 + ((z1 νv1 x1 )x2 + (z1 νv1 x1 )x2 ) +
2
1
−1
+ ((z2 v1 x2 )x1 + (z2 v1 x2 )x1 ) + (z2 v2 x1 )x1 =
Φ2 (x1 , x2 ).
2
h1 h2
(23)
В (23) Φ1 (x1 , x2 ), Φ2 (x1 , x2 )− сеточные выражения, содержащие значения правых частей;
в уравнениях введены сеточные операторы дифференцирования по следующему правилу:
(ui − ui−1 )
(ui+1 − ui )
, u x1 =
,
h1
h1
(ui − ui−1 )
(ui+1 − ui )
=
, u x2 =
.
h2
h2
ux1 =
ux2
– 119 –
(24)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Н.А. Федорова. Интегро-интерполяционный метод решения плоской задачи для композита . . .
Заметим, что для достаточно гладких правых частей погрешности аппроксимаций имеют вид ψi = o(h21 + h22 ) [8, 9].
В работе построена численная схема решения плоской задачи в перемещениях для композита, армированного одним семейством волокон, когда угол армирования введен как заданная функция координат. Схема учитывает все особенности этой задачи.
Список литературы
[1] Немировский Ю.В., Кургузов В.Д. Прочность и жесткость стеновых железобетонных
панелей со сложными структурами армирования // Известия вузов. Строительство. 2003.
№ 2. С. 4-11.
[2] Немировский Ю.В., Федорова Н.А. Моделирование деформирования плоских авиационных конструкций, армированных семействами криволинейных волокон // Вестник Сиб.
гос. аэрокосмич. ун-та. Вып. 6(13). Красноярск, 2006. С. 38-44.
[3] Федорова Н.А. Решение плоской задачи упругой среды, армированной тремя семействами волокон // Вычисл. технологии. 2005. Т. 10. С. 90-100.
[4] Немировский Ю.В., Янковский А.П. Рациональное проектирование армированных конструкций. Новосибирск: Наука, 2002. 487 с.
[5] Бицадзе А.В. Некоторые классы уравнений в частных производных. М: Наука,1981.
448 с.
[6] Тимошенко С.П., Гудьер Дж. Теория упругости. М: Наука, 1979. 550 с.
[7] Композиционные материалы. Справочник / В.В. Васильев,В.Д. Протасов и др. М: Машиностроение, 1990. 512 с.
[8] Самарский А.А. Теория разностных схем. М: Наука, 1989. 614 с.
[9] Самарский А.А., Николаев Е.С. Методы решения сеточных уравнений. М: Наука, 1989.
425 с.
Integro-Interpolational Method of Plane Problem Solving for
Reinforced by Family of Curvelinear Fibers Composite
Natalia A. Feodorova
Siberian Federal University
79 Svobodny, Krasnoyarsk, 660041 Russia
It is constructed the permitting system of equations of plane problem for environment reinforced by the
family of curved fibers. The problem articulated in the movement for family of equal strained fibers when
the angle of reinforce is the known function of coordinates. It is displayed that the system can be written
in divergence form on the movement. Based on the Ritz method the numerical pattern adapted to the
singularities of the task is received.
Key words: composite, curvelinear fibers, reinforcement.
– 120 –
1/--страниц
Пожаловаться на содержимое документа