close

Вход

Забыли?

вход по аккаунту

?

Математическое моделирование межбуквенных отношений (на материале префиксальных морфем немецкого языка).

код для вставкиСкачать
”ƒ 519.673
ћј“≈ћј“»„≈— ќ≈
ћќƒ≈Ћ»–ќ¬јЌ»≈
ћ≈∆Ѕ” ¬≈ЌЌџ’ ќ“ЌќЎ≈Ќ»…
(Ќј ћј“≈–»јЋ≈
ѕ–≈‘» —јЋ№Ќџ’ ћќ–‘≈ћ
Ќ≈ћ≈÷ ќ√ќ я«џ ј)
Ѕ”Ћ »Ќ ¬.»., Ўј–ќЌќ¬ј Ќ.¬.,
ќ–ќЅ»Ќ— јя ≈. ј
–ассматриваетс¤ приложение алгебры конечных предикатов дл¤ описани¤ межбуквенных отношений на
множестве текстов префиксальных морфем. ƒелаетс¤
вывод о возможности схемной реализации полученных соотношений и использовании данной модели в
различных подсистемах интеллектуальных систем.
ƒл¤ обеспечени¤ эффективного функционировани¤ таких информационных систем, какими ¤вл¤ютс¤ системы машинного перевода, диалоговые,
экспертные, где происходит обработка текстовой
информации, необходимо сообщить системе исчерпывающие сведени¤ о внутренней структуре различных единиц естественного ¤зыка: морфем, слов,
словосочетаний и т.д. ƒанна¤ работа посв¤щена
созданию математических моделей префиксальных
морфем имен существительных немецкого ¤зыка.
÷елью исследовани¤ ¤вл¤етс¤ математическое описание межбуквенных отношений на множестве
текстов префиксальных морфем, загруженных дл¤
этого в специальную формальную конструкцию лингвистический регистр сегментированных префиксов.
¬ качестве математического ¤зыка в работе используетс¤ универсальное средство дл¤ формального
описани¤ дискретных, детерминированных и конечных объектов и процессов - алгебра конечных
предикатов [1]. ¬ нашем случае таким объектом
будет множество префиксальных морфем имен
существительных немецкого ¤зыка, которое ¤вл¤етс¤ объединением подмножеств собственно префиксов и так называемых полупрефиксов, выступающих в роли как самосто¤тельных слов, так и
префиксальных морфем. ѕусть ћр ? множество
префиксов, а ћрр ? множество полупрефиксов,
тогда множество префиксальных морфем ћрr имен
существительных немецкого ¤зыка можно записать в виде: ћрr = ћр U ћрр.
ƒл¤ использовани¤ средств алгебры конечных предикатов необходимо за каждым фрагментом текста
морфемы закрепить строго фиксированное место.
— этой целью примен¤етс¤ абстрактна¤ математическа¤ конструкци¤ ? лингвистический регистр,
состо¤щий из двухбуквенных сегментов. »х структура, в свою очередь, отличаетс¤ в зависимости от
пор¤дка следовани¤ гласных и согласных букв:
–», 2002, є 1
gs , g_ , _s , __ -на первом месте гласна¤, на втором
согласна¤ (g ? гласна¤, s ? согласна¤, _ ? знак
пробела), sg , _g , s_ , __ - на первом месте согласна¤,
на втором гласна¤.
ƒл¤ автоматической загрузки текстов префиксальных морфем в лингвистический регистр сегментированных префиксов была разработана программа
на ¤зыке Pascal, котора¤, кроме этой основной
функции, проводит сравнительный анализ структур сегментов с тем, чтобы вы¤вить оптимальную
структуру с точки зрени¤ минимума пробелов.
јнализ показал, что если лингвистический регистр
состоит из сегментов первого типа, то при загрузке
в него множества ћрг текстов префиксальных
морфем количество пробелов, т.е. пропусков в
лингвистическом регистре, на 48 процентов больше, чем при загрузке множества префиксальных
морфем в регистр второго типа. ћощность множества префиксальных морфов, загруженных в лингвистический регистр, составл¤ет 149. ѕри этом
лингвистический регистр, состо¤щий из сегментов
первого типа ( gs ), содержал 241 пробел, а регистр
второго типа ( sg ) ? 162 пробела.
Ќа основании проведенного анализа в качестве
рабочего варианта целесообразно использовать лингвистический регистр, имеющий структуру сегментов sg. »х количество в регистре при этом равно
шести.
‘рагмент лингвистического регистра сегментированных префиксов (Ћ–—ѕ) приведен в табл. 1 [2].
“аблица 1
a
_a
__
__
__
__
__
ab
_a
b_
__
__
__
__
aber
_a
be
r_
__
__
__
ac
_a
c_
__
__
__
__
ad
_a
d_
__
__
__
__
aero
_a
e_
ro
__
__
__
affen
_a
f_
fe
n_
__
__
ag
_a
g_
__
__
__
__
Ѕуквенные переменные Ћ–—ѕ обозначим –ij, где i
? номер сегмента, a j - номер буквы в сегменте (i=
1,6, j = 1,2). ƒл¤ удобства записи уравнений
переобозначим буквенные переменные следующим
образом:
P11
P1 ; P12
P2 ; P21
P3 ; P22
P4 ;
P31
P5 ; P32
P6 ; P41
P7 ; P42
P8 ;
P51
P9 ; P52
P10 ; P61
P11 ; P61
P12 ; .
Ёти переменные имеют следующие области определени¤:
133
“аблица 2
P1 Ы P1b Ы P1c Ы P1r Ы P1g Ы P1n Ы P1s Ы P1t Ы P1l Ы
Ы P1d Ы P1w Ы P1h Ы P1k Ы P1m Ы P1 p Ы P1q Ы P1v
P2a Ы P2e Ы P2o Ы P2i Ы P2u Ы P2y Ы P2
1;
1;
P3b Ы P3c Ы P3 f Ы P3r Ы P3g Ы P3n Ы P3s Ы P3t Ы
Ы P3l Ы P3d Ы P3z Ы P3w Ы P3k Ы P3m Ы P3x Ы P3p Ы P3
P4a Ы P4e Ы P4o Ы P4i Ы P4u Ы P4y Ы P4
1;
1;
P5b Ы P5c Ы P5 f Ы P5r Ы P5g Ы P5n Ы P5s Ы P5t Ы P5c Ы
Ы P5d Ы P5z Ы P5w Ы P5h Ы P5m Ы P5p Ы P5v Ы P5
P6a Ы P6e Ы P6o Ы P6i Ы P6u Ы P6
1;
1;
P7c Ы P7r Ы P7s Ы P7t Ы P7l Ы P7d Ы P7z Ы P7h Ы P7k Ы P7
P8a Ы P8e Ы P8o Ы P8i Ы P8u Ы P8
P9n Ы P9s Ы P9t Ы P9h Ы P9
P10e Ы P10
1; P11n Ы P11
1;
1;
1;
1; P12
1; .
Ќа множествах значений переменных букв лингвистического регистра существуют отношени¤, которые можно описать с помощью алгебры конечных
предикатов. ѕусть бинарное отношение на множествах значений буквенных переменных P1 и P2
имеет вид P1R1P2. Ёто отношение можно описать с
помощью конечного предиката R1(P1,P2), тогда
этот факт можно представить в следующем виде:
R1(P1,P2)= S(f1(P1),g1(P2)),
гдеU1= f1(P1) и V1= g1(P2) ? функции, объедин¤ющие значени¤ переменных P1 и P2 в классы эквивалентности. ѕредикат S(U1,V1) описывает бинарное отношение на множествах значений классов
эквивалентности U1 и V1. ƒл¤ объединени¤ букв в
классы эквивалентности производитс¤ склеивание
строк и столбцов таблицы значений предиката
R1(P1,P2). ѕри этом строки (столбцы) одинакового
состава замен¤ютс¤ одной строкой (столбцом) того
же состава. роме того, примем следующее допущение. ¬ случае, когда строки (столбцы) таблицы
значений предиката отличаютс¤ одним элементом,
можно ввести условную единицу (1) или условный
ноль (0) в определенную ¤чейку таблицы, чтобы
объединить эти строки (столбцы) в классы эквивалентности. ѕри этом ввод¤тс¤ (исключаютс¤) некоторые св¤зи между буквенными переменными P1
и P2. ¬ дальнейшем введение (исключение) этих
св¤зей компенсируетс¤ соответствующими дополнительными уравнени¤ми. «начени¤ предиката
R1(P1,P2) приведены в табл. 2.
Ы
P1s ;U1c ~ P1c
Ы
P1k ;U1r ~ P1r
Ы
P1d ;U1g ~ P1g
Ы
P1n
Ы
P1t
U1l ~ P1l Ы P1n ;U1h ~ P1h Ы P1m Ы P1 ;U1z ~ P1z ;U1q ~ P1q ;U1Q ~ P1Q ;
P1s ! P1i ; P1r ! P1 ; P1t ! P2a ; P1h ! P2y ;( 1 )
134
(1)
a
e
o
i
u
y
_
b
1
1
0
1
1
0
1
c
0
0
1
0
0
0
1
r
0
1
0
1
0
0
1
g
1
1
1
0
0
0
1
n
1
1
1
0
0
0
1
s
1
1
0
1
1
0
1
t
1
1
1
0
0
0
1
l
1
0
0
1
0
0
0
d
0
1
0
1
0
0
1
z
0
1
0
0
1
0
1
w
1
0
0
1
0
0
0
h
1
1
1
1
1
0
0
k
0
0
1
0
0
0
1
m
1
1
1
1
1
0
0
p
1
1
1
0
0
0
1
q
0
0
0
0
1
0
0
v
0
0
1
1
0
0
0
_
1
1
1
1
1
0
0
‘ункци¤ g1(P2) после объединени¤ букв в классы
будет иметь следующий вид:
V1a ~ P2a ;V1e ~ P2e ;V1o ~ P2o ;V1i ~ P2i ;
(2)
V1u ~ P2u ;V1y ~ P2y ;V1 ~ P2 ;.
Ќа основании полученных формул (1), (2) составл¤ем таблицу значений предиката S(U1,V1), представленную в табл. 3.
“аблица 3
V1
U1
‘ункци¤ f1(P1)после объединени¤ букв в классы
эквивалентности будет иметь следующий вид:
U1b ~ P1b
P2
p
Ы P1 ;
a
e
o
i
u
y
b
1
1
0
1
1
0
1
c
0
0
1
0
0
0
1
r
0
1
0
1
0
0
1
g
1
1
1
0
0
0
1
l
1
0
0
1
0
0
0
h
1
1
1
1
1
0
0
z
0
1
0
0
1
0
1
q
0
0
0
0
1
0
0
v
0
0
1
1
0
0
0
–», 2002, є 1
ѕолученна¤ табл. 3 значений предиката S(U1,V1)
дальнейшему преобразованию не подлежит, так
как в ней отсутствуют строки (столбцы), отличающиес¤ одним элементом. ѕоэтому произведем
импликативное разложение предиката S по переменным U1 и V1:
U1b ! V1a Ы V1e Ы V1i Ы V1u Ы V1 ;
U1c ! V1u Ы V1 ; U1r ! V1e Ы V1i Ы V1 ;
U1g ! V1a Ы V1e Ы V1o Ы V1 ;
U1l ! V1a Ы V1l ;
U1n ! V1a Ы V1e Ы V1o Ы V1i Ы V1u ;
U1r ! V1e Ы V1u Ы V1 ; U1 ! V1Q ;
q
U1Q ! V1o Ы V1i ; U1a ! V1b Ы V1 Ы V1l Ы V1h ;
g
g
U1e ! V1l Ы V1r Ы V1 Ы V1h Ы V1z ;
g
U1o ! V1c Ы V1 Ы V1h Ы V1Q ;
U1i ! V1b Ы V1r Ы V1l Ы V1h Ы V1Q ;
q
U1u ! V1b Ы V1h Ы V1z Ы V1 ;
g
U1 ! V1b Ы V1c Ы V1r Ы V1 Ы V1z .
(3)
ѕолученные соотношени¤ можно реализовать схемно
с помощью многополюсников, называемых элементами I и II рода. Ёлемент I рода реализует
функцию эквивалентности и работает в соответствии с соотношением
y b ~ x1a1 Ы x1a 2 Ы Ш Ш Ш Ы x1an .
ѕри этом если на вход многополюсника подать
сигнал x1a =1, то на его выходе формируетс¤
ответный сигнал yb =1;
если x1a1 = x1a2 = = x1an = 0, то yb =0,
если yb = 0, то x1a1 = x1a2 = = x1an =0,
при n = 1, если yb = 1, то x1a = 1.
–», 2002, є 1
(4)
Ёлемент второго рода реализует функцию импликации и действует в соответствии с соотношением
y b o x1a1 Ы x1a 2 Ы Ш Ш Ш Ы x1an .
(5)
ѕри входном воздействии x1a = x2a = = xna =0
выходной сигнал yb=0. ѕри n = 1, если yb=1, то x1a
=1. »спользу¤ элементы I и II рода, можно
составить схему многополюсника, котора¤ реализует отношение P1R1P2. ѕри этом используетс¤
система уравнений (1)-(5). Ќомера элементов I и II
рода на схеме соответствуют номерам уравнений,
которые они реализуют. јналогичным образом
можно описать межбуквенные отношени¤ на множествах значений остальных переменных лингвистического регистра (P2P3,P3P4, ..., P11P12). ѕолученные уравнени¤ и их схемные реализации представл¤ют собой математическую модель внутриморфемных отношений, заданных на множестве
префиксальных морфем имен существительных
немецкого ¤зыка, загруженных в лингвистический
регистр сегментированных префиксов. ѕолученные модели могут быть использованы при разработке лингвистических подсистем информационных систем самого разнообразного назначени¤, в
первую очередь систем, которые прин¤то называть
интеллектуальными.
Ћитература: 1. Ўабанов- ушнаренко ё.ѕ. “еори¤ интеллекта. ћатематические средства. ’арьков: ¬ища
шк., 1984. 144 с. 2.—ловарь словообразовательных элементов немецкого ¤зыка /ј.Ќ. «уев. ».ƒ. ћолчанова,
–.«. ћур¤сов и др. ѕод рук. ћ.ƒ. —тепановой. ћ.: »здво –ус. ¤з. 1979. 536 с.
ѕоступила в редколлегию 03.10.2001
–ецензент: д-р техн. наук, проф. √одлевский ћ.ƒ.
Ѕулкин ¬италий »ванович, канд. техн. наук, доцент
кафедры прикладной математики и информационных
технологий ћакеевского экономико-гуманитарного
института. јдрес: ”краина, 83000, ћакеевка ƒонецкой
обл., ул.ќстровского, 16, т/факс (06232) 6-35-59.
Ўаронова Ќаталь¤ ¬алерьевна, д-р техн. наук, профессор кафедры информационных технологий ’√»
?Ќ”ј?, проректор по научно-исследовательской работе. јдрес: ”краина, 61000, ’арьков, ул. Ћермонтовска¤, 17, тел. 40-10-45; 40-10-09 (2-93).
ќробинска¤ ≈лена јлександровна, ст. преп. кафедры
информационных технологий ’√» ?Ќ”ј?. јдрес:
”краина, 61000, ’арьков, ул. Ћермонтовска¤, 17, тел.
40-10-09 (4-50).
135
Документ
Категория
Без категории
Просмотров
4
Размер файла
200 Кб
Теги
моделирование, префиксальные, язык, отношений, математические, материалы, межбуквенных, морфем, немецкого
1/--страниц
Пожаловаться на содержимое документа