close

Вход

Забыли?

вход по аккаунту

?

Анализ эффективности применения графического процессора видеокарты для решения задач конвективного теплопереноса.

код для вставкиСкачать
МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02-2/2017 ISSN 2410-6070
Эта производная обращается в нуль при
(15)
Используя это выражение, из уравнения (13) найдем
Заменив здесь х на l и полагая, что h = H (14), т.е. высота столба жидкости максимальна, получим
Фигурная скобка этого выражения равна 0,533, поэтому
Как видно, l > 0, если ширина пластинки 2L удовлетворяет требованию
(16)
Если ширина пластинки 2L меньше правой части (16), то боковые поверхности сомкнутся и столб
жидкости распадется раньше, чем высота столба достигнет максимального значения Н (14).
В заключение вычислим максимальную силу, которую нужно приложить к пластинке весом Q, чтобы
достичь максимально высокого подъема жидкости. Очевидно, что по мере подъема пластинки эта сила
возрастает, потому что возрастает перепад давлений на ее внешнюю и внутреннюю поверхности.
Обозначив символом F максимальное значение силы, приходящееся на единицу длины пластинки, найдем:
Список использованной литературы:
1. Сборник задач по общему курсу физики. Часть II. Под редакцией Д. В. Сивухина. М.: ГИФМЛ, 1960,
366 с.
2. Сивухин Д.В. Общий курс физики. Термодинамика и молекулярная физика. М.: Наука, 1979, 551 с.
© Емельянов А.В., Кудряшова Е.С., Тимошенко А.А., 2017
УДК 519.6
Ю.С. Цивинская
к.ф.-м.н.
ФГБУН Институт теоретической и прикладной механики им. С.А. Христиановича СО РАН
В.Н. Попов
д.ф.-м.н., с.н.с.
ФГБУН Институт теоретической и прикладной механики им. С.А. Христиановича СО РАН
г. Новосибирск, Российская Федерация
АНАЛИЗ ЭФФЕКТИВНОСТИ ПРИМЕНЕНИЯ ГРАФИЧЕСКОГО ПРОЦЕССОРА ВИДЕОКАРТЫ
ДЛЯ РЕШЕНИЯ ЗАДАЧ КОНВЕКТИВНОГО ТЕПЛОПЕРЕНОСА
Аннотация
Рассмотрены возможности параллельных вычислений на персональном компьютере с видеокартой
NVIDIA для решения систем линейных алгебраических уравнений, полученных при неявной
18
МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02-2/2017 ISSN 2410-6070
аппроксимации нестационарной двухмерной задачи конвективного теплопереноса.
Ключевые слова
Графические процессоры, параллельные вычисления, СЛАУ, итерационные методы.
Введение. При решении нестационарных задач тепломассопереноса необходимы значительные
ресурсы персонального компьютера, однако, в настоящее время при проведении вычислительных
экспериментов возможно использование графических процессорных устройств (GPU – graphics processing
units) с организацией параллельных вычислений. В связи с этим, актуальной является разработка
алгоритмов, позволяющих параллельно проводить схожие операции при решении систем линейных
алгебраических уравнений (СЛАУ), так как доля таких расчетов значительно преобладает при решении
нестационарных задач распределения тепла [1]. В последнее время ведутся работы по разработке
алгоритмов решения итерационными методами разреженных СЛАУ [2, 3]. Общая тенденция развития в
этой области, сформулированная в [3], заключается в том, что ввиду отсутствия единого метода,
подходящего для любого класса задач (один и тот же алгоритм может сходиться или не сходиться к
решению в зависимости от типа матрицы), необходимо иметь библиотеку программ с реализацией
различных итерационных методов.
В настоящей работе оценивалась эффективность параллельных вычислений для решения СЛАУ,
полученных при неявной аппроксимации нестационарной двухмерной тестовой задачи конвективного
теплопереноса методом конечных разностей. При расчетах использовался ПК, оснащенный
дополнительной видеокартой NVIDIA GeForce GTX 285, являющейся 240-ядерным процессором GPU. При
численной реализации исходной задачи при решении систем уравнений различными итерационными
методами сравнивалось использование CPU и CPU+GPU для оценки общего затраченного времени.
Вычисления проводились с одинарной точностью.
Модельная задача и алгоритм реализации. Рассматривается следующая задача
T
T
T
u
v
 aT  f , t , x, y [0,1] ,
t
x
y



 2
 2
где f (t , x, y ) 
u
v
a 2 a 2
t
x
y
x
y
 t , x, y   exp t sin 2x   sin 2y ,
(1)
,
u ( x, y )  8x 4  2 x 3  x 2    16 y 3  30 y 2  12 y ,
v( x, y )  84 x 3  6 x 2  2 x    4 y 4  10 y 3  6 y 2  , maxu , v   1 .
Начальные и граничные условия:
T
x
 2t ,
x 0 ,1
T
y
 2t .
(2)
y  0 ,1
T t 0   (0, x, y ) .
(3)
Для решения задачи (1)-(3) применялся конечно-разностный алгоритм. В расчетной области
использовалась равномерная пространственная сетка, шаг по времени  был принят постоянным.
Распределение температуры на n-ом временном шаге в момент времени
описывалось в узлах сетки значениями
t n в расчетной области
n
i, j
T . Разностные уравнения строились аппроксимацией (1) и
граничных условий (3). Так как для конвективных членов используется противопоточная схема, то
погрешность аппроксимации задачи имеет порядок
O( , hx , hy ) .
Разностное уравнение для узла (i,j) при
t  t n записывается в виде
ei , jTi ,nj  ai , jTi n1, j  bi , jTi ,nj 1  ci , jTi n1, j  d i , jTi ,nj 1  f i ,nj ,
19
МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02-2/2017 ISSN 2410-6070
где
a1, j  0 , cI , j  0 , j  1,..., J ; bi ,1  0 , d i , J  0 , i  1,..., I .
Полученную систему линейных алгебраических уравнений можно представить в виде
AT  f ,
(4)
является пятидиагональной, монотонной, обладает строгим диагональным
где матрица
преобладанием
A
( ei , j  ai , j  bi , j  ci , j  di , j ),
а
T  {Ti ,nj } , f  { f i ,nj } – вектора. Таким образом, при
численной реализации задачи на каждом временном шаге необходимо находить решение системы (4), что
осуществлялось различными итерационными методами [4] до получения на s–ой итерации результата с
заданной точностью
max Ti ,nj, s  Ti ,nj, s 1   , = 10 6 .
i, j
Результаты расчётов. Расчёты проводились на ПК, оснащенном CPU 2.67 ГГц и дополнительной
видеокартой NVIDIA GeForce GTX 285. Использовались пространственные сетки с различным
количеством узлов при постоянном временном шаге
  10 3 .
Время решения на CPU сравнивалось c
временем решения задачи на CPU+GPU. В таблицах приведены полученные результаты при a  0.001 . В
скобках указано количество итераций, затрачиваемых на временном шаге для достижения требуемой
точности. Наряду с этим определялась погрешность решения задачи сравниванием рассчитанных
результатов с точными значениями при tn=1.
Метод Якоби:
T k  D 1 ( LT k 1  UT k 1  f ) .
Здесь
A  L  D  U , D  {ei , j }
– диагональная матрица,
неотрицательные нижняя и верхняя треугольные матрицы,
представлены в табл. 1.
k
L  {ai , j , bi , j } , U  {ci , j , di , j }
–
– номер итерации. Результаты вычислений
Таблица 1
51 х 51
101 х 101
201 х 201
401 х 401
Время расчетов в сек. (Кол-во итераций) (Погрешность)
1.0 (4)
4.0 (5)
18.0 (7)
96.0 (13)
(9.5710-2)
(4.9210-2)
(2.4910-2 )
(1.2510-2 )
0.7 (4)
1.0 (5)
2.8 (7)
15.9 (13)
(9.5810-2 )
(4.9210-2 )
(2.4710-2 )
(1.2310-2 )
IxJ
CPU
CPU+GPU
Метод наискорейшего спуска:
(r k 1 , r k 1 )
k
k 1
k 1
, T  T   kr .
r  f  AT ,  k 
k 1
k 1
( Ar , r )
k
k
Результаты использования метода представлены в табл. 2.
Таблица 2
IxJ
CPU
CPU+GPU
51 х 51
101 х 101
201 х 201
401 х 401
Время расчетов в сек. (Кол-во итераций) (Погрешность)
1.0 (3)
3.7 (3)
13.9 (4)
57.1 (5)
(9.5710-2)
(4.9210-2)
(2.4810-2 )
(1.2210-2 )
1.0 (3)
1.0 (3)
1.6 (4)
3.1 (5)
(9.5810-2 )
(4.9110-2 )
(2.4610-2 )
(1.2010-2 )
Метод сопряженных градиентов:
r  f  AT , p  r , T  T
0
0
0
0
k
k 1
(r k , r k )
  k 1p ,  k  k
,
(p , Ap k )
k 1
r k  r k 1   k 1 Ap k 1 , p k  r k 1   k 1p k 1 ,  k 
20
(r k , r k )
.
(r k 1 , r k 1 )
МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02-2/2017 ISSN 2410-6070
Полученные результаты представлены в табл. 3.
Таблица 3
IxJ
CPU
CPU+GPU
51 х 51
101 х 101
201 х 201
401 х 401
Время расчетов в сек. (Кол-во итераций) (Погрешность)
1.0 (3)
3.8 (3)
14.0 (3)
63.9 (4)
(9.5710-2 )
(4.9210-2)
(2.4810-2 )
(1.2210-2 )
1.2 (3)
1.2 (3)
1.6 (3)
3.7 (4)
(9.5810-2 )
(4.9110-2 )
(2.4610-2 )
(1.2010-2 )
Из представленных результатов следует, что в случаях небольшого количества узлов
пространственной сетки (5151) выигрыш при использовании параллельных расчетов фактически
отсутствует. Эффективность применения GPU проявляется и растёт с увеличением количества
неизвестных. В ходе численных экспериментов при использовании стандартной видеокарты NVIDIA
GeForce было получено ускорение расчетов до 18 раз в зависимости от метода и количества точек
аппроксимации, что позволяет значительно повысить производительность расчетов.
Надо отметить, что с увеличением количества узлов пространственной сетки выявлено расхождение
в точности получаемых результатов (не превышающее 3%) при расчетах на CPU и при использовании
видеокарты. Предпринимались попытки уменьшить эти расхождения либо уменьшением временного шага,
либо повышением точности реализации итерационного процесса. Однако было определено, что такое
изменение условий расчётов не приводит к улучшению решения, и, скорее всего, объясняется тем, что
CUDA-совместимые устройства не полностью реализуют стандарт IEEE-754 представления чисел с
десятичной точкой.
Заключение. Различными итерационными методами получены решения разреженных СЛАУ на ПК с
графическим процессором NVIDIA. Определено, что такой подход при реализации задач теплопереноса
позволяет повысить производительность расчетов при относительно невысоких затратах, а эффективность
применения графического процессора растёт с увеличением размерности СЛАУ.
Список использованной литературы:
1. Максимов Д.Ю., Кудряшов И.Ю., Марченко Н.А. Суперускорение гидродинамических расчетов с
помощью применения графических процессоров NVIDIA и технологий программирования СUDA //
Вестник ЦКР Роснедра. 2010. № 1. С. 67-69.
2. Кривов М.А., Казеннов А.М. Сравнение вычислительных возможностей графических ускорителей при
решении различных классов задач // Труды Всероссийской научно-практической конференции
"Применение гибридных высокопроизводительных вычислительных систем для решения научных и
инженерных задач". Н.Н., 2011. С. 18-24.
3. Губайдуллин Д.А., Никифоров А.И., Садовников Р.В. Использование графических процессоров для
решения разреженных СЛАУ итерационными методами подпространств Крылова с предобусловливанием
на примере задач теории фильтрации // Вестник Нижегородского университета им. Н.И. Лобачевского.
2011. № 1. С. 205-212.
4. Самарский A.A., Николаев T.C. Методы решений сеточных уравнений. – М.: Наука, 1978. 592 c.
© Цивинская Ю.С., Попов В.Н., 2017
21
МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02-2/2017 ISSN 2410-6070
БИОЛОГИЧЕСКИЕ НАУКИ
УДК 636.2:612.621
Т.И. Кузьмина, д.б.н., профессор
Т.И. Станиславович, к. с.-х. н.
ФГБНУ ВНИИГРЖ
г. Санкт-Петербург – Пушкин, Российская Федерация
И.Я. Шахтамиров, д.б.н., профессор
Х.М. Мутиева, к. с.-х. н., доцент
ФГБОУ ВО «Чеченский государственный университет»
г. Грозный, Чеченская Республика
КОМПЕТЕНТНОСТЬ К РАЗИТИЮ ЗАВЕРШИВШИХ ФАЗУ РОСТА IN VIVO ИЛИ
IN VITRO ООЦИТОВ SUS SCROFA DOMESTICUS ИЗ ЯИЧНИКОВ НА РАЗНЫХ
СТАДИЯХ ОВАРИАЛЬНОГО ЦИКЛА
Аннотация
Сравнительный анализ показателей оплодотворяемости исходной популяции донорских ооцитов
свиней выявил высокие потенции к развитию ооцитов, завершивших фазу роста in vivo, выделенных из
яичников в фолликулярную фазу овариального цикла. Доля раздробившихся клеток составила 56%, а
выход бластоцист – 38%. Напротив, растущие ооциты, аспирированные из яичников в лютеиновую или
фолликулярную фазу, имели низкие показатели оплодотворяемости (% дробления – 26% и 31%, выход
бластоцист - 9% и 11%).
Ключевые слова
Яичники, ооциты, оплодотворение in vitro, Sus Scrofa. Domesticus.
T.I. Kuzmina
Dr. of Biological Sciences, Professor
T.I. Stanislavovich
The candidate of agricultural Sciences
All-Russian Research Institute for Farm Animal Genetics & Breeding
St. Petersburg – Pushkin, Russian Federation
I.Y. Shakhtamirov
Dr. of Biological Sciences, Professor
H. M. Mutieva
The candidate of agricultural Sciences, docent
the Chechen State University
Grozny, the Chechen Republic
DEVELOPMENT COMPETENCE OF PORCINE OOCYTES THAT HAVE FINISHED THE
GROWTH PHASE IN VIVO OR IN VITRO FROM THE OVARIES AT DIFFERENT
STAGES OF THE OVARIAN CYCLE
Abstract
Comparative analysis of fertility of donor’s porcine oocytes has showed high development competence of
the oocytes that have finished growth phase in vivo and isolated from the ovaries in follicular phase of the ovarian
cycle. Percentage of cleavage was 56%, and the yield of blastocysts - 38%. On the contrary, the growing oocytes,
have aspirated from the ovaries in the luteal phase or in follicular phase had low rates of fertility (percentage of
cleavage - 26% and 31%, yield of blastocysts - 9% and 11%).
22
1/--страниц
Пожаловаться на содержимое документа