[目次] [1ページ目] [前ページ] [次ページ] [OHP] [質疑応答]
(4/6)

4. 計算結果

 本計算対象は、x、z方向は一様な流れの分布とみなせるので、計算の大部分は壁面に対して平行に計算領域を分割して行った。なお、圧力ポアソン方程式は、x、z方向にFast Fourier Transform(以下、FFT)、y方向はTri-Diagonal Matrix Algorithm(以下、TDMA)を用いて計算しているため、各計算ステップでデータの転送が必要となる。また、VPP5000はベクトル計算機なので、並列化のみならずベクトル化も有効な計算を行うためには不可欠である。このベクトル化に関しては特に配慮し、圧力ポアソン方程式を計算する際には、FFTの計算の場合には、x、z方向にベクトル化、y方向に並列分割して計算を行った。他方、TDMAの計算の場合には、x方向にベクトル化、z方向へ並列分割を施して計算を行った (Fig. 3参照)。


Fig. 3 Domain decomposition and vectorized parallel computation


NWTにおいて、本計算プログラムの並列効率をRet =180の比較的小さな計算(総格子点数:約800万点)に対して計測した。なお、本計算はNWT単Processing Element(以下、PE)ではメモリー不足により計算が実行できなかったため、16PEの計算を比較の基準とした。この場合、並列効率は下記の式で定義される。



Fig. 4に並列効率を、Fig. 5に100ステップ当たりの計算時間を示す。Fig. 4より、PE数が増加するにつれて並列効率が減少することが分かる。これは、本計算は基本的にy方向に並列分割しているため、64PE計算時には1PEが担う計算量は2レイヤー分となり、計算量が少ないことが原因であると考えられる。それにもかかわらず、Fig. 5に見られるように、計算時間自体は、64PEまでPE数が増加するにつれて十分よく減少している。従って、並列計算は、メモリー量の面だけでなく計算時間の面でも有効であると言える。なお、並列効率は、計算規模が増加するにつれて改善されると考えられる。


Fig. 4 Parallel efficiency              Fig. 5 Computation time

 NWT並列計算時とVPP5000単体計算時の性能を比較する。計算条件をTable 3に、計算結果をTable 4に示す。結果として、VPP5000単体の計算速度は、NWT単PEの計算速度に対して約15倍速い結果が得られた。これは、CPUの高速化と並列度の低減の双方の効果によるもので、妥当な結果と考えている。

Table 3 比較条件


Table 4 比較結果


本研究で、最も大規模なRet = 640の計算は、名古屋大学大型計算機センター用に変更したプログラムを用い、計算領域も拡大して、VPP5000で実施中である。Table 5にNWTとVPP5000のRet = 640の計算条件を比較して示す。これに先立ち、NWT計算時の計算条件において、NWTとVPP5000の並列計算時における性能比較を行った。結果をFig. 6に示す。Fig.6より、VPP5000の並列計算時ではシングルPEの性能から期待される計算速度には、必ずしも達していないことが分かる。また、本計算では、ELAPS TimeとCPU Timeの差が大きい結果を得た。これは、FFT及びTDMA計算時に発生する大量なデータ転送が原因と考えている。

Table 5 Computation of Ret = 640



Fig. 6 Comparison of the performance between NWT and VPP5000 through a preliminary test run


このようにして計算した平行平板間乱流のDNSの結果から、壁面近傍の低速・高速ストリークを可視化した結果をFig. 7、8に示す。ここでストリークとは、粘性低層付近に低速・高速の流体が集まってできる縞状の構造のことである。元来、乱流は全くランダムな流れの形態を持つと考えられがちだが、何十年も前から乱流には準秩序的な構造が存在することが実験より見出されている。今回のDNSの結果からも、壁面近傍に低速・高速ストリーク等の準秩序的な構造がはっきりと捉えられている。さらに、レイノルズ数が高くなるにつれて乱れが間欠的となるために、構造が複雑になること等の新しい知見も得た。このように、DNSの結果は、実験では測定することが困難なデータを任意の位置、時間で求めることができ、現在では乱流現象の把握や乱流モデルの開発に必要不可欠なツールとなっている。


Fig. 7 High- and low-speed streaks and low pressure regions for Ret = 180



Fig. 8 High- and low-speed streaks and low pressure regions for Ret = 640


[目次] [1ページ目] [前ページ] [次ページ] [OHP] [質疑応答]