最近論文に追われていてブログをちゃんと更新していませんでした。
しかも昨日はSACSISに提出が済んだせいで気が抜けてしまい、全く卒論の作業をやりませんでした。
そのうえ先生の名前を前後間違えて提出してしまいました。
今日から頑張ります。
2010年1月23日土曜日
1/23 gccのusleep()
sleepで指定したマイクロ秒だけusleep()し、
合計の秒数が1秒になるよう回数を調整して実行した結果。
実行はstreams02で行った。
1.100085sec. sleep = 10000.
1.206834sec. sleep = 5000.
1.451034sec. sleep = 2500.
1.500036sec. sleep = 2000.
2.002072sec. sleep = 1000.
2.002207sec. sleep = 500.
4.021739sec. sleep = 250.
5.004297sec. sleep = 200.
10.028340sec. sleep = 100.
20.063263sec. sleep = 50.
10ms程度、最悪でも5ms以下のusleepは使わないほうがよさそう。
合計の秒数が1秒になるよう回数を調整して実行した結果。
実行はstreams02で行った。
1.100085sec. sleep = 10000.
1.206834sec. sleep = 5000.
1.451034sec. sleep = 2500.
1.500036sec. sleep = 2000.
2.002072sec. sleep = 1000.
2.002207sec. sleep = 500.
4.021739sec. sleep = 250.
5.004297sec. sleep = 200.
10.028340sec. sleep = 100.
20.063263sec. sleep = 50.
10ms程度、最悪でも5ms以下のusleepは使わないほうがよさそう。
2010年1月12日火曜日
1/12 デバッグ中
二日に渡る格闘の結果、ラウンドロビン部分とアグリゲート部分の正常動作は確認できた。
SSTにもうまくデータが送られ、それらしきスコアが返されているように見えるのだが、
どうやってもレイテンシの値が予測される値とかけ離れてしまう。
数十個に一つ0.1s台が出る程度で、他のほとんどの結果が2ms程度になってしまう。
SSTにもうまくデータが送られ、それらしきスコアが返されているように見えるのだが、
どうやってもレイテンシの値が予測される値とかけ離れてしまう。
数十個に一つ0.1s台が出る程度で、他のほとんどの結果が2ms程度になってしまう。
2010年1月9日土曜日
1/29 SPADEの分散コンパイルによる速度向上
-j 8 -r 8
real 1m5.460s
user 0m31.292s
sys 0m10.082s
-j 8 -r 4
real 1m25.733s
user 0m43.968s
sys 0m11.721s
-j 4 -r 4
real 1m29.458s
user 0m49.873s
sys 0m11.478s
-j 1
real 3m50.559s
user 2m19.719s
sys 0m17.348s
測定はCenOS5.2のtimeコマンド、測定環境はstreams01-08ノード。
-jはコンパイルスレッド数、-rはコンパイルノード数を表すSPADEコンパイラのオプション。
4ノード4スレッドでは3倍、8ノード8スレッドでは4倍の速度向上が見られる。
real 1m5.460s
user 0m31.292s
sys 0m10.082s
-j 8 -r 4
real 1m25.733s
user 0m43.968s
sys 0m11.721s
-j 4 -r 4
real 1m29.458s
user 0m49.873s
sys 0m11.478s
-j 1
real 3m50.559s
user 2m19.719s
sys 0m17.348s
測定はCenOS5.2のtimeコマンド、測定環境はstreams01-08ノード。
-jはコンパイルスレッド数、-rはコンパイルノード数を表すSPADEコンパイラのオプション。
4ノード4スレッドでは3倍、8ノード8スレッドでは4倍の速度向上が見られる。
登録:
投稿 (Atom)