2024/09/30 更新

お知らせ

 

写真a

オオシマ サトシ
大島 聡史
OHSHIMA SATOSHI
所属
情報基盤研究開発センター 先端計算科学研究部門 准教授
システム情報科学府 情報理工学専攻(併任)
マス・フォア・イノベーション連係学府 (併任)
職名
准教授
連絡先
メールアドレス
ホームページ
外部リンク

学位

  • 博士(工学)

経歴

  • 2014.04-2016.03 文部科学省 技術参与

    2014.04-2016.03 文部科学省 技術参与

  • 2009.04-2009.09 電気通信大学 産学官連携研究員 2009.10-2017.03 東京大学 情報基盤センター(助教) 2017.04-2019.06 九州大学 情報基盤研究開発センター 学際計算科学研究部門 助教 2019.07-2022.09 名古屋大学 情報基盤センター 大規模計算支援環境研究部門 准教授

研究テーマ・研究キーワード

  • 研究テーマ:GPUの有するRTコアの計算科学分野における活用に関する研究

    研究キーワード:GPU, RTコア, 計算科学

    研究期間: 2021年4月

  • 研究テーマ:最新並列計算機環境における通信削減CG法に関する研究

    研究キーワード:通信削減CG法

    研究期間: 2017年4月 - 2020年12月

  • 研究テーマ:時間並列計算法に関する研究

    研究キーワード:Parareal法

    研究期間: 2017年4月 - 2020年3月

  • 研究テーマ:GPUを用いた低ランク近似行列計算法に関する研究

    研究キーワード:低ランク近似計算、GPU

    研究期間: 2016年4月

  • 研究テーマ:マルチコア・メニーコアプロセッサにおける分子動力学計算に関する研究

    研究キーワード:分子動力学計算、マルチコアCPU、メニーコアプロセッサ、自動チューニング

    研究期間: 2015年4月 - 2020年12月

  • 研究テーマ:並列数値計算の自動チューニングに関する研究

    研究キーワード:自動チューニング

    研究期間: 2009年10月

  • 研究テーマ:GPUを用いた高性能計算に関する研究

    研究キーワード:GPU, GPGPU, GPUコンピューティング

    研究期間: 2004年5月

受賞

  • Best Paper Award of PDSEC 2023

    2023年5月   PDSEC committee  

     詳細を見る

    前職の名古屋大学在籍時に指導していた学生が中心となり、共同で指導していた教員らとともに執筆・投稿した論文が、国際ワークショップPDSECにてBest Paper Awardを受賞した。

論文

  • FMOプログラムABINIT-MPの整備状況2023

    望月 祐志, 中野 達也, 坂倉 耕太, 奥脇 弘次, 土居 英男, 加藤 季広, 滝沢 寛之, 成瀬 彰, 大島 聡史, 星野 哲也, 片桐 孝洋

    23 ( 1 )   4 - 8   2024年   ISSN:13471767 eISSN:13473824

     詳細を見る

    記述言語:日本語   出版者・発行元:日本コンピュータ化学会  

    <p>In August 2023, we released the latest version of our ABINIT-MP program, Open Version 2 Revision 8. In this version, the most commonly used FMO-MP2 calculations are even faster than in the previous Revision 4. It is now also possible to calculate excitation and ionization energies for regions of interest. Improved interaction analysis is also available. In addition, we have started GPU-oriented modifications. In this preliminary report, we present the current status of ABINIT-MP.</p>

    DOI: 10.2477/jccj.2024-0001

    CiNii Research

  • 九州大学情報基盤研究開発センター新スーパーコンピュータシステムの紹介

    大島聡史, 南里豪志, 美添一樹, 平島智将, 原田浩睦, 池田嗣穂

    大学ICT推進協議会 2023年度 年次大会   2023年12月

     詳細を見る

    記述言語:その他  

  • GPUスパコンを用いたPETの四次元再構成

    大島 聡史, 湯淺 義尚, 松村 海飛, 横田 達也, 本谷 秀堅, 坂田 宗之, 木村 裕一, 片桐 孝洋, 永井 亨, 塙 敏博, 星野 哲也

    Medical Imaging Technology   41 ( 4-5 )   150 - 156   2023年11月   ISSN:0288450X eISSN:21853193

     詳細を見る

    記述言語:日本語   出版者・発行元:日本医用画像工学会  

    <p>医用画像処理技術の発達により,生体の内部を視覚的に理解するためのさまざまな技術が開発され,利用されている.しかし,それらにより直接的に得ることができるのは画像や映像であり,診断は医師など人の手によって行われている.これらの労力を軽減するソフトウェアへの期待は大きく,すでに医療の現場で利用されている技術も増えてきているが,医療(医用画像)と計算機技術の両方の知識と技術が必要なため,対象は限られている.そこで本研究では,医用画像処理分野と高性能計算分野の研究者が協力してPET における画像再構成の高速化と大規模化に取り組んでいる.本稿ではその取り組みの内容とこれまでに得られた成果を紹介する.</p>

    DOI: 10.11409/mit.41.150

    CiNii Research

  • Bayesian phase difference estimation algorithm for direct calculation of fine structure splitting: accelerated simulation of relativistic and quantum many-body effects

    Kenji Sugisaki, Srinivasa Prasannaa, Satoshi Ohshima, Takahiro Katagiri, Yuji Mochizuki, Bijaya Kumar Sahoo, Bhanu Pratap Das

    Electronic Structure   2023年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1088/2516-1075/acf909

  • CUDA Fortran+MIG+UVMを用いたBLR行列QR分解の大規模高速化

    大島聡史, 伊田明弘, 河合直聡, 横田理央, 山崎市太郎

    情報処理学会研究報告(Web)   2023 ( HPC-190 )   2023年7月

     詳細を見る

    記述言語:その他  

  • 「不⽼」 Type II上でcuQuantum量⼦シミュレータを⽤いた相対論的量⼦化学計算の事例

    杉﨑研司, Prasannaa V. S, 大島聡史, 片桐孝洋, 森野慎也, 望月祐志, Sahoo B. K, Das B. P

    第28回計算工学講演会 予稿集   2023年6月

     詳細を見る

    記述言語:その他  

  • 数値計算ライブラリの自動チューニングにおけるXAI適用の試み—An Adaptation of XAI to Auto-tuning for Numerical Calculation Library

    青木 将太, 片桐 孝洋, 大島 聡史, 永井 亨, 星野 哲也

    計算工学講演会論文集 = Proceedings of the Conference on Computational Engineering and Science / 日本計算工学会 編   28   904 - 907   2023年5月

     詳細を見る

    記述言語:日本語  

  • Implementation of Radio Wave Propagation using RT Cores and Consideration of Programming Models.

    Shinya Hashinoki, Satoshi Ohshima, Takahiro Katagiri, Toru Nagai, Tetsuya Hoshino

    IPDPS Workshops   673 - 681   2023年5月

     詳細を見る

    記述言語:その他   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/IPDPSW59300.2023.00115

  • QR Factorization of Block Low-Rank Matrices on Multi-Instance GPU 査読 国際誌

    Satoshi Ohshima, Akihiro Ida, Rio Yokota, Ichitaro Yamazaki

    Parallel and Distributed Computing, Applications and Technologies   2023年4月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: https://doi.org/10.1007/978-3-031-29927-8_28

  • QR Factorization of Block Low-Rank Matrices on Multi-instance GPU 査読

    359 - 369   2023年4月

     詳細を見る

    記述言語:その他  

    DOI: 10.1007/978-3-031-29927-8_28

  • Autotuning Power Consumption and Computation Accuracy using ppOpen-AT.

    Shouhei Yamanashi, Hisashi Yashiro, Takahiro Katagiri, Toru Nagai, Satoshi Ohshima

    MCSoC   208 - 215   2023年1月

     詳細を見る

    記述言語:その他   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/MCSoC57363.2022.00041

  • Parallelization of Automatic Tuning for Hyperparameter Optimization of Pedestrian Route Prediction Applications using Machine Learning

    Fujika S., Yajima Y., Tanaka T., Fujii A., Kato Y., Ohshima S., Katagiri T.

    ACM International Conference Proceeding Series   96 - 105   2023年   ISBN:9781450398053

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM International Conference Proceeding Series  

    We study software automatic tuning. Automatic tuning tools using iterative one-dimensional search estimate hyperparameters of machine learning programs. Iterative one-dimensional search searches the parameter space consisting of possible values of the parameters to be tuned by repeatedly measuring and evaluating the target program. Since it takes time to train a machine learning program, estimating the optimal hyperparameters is time-consuming. Therefore, we propose a method to reduce the time required for automatic tuning by parallelization of iterative one-dimensional search. For parallelization, we use multiple job execution on a supercomputer that can utilize multiple GPUs, which is effective for machine learning. In this method, each job measures different hyperparameters. The next search point is determined by referring to the data obtained from each job. The target program is a pedestrian path prediction application. This program predicts future routes and arrival points based on past pedestrian trajectory data. The program is intended to be used in a variety of locations, and the locations and movement patterns will vary depending on the dataset used for training. We hypothesized that the estimation results of one dataset could be used for automatic tuning of another dataset, thereby reducing the time required for automatic tuning. Experimental results confirm that the parallelized iterative one-dimensional search reduces the estimation time from 89.5 hours to 4 hours compared to the sequential search. We also show that the iterative one-dimensional search efficiently investigates the point at which the performance index improves. Moreover, the hyperparameters estimated for one data set are used as the initial point for the search and automatic tuning for another data set. Compared to the results of automatic tuning with the currently used hyperparameters as the initial values, both the number of executions and execution time were reduced.

    DOI: 10.1145/3578178.3578235

    Scopus

    researchmap

    その他リンク: https://dblp.uni-trier.de/db/conf/hpcasia/hpcasia2023.html#FujikaYTFKOK23

  • Autotuning by Changing Directives and Number of Threads in OpenMP using ppOpen-AT.

    Toma Sakurai, Satoshi Ohshima, Takahiro Katagiri, Toru Nagai

    CoRR   abs/2312.05779   2023年

     詳細を見る

    掲載種別:研究論文(学術雑誌)  

    DOI: 10.48550/arXiv.2312.05779

    researchmap

  • mdx: A Cloud Platform for Supporting Data Science and Cross-Disciplinary Research Collaborations.

    DASC/PiCom/CBDCom/CyberSciTech   1 - 7   2022年12月

     詳細を見る

    記述言語:その他   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/DASC/PiCom/CBDCom/Cy55231.2022.9927975

  • 磁場閉じ込めプラズマの乱流シミュレーション・データに対する画像を用いた解析—Image-based Analysis for Turbulence Simulation Data of Magnetic Confined Plasmas—小特集 プラズマ・核融合シミュレーション研究の最近の進展

    定方 翼, 沼波 政倫, 片桐 孝洋, 大島 聡史, 永井 亨

    シミュレーション = Journal of the Japan Society for Simulation Technology / 日本シミュレーション学会 編   41 ( 4 )   228 - 233   2022年12月

     詳細を見る

    記述言語:日本語  

  • FMOプログラムABINIT-MPの整備状況2022 招待 査読

    望月 祐志, 中野 達也, 坂倉 耕太, 渡邊 啓正, 佐藤 伸哉, 奥脇 弘次, 秋澤 和輝, 土居 英男, 大島 聡史, 片桐 孝洋

    21 ( 4 )   106 - 110   2022年12月

     詳細を見る

    記述言語:日本語  

    We have been developing the ABINIT-MP program for fragment molecular orbital (FMO) calculations over 20 years. Several improvements for accelerated processing were made after the release of Open Version 2 Revision 4 at September 2021. Functionalities were enhanced as well. In this short report, we summarize such developments toward the next release of Revision 8.

    DOI: 10.2477/jccj.2022-0037

  • マルチインスタンスGPU上におけるBLR行列のQR分解

    大島聡史, 伊田明弘, 横田理央, 山崎市太郎

    日本応用数理学会年会講演予稿集(CD-ROM)   2022   2022年9月

     詳細を見る

    記述言語:その他  

  • A Novel Approach for Data Analysis Based on Visualization of Phase Space Distribution Function in Plasma Turbulence Simulations

    Tsubasa SADAKATA, Shuta KITAZAWA, Masanori NUNAMI, Takahiro KATAGIRI, Satoshi OHSHIMA, Toru NAGAI

    Plasma and Fusion Research   17   2403079 - 2403079   2022年6月

     詳細を見る

    記述言語:その他   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1585/pfr.17.2403079

  • 高精度行列積ライブラリの性能チューニングにおけるXAIの適用と評価—Adaptation and Evaluation of XAI to Performance Auto-tuning on an Accurate Precision Matrix-Matrix Library

    片桐 孝洋, 青木 将太, 大島 聡史, 永井 亨

    計算工学講演会論文集 = Proceedings of the Conference on Computational Engineering and Science / 日本計算工学会 編   27   548 - 551   2022年6月

     詳細を見る

    記述言語:日本語  

  • mdx: A Cloud Platform for Supporting Data Science and Cross-Disciplinary Research Collaborations.

    CoRR   abs/2203.14188   2022年5月

     詳細を見る

    記述言語:その他   掲載種別:研究論文(学術雑誌)  

    DOI: 10.48550/arXiv.2203.14188

  • A64FXを用いたフラグメント分子軌道計算プログラムの性能評価

    満田, 晴紀, 片桐, 孝洋, 坂倉, 耕太, 中野, 達也, 望月, 祐志, 大島, 聡史, 永井, 亨

    第84回全国大会講演論文集   2022 ( 1 )   63 - 64   2022年2月

     詳細を見る

    記述言語:日本語  

    フラグメント分子軌道計算(FMO)を行うソフトウェアABINIT-MPについて、名古屋大学情報基盤センターが提供するスーパーコンピュータ「不老」TypeⅠサブシステム(CPU:ARMA64FX)を用いて性能評価した結果を示す。

  • サポートベクターマシンへのCMOSアニーリング適用の検討

    福原, 諒河, 森下, 誠, 片桐, 孝洋, 大島, 聡史, 永井, 亨

    第84回全国大会講演論文集   2022 ( 1 )   69 - 70   2022年2月

     詳細を見る

    記述言語:日本語  

    本発表ではサポートベクターマシン(SVM)にCMOSアニーリングを適用することを検討する。SVMとは線形入力素子を利用して2クラスのパターン識別器を構成する手法である。訓練サンプルから、各データ点との距離が最大となるマージン最大化超平面を求めるという基準で線形入力素子のパラメータを学習する。この際誤分類の許容度や汎化性能におけるハイパーパラメータの調整が必要になるが本研究では交差エントロピー損失を評価指標としてチューニングする。一方、CMOSアニーリングマシンは「組合せ最適化問題」に対して高速に最適解を出すアニーリング技術を常温環境で利用できる非ノイマン型計算機である。これを2クラス分類問題に用いSVMと比較する。

  • Mesh Tensorflowを用いたMNIST学習の性能評価

    鵜野, 圭介, 大島, 聡史, 片桐, 孝洋, 永井, 亨

    第84回全国大会講演論文集   2022 ( 1 )   65 - 66   2022年2月

     詳細を見る

    記述言語:日本語  

    Mesh tensorflowは2019年に提案された分散型深層学習用の言語である。モデル並列によって大規模ニューラルネットワーク学習を行うといった特徴を持つソフトウェアだが、BERT型の構造を持つニューラルネットワークのみにしか使用できない点もあり性能評価事例が多くない。そこで本研究ではGPUスパコン上でMesh Tensorflowのサンプルコードの性能評価を行う。コード内ではパラメタとしてバッチサイズやレイアウトルール等が存在するため、それらを考慮した性能評価を行う。

  • RTコアによる電波の伝搬損失計算の実装とプログラミングモデルの検討

    大島 聡史

    研究報告ハイパフォーマンスコンピューティング(HPC)   2022-HPC-185   1 - 12   2022年

     詳細を見る

  • Parallelization of GKV benchmark using OpenACC.

    Makoto Morishita, Satoshi Ohshima, Takahiro Katagiri, Toru Nagai

    IEEE International Parallel and Distributed Processing Symposium Workshops   723 - 729   2021年6月

     詳細を見る

    記述言語:その他   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/IPDPSW52791.2021.00109

  • An Auto-tuning with Adaptation of A64 Scalable Vector Extension for SPIRAL.

    Naruya Kitai, Daisuke Takahashi, Franz Franchetti, Takahiro Katagiri, Satoshi Ohshima, Toru Nagai

    IEEE International Parallel and Distributed Processing Symposium Workshops   789 - 797   2021年6月

     詳細を見る

    記述言語:その他   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/IPDPSW52791.2021.00117

  • マルチGPU環境における機械学習ハイパーパラメータの自動チューニング(1)

    多部田, 敏樹, 藤家, 空太郎, 藤井, 昭宏, 田中, 輝雄, 加藤, 由花, 大島, 聡史, 片桐, 孝洋

    第83回全国大会講演論文集   2021 ( 1 )   41 - 42   2021年3月

     詳細を見る

    記述言語:日本語  

    我々は複数のパラメータを同時に推定する手法として,パラメータ空間における反復一次元探索を提案している.この手法はパラメータの組み合わせを自動的に選択し,その実行性能を実測,さらに別の組み合わせの選択を繰り返すことで探索を行う.この提案手法を機械学習プログラムに適用する.機械学習には複数のハイパーパラメータが存在し,適切なハイパーパラメータの組み合わせを推定するには時間がかかる.本研究は歩行者経路予測アプリケーションに用いる機械学習のハイパーパラメータについて適切な組み合わせを推定し,マルチGPU環境を利用して実測処理を並列化することで,約15日かかる推定が約12時間で完了することを示す.

  • マルチGPU環境における機械学習ハイパーパラメータの自動チューニング(2)

    藤家, 空太郎, 多部田, 敏樹, 藤井, 昭宏, 田中, 輝雄, 加藤, 由花, 大島, 聡史, 片桐, 孝洋

    第83回全国大会講演論文集   2021 ( 1 )   43 - 44   2021年3月

     詳細を見る

    記述言語:日本語  

    我々は反復一次元探索を用いた自動チューニングの研究に取り組んでおり,マルチGPU環境を用いた機械学習のプログラムのハイパーパラメータの最適化を進めている.機械学習は同一のハイパーパラメータを用いても毎回教師データが変わるなど同一の結果にならないため,自動チューニングの結果にブレが生じる.このブレに対して,これまで,我々は推定したパラメータに対して追加測定を行い自動チューニングの安定性を高める手法を提案してきた.本研究では,歩行者経路予測アプリケーションに用いる機械学習プログラムに適用しマルチGPU環境で推定したハイパーパラメータの値を並列化し複数回まとめて追加測定することによる,自動チューニングの精度向上について示す.

  • 高精度行列-行列積における疎行列演算実装選択の自動チューニングの検討

    青木将太, 片桐孝洋, 大島聡史, 永井亨

    情報処理学会 第83回全国大会   1 - 2   2021年3月

     詳細を見る

    記述言語:その他  

  • 量子アニーリングマシンにおける組み合わせ最適化問題の適用可能性の調査

    大山基樹, 森下誠, 片桐孝洋, 大島聡史, 永井亨

    情報処理学会 第83回全国大会   1 - 2   2021年3月

     詳細を見る

    記述言語:その他  

  • マルチGPU環境における機械学習ハイパーパラメータの自動チューニング(1)

    多部田敏樹, 藤家空太郎, 藤井昭宏, 田中輝雄, 加藤由花, 大島聡史, 片桐孝洋

    情報処理学会 第83回全国大会   1 - 2   2021年3月

     詳細を見る

    記述言語:その他  

  • マルチGPU環境における機械学習ハイパーパラメータの自動チューニング(2)

    藤家空太郎, 多部田敏樹, 藤井昭宏, 田中輝雄, 加藤由花, 大島聡史, 片桐孝洋

    情報処理学会 第83回全国大会   1 - 2   2021年3月

     詳細を見る

    記述言語:その他  

  • RTコアによるハードウェアレイトレーシングの性能評価

    枦木慎也, 大島聡史, 片桐孝洋, 永井亨

    情報処理学会 第83回全国大会   1 - 2   2021年3月

     詳細を見る

    記述言語:その他  

  • GPUクラスタを用いて並列化した自動チューニングの機械学習プログラムへの適用と安定性の検証

    藤家空太郎, 多部田敏樹, 藤井昭宏, 田中輝雄, 加藤由花, 大島聡史, 片桐孝洋

    情報処理学会 研究報告(HPC-178)   1 - 8   2021年3月

     詳細を見る

    記述言語:その他  

  • Adaptation of A64 Scalable Vector Extension for Spiral

    Naruya Kitai, Daisuke Takahasi, Franz Franchetti, Takahiro Katagiri, Satoshi Ohshima, Toru Nagai

    1 - 6   2021年3月

     詳細を見る

    記述言語:英語  

  • スーパーコンピュータ「不老」におけるOpenFOAMの性能評価

    大島聡史, 今野雅

    オープンCAE・FrontISTR合同シンポジウム2020   1 - 10   2020年12月

     詳細を見る

    記述言語:その他  

  • スーパーコンピュータ「不老」のシステム構成と性能

    大島聡史, 永井亨, 片桐孝洋

    大学ICT推進協議会 2020年度 年次大会   1 - 8   2020年12月

     詳細を見る

    記述言語:その他  

  • スーパーコンピュータ「不老」のサービスとエコシステム

    田島嘉則, 山田一成, 高橋一郎, 毛利晃大, 片桐孝洋, 大島聡史, 永井亨

    大学ICT推進協議会 2020年度 年次大会   1 - 4   2020年12月

     詳細を見る

    記述言語:その他  

  • スーパーコンピュータ「不老」における光ディスクライブラリを用いたコールドストレージシステムの構築

    高橋一郎, 大島聡史, 片桐孝洋

    大学ICT推進協議会 2020年度 年次大会   1 - 6   2020年12月

     詳細を見る

    記述言語:その他  

  • カスタムキャビテーションモデルを用いたNACA0015水中翼周りの数値解析

    池田拓士, 秋山善克, 今野雅, 大島聡史

    オープンCAE・FrontISTR合同シンポジウム2020   1 - 2   2020年12月

     詳細を見る

    記述言語:その他  

  • OpenFOAMへのカスタムキャビテーションモデルの実装

    秋山善克, 池田拓士, 今野雅, 大島聡史

    オープンCAE・FrontISTR合同シンポジウム2020   1 - 3   2020年12月

     詳細を見る

    記述言語:その他  

  • LNGタンク内の異密度LNGの混合流動解析

    田村守淑, 今野雅, 大島聡史

    オープンCAE・FrontISTR合同シンポジウム2020   1 - 7   2020年12月

     詳細を見る

    記述言語:その他  

  • Performance Evaluation of Accurate Matrix-Matrix Multiplication on GPU Using Sparse Matrix Multiplications 査読

    Fumiya Ishiguro, Takahiro Katagiri, Satoshi Ohshima, Toru Nagai

    2020 Eighth International Symposium on Computing and Networking Workshops (CANDARW)   178 - 184   2020年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/CANDARW51189.2020.00044

  • 自動チューニング言語ppOpen-ATによる混合精度演算の最適化機能について

    片桐孝洋, 山梨祥平, 八代尚, 大島聡史, 永井亨

    日本応用数理学会年会講演予稿集(CD-ROM)   2020   2020年9月

     詳細を見る

    記述言語:その他  

  • 名古屋大学スーパーコンピュータ「不老」における医用画像処理

    大島聡史, 小田昌宏, 片桐孝洋, 森健策

    電子情報通信学会 技報 MI2020-32(2020-09)   120 ( 156(MI2020 17-32) )   69 - 74   2020年9月

     詳細を見る

    記述言語:その他  

  • Parareal法における低精度演算・混合精度演算の活用

    大島聡史, 飯塚幹夫, 小野謙二

    日本応用数理学会 2020年 年会   2020   64 - 65   2020年9月

     詳細を見る

    記述言語:その他  

  • 医用画像処理におけるLDDMMのマルチGPU高速化

    杉浦拓未, 大島聡史, 片桐孝洋, 横田達也, 本谷秀堅, 永井亨

    情報処理学会 研究報告(HPC-175)   2020 ( HPC-175 )   1 - 7   2020年7月

     詳細を見る

    記述言語:その他  

  • スーパーコンピュータ「不老」の性能評価

    大島聡史, 永井亨, 片桐孝洋

    情報処理学会 研究報告(HPC-175)   2020 ( HPC-175 )   1 - 10   2020年7月

     詳細を見る

    記述言語:その他  

  • Parareal法における低精度計算・混合精度計算の活用について

    大島聡史, 飯塚幹夫, 小野謙二

    第25回計算工学講演会   25   1 - 2   2020年6月

     詳細を見る

    記述言語:その他  

  • Scalable Direct-Iterative Hybrid Solver for Sparse Matrices on Multi-Core and Vector Architectures 査読

    Kenji Ono, Toshihiro Kato, Satoshi Ohshima, Takeshi Nanri

    HPCAsia2020: Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region   11 - 21   2020年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1145/3368474.3368484

  • 3次元医用画像データの再構成処理の並列化

    中島大地, 大島聡史, 五嶋優詞, 横田達也, 片桐孝洋, 本谷秀堅, 永井亨, 岩本千佳, 大内田研宙, 橋爪誠

    情報処理学会研究報告(Web)   2019 ( HPC-172 )   1 - 7   2019年12月

     詳細を見る

    記述言語:日本語  

  • Optimization of Numerous Small Dense-Matrix-Vector Multiplications in H-matrix Arithmetic on GPU 査読

    Satoshi Ohshima, Ichitaro Yamazaki, Akihiro Ida, Rio Yokota

    2019 IEEE 13th International Symposium on Embedded Multicore/Many-core Systems-on-Chip (MCSoC)   9 - 16   2019年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    Optimization of Numerous Small Dense-Matrix-Vector Multiplications in H-matrix Arithmetic on GPU

    DOI: 10.1109/MCSoC.2019.00009

  • GPUによる階層型行列計算法の高速化に向けた多数の小密行列ベクトル積計算の最適化

    大島聡史, 山崎市太郎, 伊田明弘, 横田理央

    日本応用数理学会年会講演予稿集(CD-ROM)   2019   180‐181   2019年9月

     詳細を見る

    記述言語:日本語  

  • Performance evaluation of the MODYLAS application on modern multi-core and many-core environments 査読 国際誌

    Satoshi Ohshima, Soichiro Suzuki, Tatsuya Sakashita, Masao Ogino, Takahiro Katagiri, Yoshimichi Andoh

    In Proceedings of IPDPSW2019   2019年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  • Performance evaluation of the MODYLAS application on modern multi-core and many-core environments 査読

    Satoshi Ohshima, Soichiro Suzuki, Tatsuya Sakashita, Masao Ogino, Takahiro Katagiri, Yoshimichi Andoh

    IPDPSW2019   2019年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    Performance evaluation of the MODYLAS application on modern multi-core and many-core environments

  • 512bit SIMD環境における分子動力学アプリケーションMODYLASの性能評価

    研究報告ハイパフォーマンスコンピューティング(HPC)   166 ( 14 )   1 - 9   2018年9月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

  • 高精度行列-行列積のためのBatched BLASおよび疎行列演算を用いた実装方式のGPU環境での性能評価

    石黒史也, 片桐孝洋, 大島聡史, 永井亨, 荻野正雄

    日本応用数理学会年会講演予稿集(CD-ROM)   2018   147‐148   2018年9月

     詳細を見る

    記述言語:日本語  

  • マルチコア・メニーコア計算機環境におけるChebyshev基底通信削減CG法の性能評価

    大島聡史, 藤井昭宏, 田中輝雄, 深谷猛, 須田礼仁

    日本応用数理学会年会講演予稿集(CD-ROM)   2018   471‐472   2018年9月

     詳細を見る

    記述言語:日本語  

  • 512bit SIMD環境における分子動力学アプリケーションMODYLASの性能評価

    大島聡史, 鈴木惣一朗, 坂下逹哉, 荻野正雄, 片桐孝洋, 安藤嘉倫

    情報処理学会研究報告(Web)   2018 ( HPC-166 )   Vol.2018‐HPC‐166,No.14,1‐9 (WEB ONLY)   2018年9月

     詳細を見る

    記述言語:日本語  

  • Performance of Hierarchical-matrix BiCGStab Solver on GPU Clusters

    Ichitaro Yamazaki, Ahmad Abdelfattah, Akihiro Ida, Satoshi Ohshima, Stanimire Tomov, Rio Yokota, Jack Dongarra

    32nd IEEE International Parallel and Distributed Processing Symposium, IPDPS 2018 Proceedings - 2018 IEEE 32nd International Parallel and Distributed Processing Symposium, IPDPS 2018   930 - 939   2018年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/IPDPS.2018.00102

  • Chebyshev基底通信削減CG法のマルチコア・メニーコア計算環境における性能評価

    研究報告ハイパフォーマンスコンピューティング(HPC)   165 ( 17 )   1 - 9   2018年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

  • Mellanox社のスイッチ装置への集団通信オフロード機能による集団通信隠蔽効果の調査

    南里豪志, 大島聡史, 小野謙二

    情報処理学会研究報告(Web)   2018 ( HPC-165 )   Vol.2018‐HPC‐165,No.12,1‐10 (WEB ONLY)   2018年7月

     詳細を見る

    記述言語:日本語  

  • GPGPUによる高精度行列-行列積アルゴリズムのためのBatched BLASを用いた実装方式の提案

    石黒史也, 片桐孝洋, 大島聡史, 永井亨, 荻野正雄

    情報処理学会研究報告(Web)   2018 ( HPC-165 )   Vol.2018‐HPC‐165,No.32,1‐8 (WEB ONLY)   2018年7月

     詳細を見る

    記述言語:日本語  

  • Chebyshev基底通信削減CG法のマルチコア・メニーコア計算環境における性能評価

    大島聡史, 藤井昭宏, 田中輝雄, 深谷猛, 須田礼仁

    情報処理学会研究報告(Web)   2018 ( HPC-165 )   Vol.2018‐HPC‐165,No.17,1‐9 (WEB ONLY)   2018年7月

     詳細を見る

    記述言語:日本語  

  • Mellanox社のスイッチ装置への集団通信オフロード機能による集団通信隠蔽効果の調査

    研究報告ハイパフォーマンスコンピューティング(HPC)   165 ( 12 )   1 - 10   2018年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

  • GPGPUによる高精度行列-行列積アルゴリズムのためのBatched BLASを用いた実装方式の提案

    研究報告ハイパフォーマンスコンピューティング(HPC)   165 ( 32 )   1 - 8   2018年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

  • A thread-level parallelization of pairwise additive potential and force calculations suitable for current many-core architectures 査読

    Yoshimichi Andoh, Soichiro Suzuki, Satoshi Ohshima, Tatsuya Sakashita, Masao Ogino, Takahiro Katagiri, Noriyuki Yoshii, Susumu Okazaki

    Journal of Supercomputing   74 ( 6 )   2449 - 2469   2018年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1007/s11227-018-2272-2

  • 階層型行列計算におけるソフトウェア自動チューニング

    大島聡史, 山崎市太郎, 伊田明弘, 横田理央

    計算工学講演会論文集(CD-ROM)   23   ROMBUNNO.D‐05‐03   2018年6月

     詳細を見る

    記述言語:日本語  

  • Performance of Hierarchical-matrix BiCGStab Solver on GPU Clusters. 査読

    Ichitaro Yamazaki, Ahmad Abdelfattah, Akihiro Ida, Satoshi Ohshima, Stanimire Tomov, Rio Yokota, Jack J. Dongarra

    2018 IEEE International Parallel and Distributed Processing Symposium, IPDPS 2018, Vancouver, BC, Canada, May 21-25, 2018   930 - 939   2018年5月

     詳細を見る

    記述言語:その他   掲載種別:研究論文(その他学術会議資料等)  

    Performance of Hierarchical-matrix BiCGStab Solver on GPU Clusters.

    DOI: 10.1109/IPDPS.2018.00102

  • Optimization of Hierarchical matrix computation on GPU 査読 国際誌

    Satoshi Ohshima, @Ichitaro Yamazaki, @Akihiro Ida, @Rio Yokota

    In proceedings of Supercomputing Frontiers. SCFA 2018, Lecture Notes in Computer Science   10776   274 - 292   2018年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1007/978-3-319-69953-0_16

    その他リンク: https://doi.org/10.1007/978-3-319-69953-0_16

  • 高精度行列-行列積アルゴリズムにおけるBatched BLASの適用

    石黒史也, 片桐孝洋, 大島聡史, 永井亨, 荻野正雄

    情報処理学会全国大会講演論文集   80th ( 1 )   1.49‐1.50   2018年3月

     詳細を見る

    記述言語:日本語  

  • Optimization of hierarchical matrix computation on GPU 査読

    Satoshi Ohshima, Ichitaro Yamazaki, Akihiro Ida, Rio Yokota

    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)   10776   274 - 292   2018年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1007/978-3-319-69953-0_16

  • Optimization of Hierarchical matrix computation on GPU 査読

    Satoshi Ohshima, Ichitaro Yamazaki, Akihiro Ida, Rio Yokota

    Lecture Notes in Computer Science   10776   2018年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1007/978-3-319-69953-0_16

  • 高精度行列-行列積アルゴリズムにおけるbatched BLASの適用

    第80回情報処理学会全国大会 第80回情報処理学会全国大会 予稿集   2018年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(その他学術会議資料等)  

  • A thread-level parallelization of pairwise additive potential and force calculations suitable for current many-core architectures 査読 国際誌

    Yoshimichi Andoh, Soichiro Suzuki, Satoshi Ohshima, Tatsuya Sakashita, Masao Ogino, Takahiro Katagiri, Noriyuki Yoshii, Susumu Okazaki

    The Journal of Supercomputing   2018年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1007/s11227-018-2272-2

    その他リンク: https://link.springer.com/article/10.1007/s11227-018-2272-2

  • スーパーコンピュータシステムITOの性能評価

    研究報告ハイパフォーマンスコンピューティング(HPC)   162 ( 7 )   1 - 9   2017年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    九州大学情報基盤研究開発センターではスーパーコンピュータシステム “ITO” を導入し,2017 年 10 月より一部システムによる試験運用を開始,2018 年 1 月より全システムによるサービス提供を予定している.本システムは最新の CPU や GPU を搭載していることに加えて,オープンデータの活用やパブリッククラウドサービスとの連携を考慮した挑戦的なシステムである.本稿では ITO の設計を紹介し,既に試験運用を開始しているバックエンドサブシステム B を用いて測定した性能評価の結果を示す.

  • 非ブロッキング集団通信の通信隠蔽効果に関する調査

    南里豪志, 大島聡史, 小野謙二

    情報処理学会研究報告(Web)   2017 ( HPC-162 )   Vol.2017‐HPC‐162,No.17,1‐11 (WEB ONLY)   2017年12月

     詳細を見る

    記述言語:日本語  

  • スーパーコンピュータシステムITOの性能評価

    大島聡史, 南里豪志, 渡部善隆, 天野浩文, 小野謙二

    情報処理学会研究報告(Web)   2017 ( HPC-162 )   Vol.2017‐HPC‐162,No.7,1‐9 (WEB ONLY)   2017年12月

     詳細を見る

    記述言語:日本語  

  • 非ブロッキング集団通信の通信隠蔽効果に関する調査

    研究報告ハイパフォーマンスコンピューティング(HPC)   162 ( 17 )   1 - 11   2017年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本稿では,非ブロッキング集団通信による通信隠蔽技術について,特にプログレススレッドを用いた場合の実用上の効果を計測し,評価した.従来の通信隠蔽率のみを計測するベンチマークプログラムでは,プログレススレッドを利用した場合の計算性能の低下による影響が計測結果に反映されないため,実用性の検証が困難である.そこで本稿では,計算と通信を含む総合的な性能評価を行うため,スレッド並列とプロセス並列によるハイブリッド並列のベンチマークプログラムを作成した.このプログラムは,通信と計算の量をそれぞれ明示的に指定するため,プログレススレッドへの CPU コアの割り当て方法やスレッドのスケジューリングポリシーなどの実行時パラメータを変化させた場合の,計測結果の相互比較も可能となった.このプログラムを,Fujitsu PRIMERGY CX 400 および Fujitsu PRIMEHPC FX 100 上で実行し,性能を計測した.その結果,Alltoall では,適切な実行時パラメータを選択することにより,プログラム全体としての性能向上が見込めることが分かった.一方,Allreduce では,特にノード内で複数のプロセスを起動した場合に,性能が低下する場合があることが分かった.これらの結果から,非ブロッキング集団通信の利用にあたっては,使用する集団通信の種類やメッセージサイズ,計算量等に応じて,効果を事前に調査することが重要であることを確認した.また,非ブロッキング集団通信を推進するもう一つの手段であるオフロード機能について,Mellanox 社の SHArP 機能を用いた場合の通信隠蔽効果を予備評価し,通信隠蔽による性能向上が見込めることを確認した.

  • スーパーコンピュータ上でのDeep Learning学習環境の初期構築

    野村行弘, 佐藤一誠, 佐藤一誠, 佐藤一誠, 塙敏博, 花岡昇平, 中尾貴祐, 竹永智美, 佐藤大介, 星野哲也, 関谷勇司, 大島聡史, 林直人, 阿部修

    電子情報通信学会技術研究報告   117 ( 281(MI2017 47-62) )   1‐2   2017年10月

     詳細を見る

    記述言語:日本語  

  • 階層型行列計算のGPU向け最適化

    大島聡史, 山崎市太郎, 伊田明弘, 横田理央

    日本応用数理学会年会講演予稿集(CD-ROM)   2017   151‐152   2017年9月

     詳細を見る

    記述言語:日本語  

  • GPUクラスタ上における階層型行列計算の最適化

    研究報告ハイパフォーマンスコンピューティング(HPC)   160 ( 14 )   1 - 8   2017年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    階層型行列は小さな密行列と低ランク近似行列から構成される行列である.密行列を階層型行列によって近似することで,大規模な計算をより少ないメモリ量で行うことが可能となる.しかし階層型行列を用いた計算は複雑であるため,最適化が求められている.我々はこれまで階層型行列を用いた境界要素法による静電場解析問題の実装と評価をマルチコア CPU やメニーコアプロセッサにて実施してきた.本稿では,階層型行列を係数行列に持つ線形方程式に対する反復法を対象として,GPU クラスタ上での性能評価や最適化に取り組んだ結果を示す.主要な計算部である階層型行列ベクトル積計算を構成する密行列ベクトル積計算を MAGMA BLAS に行わせることで高速化を目指したところ,GPU カーネル起動のオーバーヘッドにより実行時間が増大したが,BATCHED MAGMA を用いることで大幅に性能が改善した.実験環境としては TSUBAME 2.5 (最大 8 ノード / 1 ノードあたり 1 GPU) および Reedbush-H (最大 8 ノード / 1 ノードあたり 1 GPU) を使用し,それぞれ 8 ノードまで性能向上は得られたが,ノード数を増やした場合には MPI 処理の時間も目立ってきており,さらなる最適化が求められる結果となった.

  • GPUクラスタ上における階層型行列計算の最適化

    大島聡史, 山崎市太郎, 伊田明弘, 横田理央

    情報処理学会研究報告(Web)   2017 ( HPC-160 )   Vol.2017‐HPC‐160,No.14,1‐8 (WEB ONLY)   2017年7月

     詳細を見る

    記述言語:日本語  

  • Auto-tuning on NUMA and Many-core Environments with an FDM code

    Takahiro Katagiri, Satoshi Ohshima, Masaharu Matsumoto

    31st IEEE International Parallel and Distributed Processing Symposium, IPDPS 2017 The Twelfth International Workshop on Automatic Performance Tuning (iWAPT2017) (In Conjunction with the IEEE IPDPS2017)   2017年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

  • Pascal vs KNL: Performance Evaluation with ICCG Solve 査読

    Tetsuya Hoshino, Satoshi Ohshima, Toshihiro Hanawa, Kengo Nakaima, Akihiro Ida

    HPC in Asia Workshop Poster Session, ISC High Performance 2017   2017年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    Pascal vs KNL: Performance Evaluation with ICCG Solve

  • Auto-Tuning on NUMA and many-core environments with an FDM code 査読

    Takahiro Katagiri, Satoshi Ohshima, Masaharu Matsumoto

    Proceedings - 2017 IEEE 31st International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2017   1399 - 1407   2017年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/IPDPSW.2017.27

  • ポストムーア時代における有限差分法コードの自動チューニング技法の一考察

    片桐 孝洋, 大島 聡史, 松本 正晴

    計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science   22   ROMBUNNO.C‐01‐1   2017年5月

     詳細を見る

    記述言語:日本語  

  • GPU搭載スーパーコンピュータReedbush‐Hの性能評価

    塙敏博, 星野哲也, 中島研吾, 大島聡史, 伊田明弘

    情報処理学会研究報告(Web)   2017 ( HPC-159 )   Vol.2017‐HPC‐159,No.9,1‐6 (WEB ONLY)   2017年4月

     詳細を見る

    記述言語:日本語  

  • OpenACCを用いたICCG法ソルバーのPascal GPUにおける性能評価

    星野哲也, 大島聡史, 塙敏博, 中島研吾, 伊田明宏

    情報処理学会研究報告(Web)   2017 ( HPC-158 )   Vol.2017‐HPC‐158,No.18,1‐9 (WEB ONLY)   2017年3月

     詳細を見る

    記述言語:日本語  

  • Xeon Phi+OmniPath環境におけるOpenMP,MPI性能最適化

    塙敏博, 星野哲也, 中島研吾, 大島聡史, 伊田明弘

    情報処理学会研究報告(Web)   2017 ( HPC-158 )   Vol.2017‐HPC‐158,No.21,1‐8 (WEB ONLY)   2017年3月

     詳細を見る

    記述言語:日本語  

  • ICCG法ソルバーのIntel Xeon Phi向け最適化

    中島研吾, 中島研吾, 大島聡史, 大島聡史, 塙敏博, 星野哲也, 伊田明弘, 伊田明弘

    情報処理学会研究報告(Web)   2016 ( HPC-157 )   Vol.2016‐HPC‐157,No.16,1‐8 (WEB ONLY)   2016年12月

     詳細を見る

    記述言語:日本語  

  • パイプライン型共役勾配法の性能評価

    塙敏博, 中島研吾, 中島研吾, 大島聡史, 大島聡史, 星野哲也, 伊田明弘, 伊田明弘

    情報処理学会研究報告(Web)   2016 ( HPC-157 )   Vol.2016‐HPC‐157,No.6,1‐9 (WEB ONLY)   2016年12月

     詳細を見る

    記述言語:日本語  

  • データ解析・シミュレーション融合スーパーコンピュータシステムReedbush‐Uの性能評価

    塙敏博, 中島研吾, 大島聡史, 伊田明弘, 星野哲也, 田浦健次朗

    情報処理学会研究報告(Web)   2016 ( HPC-156 )   Vol.2016‐HPC‐156,No.10,1‐10 (WEB ONLY)   2016年9月

     詳細を見る

    記述言語:日本語  

  • 高バンド幅メモリ環境における数値計算アルゴリズムの変革と自動チューニング技術~FDMコードを例にして~

    片桐孝洋, 松本正晴, 大島聡史

    日本応用数理学会年会講演予稿集(CD-ROM)   2016   ROMBUNNO.9GATSU12NICHI,09:30,3E,1   2016年9月

     詳細を見る

    記述言語:日本語  

  • 3次元積層技術による高メモリバンド幅時代の自動チューニング~FDMコードを例にして~

    片桐孝洋, 松本正晴, 大島聡史

    情報処理学会研究報告(Web)   2016 ( HPC-155 )   Vol.2016‐HPC‐155,No.38,1‐8 (WEB ONLY)   2016年8月

     詳細を見る

    記述言語:日本語  

  • ppOpen-HPC: Open Source Infrastructure for Development and Execution of Large-Scale Scientific Applications on Post-Peta-Scale Supercomputers with Automatic Tuning (AT) 査読

    Kengo Nakajima, Masaki Satoh, Takashi Furumura, Hiroshi Okuda, Takeshi Iwashita, Hide Sakaguchi, Takahiro Katagiri, Masaharu Matsumoto, Satoshi Ohshima, Hideyuki Jitsumoto, Takashi Arakawa, Futoshi Mori, Takeshi Kitayama, Akihiro Ida, Miki Y. Matsuo

    OPTIMIZATION IN THE REAL WORLD: TOWARD SOLVING REAL-WORLD OPTIMIZATION PROBLEMS   13   15 - 35   2016年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1007/978-4-431-55420-2_2

  • 階層型行列ベクトル積のメニーコア向け最適化

    大島聡史, 伊田明弘, 河合直聡, 塙敏博

    情報処理学会研究報告(Web)   2016 ( HPC-155 )   Vol.2016‐HPC‐155,No.39,1‐9 (WEB ONLY)   2016年8月

     詳細を見る

    記述言語:日本語  

  • FPGAを用いた階層型行列ベクトル積

    塙敏博, 伊田明弘, 大島聡史, 河合直聡

    情報処理学会研究報告(Web)   2016 ( HPC-155 )   Vol.2016‐HPC‐155,No.40,1‐9 (WEB ONLY)   2016年8月

     詳細を見る

    記述言語:日本語  

  • Auto-tuning of hybrid MPI/OpenMP execution with code selection by ppOpen-AT

    Takahiro Katagiri, Masaharu Matsumoto, Satoshi Ohshima

    30th IEEE International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2016 Proceedings - 2016 IEEE 30th International Parallel and Distributed Processing Symposium, IPDPS 2016   1488 - 1495   2016年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/IPDPSW.2016.49

  • Utilization and expansion of ppOpen-AT for OpenACC

    Satoshi Ohshima, Takahiro Katagiri, Masaharu Matsumoto

    30th IEEE International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2016 Proceedings - 2016 IEEE 30th International Parallel and Distributed Processing Symposium, IPDPS 2016   1496 - 1505   2016年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/IPDPSW.2016.123

  • エクサスケールコンピューティングに向けた自動性能チューニング研究の進展(AT研究動向とAT専用言語ppOpen-ATの最新機能の紹介/複数性能パラメタ空間における実行時AT機構/FFTにおけるAT)

    片桐 孝洋, 大島 聡史, 松本 正晴, 田中 輝雄, 望月 大義, 村田 陸, 藤井 昭宏, 高橋 大介

    ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集   ( 2016 )   47 - 48   2016年5月

     詳細を見る

    記述言語:日本語  

  • Utilization and Expansion of ppOpen-AT for OpenACC 査読

    Satoshi Ohshima, Takahiro Katagiri, Masaharu Matsumoto

    2016 IEEE 30TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS (IPDPSW)   1496 - 1505   2016年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/IPDPSW.2016.123

  • Auto-tuning of Hybrid MPI/OpenMP Execution with Code Selection by ppOpen-AT 査読

    Takahiro Katagiri, Masaharu Matsumoto, Satoshi Ohshima

    2016 IEEE 30TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS (IPDPSW)   1488 - 1495   2016年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/IPDPSW.2016.49

  • 分子動力学計算ソフトウェアMODYLASのメニーコアアーキテクチャ対応並列化に関する研究(分子動力学計算による研究の現状と課題/粒子対計算部分のメニーコア間スレッド並列の効率化/Xeon Phiによる分子動力学計算の高速化)

    安藤 嘉倫, 鈴木 惣一朗, 大島 聡史

    ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集   ( 2016 )   97 - 98   2016年5月

     詳細を見る

    記述言語:日本語  

  • ポストムーア時代に向けた階層型自動チューニング機能の性能評価

    片桐 孝洋, 松本 正晴, 大島 聡史

    計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science   21   ROMBUNNO.F‐1‐1   2016年5月

     詳細を見る

    記述言語:日本語  

  • FPGAを用いた疎行列数値計算の性能評価

    大島聡史, 塙敏博, 片桐孝洋, 中島研吾

    情報処理学会研究報告(Web)   2016 ( HPC-153 )   VOL.2016‐HPC‐153,NO.1 (WEB ONLY)   2016年2月

     詳細を見る

    記述言語:日本語  

  • 有限要素法係数行列生成プロセスのメニィコア環境における最適化

    中島研吾, 中島研吾, 成瀬彰, 大島聡史, 大島聡史, 塙敏博, 片桐孝洋, 片桐孝洋, 田浦健次朗

    情報処理学会研究報告(Web)   2015 ( HPC-152 )   VOL.2015‐HPC‐152,NO.12 (WEB ONLY)   2015年12月

     詳細を見る

    記述言語:日本語  

  • Directive-Based Auto-Tuning for the Finite Difference Method on the Xeon Phi

    Takahiro Katagiri, Satoshi Ohshima, Masaharu Matsumoto

    29th IEEE International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2015 Proceedings - 2015 IEEE 29th International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2015   1221 - 1230   2015年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/IPDPSW.2015.11

  • ppOpen‐ATによるOpenACCプログラムの自動チューニング

    大島聡史, 片桐孝洋, 松本正晴

    日本応用数理学会年会講演予稿集(CD-ROM)   2015   ROMBUNNO.9GATSU11NICHI,09:30,B,2   2015年9月

     詳細を見る

    記述言語:日本語  

  • ppOpen‐ATによる静的コード生成で実現する自動チューニング方式の評価

    片桐孝洋, 松本正晴, 大島聡史

    日本応用数理学会年会講演予稿集(CD-ROM)   2015   ROMBUNNO.9GATSU11NICHI,09:30,B,1   2015年9月

     詳細を見る

    記述言語:日本語  

  • ppOpen‐APPL/FVMを使用した並列有限要素法アプリケーション

    中島研吾, 中島研吾, 塙敏博, 大島聡史, 大島聡史, 片桐孝洋, 片桐孝洋

    情報処理学会研究報告(Web)   2015 ( HPC-151 )   VOL.2015-HPC-151,NO.24 (WEB ONLY)   2015年9月

     詳細を見る

    記述言語:日本語  

  • SCG‐AT:静的コード生成のみによる自動チューニング実現方式

    片桐孝洋, 松本正晴, 大島聡史

    情報処理学会研究報告(Web)   2015 ( HPC-150 )   VOL.2015-HPC-150,NO.32 (WEB ONLY)   2015年7月

     詳細を見る

    記述言語:日本語  

  • ppOpen‐ATを用いたOpenACCプログラムの自動チューニング

    大島聡史, 片桐孝洋, 松本正晴

    情報処理学会研究報告(Web)   2015 ( HPC-150 )   VOL.2015-HPC-150,NO.30 (WEB ONLY)   2015年7月

     詳細を見る

    記述言語:日本語  

  • 1ノード200超スレッド時代の自動チューニングに向けて : FDMコードを例にして

    片桐 孝洋, 大島 聡史, 松本 正晴

    計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science   20   ROMBUNNO.E-1-4   2015年6月

     詳細を見る

    記述言語:日本語  

  • 1ノード200超スレッド時代の自動チューニング手法 : FDMコード最適化を中心に (特集 エクサスケール時代に向けた数値計算処理の自動チューニングの進展)

    片桐 孝洋, 大島 聡史, 松本 正晴

    計算工学   20 ( 2 )   3262 - 3265   2015年6月

     詳細を見る

    記述言語:日本語  

  • CFDツールOpenFOAM®への疎行列ライブラリXabclibの適用

    櫻井 隆雄, 片桐 孝洋, 大島 聡史, 黒田 久泰, 猪貝 光祥, 直野 健

    ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集   ( 2015 )   84 - 84   2015年5月

     詳細を見る

    記述言語:日本語  

  • Directive-based Auto-tuning for the Finite Difference Method on the Xeon Phi 査読

    Takahiro Katagiri, Satoshi Ohshima, Masaharu Matsumoto

    2015 IEEE 29TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS   1221 - 1230   2015年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/IPDPSW.2015.11

  • 1ノード200超スレッド時代の自動チューニング手法~FDMコード最適化を中心に~

    片桐孝洋, 大島聡史, 松本正晴

    計算工学   20 ( 2 )   3262 - 3265   2015年4月

     詳細を見る

    記述言語:日本語  

  • 未知語の音声クエリに対する複数検索結果を用いた音声中の検索語検出

    大島聡史, 小嶋和徳, 石亀昌明, 伊藤慶明

    日本音響学会研究発表会講演論文集(CD-ROM)   2015   ROMBUNNO.1-P-6   2015年3月

     詳細を見る

    記述言語:日本語  

  • 動的な並列実行機構を用いたSpMV実装の性能評価

    大島 聡史, 片桐 孝洋, 櫻井 隆雄, 中島 研吾, 黒田 久泰, 直野 健, 猪貝 光祥

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   2015 ( 3 )   1 - 12   2015年2月

     詳細を見る

    記述言語:日本語  

    本稿では疎行列ベクトル積 (SpMV) の実装について述べる.疎行列ベクトル積の高速化に関する研究は多く実施されており,行列の形状 (非ゼロ要素の配置) や行列格納形式,実行するハードウェアなど様々な観点からの研究が進められている.我々が本稿において着目するのは,非ゼロ要素の配置に偏りがある疎行列に対して,動的な並列実行機構を活用して高速化を行うことである.現在の OpenMP や CUDA には負荷バランスの悪い並列計算問題に対して性能改善を行える可能性のある動的な並列実行機構が備わっている.そこで,これらの機構を活用することで疎行列ベクトル積の性能を向上させることを目的として実装と性能評価を行った.実験の結果,非ゼロ要素の配置に偏りがあるシンプルな疎行列に対しては高い性能向上が得られた.その一方で,より一般的な行列を用いた場合の効果は限定的であり,むしろ実行時間が大きく伸びる例も多く,実用とするためにはさらなる最適化が必要であることも確認できた.性能向上を阻害する主な原因は動的な並列実行機構のオーバーヘッドにもあると考えられ,今後のハードウェアやシステムソフトウェアの改善も期待される.

  • Auto-tuning of computation kernels from an FDM code with ppOpen-AT 査読

    Takahiro Katagiri, Satoshi Ohshima, Masaharu Matsumoto

    Proceedings - 2014 IEEE 8th International Symposium on Embedded Multicore/Manycore SoCs, MCSoC 2014   91 - 98   2014年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/MCSoC.2014.22

  • Performance optimization of SpMV using CRS format by considering OpenMP scheduling on CPUs and MIC 査読

    Satoshi Ohshima, Takahiro Katagiri, Masaharu Matsumoto

    Proceedings - 2014 IEEE 8th International Symposium on Embedded Multicore/Manycore SoCs, MCSoC 2014   253 - 260   2014年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/MCSoC.2014.43

  • 有限要素法係数行列生成プロセスのマルチコア・メニィコア環境における最適化

    中島 研吾, 大島 聡史, 塙 敏博

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   2014 ( 22 )   1 - 7   2014年9月

     詳細を見る

    記述言語:日本語  

    有限要素法は偏微分方程式の数値解法として様々な科学技術シミュレーションに使用されている.有限要素法において係数行列生成部は疎行列計算と並んで計算時間を要するプロセスである.本研究では,OpenMP によってマルチスレッド並列化された係数行列生成部に関する 3 種類の実装によるプログラムを様々なマルチコア,メニィコア環境で評価した事例を紹介し,自動チューニングに向けた方策について検討する.

  • 1ノード200超スレッド時代の自動チューニング手法~FDMコードを例にして~

    片桐孝洋, 大島聡史, 松本正晴

    日本応用数理学会年会講演予稿集(CD-ROM)   2014   ROMBUNNO.9GATSU3NICHI,09:30,E,3   2014年8月

     詳細を見る

    記述言語:日本語  

  • 疎行列ソルバーにおける自動チューニングを用いたOpenMP指示文の最適化

    大島聡史, 松本正晴, 片桐孝洋

    日本応用数理学会年会講演予稿集(CD-ROM)   2014   ROMBUNNO.9GATSU3NICHI,09:30,E,1   2014年8月

     詳細を見る

    記述言語:日本語  

  • 様々な計算機環境におけるOpenMP/OpenACCを用いたICCG法の性能評価

    大島聡史, 松本正晴, 片桐孝洋, 塙敏博, 中島研吾

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   2014 ( 21 )   1 - 10   2014年7月

     詳細を見る

    記述言語:日本語  

    今日の HPC においては高い演算性能と低い消費電力を達成するために様々な並列計算ハードウェアが用いられている.CPU は微細化と消費電力の制限等によりマルチコア化が進み,現在では 1 ソケットあたり 10 前後のコアを搭載した CPU が多く用いられている.GPU は非常に多くの計算コアと高いピーク性能を備え,CPU と比べると適したアプリケーションが限られるものの,様々なシーンにおいて活用が進んでいる.メニーコアプロセッサは CPU と GPU それぞれのメリットを享受できるものとして注目が高まっている.一方で並列計算のためのプログラミング環境に着目すると,従来から使われている OpenMP や MPI の普及がますます進んでいる.さらに近年では従来の OpenMP では対応できなかった GPU プログラミングについても OpenMP のような指示文を用いた簡便な並列化プログラミングを可能にするべく,OpenMP 4.0 や OpenACC が策定され,対応するコンパイラもいくつか公開・販売され始めている.そこで本稿では,様々な計算機環境を対象として OpenMP や OpenACC を用いて同一の問題を実行し,性能やその傾向を調査し報告する.対象問題としては有限体積法アプリケーションにおける ICCG 法を用いる.対象とする並列計算ハードウェアは以下の通りである: Intel Xeon (IvyBridge-EP),AMD Opteron (Piledriver),富士通 SPARC64 IXfx,NVIDIA Tesla (Kepler),Intel Xeon Phi (Knights Corner).

  • Xeon PhiにおけるppOpen-ATを用いた有限差分法コードの自動チューニング

    片桐 孝洋, 大島 聡史, 松本 正晴

    計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science   19   ROMBUNNO.F-6-3   2014年6月

     詳細を見る

    記述言語:日本語  

  • Implementation and evaluation of an AMR framework for FDM applications 査読

    Masaharu Matsumoto, Futoshi Mori, Satoshi Ohshima, Hideyuki Jitsumoto, Takahiro Katagiri, Kengo Nakajima

    Procedia Computer Science   29   936 - 946   2014年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1016/j.procs.2014.05.084

  • 通信削減アルゴリズムCAQRのRSDFTの直交化処理への適用と評価

    片桐孝洋, 高山恒一, 米村崇, 熊洞宏樹, 猪貝光祥, 北上純一, 江口義之, 深谷猛, 山本有作, 岩田潤一, 内田和之, 大島聡史, 中島研吾

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   2014 ( 3 )   1 - 6   2014年5月

     詳細を見る

    記述言語:日本語  

    本報告では,量子力学的第一原理シミュレーションのソフトウェア RSDFT における直交化処理に,通信削減アルゴリズムを用いた QR 分解アルゴリズムである CAQR を組み込んだ性能について報告する.東京大学情報基盤センターの FX10 を用いた 1,024 ノード実行 (4,096MPI,MPI 当たり 4OMP 実行のハイブリッド MPI-OpenMP 実行) におけるバンド分割が 64 の時の実行では,従来の Gram-Schmidt 法による直交化に比べ CAQR を利用すると,最大で 11 倍の高速化が得られる事例があった.

  • レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究のアプリケーションの異機種環境での評価 ~メニーコア環境を中心に~

    片桐孝洋, 大島聡史, 中島研吾, 米村崇, 熊洞宏樹, 樋口清隆, 橋本昌人, 高山恒一, 藤堂眞治, 岩田潤一, 内田和之, 佐藤正樹, 羽角博康, 黒木聖夫, 安達斉, 江口義之

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   2014 ( 26 )   1 - 13   2014年2月

     詳細を見る

    記述言語:日本語  

    本報告では,レイテンシコアの高度化・高効率化による将来の HPCI システムに関する調査研究におけるコデザインで用いるアプリケーションについて,コード最適化による性能チューニングを行った結果を報告する.また,富士通 PRIMEHPC FX10,日立 SR16000,Intel Ivy Bridge,および Intel Xeon Phi を用いた異機種環境で性能評価を行った結果を紹介する.

  • Auto-tuning of computation kernels from an FDM code with ppOpen-AT

    Takahiro Katagiri, Satoshi Ohshima, Masaharu Matsumoto

    2014 8th IEEE International Symposium on Embedded Multicore/Manycore SoCs, MCSoC 2014 Proceedings - 2014 IEEE 8th International Symposium on Embedded Multicore/Manycore SoCs, MCSoC 2014   91 - 98   2014年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/MCSoC.2014.22

  • Implementation and evaluation of an AMR framework for FDM applications 査読

    Masaharu Matsumoto, Futoshi Mori, Satoshi Ohshima, Hideyuki Jitsumoto, Takahiro Katagiri, Kengo Nakajima

    14th Annual International Conference on Computational Science, ICCS 2014 Procedia Computer Science   29   936 - 946   2014年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1016/j.procs.2014.05.084

  • 実アプリを用いたさまざまなアーキテクチャからなる計算機システムの性能評価

    深沢圭一郎, 片桐孝洋, 大宮学, 江川隆輔, 大島聡史, 青木尊之, 下川辺隆史, 荻野正雄, 岩下武史, 東田学

    情報処理学会研究報告(Web)   2013 ( ARC-207 )   VOL.2013-ARC-207,NO.16 (WEB ONLY) - 7   2013年12月

     詳細を見る

    記述言語:日本語  

    現在いわゆるスーパーコンピュータと呼ばれる大規模計算機システムは x86 系,SPARC 系,POWER 系,ベクトル系,GPU 系などさまざまなアーキテクチャから構成されている.さらに近年では ARM 系や MICなどから構成される新しいスーパーコンピュータシステムも出てきている.これらのコンピュータシステムでは計算コアのアーキテクチャが異なるため,アプリケーションによってはそのシステムに対して向き不向きがあり,また性能チューニングも各アーキテクチャにより基本的には異なる.そのため,今までと異なるコンピュータシステムにアプリケーションの移植を行うことは非常に手間のかかる作業となっている.そこで本研究では,JHPCN-HPCI システムで利用可能である x86 系,SPARC 系,POWER 系,ベクトル系といった異なるアーキテクチャのコンピュータシステムを利用し,システムの実性能評価を行い,アーキテクチャ毎に性能がどのようになるか調べた.アプリケーションとしては実際に研究に用いられている電磁流体コードを用いて,いくつかの最適化を施したケースを評価した.その結果,x86 系ではベクトル系に効くベクトル化が効果的であり,SPARC 系と POWER 系ではキャッシュの効率的な利用が効果的となった.また,効果的な結果とそうで無いものを比べると倍程度の性能差があった.電磁流体コードは中性流体に電磁力を含めたコードであるため,本研究の結果は流体コードにも効果的であると考えられる.Recent supercomputer systems consist of various architecture such as X86, SPARC, POWER, Vector and GPU. In addition the computer systems which consist of MIC and ARM are appeared. Some applications are better suited for these computer systems or not due to the different architectures of calculation core they have. The way of performance optimization is also difference depending on the architecture. Thus it is hard to introduce applications running on a computer system to another computer system. In this study we evaluate the effective performance of various architectures computer systems using an MHD (magnetohydrodynamic) simulation code. The MHD simulation code used in this study solves the planetary magnetosphere in the space plasma. We evaluate two types of optimization, which are the vector suited and effective cache-hit. As the results, we found the vector suited optimization is effective to the X86 architecture computer systems and the cache hit optimization is suited for the SPARC and POWER architectures. There is the twice difference of performance between the results of effective optimization and not. The MHD simulation code is a kind of fluid code (including the magneto-electric force) so that it is general that these results are performed in the fluid codes.

  • Energy optimization for scientific programs using auto-tuning language ppOpen-AT 査読

    Takahiro Katagiri, Cheng Luo, Reiji Suda, Shoichi Hirasawa, Satoshi Ohshima

    Proceedings - IEEE 7th International Symposium on Embedded Multicore/Manycore System-on-Chip, MCSoC 2013   123 - 128   2013年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/MCSoC.2013.14

  • Early experiences for adaptation of auto-tuning by ppOpen-AT to an explicit method 査読

    Takahiro Katagiri, Satoshi Ito, Satoshi Ohshima

    Proceedings - IEEE 7th International Symposium on Embedded Multicore/Manycore System-on-Chip, MCSoC 2013   153 - 158   2013年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/MCSoC.2013.15

  • メニーコアアーキテクチャ向けのSpMV最適化と自動チューニング

    大島聡史, 金子勇, 片桐孝洋

    日本応用数理学会年会講演予稿集(CD-ROM)   2013   ROMBUNNO.9098   2013年9月

     詳細を見る

    記述言語:日本語  

  • ppOpen‐ATにより自動生成されたppOpen‐HPCコードにおける自動チューニング機能の性能評価

    片桐孝洋, 大島聡史, 松本正晴

    日本応用数理学会年会講演予稿集(CD-ROM)   2013   ROMBUNNO.9059   2013年9月

     詳細を見る

    記述言語:日本語  

  • Xeon PhiにおけるSpMVの性能評価

    大島聡史, 金子勇, 片桐孝洋

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   2013 ( 33 )   1 - 8   2013年7月

     詳細を見る

    記述言語:日本語  

    本稿では最新のメニーコアプロセッサ Xeon Phi(以下,Phi) の疎行列ベクトル積演算性能について述べる.Phi は高い演算性能およびメモリ転送性能を備えたハードウェアであり,様々なアプリケーションへの適用について盛んに研究が行われている.また Phi はその性能を従来の CPU 同様のプログラミング手法によって活用できることが重要な特徴・利点としてあげられているものの,実際にはアーキテクチャの特性にあわせた最適化の余地が多く存在することが知られている.一方で Phi はアーキテクチャとしても製品としても新しいものであるため,性能を十分に引き出すための知識や技術のさらなる共有が必要である.本稿では疎行列ベクトル積を対象としてPhiの性能を測定し,他の並列計算ハードウェアと性能を比較して性能評価を行う.なお本稿では Phi として先行提供版の Preproduction Xeon Phi を用いている.

  • 陽解法カーネルのための自動チューニング記述言語ppOpen‐ATの新機能について

    片桐孝洋, 大島聡史, 伊東聰

    計算工学講演会論文集(CD-ROM)   18   ROMBUNNO.D-13-1   2013年6月

     詳細を見る

    記述言語:日本語  

  • A Sparse Matrix Library with Automatic Selection of Iterative Solvers and Preconditioners 査読

    Takao Sakurai, Takahiro Katagiri, Hisayasu Kuroda, Ken Naono, Mitsuyoshi Igai, Satoshi Ohshima

    2013 INTERNATIONAL CONFERENCE ON COMPUTATIONAL SCIENCE   18   1332 - 1341   2013年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1016/j.procs.2013.05.300

  • 陽解法カーネルのため自動チューニング記述言語ppOpen-ATの新機能について

    片桐 孝洋, 大島 聡史, 伊東 聰

    計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science   18   4p   2013年6月

     詳細を見る

    記述言語:日本語  

  • メニーコアプロセッサXeon Phiの性能評価

    大島聡史, 金子勇

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   2013 ( 20 )   1 - 6   2013年5月

     詳細を見る

    記述言語:日本語  

    本稿では最新のメニーコアプロセッサ Xeon Phi(以下,Phi) の性能について述べる.Phi は高い演算性能およびメモリ転送性能を従来の CPU 同様のプログラミングによって活用できるハードウェアとして高い注目を集めている.その一方でアーキテクチャとしても製品としても新しいものであるため性能を十分に引き出すための知識や技術の共有が十分ではない.そこで本稿では幾つかのベンチマークプログラム等を用いて Phi の性能を評価するとともに,性能に影響を与える実装方法や実行方法について示し情報共有を行う.なお本稿では Phi として先行提供版の Preproduction Xeon Phi を用いている.

  • レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究におけるアプリケーションの最適化と複数の計算機環境での性能評価

    大島聡史, 片桐孝洋, 中島研吾, 米村崇, 熊洞宏樹, 樋口清隆, 橋本昌人, 高山恒一, 藤堂眞治, 岩田潤一, 内田和之, 佐藤正樹, 羽角博康, 黒木聖夫

    先進的計算基盤システムシンポジウム論文集   2013 ( 2013 )   111 - 111   2013年5月

     詳細を見る

    記述言語:日本語  

  • レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究のためのアプリケーション最適化と異機種計算機環境での性能評価

    片桐孝洋, 大島聡史, 中島研吾, 米村崇, 熊洞宏樹, 樋口清隆, 橋本昌人, 高山恒一, 藤堂眞治, 岩田潤一, 内田和之, 佐藤正樹, 羽角博康, 黒木聖夫

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   2013 ( 4 )   1 - 9   2013年5月

     詳細を見る

    記述言語:日本語  

    本報告では,レイテンシコアの高度化・高効率化による将来の HPCI システムに関する調査研究におけるコデザインで用いるアプリケーションについて,コード最適化による性能チューニングを行った結果を報告する.Sparc64,Intel,IBM の CPU を構成要素とする異機種計算機環境での性能評価も報告する.コード最適化の結果,実測での byte perflops (B/F) 値が上がっても実時間は高速化される例があり,B/F 値のみの評価は不十分なことを示す.

  • レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究のためのアプリケーションと性能評価

    片桐孝洋, 大島聡史, 中島研吾, 米村崇, 熊洞宏樹, 樋口清隆, 橋本昌人, 高山恒一, 藤堂眞治, 岩田潤一, 内田和之, 佐藤正樹, 羽角博康, 黒木聖夫

    情報処理学会研究報告(CD-ROM)   2012 ( 5 )   ROMBUNNO.ARC-202,NO.2   2013年2月

     詳細を見る

    記述言語:日本語  

  • 超低消費電力高性能計算に向けた取り組み

    大島 聡史, Luo Cheng, 平澤 将一, 片桐 孝洋, 須田 礼二, 本多 弘樹

    第54回プログラミング・シンポジウム予稿集   54th ( 2013 )   75 - 80   2013年1月

     詳細を見る

    記述言語:日本語  

  • Implementation and Evaluation of 3D Finite Element Method Application for CUDA 査読

    Satoshi Ohshima, Masae Hayashi, Takahiro Katagiri, Kengo Nakajima

    HIGH PERFORMANCE COMPUTING FOR COMPUTATIONAL SCIENCE - VECPAR 2012   7851   140 - 148   2013年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1007/978-3-642-38718-0_16

  • Control formats for unsymmetric and symmetric sparse matrix-vector multiplications on OpenMP implementations 査読

    Takahiro Katagiri, Takao Sakurai, Mitsuyoshi Igai, Satoshi Ohshima, Hisayasu Kuroda, Ken Naono, Kengo Nakajima

    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)   7851   236 - 248   2013年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1007/978-3-642-38718-0_24

  • レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究のためのアプリケーションと性能評価

    片桐孝洋, 大島聡史, 中島研吾, 米村崇, 熊洞宏樹, 樋口清隆, 橋本昌人, 高山恒一, 藤堂眞治, 岩田潤一, 内田和之, 佐藤正樹, 羽角博康, 黒木聖夫

    研究報告ハイパフォーマンスコンピューティング(HPC)   2012 ( 2 )   1 - 12   2012年12月

     詳細を見る

    記述言語:日本語  

    本報告では,レイテンシコアの高度化・高効率化による将来の HPCI システムに関する調査研究におけるターゲットアプリケーションの特徴について,演算パターンと通信パターンの観点からの分類法を提案する.東京大学情報基盤センターに設定された富士通 PRIMEHPC FX10 を用いたプロファイル結果を示し,同計算機でのハードウェア性能からの特徴について紹介する.

  • レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究のためのアプリケーションと性能評価

    片桐孝洋, 大島聡史, 中島研吾, 米村崇, 熊洞宏樹, 樋口清隆, 橋本昌人, 高山恒一, 藤堂眞治, 岩田潤一, 内田和之, 佐藤正樹, 羽角博康, 黒木聖夫

    研究報告計算機アーキテクチャ(ARC)   2012 ( 2 )   1 - 12   2012年12月

     詳細を見る

    記述言語:日本語  

    本報告では,レイテンシコアの高度化・高効率化による将来の HPCI システムに関する調査研究におけるターゲットアプリケーションの特徴について,演算パターンと通信パターンの観点からの分類法を提案する.東京大学情報基盤センターに設定された富士通 PRIMEHPC FX10 を用いたプロファイル結果を示し,同計算機でのハードウェア性能からの特徴について紹介する.

  • BiCGStab法の前処理付きアルゴリズムに対する改善

    伊藤祥司, 片桐孝洋, 櫻井隆雄, 猪貝光祥, 大島聡史, 黒田久泰, 直野健

    情報処理学会論文誌トランザクション(CD-ROM)   2012 ( 1 )   ROMBUNNO.KONPYUTINGUSHISUTEMU,VOL.5,NO.3,11-21   2012年10月

     詳細を見る

    記述言語:日本語  

  • 大規模超並列スーパーコンピューターシステムOakleaf‐FX(Fujitsu PRIMEHPC FX10)の性能評価

    大島聡史, 實本英之, 鴨志田良和, 片桐孝洋, 田浦健次朗, 中島研吾

    情報処理学会研究報告(CD-ROM)   2012 ( 3 )   ROMBUNNO.HPC-135,NO.43   2012年10月

     詳細を見る

    記述言語:日本語  

  • SSG-AT: An auto-tuning method of sparse matrix-vector multiplicataion for semi-structured grids-An adaptation to openfoam 査読

    Satoshi Ito, Satoshi Ohshima, Takahiro Katagiri

    Proceedings - IEEE 6th International Symposium on Embedded Multicore SoCs, MCSoC 2012   191 - 197   2012年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/MCSoC.2012.26

  • 収束障害(Fault Convergence):数値計算ソフトウェアにおける新しい安全性の概念

    片桐孝洋, 櫻井隆雄, 伊藤祥司, 猪貝光祥, 大島聡史, 黒田久泰, 直野健, 中島研吾

    情報処理学会研究報告(CD-ROM)   2012 ( 2 )   ROMBUNNO.HPC-134,NO.9   2012年8月

     詳細を見る

    記述言語:日本語  

  • ポストペタスケール環境のための自動チューニング基盤ppOpen‐ATの新機能について

    片桐孝洋, 伊東聰, 大島聡史

    日本応用数理学会年会講演予稿集(CD-ROM)   2012   273 - 274   2012年8月

     詳細を見る

    記述言語:日本語  

  • Xabclib:ソルバ・前処理自動選択機能を備えた疎行列ライブラリ

    櫻井隆雄, 片桐孝洋, 直野健, 黒田久泰, 中島研吾, 猪貝光祥, 大島聡史, 伊藤祥司

    日本応用数理学会年会講演予稿集(CD-ROM)   2012   281 - 282   2012年8月

     詳細を見る

    記述言語:日本語  

  • GPUを用いた疎行列ベクトル積計算の最適化

    大島聡史

    日本応用数理学会年会講演予稿集(CD-ROM)   2012   299 - 300   2012年8月

     詳細を見る

    記述言語:日本語  

  • A Fully Run-time Auto-tuned Sparse Iterative Solver with OpenATLib 査読

    Ken Naono, Takao Sakurai, Takahiro Katagiri, Satoshi Ohshima, Shoji Itoh, Kengo Nakajima, Mitsuyoshi Igai, Hisayasu Kuroda

    2012 4TH INTERNATIONAL CONFERENCE ON INTELLIGENT AND ADVANCED SYSTEMS (ICIAS), VOLS 1-2   143 - 148   2012年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

    DOI: 10.1109/ICIAS.2012.6306176

  • BiCGStab法の前処理付きアルゴリズムに対する改善

    伊藤 祥司, 片桐 孝洋, 櫻井 隆雄, 猪貝 光祥, 大島 聡史, 黒田 久泰, 直野 健

    情報処理学会論文誌コンピューティングシステム(ACS)   5 ( 3 )   11 - 21   2012年5月

     詳細を見る

    記述言語:日本語  

    前処理付きBiCGStab(PBiCGStab)法の改善アルゴリズムを提案する.前処理付きBiCG法にCGS法の導出手順を適用すると,CGS法の合理的な前処理付きアルゴリズムが構成される.この手法をPBiCGStab法へと拡張するにあたり,BiCGStab法に現れるMR演算に対し論理面からの新たな考察を行い,適用できることを示した.本提案アルゴリズムが従来のPBiCGStabよりも合理的であることと,数値実験により本提案の有効性を示す.An improved preconditioned BiCGStab algorithm (improved PBiCGStab) is proposed. Rational preconditioned algorithm of CGS has been constructed, by applying the derivation procedure of the CGS to the preconditioned BiCG. In order to extend this approach to the BiCGStab, minimum residual part of the BiCGStab must be considered logically. This proposed algorithm is also more rational than the conventional typical PBiCGStab mathematically. Numerical results show advantages of this improved PBiCGStab.

  • 収束障害(Fault Convergence):数値計算ソフトウェアにおける新しい安全性の概念

    片桐 孝洋, 櫻井 隆雄, 伊藤 祥司, 猪貝 光祥, 大島 聡史, 黒田 久泰, 直野 健, 中島 研吾

    研究報告ハイパフォーマンスコンピューティング(HPC)   2012 ( 9 )   1 - 8   2012年5月

     詳細を見る

    記述言語:日本語  

    本論文では,数値計算ソフトウェアで多く用いられている数値反復解法において生じると考えられる収束障害 (Fault Convergence) の概念を提案する.数値計算分野で用いられている偽収束 (False Convergence) との違いを議論する.Laprie により定義されたディペンダブルコンピューティング実現のための 3 つの脅威―障害 (fault) ‐異常 (error) ‐故障 (failure) モデル-を用いて数値反復解法での収束問題を議論することにより,収束障害の一例を示す.In this paper, we propose a concept of "Fault Convergence" for numerical iteration methods, which are widely used methods in numerical software. With respect to the difference to the concept of "False" convergence on numerical computation field, we explain a situation that fault convergence occurs. By using the model proposed by Laprie with the 3 kinds of threats to dependable computing―the fault-error-failure model―, we discuss an example of fault convergence situation in convergence problem to numerical iterative methods.

  • ppOpen-HPCのための自動チューニング基盤ppOpen-ATの開発

    片桐 孝洋, 大島 聡史, 伊東 聰

    計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science   17   ROMBUNNO.E-7-6   2012年5月

     詳細を見る

    記述言語:日本語  

  • ppOpen-ATにおけるOpenFOAM高速化の取り組み

    伊東 聰, 大島 聡史, 片桐 孝洋

    計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science   17   ROMBUNNO.E-7-7   2012年5月

     詳細を見る

    記述言語:日本語  

  • 大規模SMP並列スーパーコンピューター(HITACHI SR16000モデルM1)の性能評価

    大島聡史, 實本英之, 鴨志田良和, 片桐孝洋, 田浦健次朗, 中島研吾

    情報処理学会研究報告(CD-ROM)   2011 ( 6 )   ROMBUNNO.HPC-133,NO.5   2012年4月

     詳細を見る

    記述言語:日本語  

  • 複数GPU向けのCUDAコードを生成するOpenMP処理系の提案

    長塚郁, 大島聡史, 平澤将一, 近藤正章, 本多弘樹

    情報処理学会研究報告(CD-ROM)   2011 ( 6 )   ROMBUNNO.HPC-133,NO.12   2012年4月

     詳細を見る

    記述言語:日本語  

  • 大規模SMP並列スーパーコンピューター(HITACHI SR16000モデルM1)の性能評価

    大島 聡史, 實本 英之, 鴨志田 良和, 片桐 孝洋, 田浦 健次朗, 中島 研吾

    研究報告ハイパフォーマンスコンピューティング(HPC)   2012 ( 5 )   1 - 10   2012年3月

     詳細を見る

    記述言語:日本語  

    本稿では東京大学情報基盤センターにおいて 2011 年 10 月に稼働を開始したスーパーコンピューターシステム HITACHI SR16000 モデル M1(愛称 Yayoi) の性能について報告する.本システムは計算ノードに Power7 プロセッサを搭載した最新のスーパーコンピューターシステムである.いくつかのベンチマークを用いて性能評価を行った結果,性能の特性や重要な実行時環境変数の設定などが明らかとなった.We report the performance of HITACHI SR16000 model M1 supercomputer system (named Yayoi) which has started in October 2011 at Information Technology Center, The University of Tokyo. This is a latest supercomputer system which mounts Power7 CPU on the computation node. We executed several benchmarks on the system and unveiled characteristic features of performance and imporant parameters.

  • 複数GPU向けのCUDAコードを生成するOpenMP処理系の提案

    長塚郁, 大島聡史, 平澤将一, 近藤正章, 本多弘樹

    研究報告ハイパフォーマンスコンピューティング(HPC)   2012 ( 12 )   1 - 8   2012年3月

     詳細を見る

    記述言語:日本語  

    著者らは OpenMP プログラムから CUDA プログラムへ変換する処理系,"OMPCUDA" の開発を行っている.本稿では,OMPCUDA における複数 GPU 向けの CUDA プログラムを生成するための機能の実装を述べ,生成された CUDA コードの評価結果について考察する.

  • BiCGStab法の前処理付きアルゴリズムに対する改善

    伊藤 祥司, 片桐 孝洋, 櫻井 隆雄, 猪貝 光祥, 大島 聡史, 黒田 久泰, 直野 健

    ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集   2012 ( 2012 )   117 - 126   2012年1月

     詳細を見る

    記述言語:日本語  

  • 並列スーパーコンピュータSR16000/M1の構成と性能

    大島聡史, 實本英之, 鴨志田良和, 片桐孝洋, 田浦健次朗, 中島研吾

    ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集   2012 ( 2012 )   84 - 84   2012年1月

     詳細を見る

    記述言語:日本語  

  • ヘテロ環境を目指した拡張階層型領域間分割に基づく高次フィルイン付き前処理手法の高速化

    林雅江, 大島聡史, 中島研吾

    情報処理学会研究報告(CD-ROM)   2011 ( 2 )   ROMBUNNO.HPC-130,NO.5   2011年8月

     詳細を見る

    記述言語:日本語  

  • 自動チューニングインターフェースOpenATLibにおける自動チューニング機能の評価

    櫻井隆雄, 片桐孝洋, 直野健, 黒田久泰, 中島研吾, 猪貝光祥, 大島聡史, 伊藤祥司

    情報処理学会研究報告(CD-ROM)   2011 ( 2 )   ROMBUNNO.HPC-130,NO.43   2011年8月

     詳細を見る

    記述言語:日本語  

  • 三次元有限要素法アプリケーションにおける行列生成処理のCUDA向け実装

    大島聡史, 林雅江, 片桐孝洋, 中島研吾

    情報処理学会研究報告(CD-ROM)   2011 ( 2 )   ROMBUNNO.HPC-130,NO.11   2011年8月

     詳細を見る

    記述言語:日本語  

  • ヘテロ環境を目指した拡張階層型領域間分割に基づく高次フィルイン付き前処理手法の高速化

    林 雅江, 大島 聡史, 中島 研吾

    研究報告ハイパフォーマンスコンピューティング(HPC)   2011 ( 5 )   1 - 5   2011年7月

     詳細を見る

    記述言語:日本語  

    拡張階層型領域間分割は,領域外からの高次フィルインを考慮可能とする並列化手法であり,分散データの局所性も高いことから,メニーコア環境での効率的な並列化手法として期待される.本研究では,物性値分布に不均質性をもつことから悪条件となる三次元静弾性問題に対し,拡張階層型領域間分割に基づく高次フィルイン前処理付き反復解法を適用する.本報告では,T2K(東大) を利用し,マルチコア環境における本並列実装プログラムの収束性および高次フィルイン付き前処理の並列性能についてマルチカラー法との比較に基づき評価する.Extended version of Hierarchical Interface Decomposition(HID) is developed as an effective parallelization method for Finite Element Method(FEM) on multi/many-core environments for its high locality of distributed mesh data. And thichker separators introduced in Extended HID allow us to take into account high level fill-ins in parallel ILU preconditioners. We implemented Extended HID to OpenMP parallel FEM base simulation of linear elasticity problem with heterogeneous property. The developed code has been tested on the T2K Open Super Computer(T2K/Tokyo) using 1 node, 16 cores to evaluate the robustness and the scalability of parallel ILU decomposition based on the comparison with MC ordering.

  • 自動チューニングインターフェースOpenATLibにおける自動チューニング機能の評価

    櫻井 隆雄, 片桐 孝洋, 直野 健, 黒田 久泰, 中島 研吾, 猪貝 光祥, 大島 聡史, 伊藤 祥司

    研究報告ハイパフォーマンスコンピューティング(HPC)   2011 ( 43 )   1 - 6   2011年7月

     詳細を見る

    記述言語:日本語  

    科学技術計算等で利用される行列計算ライブラリは高い演算性能が得られるパラメータの選択や入力に多大な手間が必要なため,それを自動的に設定する方式が求められている.そこで,筆者らは自動チューニングインターフェース OpenATlib を開発している.本稿では OpenATLib の提供する機能の 1 つであるリスタート周期自動チューニング機能について述べる.本機能では残差履歴を用いて最適なリスタート周期を自動的に選択する.T2K オープンスパコンを用いて 3 種の解法で本機能の効果を評価した結果,固定値と比較して最大で 38.5 倍の性能差があり,機能の有効性が確認できた.Matrix libraries have many parameters as inputs by the user. They include problem parameters what are difficult to set values and the approach of automatically setting them is needed. Then, we proposed Auto-tuning interface "OpenATLib." In this paper, we explain a runtime automatic tuning approach for deciding the size of projection matrix in Krylov subspace methods. This approach searches the best size of projection matrix with history of residual values at runtime.Performance evaluations of OpenATLib using 3 solvers on T2K Open Supercomputer indicates that the maximum speedup establishes 38.5x.

  • 三次元有限要素法アプリケーションにおける行列生成処理のCUDA向け実装

    大島 聡史, 林 雅江, 片桐 孝洋, 中島 研吾

    研究報告ハイパフォーマンスコンピューティング(HPC)   2011 ( 11 )   1 - 6   2011年7月

     詳細を見る

    記述言語:日本語  

    本稿では三次元有限要素法 (FEM) アプリケーションにおける行列生成処理の CUDA 向け実装について述べる.GPU は高い演算性能・メモリ転送性能を持つため様々な科学技術計算アプリケーションに利用されており,FEM についても多くの研究がなされている.特に,FEM の実行時間の多くは疎行列ソルバーが占めるため,疎行列ソルバーを対象とした GPU 実装の研究が盛んである.本稿では,疎行列ソルバーに次いで実行時間を要する処理である行列生成処理を対象として,1GPU,2GPU および 2GPU と CPU を用いた実装と性能について報告する.We describe the implementation of matrix assembly process in 3D Finite Element Method (FEM) using CUDA. Because GPU has high calculation performance and memory transfer performance, GPU is now utilizing for several scientific applications include FEM. Especially, many researches aim at speeeding up of sparse matrix solver because sparse matrix solver has the largest time ratio of execution time of FEM. In this paper, we focus on matrix assembly process which has the second largest time ratio of FEM, and show the result of implementation and performance evaluation.

  • 前処理付きBiCGStab法の問題点に対する改良

    伊藤祥司, 片桐孝洋, 櫻井隆雄, 猪貝光祥, 大島聡史, 黒田久泰, 直野健, 中島研吾

    計算工学講演会論文集(CD-ROM)   16   ROMBUNNO.F-4-3   2011年5月

     詳細を見る

    記述言語:日本語  

  • HxABCLibScript : 非均質計算機向け自動チューニング記述言語拡張 (ハイパフォーマンスコンピューティング(HPC) Vol.2011-HPC-129)

    片桐 孝洋, 大島 聡史, 平澤 将一, 本多 弘樹

    情報処理学会研究報告   2010 ( 6 )   1 - 8   2011年4月

     詳細を見る

    記述言語:日本語  

    本稿では,CPUおよびGPU(Graphics Processing Unit)を混載した非均質計算機において,任意のプログラムの一部分が,適する計算資源上で実行される最適化を実現する自動チューニング専用言語HxABCLibScriptを提案する.性能評価の結果,HxABCLibScript記述から自動生成されるコードは,問題サイズや反復回数に応じ,CPUとGPU間で適切に計算資源を切り替えることで最適化されることを確認した.In this paper, we propose HxABCLibScript, which is a dedicated language for auto-tuning description on heterogeneous computer environment, which includes CPU and GPU (Graphics Processing Unit), to adapt arbitrary parts of programs. Results of performance evaluation indicated that the automatically generated codes from the description of HxABCLibScript can select the best computer resources between CPU and GPU according to problem size or the number of iterations on the program.

  • 三次元有限要素法アプリケーションのCUDA向け実装と性能評価—Implementation and Evaluation of 3D Finite Element Method for CUDA

    大島 聡史, 林 雅江, 片桐 孝洋

    情報処理学会研究報告   2010年度 ( 6 )   1 - 6   2011年4月

     詳細を見る

    記述言語:日本語  

  • 三次元有限要素法アプリケーションのCUDA向け実装と性能評価

    大島 聡史, 林 雅江, 片桐 孝洋, 中島 研吾

    研究報告ハイパフォーマンスコンピューティング(HPC)   2011 ( 20 )   1 - 6   2011年3月

     詳細を見る

    記述言語:日本語  

    本稿では三次元弾性静力学を対象とした有限要素法(Finite Element Method, FEM)のGPU(CUDA)向け実装と性能評価について述べる.高い演算性能・メモリ転送性能を持つGPUは様々な科学技術計算アプリケーションに利用されており,FEMについても多くの研究がなされている.本稿では特に前処理付き共役勾配法(Conjugate Gradient Method, CG法)による疎行列ソルバーと係数行列生成部分に注目し,CUDA向けの実装と性能評価を行った結果を報告する.In this paper, we describe the implementation and evaluation of Finite Element Method(FEM) on GPU(CUDA). Because GPU has high calculation performance and memory transfer performance, GPU is now utilizing for several scientific applications include FEM. We show the result of implementation and performance evaluation especially about sparse matrix solver using Conjugate Gradient Method and matrix creation.

  • Segmented Scan法のCUDA向け最適化実装

    大島聡史, 櫻井隆雄, 片桐孝洋, 中島研吾, 黒田久泰, 直野健, 猪貝光祥, 伊藤祥司

    情報処理学会研究報告(CD-ROM)   2010 ( 3 )   ROMBUNNO.HPC-126,NO.1   2010年10月

     詳細を見る

    記述言語:日本語  

  • ATのGPUへの展開

    大島聡史

    日本応用数理学会年会講演予稿集   2010   297 - 298   2010年9月

     詳細を見る

    記述言語:日本語  

  • GPUコンピューティング向け中間言語の研究

    平澤 将一, 大島 聡史, 本多 弘樹

    情報処理学会論文誌プログラミング(PRO)   3 ( 4 )   66 - 66   2010年9月

     詳細を見る

    記述言語:日本語  

    本発表においては,GPUコンピューティングに代表されるヘテロジニアスなデータ並列アクセラレータ環境に適する中間言語を明らかにする.主に画像処理用プロセッサとして用いられていたGPUなどのデータ並列プロセッサは汎用計算において高い実行ピーク性能を持ち,高性能コンピューティングにおいてアクセラレータとして注目されている.これらアクセラレータは,メインメモリとは独立したメモリ空間,アドレスを持つオンチップ高速スクラッチパッドメモリおよびSIMDやSPMDなどの並列実行モデルを持つ.既存のCPU向けコンパイラで用いられる中間言語はこれらアクセラレータが持つ特徴の記述性に乏しく,現在はアクセラレータの種類ごとに高いピーク性能を発揮させる独自のプログラミング環境が使用されており,ユーザがソースレベルでピーク性能に近付ける性能チューニングを行っている.本発表においてはヘテロジニアスなデータ並列アクセラレータ環境で使用可能な中間言語を明らかにするべく,Javaバイトコードをベースとしたネイティブコンパイル環境による実行性能を評価し,アクセラレータの持つ特徴を記述可能とする中間言語について議論する.In this presentation, we will discuss a intermediate language suitable for GPU computing. GPUs as data parallel processors have very high execution peak performance for general purpose computation. GPUs attract attention as accelerators in HPC (High Performance Computing). Accelerators usually have parallel execution models like SIMD and SPDM, independent memory, and high-speed on-chip scratchpad memory. Intermediate languages used in CPU compilers cannot fully describe these features. Users are using different programming environments for each accelerators and tuning source codes toward the peak performance. We evaluate the execution performance of a native compiling environment based on Java Bytecode and discuess the intermediate language which is suitable to describe the accelerator features.

  • Segmented Scan 法のCUDA向け最適化実装

    大島 聡史, 櫻井 隆雄, 片桐 孝洋, 中島 研吾, 黒田 久泰, 直野 健, 猪貝 光祥, 伊藤 祥司

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   126 ( 1 )   A1 - A7   2010年8月

     詳細を見る

    記述言語:日本語  

    本稿では Segmented Scan 法を用いた疎行列ベクトル積の CUDA 向け最適化実装について述べる.我々は実装の再利用性に着目した自動チューニングインターフェース OpenATLib の提案を行い,また OpenATLib の提供する機能の一つである疎行列ベクトル積においては Segmented Scan 方式を元にスカラ計算機向けに改良を行った Branchless Segmented Scan 方式を提案している.本稿ではこれらの方式を元にして CUDA 向けの新たな Segmented Scan 方式を考案し実装した.GPU 上で高速実行可能なようにアルゴリズムの改良や各種の最適化を行った結果,偏りの大きな行列に対して NVIDIA GeForceGTX285 上で最大で 3.26GFLOPS の性能を達成した.We discuss about optimized implementation of sparse matrix vector multiplication for CUDA using Segmented Scan method. We proposed Auto-tuning interface OpenATLib and we also proposed Branchless Segmented Scan method besed on Segmented Scan method for scalar computer as an important new feature of sparse matrix vector multiplication. In this paper, we proposed and implemented new Segmented Scan method for CUDA based on Segmented Scan method and Branchless Segmented Scan method. As a result of optimized implementation, we aimed 3.26GFLOPS on NVIDIA GeForceGTX285.

  • GPU向けソフトウェアキャッシュ機構の実装と評価

    平澤将一, 下田和明, 下田和明, 大島聡史, 本多弘樹

    情報処理学会研究報告(CD-ROM)   2009 ( 4 )   ROMBUNNO.ARC-186,9   2009年12月

     詳細を見る

    記述言語:日本語  

  • GPU向けソフトウェアキャッシュ機構の実装と評価

    平澤 将一, 下田 和明, 大島 聡史, 本多 弘樹

    情報処理学会研究報告. 計算機アーキテクチャ研究会報告   186   I1 - I10   2009年11月

     詳細を見る

    記述言語:日本語  

    高性能コンピューティングにおいて GPU が注目されている.NVIDIA 製 GPU は CUDA において高性能なシェアードメモリを有効に用いるプログラミング技術により各種アプリケーションで非常に高いピーク性能が得られている一方,プログラミングの容易さ,汎用性に問題を残している.本研究においては CUDA においてユーザが明示的に使用するシェアードメモリの一部をデバイスメモリのキャッシュとするソフトウェアキャッシュ機構を提案する.本機構によりデバイスメモリからシェアードメモリへ暗黙的にデータ転送が行われ汎用計算の高速化が達成される.In HPC, GPU attracts attention. Although programming difficulty still remains, very high peak performance can be achieved using NVIDIA GPUs. In this research, we propose a software cache mechanism which caches the device memory of CUDA with the shared memory. User data can be transfered implicitly with the software cache and performance improvement of general-purpose computation benchmark programs can be achieved.

  • GPU向けソフトウェアキャッシュ機構の実装と評価

    平澤 将一, 下田 和明, 大島 聡史, 本多 弘樹

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   123 ( 9 )   I1 - I10   2009年11月

     詳細を見る

    記述言語:日本語  

    高性能コンピューティングにおいて GPU が注目されている.NVIDIA 製 GPU は CUDA において高性能なシェアードメモリを有効に用いるプログラミング技術により各種アプリケーションで非常に高いピーク性能が得られている一方,プログラミングの容易さ,汎用性に問題を残している.本研究においては CUDA においてユーザが明示的に使用するシェアードメモリの一部をデバイスメモリのキャッシュとするソフトウェアキャッシュ機構を提案する.本機構によりデバイスメモリからシェアードメモリへ暗黙的にデータ転送が行われ汎用計算の高速化が達成される.In HPC, GPU attracts attention. Although programming difficulty still remains, very high peak performance can be achieved using NVIDIA GPUs. In this research, we propose a software cache mechanism which caches the device memory of CUDA with the shared memory. User data can be transfered implicitly with the software cache and performance improvement of general-purpose computation benchmark programs can be achieved.

  • OMPCUDA:GPU向けOpenMP処理系

    大島聡史, 平澤将一, 本多弘樹

    情報処理学会シンポジウム論文集   2009 ( 2 )   42   2009年1月

     詳細を見る

    記述言語:日本語  

  • OMPCUDA:GPU向けOpenMPの実装

    大島聡史, 平澤将一, 本多弘樹

    情報処理学会シンポジウム論文集   2009 ( 2 )   131 - 138   2009年1月

     詳細を見る

    記述言語:日本語  

  • OMPCUDA : GPU向け OpenMP の実装

    大島 聡史, 平澤 将一, 本多 弘樹

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   118 ( 125(HPC-118) )   121 - 126   2008年12月

     詳細を見る

    記述言語:日本語  

    GPU(Graphics Processing Unit)を用いた汎用演算GPGPU(General-Purpose computation using GPUs)は高い演算性能が注目されている一方で,プログラム作成の難しさが問題となっている.そこで我々は,既存の並列プログラミング手法を用いたGPGPUプログラミングを提案している.本論文では共有メモリ型並列計算機で広く用いられているOpenMPを用いたGPGPUの可能性を探るため,CUDA対応GPU向けのOpenMP処理系OMPCUDAを実装した.また,並列性の高いテストプログラムを用いて評価を行い,並列プログラムが容易に作成できることおよび既存のOpenMPと同様の記述で容易に並列高速化できることを確認した.

  • メッセージ通信型GPGPUプログラミング(プログラミング環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))

    大島 聡史, 平澤 将一, 本多 弘樹

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   2008 ( 19 )   109 - 114   2008年3月

     詳細を見る

    記述言語:日本語  

    GPUの性能向上に伴い,GPUの性能を様々な用途に活用するGPGPUが注目されている.GPGPUは特に並列処理に適しているためCPUを超える演算性能が期待される一方,独自のプログラミング手法を用いる必要があるためソフトウェアの作成が容易ではない.そこで我々は既存の並列プログラミング手法を用いたGPGPUプログラミングを提案している.本稿ではメッセージ通信をはじめとした既存の並列プログラミング手法をいくつかとりあげ,それらがGPGPUプログラミングにどのように適用できるかを検討した。

  • メッセージ通信型GPGPUプログラミング

    大島 聡史, 平澤 将一, 本多 弘樹

    情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告   177 ( 19(ARC-177 HPC-114) )   109 - 114   2008年3月

     詳細を見る

    記述言語:日本語  

    GPUの性能向上に伴い,GPUの性能を様々な用途に活用するGPGPUが注目されている.GPGPUは特に並列処理に適しているためCPUを超える演算性能が期待される一方,独自のプログラミング手法を用いる必要があるためソフトウェアの作成が容易ではない.そこで我々は既存の並列プログラミング手法を用いたGPGPUプログラミングを提案している.本稿ではメッセージ通信をはじめとした既存の並列プログラミング手法をいくつかとりあげ,それらがGPGPUプログラミングにどのように適用できるかを検討した。

  • 既存の並列化手法を用いたGPGPUプログラミング

    大島 聡史, 平澤 将一, 本多 弘樹

    第49回プログラミング・シンポジウム予稿集   49th ( 2008 )   81 - 88   2008年1月

     詳細を見る

    記述言語:日本語  

  • 既存の並列化手法を用いたGPGPUプログラミングの提案

    大島 聡史, 平澤 将一, 本多 弘樹

    情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告   175 ( 115(ARC-175) )   7 - 10   2007年11月

     詳細を見る

    記述言語:日本語  

    GPUの性能向上に伴い,GPUの性能を様々な用途に活用するGPGPUが注目されている.GPGPUは特に並列プログラムにおいてCPUを超える高い性能が期待される一方,GPGPUプログラミング特有の手法を用いる必要があるためソフトウェアの作成が容易ではない.本稿ではGPGPUプログラミングを容易にする1つの手法として既存の並列化手法を利用することを提案する.また具体的な実装に向けて,近年利用され始めたGPGPU向けプログラミング言語CUDAを利用し,GPU上の処理をOpenMPやMPIで記述する方法を検討する.

  • ソフトウェア DSM Mocha とMPIの並列ベンチマークを用いた性能評価

    今村 昌之, 鈴木 祥, 坂口 朋也, 大島 聡史, 片桐 孝洋, 吉瀬 謙二, 弓場 敏嗣

    情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告   172 ( 17(ARC-172 HPC-109) )   103 - 108   2007年3月

     詳細を見る

    記述言語:日本語  

    ソフトウェア分散共有メモリ(S-DSM)システムによるプログラミングは,一般に普及しているメッセージパッシングインタフェース(MPI)によるプログラミングよりも容易であるとされている.本稿では,MPIのひとつの実現ライブラリであるMPICHと,S-DSMであるMochaの性能を比較をした.4種のアプリケーション(MM, SOR, IS, LU)をベンチマークとして使用した.S-DSMシステムのオーバヘッドを測定するため,割り込みハンドラの実行時間を測定した.その結果,S-DSMの性能がMPIの性能に追いつくためには:1.ページフォルト時より前に共有データをプリフェッチ;2.ロック取得の高速化;3.バリア同期の高速化;の順番に改善をおこなうべきであることが明らかとなった.

  • ソフトウェアDSM MochaとMPIの並列ベンチマークを用いた性能評価(クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))

    今村 昌之, 鈴木 祥, 坂口 朋也, 大島 聡史, 片桐 孝洋, 吉瀬 謙二, 弓場 敏嗣

    情報処理学会研究報告. [ハイパフォーマンスコンピューティング]   2007 ( 17 )   103 - 108   2007年3月

     詳細を見る

    記述言語:日本語  

    ソフトウェア分散共有メモリ(S-DSM)システムによるプログラミングは,一般に普及しているメッセージパッシングインタフェース(MPI)によるプログラミングよりも容易であるとされている.本稿では,MPIのひとつの実現ライブラリであるMPICHと,S-DSMであるMochaの性能を比較をした.4種のアプリケーション(MM, SOR, IS, LU)をベンチマークとして使用した.S-DSMシステムのオーバヘッドを測定するため,割り込みハンドラの実行時間を測定した.その結果,S-DSMの性能がMPIの性能に追いつくためには:1.ページフォルト時より前に共有データをプリフェッチ;2.ロック取得の高速化;3.バリア同期の高速化;の順番に改善をおこなうべきであることが明らかとなった.

  • CPUとGPUを用いた基本行列計算ライブラリ

    大島聡史, 片桐孝洋, 弓場敏嗣, 平澤将一, 本多弘樹

    情報処理学会シンポジウム論文集   2007 ( 1 )   66   2007年1月

     詳細を見る

    記述言語:日本語  

  • Parallel processing of matrix multiplication in a CPU and GPU heterogeneous environment 査読

    Satoshi Ohshima, Kenji Kise, Takahiro Katagiri, Toshitsugu Yuba

    HIGH PERFORMANCE COMPUTING FOR COMPUTATIONAL SCIENCE - VECPAR 2006   4395   305 - 318   2007年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)  

  • CPUとGPUを用いた並列GEMM演算の提案と実装

    大島 聡史, 吉瀬 謙二, 片桐 孝洋, 弓場 敏嗣

    情報処理学会論文誌コンピューティングシステム(ACS)   47 ( 12 )   317 - 328   2006年9月

     詳細を見る

    記述言語:日本語  

    画像処理用のハードウェアであるGPU(Graphics Processing Unit)の性能向上にともない,GPUの演算能力を様々な分野で活用する研究がさかんである.我々はGPUを用いた新しい計算方式として,CPUとGPUの並列処理による数値計算方式を提案してきた.本稿では既存の数値計算ライブラリに対して計算方式を適用し,性能チューニングのための検討およびベンチマークプログラムを用いた性能評価を行った.計算方式をBLASのGEMMに適用して並列GEMMを作成し,これを用いてHPLベンチマークを実行したところ,Pentium43.0GHz単体での実行と比べて最大で1.45倍の性能を達成した.GPUによる演算が単精度であるためHPLの高速化としては問題があるものの,計算方式が現実的なアプリケーションに適用できる可能性を示すことができた.GPUs for numerical computations are becoming an attractive research topics. We have proposed a new computation method of GPU, which utilizes parallel processing based on CPU and GPU. In this paper, we apply this method to existing numerical computation library. We examine a performance tuning method and execute performance experiments using a benchmark program. We also apply the method to the GEMM routine of BLAS and execute the HPL benchmark. As a result, the performance can be improved to 1. 45 times by our method, compared with a CPU only environment using Pentium 43.0GHz. There is a precision problem depending on GPU&#039;s arithmatic precision, but we show such a potentiality that our method can be applied to various applications.

  • MPIとの比較によるソフトウェアDSMの性能評価

    今村 昌之, 鈴木 祥, 坂口 朋也, 大島 聡史, 片桐 孝洋, 吉瀬 謙二, 弓場 敏嗣

    情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告   169 ( 88 )   157 - 162   2006年8月

     詳細を見る

    記述言語:日本語  

    ソフトウェア分散共有メモリ(S-DSM)システムは,PCクラスタなどの分散メモリ環境上で,ソフトウェアによって仮想的な共有メモリ環境を提供する.S-DSMによる並列プログラミングインタフェースは,一般に普及しているメッセージパッシングインタフェースよりもプログラミングが容易であるとされている.本稿では,メッセージパッシングインタフェースのひとつの実現ライブラリであるMPICHと,S-DSM Mochaの性能を比較をおこなった.三つのアプリケーション(MM, SOR, LU)をベンチマークとして使用した.その結果,プログラマが通信によるチューニングをおこなえるアプリケーションでは,MPIはS-DSMに対して性能が高く,反対におこなえない場合はMPIとS-DSMの性能は拮抗することがわかった.

  • 相乗り通信を利用したソフトウェアDSMの通信回数削減手法

    坂口 朋也, 今村 昌之, 鈴木 祥, 大島 聡史, 片桐 孝洋, 吉瀬 謙二, 弓場 敏嗣

    情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告   169 ( 88 )   151 - 156   2006年8月

     詳細を見る

    記述言語:日本語  

    PCクラスタにおいてソフトウェアで仮想的な共有メモリを実現するソフトウェア分散共有メモリ(S-DSM)システムの高速化について議論する.S-DSMシステムのクラスタを構成するノード間で,近い将来に転送されるページを動的に予測し,予め転送しておくことで通信オーバヘッドを削減し高速化を図る方法がある.本稿では,予測したページを予め転送しておく方式として,S-DSMシステムでやりとりされるメッセージにページデータを含ませる「相乗り通信」という転送方式を提案する.従来の転送方式のS-DSMシステムと比較して,提案手法を用いたS-DSMシステムは最大でMM(Matrix Multiply)では45.1&#37;,SOR(Red-Black Successive Over Relaxation)で5.3&#37;,LU(Parallel Dense-blocked LU Factorization, No Pivoting)で7.5&#37;,IS(Integer sort)で4.8&#37;の性能向上が得られた.

  • MPIとの比較によるソフトウェアDSMの性能評価

    今村昌之, 鈴木祥, 坂口朋也, 大島聡史, 片桐孝洋, 吉瀬謙二, 弓場敏嗣

    情報処理学会研究報告   2006 ( 88(ARC-169) )   157 - 162   2006年7月

     詳細を見る

    記述言語:日本語  

  • 相乗り通信を利用したソフトウェアDSMの通信回数削減手法

    坂口朋也, 今村昌之, 鈴木祥, 大島聡史, 片桐孝洋, 吉瀬謙二, 弓場敏嗣

    情報処理学会研究報告   2006 ( 88(ARC-169) )   151 - 156   2006年7月

     詳細を見る

    記述言語:日本語  

    PCクラスタにおいてソフトウェアで仮想的な共有メモリを実現するソフトウェア分散共有メモリ(S-DSM)システムの高速化について議論する.S-DSMシステムのクラスタを構成するノード間で,近い将来に転送されるページを動的に予測し,予め転送しておくことで通信オーバヘッドを削減し高速化を図る方法がある.本稿では,予測したページを予め転送しておく方式として,S-DSMシステムでやりとりされるメッセージにページデータを含ませる「相乗り通信」という転送方式を提案する.従来の転送方式のS-DSMシステムと比較して,提案手法を用いたS-DSMシステムは最大でMM(Matrix Multiply)では45.1&#37;,SOR(Red-Black Successive Over Relaxation)で5.3&#37;,LU(Parallel Dense-blocked LU Factorization No Pivoting)で7.5&#37;,IS(Integer sort)で4.8&#37;の性能向上が得られた.We discuss the method to speed up the software distributed shared memory (S-DSM) systems. By predicting a page which will be needed to be transferred in the future and prefetching it, we can speed up the S-DSM systems. In this paper, we propose a method to transfer the predicted pages together with a message used in S-DSM systems. We will call this method Ainori communication. We evaluate our implementation using four S-DSM benchmarks and show that it can decrease the number of communication and improve the performance.

  • CPUとGPUを用いた並列GEMM演算の提案と実装

    大島聡史, 吉瀬謙二, 片桐孝洋, 弓場敏嗣

    情報処理学会シンポジウム論文集   2006 ( 5 )   41 - 50   2006年5月

     詳細を見る

    記述言語:日本語  

  • CPUとGPUを複数用いた並列数値計算環境の検討

    大島聡史, 吉瀬謙二, 片桐孝洋, 本多弘樹, 弓場敏嗣

    情報処理学会シンポジウム論文集   2006 ( 5 )   252 - 253   2006年5月

     詳細を見る

    記述言語:日本語  

  • CPUとGPUの並列処理による行列積和演算方式の提案 (2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)--研究会・連続同時開催)

    大島 聡史, 吉瀬 謙二, 片桐 孝洋, 弓場 敏嗣

    情報処理学会研究報告   2005 ( 80 )   139 - 144   2005年8月

     詳細を見る

    記述言語:日本語  

    数値計算にGPU(Graphics Processing Unit)を利用する研究が盛んになりつつある.本稿ではGPUを用いてより高い演算性能を得るため, GPUで数値計算をおこなうだけではなく, 対象問題を分割し, CPUとGPUで並列に問題を解く方式を提案する.行列の積和演算をCPUとGPUで並列実行した結果, CPUのみで解いた場合に比べて, 最大38.1&#37;の性能向上が得られた.また, 予備実験によって得たCPUとGPUそれぞれのFLOPS値を利用し, 最適な問題配分をおこなうための方法を検討した.その結果, 実験による測定値に近い値を, 計算によって求めることができた.

  • GPUによるBLAS演算の性能評価

    大島聡史, 吉瀬謙二, 片桐孝洋, 弓場敏嗣

    情報処理学会シンポジウム論文集   2005 ( 5 )   247 - 248   2005年5月

     詳細を見る

    記述言語:日本語  

  • GPUによる高速な行列積の実装

    大島 聡史, 吉瀬 謙二, 片桐 孝洋, 弓場 敏嗣

    第67回全国大会講演論文集   2005 ( 1 )   159 - 160   2005年3月

     詳細を見る

    記述言語:日本語  

  • 命令レベル並列性を利用したOpenMPによるプロセッサシミュレータの並列実行

    大島 聡史, 檜田 敏克, 吉瀬 謙二, 片桐 孝洋, 本多 弘樹, 弓場 敏嗣

    第66回全国大会講演論文集   2004 ( 1 )   121 - 122   2004年3月

     詳細を見る

    記述言語:日本語  

▼全件表示

書籍等出版物

  • 演習で学ぶ数値計算 : C&Fortran

    片桐, 孝洋, 大島, 聡史

    共立出版  2022年3月 

     詳細を見る

    担当ページ:総ページ数:viii, 212p   記述言語:日本語  

講演・口頭発表等

  • Considering multi process calculations on current GPU 招待 国際会議

    Satoshi Ohshima

    ATAT in HPSC 2024  2024年3月 

     詳細を見る

    開催年月日: 2024年3月

    記述言語:英語   会議種別:口頭発表(一般)  

    国名:台湾  

  • 九大新スパコン玄界による限界のないコンピューティングへの挑戦 招待

    大島聡史

    2024年3月 

     詳細を見る

    開催年月日: 2024年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:タワーホール船堀   国名:日本国  

  • 一万計算コア超時代のGPUに向けたプログラム最適化と自動チューニングを考える

    大島聡史

    第15回 自動チューニング技術の現状と応用に関するシンポジウム(ATTA2023)  2023年12月 

     詳細を見る

    開催年月日: 2023年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:工学院大学新宿キャンパス アーバンテックホール   国名:日本国  

  • QR Factorization of Block Low-rank Matrices on Multiple-/Multi-Instance GPUs 招待 国際会議

    Satoshi Ohshima

    ATAT in HPSC 2023  2023年3月 

     詳細を見る

    開催年月日: 2023年3月

    記述言語:英語   会議種別:口頭発表(一般)  

    国名:台湾  

  • BLR-QR on GPU:マルチインスタンスGPUを用いた多数の小密行列計算の高速化

    大島聡史, 伊田明弘, 横田理央, 山崎市太郎

    第14回 自動チューニング技術の現状と応用に関するシンポジウム(ATTA2022)  2022年12月 

     詳細を見る

    開催年月日: 2022年12月

    記述言語:その他  

    国名:その他  

  • QR Factorization of Block Low-Rank Matrices on Multi-Instance GPU 国際会議

    @Satoshi Ohshima, Akihiro Ida, Rio Yokota, Ichitaro Yamazaki

    The 23rd International Conference on Parallel and Distributed Computing, Applications and Technologies (PDCAT' 22)  2022年12月 

     詳細を見る

    開催年月日: 2022年12月

    記述言語:英語   会議種別:口頭発表(一般)  

    国名:日本国  

  • 大規模分散医用画像処理アプリケーションの実用化に向けた研究

    大島聡史

    JHPCN: 学際大規模情報基盤共同利用・共同研究拠点 第14回 シンポジウム  2022年7月 

     詳細を見る

    開催年月日: 2022年7月

    記述言語:その他  

    国名:その他  

  • 大規模分散医用画像処理に向けた医用画像処理アプリケーションの最適化

    大島聡史

    JHPCN: 学際大規模情報基盤共同利用・共同研究拠点 第14回 シンポジウム  2022年7月 

     詳細を見る

    開催年月日: 2022年7月

    記述言語:その他  

    国名:その他  

  • スーパーコンピュータ「不老」の"クラウド的な"利用の状況について

    大島聡史

    PCクラスタワークショップin 神戸2022「クラウドとHPC」  2022年5月 

     詳細を見る

    開催年月日: 2022年5月

    記述言語:その他  

    国名:その他  

  • Effectiveness of Low-/Mixed-Precision Computation on Parareal Method 国際会議

    Satoshi Ohshima

    ATAT in HPSC 2021 (2021 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing)  2021年3月 

     詳細を見る

    開催年月日: 2021年3月

    記述言語:その他  

    国名:その他  

  • RTコアによるハードウェアレイトレーシングの性能評価

    枦木慎也, 大島聡史, 片桐孝洋, 永井亨

    情報処理学会 第83回全国大会  2021年3月 

     詳細を見る

    開催年月日: 2021年3月

    記述言語:その他  

    国名:その他  

  • 高精度行列-行列積における疎行列演算実装選択の自動チューニングの検討

    青木将太, 片桐孝洋, 大島聡史, 永井亨

    情報処理学会 第83回全国大会  2021年3月 

     詳細を見る

    開催年月日: 2021年3月

    記述言語:その他  

    国名:その他  

  • 量子アニーリングマシンにおける組み合わせ最適化問題の適用可能性の調査

    大山基樹, 森下誠, 片桐孝洋, 大島聡史, 永井亨

    情報処理学会 第83回全国大会  2021年3月 

     詳細を見る

    開催年月日: 2021年3月

    記述言語:その他  

    国名:その他  

  • マルチGPU環境における機械学習ハイパーパラメータの自動チューニング(2)

    藤家空太郎, 多部田敏樹, 藤井昭宏, 田中輝雄, 加藤由花, 大島聡史, 片桐孝洋

    情報処理学会 第83回全国大会  2021年3月 

     詳細を見る

    開催年月日: 2021年3月

    記述言語:その他  

    国名:その他  

  • マルチGPU環境における機械学習ハイパーパラメータの自動チューニング(1)

    多部田敏樹, 藤家空太郎, 藤井昭宏, 田中輝雄, 加藤由花, 大島聡史, 片桐孝洋

    情報処理学会 第83回全国大会  2021年3月 

     詳細を見る

    開催年月日: 2021年3月

    記述言語:その他  

    国名:その他  

  • Adaptation of A64 Scalable Vector Extension for Spiral

    Naruya Kitai, Daisuke Takahasi, Franz Franchetti, Takahiro Katagiri, Satoshi Ohshima, Toru Nagai

    2021年3月 

     詳細を見る

    開催年月日: 2021年3月

    記述言語:英語  

    国名:その他  

  • GPUクラスタを用いて並列化した自動チューニングの機械学習プログラムへの適用と安定性の検証

    藤家空太郎, 多部田敏樹, 藤井昭宏, 田中輝雄, 加藤由花, 大島聡史, 片桐孝洋

    情報処理学会 研究報告(HPC-178)  2021年3月 

     詳細を見る

    開催年月日: 2021年3月

    記述言語:その他  

    国名:その他  

  • ジャイロ運動論シミュレーションにおける位相空間上の分布関数構造の可視化および自動類似度判定システムの開発に向けて

    北澤修太, 沼波政倫, 大谷寛明, 片桐孝洋, 大島聡史, 永井亨

    先進的描画技術を用いた可視化情報の研究会(VR2020)  2020年12月 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:その他  

    国名:その他  

  • ジャイロ運動論シミュレーションにおける位相空間上の分布関数構造の可視化と類似度判定

    北澤修太, 沼波政倫, 大谷寛明, 片桐孝洋, 大島聡史, 永井亨

    閉じ込め・輸送研究会2020  2020年12月 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:その他  

    国名:その他  

  • スーパーコンピュータ「不老」のシステム構成と性能

    大島聡史, 永井亨, 片桐孝洋

    大学ICT推進協議会 2020年度 年次大会  2020年12月 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:その他  

    国名:その他  

  • スーパーコンピュータ「不老」における光ディスクライブラリを用いたコールドストレージシステムの構築

    高橋一郎, 大島聡史, 片桐孝洋

    大学ICT推進協議会 2020年度 年次大会  2020年12月 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:その他  

    国名:その他  

  • スーパーコンピュータ「不老」のサービスとエコシステム

    田島嘉則, 山田一成, 高橋一郎, 毛利晃大, 片桐孝洋, 大島聡史, 永井亨

    大学ICT推進協議会 2020年度 年次大会  2020年12月 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:その他  

    国名:その他  

  • Large-scale numerical simulation of fluid-rigid body interactions simulation based on a stabilized ISPH method with Chebyshev basis CG solver 国際会議

    Bowen Liu, Masao Ogino, Mitsuteru Asai, Takahiro Katagiri, Satoshi Ohshima

    COMPSAFE 2020  2020年12月 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:その他  

    国名:その他  

  • LNGタンク内の異密度LNGの混合流動解析

    田村守淑, 今野雅, 大島聡史

    オープンCAE・FrontISTR合同シンポジウム2020  2020年12月 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:その他  

    国名:その他  

  • スーパーコンピュータ「不老」におけるOpenFOAMの性能評価

    大島聡史, 今野雅

    オープンCAE・FrontISTR合同シンポジウム2020  2020年12月 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:その他  

    国名:その他  

  • カスタムキャビテーションモデルを用いたNACA0015水中翼周りの数値解析

    池田拓士, 秋山善克, 今野雅, 大島聡史

    オープンCAE・FrontISTR合同シンポジウム2020  2020年12月 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:その他  

    国名:その他  

  • OpenFOAMへのカスタムキャビテーションモデルの実装

    秋山善克, 池田拓士, 今野雅, 大島聡史

    オープンCAE・FrontISTR合同シンポジウム2020  2020年12月 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:その他  

    国名:その他  

  • 「不老」の特徴的な機能とベンチマーク結果の紹介

    大島聡史

    第1回 スーパーコンピュータ「不老」 ユーザ会  2020年8月 

     詳細を見る

    開催年月日: 2020年8月

    記述言語:その他  

    国名:その他  

  • ユーザプログラム利用状況の紹介

    大島聡史

    第1回 スーパーコンピュータ「不老」 ユーザ会  2020年8月 

     詳細を見る

    開催年月日: 2020年8月

    記述言語:その他  

    国名:その他  

  • Performance evaluation of the MODYLAS application on modern multi-core and many-core environments 国際会議

    Satoshi Ohshima, Soichiro Suzuki, Tatsuya Sakashita, Masao Ogino, Takahiro Katagiri, Yoshimichi Andoh

    The Fourteenth International Workshop on Automatic Performance Tuning (iWAPT2019, IPDPS2019 Workshop)  2019年5月 

     詳細を見る

    開催年月日: 2019年5月

    記述言語:英語   会議種別:口頭発表(一般)  

    国名:ブラジル連邦共和国  

  • Trying to accelerate many small BLAS calculations on GPU 国際会議

    Satoshi Ohshima

    ATAT in HPSC (2019 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing)  2019年2月 

     詳細を見る

    開催年月日: 2019年2月

    記述言語:英語   会議種別:口頭発表(一般)  

    国名:台湾  

  • 階層型行列計算におけるソフトウェア自動チューニング

    大島聡史, 山崎市太郎, 伊田明弘, 横田理央

    第23回計算工学講演会  2018年6月 

     詳細を見る

    開催年月日: 2018年6月

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:ウインクあいち   国名:日本国  

  • Performance of Hierarchical-matrix BiCGStab Solver on GPU Clusters

    Ichitaro Yamazaki, Ahmad Abdelfattah, Akihiro Ida, Satoshi Ohshima, Stanimire Tomov, Rio Yokota, Jack Dongarra

    32nd IEEE International Parallel and Distributed Processing Symposium, IPDPS 2018  2018年8月 

     詳細を見る

    開催年月日: 2018年5月

    記述言語:英語  

    国名:カナダ  

  • Optimization of Hierarchical matrix computation on GPU 国際会議

    Satoshi Ohshima, @Ichitaro Yamazaki, @Akihiro Ida, @Rio Yokota

    SC-Asia 2018  2018年3月 

     詳細を見る

    開催年月日: 2018年3月

    記述言語:英語   会議種別:口頭発表(一般)  

    国名:シンガポール共和国  

  • スーパーコンピュータシステムITOの性能評価

    大島聡史、南里豪志、渡部善隆、天野浩文、小野謙二

    情報処理学会 第162回ハイパフォーマンスコンピューティング研究発表会  2017年12月 

     詳細を見る

    開催年月日: 2017年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:くまもと県民交流館パレア   国名:日本国  

  • 非ブロッキング集団通信の通信隠蔽効果に関する調査

    南里豪志、大島聡史、小野謙二

    情報処理学会 第162回ハイパフォーマンスコンピューティング研究発表会  2017年12月 

     詳細を見る

    開催年月日: 2017年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:くまもと県民交流館パレア   国名:日本国  

  • 通信削減CG法の性能評価@OFP

    大島聡史

    ATマイクロワークショップ@鳥羽  2017年10月 

     詳細を見る

    開催年月日: 2017年10月

    記述言語:日本語   会議種別:シンポジウム・ワークショップ パネル(公募)  

    開催地:鳥羽シーサイドホテル   国名:日本国  

  • Auto-tuning of directives: tuning directives of OpenMP and OpenACC 国際会議

    Satoshi Ohshima

    Second International Workshop on Deepening Performance Models for Automatic Tuning (DPMAT)  2017年8月 

     詳細を見る

    開催年月日: 2017年8月

    記述言語:英語   会議種別:口頭発表(一般)  

    国名:日本国  

  • GPUクラスタ上における階層型行列計算の最適化

    大島聡史, @山崎市太郎, @伊田明弘, @横田理央

    情報処理学会 第160回ハイパフォーマンスコンピューティング研究発表会  2017年7月 

     詳細を見る

    開催年月日: 2017年7月

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:秋田アトリオンビル   国名:日本国  

  • KNLを用いたFDMコードの自動チューニングとGPU適用の最新動向

    @片桐孝洋,大島聡史,@松本正晴

    2017年ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2017)  2017年6月 

     詳細を見る

    開催年月日: 2017年6月

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:神戸大学先端融合研究環統合研究拠点 コンベンションホール   国名:日本国  

  • Auto-tuning on NUMA and Many-core Environments with an FDM code 国際会議

    @Takahiro Katagiri, Satoshi Ohshima @Masaharu Matsumoto

    The Twelfth International Workshop on Automatic Performance Tuning (iWAPT2017) (In Conjunction with the IEEE IPDPS2017)  2017年6月 

     詳細を見る

    開催年月日: 2017年5月 - 2017年6月

    記述言語:英語   会議種別:シンポジウム・ワークショップ パネル(公募)  

    国名:アメリカ合衆国  

  • Auto-Tuning of Hierarchical Computations with ppOpen-AT

    Takahiro Katagiri, Masaharu Matsumoto, Satoshi Ohshima

    SIAM Conference on Parallel Processing for Scientific Computing (PP16), MS55 Auto-Tuning for the Post Moore's Era - Part I of II  2016年4月 

     詳細を見る

    開催年月日: 2016年4月

    記述言語:英語  

    国名:その他  

    Auto-Tuning of Hierarchical Computations with ppOpen-AT

  • 3.基礎物理シミュレーション研究と可視化技術の進展 3.2 可視化技術

    大谷寛明, 大谷寛明, 石黒静児, 石黒静児, 宮澤順一, 宮澤順一, 大野暢亮, 陰山聡, 三浦英昭, 森高外征雄, 森高外征雄, 田村祐一, 北澤修太, 片桐孝洋, 大島聡史, 永井亨, 沼波政倫, 沼波政倫, 名倉成輝, 川原慎太郎, HU Kunqi, 小山田耕二, 後藤拓也, 嘉無木昇, 高丸尚教, PETROSKY Tomio, 田中智

    プラズマ・核融合学会誌  2020年10月 

     詳細を見る

    記述言語:その他  

    国名:日本国  

  • 可視化技術—Visualization Technology—プロジェクトレビュー 核融合科学研究所における数値実験炉研究プロジェクト ; 基礎物理シミュレーション研究と可視化技術の進展

    大谷 寛明, 石黒 静児, 宮澤 順一, 大野 暢亮, 陰山 聡, 三浦 英昭, 森高 外征雄, 田村 祐一, 北澤 修太, 片桐 孝洋, 大島 聡史, 永井 亨, 沼波 政倫, 名倉 成輝, 川原 慎太郎, 胡 昆祁, 小山田 耕二, 後藤 拓也, 嘉無木 昇, 高丸 尚教, PETROSKY Tomio, 田中 智

    プラズマ・核融合学会誌 = Journal of plasma and fusion research / プラズマ・核融合学会編集委員会 編  2020年10月 

     詳細を見る

    記述言語:日本語  

    国名:日本国  

  • マルチGPU環境における機械学習ハイパーパラメータの自動チューニング(1)

    多部田, 敏樹, 藤家, 空太郎, 藤井, 昭宏, 田中, 輝雄, 加藤, 由花, 大島, 聡史, 片桐, 孝洋

    第83回全国大会講演論文集  2021年3月 

     詳細を見る

    記述言語:日本語  

    国名:日本国  

    我々は複数のパラメータを同時に推定する手法として,パラメータ空間における反復一次元探索を提案している.この手法はパラメータの組み合わせを自動的に選択し,その実行性能を実測,さらに別の組み合わせの選択を繰り返すことで探索を行う.この提案手法を機械学習プログラムに適用する.機械学習には複数のハイパーパラメータが存在し,適切なハイパーパラメータの組み合わせを推定するには時間がかかる.本研究は歩行者経路予測アプリケーションに用いる機械学習のハイパーパラメータについて適切な組み合わせを推定し,マルチGPU環境を利用して実測処理を並列化することで,約15日かかる推定が約12時間で完了することを示す.

  • マルチGPU環境における機械学習ハイパーパラメータの自動チューニング(2)

    藤家, 空太郎, 多部田, 敏樹, 藤井, 昭宏, 田中, 輝雄, 加藤, 由花, 大島, 聡史, 片桐, 孝洋

    第83回全国大会講演論文集  2021年3月 

     詳細を見る

    記述言語:日本語  

    国名:日本国  

    我々は反復一次元探索を用いた自動チューニングの研究に取り組んでおり,マルチGPU環境を用いた機械学習のプログラムのハイパーパラメータの最適化を進めている.機械学習は同一のハイパーパラメータを用いても毎回教師データが変わるなど同一の結果にならないため,自動チューニングの結果にブレが生じる.このブレに対して,これまで,我々は推定したパラメータに対して追加測定を行い自動チューニングの安定性を高める手法を提案してきた.本研究では,歩行者経路予測アプリケーションに用いる機械学習プログラムに適用しマルチGPU環境で推定したハイパーパラメータの値を並列化し複数回まとめて追加測定することによる,自動チューニングの精度向上について示す.

  • 高精度行列-行列積アルゴリズムにおけるbatched BLASの適用

    石黒 史也, 片桐 孝洋, 大島 聡史, 永井 亨, 荻野 正雄

    第80回全国大会講演論文集  2018年3月 

     詳細を見る

    記述言語:日本語  

    国名:その他  

    行列-行列積に代表される基本線形計算を集約したライブラリBLAS (Basic Linear Algebra Subprograms) は、多くの数値計算で必須の処理である。しかし、従来の数値計算ライブラリは、演算速度の向上は考慮しているが演算精度の向上に関する考慮が不十分である。一方、尾崎が提案した高精度行列-行列演算アルゴリズム(以降、尾崎の方法)は、利用している浮動小数点演算型の精度限界まで高精度演算ができる。本研究では尾崎の方法の実装に対して、複数の小さな行列-行列積を高速に行うことができるBatched BLASを適用した実装方式を提案する。性能評価では、Batched BLASの有効性を検証し、CPU環境だけでなくGPU環境についても提案する実装方式の有効性を検証する。

  • パネルディスカッション「スーパーコンピュータの産業利用と今後の産学共創のあり方」(パネリスト)

    大島聡史

     詳細を見る

    記述言語:その他  

    国名:その他  

  • GPUが支えるDX 変革の今、この先を考える- GPUスパコンとOpenACC ー(パネリスト)

    大島聡史

     詳細を見る

    記述言語:その他  

    国名:その他  

  • SIAM AN10(Conference Reports)

    2010年12月 

     詳細を見る

    記述言語:日本語  

    国名:日本国  

    SIAM AN10(Conference Reports)

  • 未踏ユースから育ったタレントたち【PART 1 若い未踏クリエータからのメッセージ】:13.発掘し,育成し,つなぐ場所

    大島 聡史

    情報処理  2011年11月 

     詳細を見る

    記述言語:日本語  

    国名:日本国  

▼全件表示

MISC

  • 【HPCによる大規模医用画像処理】GPUスパコンを用いたPETの四次元再構成

    大島 聡史, 湯淺 義尚, 松村 海飛, 横田 達也, 本谷 秀堅, 坂田 宗之, 木村 裕一, 片桐 孝洋, 永井 亨, 塙 敏博, 星野 哲也

    MEDICAL IMAGING TECHNOLOGY   41 ( 4-5 )   150 - 155   2023年11月   ISSN:0288-450X

     詳細を見る

    記述言語:日本語   出版者・発行元:(一社)日本医用画像工学会  

    医用画像処理技術の発達により,生体の内部を視覚的に理解するためのさまざまな技術が開発され,利用されている.しかし,それらにより直接的に得ることができるのは画像や映像であり,診断は医師など人の手によって行われている.これらの労力を軽減するソフトウェアへの期待は大きく,すでに医療の現場で利用されている技術も増えてきているが,医療(医用画像)と計算機技術の両方の知識と技術が必要なため,対象は限られている.そこで本研究では,医用画像処理分野と高性能計算分野の研究者が協力してPETにおける画像再構成の高速化と大規模化に取り組んでいる.本稿ではその取り組みの内容とこれまでに得られた成果を紹介する.(著者抄録)

所属学協会

  • 情報処理学会 プログラミング研究会

  • 自動チューニング研究会

  • 日本応用数理学会 「行列・固有値問題の解法とその応用」研究部会

  • Society for Industrial and Applied Mathematics

  • Association for Computing Machinery

  • オープンCAE学会

  • 情報処理学会 ハイパフォーマンスコンピューティング研究会

  • 情報処理学会 ゲーム情報学研究会

▼全件表示

委員歴

  • 自動チューニング研究会   主査   国内

    2023年6月 - 2027年6月   

  • (元)情報処理学会 HPC研究会   運営委員   国内

    2016年4月 - 2020年3月   

  • (元)自動チューニング研究会   幹事   国内

    2016年4月 - 2020年3月   

  • (元)日本応用数理学会 若手の会   運営委員   国内

    2015年4月 - 2019年3月   

  • 日本応用数理学会 「行列・固有値問題の解法とその応用」研究部会   運営委員   国内

    2013年4月 - 現在   

  • オープンCAE学会   理事   国内

    2011年4月 - 現在   

▼全件表示

学術貢献活動

  • PC委員

    ( 徳島 ) 2024年8月

     詳細を見る

    種別:大会・シンポジウム等 

  • Finance Chair 国際学術貢献

    ICS 2024: International Conference on Supercomputing  ( Kyoto Japan ) 2024年6月

     詳細を見る

    種別:大会・シンポジウム等 

  • Steering Committee 国際学術貢献

    International Workshop on Automatic Performance Tuning (iWAPT) 2024  ( San Francisco UnitedStatesofAmerica ) 2024年5月

     詳細を見る

    種別:大会・シンポジウム等 

  • Proceedings Chair 国際学術貢献

    The International Conference on High Performance Computing in Asia-Pacific Region (HPC Asia 2024)  ( Nagoya Japan ) 2024年1月

     詳細を見る

    種別:大会・シンポジウム等 

  • PC委員

    ( 函館 ) 2023年8月

     詳細を見る

    種別:大会・シンポジウム等 

  • Program Chair 国際学術貢献

    International Workshop on Automatic Performance Tuning (iWAPT) 2023  ( St. Petersburg, Florida UnitedStatesofAmerica ) 2023年5月

     詳細を見る

    種別:大会・シンポジウム等 

  • 幹事

    第64回 プログラミング・シンポジウム  ( 修善寺、オンライン ) 2023年1月

     詳細を見る

    種別:大会・シンポジウム等 

  • PC委員

    ( 下関 ) 2022年8月

     詳細を見る

    種別:大会・シンポジウム等 

  • Program Vice-chair 国際学術貢献

    International Workshop on Automatic Performance Tuning (iWAPT) 2022  2022年6月

     詳細を見る

    種別:大会・シンポジウム等 

  • PC委員

    ( 一橋講堂(東京) ) 2018年5月

     詳細を見る

    種別:大会・シンポジウム等 

  • PC委員 国際学術貢献

    ( Aomori Prefecture Tourist Center(青森市) ) 2017年11月

     詳細を見る

    種別:大会・シンポジウム等 

  • 実行委員

    ( 秋田アトリオンビル(秋田市) ) 2017年7月

     詳細を見る

    種別:大会・シンポジウム等 

  • PC委員

    ( 神戸大学(神戸市) ) 2017年6月

     詳細を見る

    種別:大会・シンポジウム等 

  • PC委員

    ( 虎ノ門ヒルズ(東京) ) 2017年4月

     詳細を見る

    種別:大会・シンポジウム等 

  • 学術論文等の審査

    役割:査読

    2017年

     詳細を見る

    種別:査読等 

    外国語雑誌 査読論文数:0

    日本語雑誌 査読論文数:1

    国際会議録 査読論文数:11

    国内会議録 査読論文数:3

▼全件表示

共同研究・競争的資金等の研究課題

  • 低ランク構造行列法の適用範囲拡大と多様な計算アーキテクチャの活用

    研究課題/領域番号:24K02949  2024年4月 - 2027年3月

    科学研究費助成事業  基盤研究(B)

    伊田 明弘, 横田 理央, 塙 敏博, 岩下 武史, 大島 聡史, 星野 哲也, 平石 拓, 河合 直聡

      詳細を見る

    資金種別:科研費

    本研究では、低ランク構造行列法ライブラリの高機能化を実施する。科学技術計算では、密行列演算に基づく計算手法の数値線形代数ライブラリが広く利用されいる。密行列演算から低ランク構造行列演算へ置き換えが行えるように、低ランク構造行列法の適用範囲を拡大する。低ランク構造行列に基づく新たな数値計算アルゴリズムを開発する。アルゴリズム開発は、GPU・FPGAなど最新の計算機アーキテクチャで構成されるクラスタ計算機を意識し、実装の最適化を行う。様々な低ランク構造行列の演算に対し、最適な計算機アーキテクチャを割当て、混合精度演算・動的負荷分散なども活用し、計算機の性能を最大限に引き出す実装法を研究する。

    CiNii Research

  • JHPCN2022:大規模分散医用画像処理アプリケーションの実用化に向けた研究

    2022年4月 - 2023年3月

      詳細を見る

    担当区分:研究代表者 

    JHPCN jh220011

  • JHPCN2022:管楽器および音響機器の大規模流体音響解析 管楽器および音響機器の大規模流体音響解析

    2022年4月 - 2023年3月

      詳細を見る

    担当区分:研究分担者 

    JHPCN jh220001

  • JHPCN2022:多粒子分散系の乱流輸送に関する大規模シミュレーション

    2022年4月 - 2023年3月

      詳細を見る

    担当区分:研究分担者 

    JHPCN jh220003

  • JHPCN2022:Hierarchical low-rank approximation methods on distributed memory and GPUs

    2022年4月 - 2023年3月

      詳細を見る

    担当区分:研究分担者 

    JHPCN jh220009

  • JHPCN2022:FMOプログラムABINIT-MPの高速化と超大規模系への対応

    2022年4月 - 2023年3月

      詳細を見る

    担当区分:研究分担者 

    JHPCN jh220010

  • JHPCN2022:高性能かつ高信頼な数値計算手法とその応用

    2022年4月 - 2023年3月

      詳細を見る

    担当区分:研究分担者 

    JHPCN jh220022

  • JHPCN2022:三次元強震動シミュレーションとリアルタイムデータ同化の融合

    2022年4月 - 2023年3月

      詳細を見る

    担当区分:研究分担者 

    JHPCN jh220029

  • JHPCN2022:機械学習ソフトウェアへのソフトウェア自動チューニング技術の適用

    2022年4月 - 2023年3月

      詳細を見る

    担当区分:研究分担者 

    JHPCN jh220044

  • JHPCN2022:HPCと高速通信技術の融合による大規模データの拠点間転送技術開発と実データを用いたシステム実証試験

    2022年4月 - 2023年3月

      詳細を見る

    担当区分:研究分担者 

    JHPCN jh220048

  • JHPCN2022:Innovative Multigrid Methods II

    2022年4月 - 2023年3月

      詳細を見る

    担当区分:研究分担者 

    JHPCN jh220049

  • HPCI2022:新規感染症のための計算科学的解析環境の整備

    2022年4月 - 2023年3月

      詳細を見る

    担当区分:研究分担者 

    hp220025

  • 科研2021-:格子H行列に基づく数値線形代数の構築と最新アーキテクチャへの高性能実装法

    2021年4月 - 2024年3月

      詳細を見る

    担当区分:研究分担者 

    科研基盤B

  • 科研2021-:レイトレーシング加速機構を備える画像処理ハードウェアを用いた高性能計算科学の創成

    2021年4月 - 2024年3月

      詳細を見る

    担当区分:研究代表者 

    科研萌芽

  • レイトレーシング加速機構を備える画像処理ハードウェアを用いた高性能計算科学の創成

    2021年 - 2023年

    日本学術振興会  科学研究費助成事業  挑戦的研究(萌芽)

      詳細を見る

    担当区分:研究代表者  資金種別:科研費

  • 格子H行列に基づく数値線形代数の構築と最新アーキテクチャへの高性能実装法

    2021年 - 2023年

    日本学術振興会  科学研究費助成事業  基盤研究(B)

      詳細を見る

    担当区分:研究分担者  資金種別:科研費

  • 科研2020-:超巨大ニューラルネットの継続学習への型破りな線形代数技術の適用

    2020年4月 - 2023年3月

      詳細を見る

    担当区分:研究分担者 

    科研開拓

  • 超巨大ニューラルネットの継続学習への型破りな線形代数技術の適用

    2020年 - 2022年

    日本学術振興会  科学研究費助成事業  挑戦的研究(開拓)

      詳細を見る

    担当区分:研究分担者  資金種別:科研費

  • 科研2018-:機械学習向けハードウェアとの親和性が高い連立一次方程式の解法の開発とその高性能超並列実装

    2018年4月 - 2021年3月

      詳細を見る

    担当区分:研究分担者 

    科研基盤研究(B)

  • 機械学習向けハードウェアとの親和性が高い連立一次方程式の解法

    研究課題/領域番号:18H03248  2018年 - 2020年

    日本学術振興会  科学研究費助成事業  基盤研究(B)

      詳細を見る

    担当区分:研究分担者  資金種別:科研費

  • ディープラーニングを利用した革新的自動チューニング基盤の創製

    研究課題/領域番号:18K19782  2018年 - 2020年

    日本学術振興会  科学研究費助成事業  挑戦的研究(萌芽)

      詳細を見る

    担当区分:研究分担者  資金種別:科研費

  • 科研2017-:H行列法ライブラリの機能拡張と次世代スパコン向け最適化

    2017年4月 - 2020年3月

      詳細を見る

    担当区分:研究分担者 

    科研基盤研究(B)

  • 科研2017-:逐次問題の並列計算の数理とフレームワーク研究開発・実証 国際共著

    2017年4月 - 2019年3月

      詳細を見る

    担当区分:研究分担者 

    科研基盤研究(B)

  • 逐次問題の並列計算の数理とフレームワーク研究開発・実証

    2017年 - 2019年

    日本学術振興会  科学研究費助成事業  基盤研究(B)

      詳細を見る

    担当区分:研究分担者  資金種別:科研費

  • H行列法ライブラリの機能拡張と次世代スパコン向け最適化

    研究課題/領域番号:17H01749  2017年 - 2019年

    日本学術振興会  科学研究費助成事業  基盤研究(B)

      詳細を見る

    担当区分:研究分担者  資金種別:科研費

  • 科研2016-:通信回避・削減アルゴリズムのための自動チューニング技術の新展開

    2016年4月 - 2019年3月

      詳細を見る

    担当区分:連携研究者 

    科研基盤研究(B)

  • 国際交流による自動チューニングのための性能モデルの深化 国際共著

    2016年4月 - 2018年3月

      詳細を見る

    日本-台湾の2国間による国際共同研究プロジェクト

  • JHPCN2016-:Hierarchical low-rank approximation methods on distributed memory and GPUs 国際共著

    2016年4月

      詳細を見る

    JHPCN国際共同研究

  • 通信回避・削減アルゴリズムのための自動チューニング技術の新展開

    研究課題/領域番号:16H02823  2016年 - 2018年

    日本学術振興会  科学研究費助成事業  基盤研究(B)

      詳細を見る

    担当区分:連携研究者  資金種別:科研費

  • JHPCN2015:分子動力学計算ソフトウェアMODYLASのメニーコアアーキテクチャ対応並列化に関する研究

    2015年4月 - 2016年3月

      詳細を見る

    JHPCN jh150015

▼全件表示

他大学・他機関等の客員・兼任・非常勤講師等

  • 2023年  名古屋大学 情報基盤センター  区分:客員教員  国内外の区分:国内 

    学期、曜日時限または期間:2023年4月 - 2024年3月

  • 2022年  名古屋大学 情報学部  区分:非常勤講師  国内外の区分:国内 

    学期、曜日時限または期間:秋II期、プログラミング2(週2コマ)

  • 2022年  名古屋大学 情報基盤センター  区分:客員教員  国内外の区分:国内 

    学期、曜日時限または期間:2022年10月 - 2023年3月

社会貢献・国際連携活動概要

  • 経済産業省「AKATSUKIプロジェクト」採択事業である「福岡未踏的人材発掘・育成コンソーシアム」にリードPMと参加し、若手人材の発掘・育成事業に関わった。(2023年6月~2024年1月)

政策形成、学術振興等への寄与活動

  • 2018年1月 - 2020年1月   文部科学省

    文部科学省研究振興局 HPCI計画推進委員会将来のHPCIの在り方に関する検討ワーキンググループ委員

学内運営に関わる各種委員・役職等

  • 2022年10月 - 現在   センター HPC事業室

  • その他 准教授