核融合科学研究所は6月14日、大型ヘリカル装置(LHD)の25年分の実験データ約2ペタバイト(約4000万件)を、Amazon Web Services(AWS)上でオープンデータとして公開したと発表した。世界的にも初の試みで、核融合エネルギー研究のオープンサイエンス化推進につなげたい考えだ。
核融合科学研究所は、超高温プラズマ実験装置であるLHDを使って、核融合エネルギー実現に向けた研究を行っている。LHD実験では、膨大な量の計測・解析データが生成されており、これらのデータ資産はこれまで国内外の共同研究者から積極的に活用されてきた。しかし、データ量が膨大であること、データサイズが大きいことなどから、共同研究以外の目的ではほとんど利用されてこなかった。
そこで核融合科学研究所は、「巨大な実験データの全ぼうを網羅的かつ俯瞰的に見通せること」「データ解析環境が簡単に準備できて、すぐに解析が始められ、また必要に応じて計算処理性能を加減できること」という二つの要件を満たす仕組みを整備し、LHD実験データのオープンデータ化を進めることにした。
オープンデータ化にあたっては、研究者や産業界、一般の利用者がデータを容易かつ効率的に活用できるコンピュータ環境を整備するために、クラウドサービスの活用を前提とした。AWSの「オープンデータスポンサーシッププログラム」を利用し、膨大なLHD実験データをAWSのオブジェクトストレージサービス「Amazon S3」上に完全複製し、AWSのアカウントなしで誰でもインターネット上から自由にアクセスできるようにした。また、AWS上でデータ解析プログラム群を動かすことも可能で、「S3上に複製されたLHD実験データに直接アクセスして、いつでもユーザーがオンデマンドで高速に大規模解析できるようになった」という。
核融合科学研究所はAWSを採用理由として、Amazon S3のスケーラビリティと耐久性の高さを挙げている。また、AWS上で解析を行うことでデータ転送の手間を削減し、核融合科学研究所のシステムと切り離したかたちで多くのユーザーが迅速にデータを解析できる環境を提供できる点も評価した。
今後、核融合科学研究所はAWS上でデータ解析を行うためのワークショップなどを実施する予定。また、LHD実験データにデジタル永続性識別子DOI(Digital Object Identifier)を付与し、データの検索・引用を容易にする計画だ。
ニュースリリースURL
https://www.nifs.ac.jp/news/collabo/240614.html
https://aws.amazon.com/jp/blogs/news/25years-huge-fusion-experiment-data-fully-open-on-s3-via-odp-2024/