
はじめに
本データ分析チャレンジコンテストは、日本の製造業におけるPHM(Prognostics and Health Management)の取組拡大、活性化を目的として実施するものです。日本の製造業にお勤めのデータサイエンティストの方々に応募を頂くことを想定しています。ぜひ奮ってご参加頂きますようお待ちしております。皆さんで「ものづくり日本」におけるデータ活用の取組みを盛り上げていきましょう!
コンテスト概要
分析課題 | 航空機エンジンの残寿命予測 |
---|---|
使用データ | 訓練用データ(エンジンの使用開始~リタイアに至るまでの稼働データ) 検証用データ(フィールドで稼働中のエンジンのデータ、余命あり) |
サブミット | テンプレートファイルに従って予測結果をサブミット頂きます。 サブミットは1日につき1回までとします。 ※土日祝日にサブミットした場合、ランキング結果反映は翌営業日以降になります。 ※サブミットは1日1ファイル提出となります。提出されなかった日の分を、別の日分としてまとめてご提出することはご遠慮ください。 |
その他提出物 | 入賞者2名は予測モデルをご提出頂きます。 (確認目的であり、著作権は作者に留保されます。) |
評価基準 | 精度 |
使用ツール | Python、R、Matlab(※)のいずれかとします。 ※希望者にはMathworks社のご協力によりMatlabおよび関連ツールキットの評価版をご利用頂くことが出来ます。以下URLよりお申し込み下さい。 https://jp.mathworks.com/campaigns/products/trials/targeted/pdm.html |
スケジュール | 応募受付終了は5月10日(金)、5月下旬入賞者確定、 6月6日(木)表彰式(PHM Conference in JAPAN 2019内にて) |
表彰 | 上位2名を表彰し、正賞品として2019年9月に米国アリゾナ州スコッツデールで開催されるPHMイベントに招待(※)いたします。 (http://www.phmsociety.org/events/conference/phm/19) また、副賞品として、1位10万円分相当 2位5万円分相当のギフト券を進呈します。 |
※招待:PHM Societyが主催する「annual conference of the prognostics and health management society 2019」(http://www.phmsociety.org/events/conference/phm/19)への参加を招待します。招待とは、往復の東京発着国際線チケット、現地交通宿泊費、PHMイベント参加費を本チャレンジコンテスト主催者にて負担することを意味します。(本権利の他人への譲渡は出来ません)
参加資格とエントリー方法
今回の趣旨に鑑み、本チャレンジコンテストの参加資格は、「ご参加者の所属勤務先が日本の製造業であること」と致します。(申込時に勤務先の確認をさせて頂きますが、それ以外で会社名が公表されることはありません。また、勤務先業務として応募するのか、資格を有する個人として応募するかは事務局としては問いません)
参加資格を有しない、非製造業にお勤めの方や個人事業主の方、学生その他の方々は、今回はご参加を頂けませんのでご理解の程お願い申し上げます。お申し込みの方の勤務先が「製造業」に該当するか否かは事務局にて判断をさせて頂きます。お申し込み後、「製造業」に該当しないと事務局が判断する場合は、お断りする場合がありますので予めご了承下さい。
エントリーにあたっては、ルールをご確認頂き、ご同意頂ける方のみ申込み可能です。(お申込み頂いた方はご同意頂いたものと見なします)
参加申込書(ダウンロードはこちら)にご記入の上、以下の受付アドレスへお送り下さい。折り返し、ご勤務先アドレス宛にデータダウンロードのご案内をお送り致します。(参加資格の確認のため)
エントリー受付アドレス:g-ex-phmc2019-datachallenge@group.isid.co.jp
参加申込書ダウンロードなお、チームでの応募も認めますが、表彰賞品はエントリー時に記載された代表者へ与えられるものとし、権利の譲渡は認められません。
分析テーマ
航空機エンジンの残寿命予測を今回の分析テーマと致します。
航空機運用サービス会社は、航空機エンジンのフリートからデータ収集とモニタリングを行っており、膨大な量の履歴データを持っています。データの中には、エンジンが寿命に到達するまでのデータも含まれています。航空機運用サービス会社はエンジンの健全性を評価し、エンジンが寿命に達するまでに、あとどれだけフライトができるかを自動的に予測するアルゴリズムを開発したいと考えています。ここで記載しているエンジンの寿命とは、エンジンの完全な故障ではなく、性能が許容出来なくなるレベルの劣化を意味しています。
現在、航空機運用サービス会社は260機の航空機エンジンからの履歴データを蓄積していますが、フィールドでは100機のエンジンからデータを収集しています。データの種類としては、飛行中のエンジンの圧力・スプール速度・温度などのパラメータで、ある時間でのスナップショットのデータです。フライト中は、飛行高度・巡航速度・出力設定などを基に6つの異なる飛行状態(離陸中・巡航中・着陸中など)に分割出来ますが、データは飛行状態別に収集されます。航空機運用サービス会社のこれまでの経験と履歴データから、高圧コンプレッサの性能劣化が航空機エンジンのリタイアの要因となっている事が分かっています。したがって、高圧圧縮機(HPC)に関連するエンジンの健全性を監視することに着目して、劣化の状態から現在監視しているエンジンの残寿命を予測します。
課題
航空機エンジン用の健全性監視及び残寿命予測アルゴリズムを開発して下さい。260機以上のエンジンからの履歴データを提供します。その履歴データを利用して、現在監視している100機の航空機エンジンの健全性を評価し、残りのフライト数を正確に予測するモデルを作成してください。
データについての説明
航空機エンジンを監視するために、25個の列にデータがあります。25種類のセンサー一覧がヘッダー部分に記載されており、様々な圧力・温度・回転速度・エンジンの設定で構成されています。データファイルの各行は1フライトを表し、ある飛行状態(離陸中・巡航中・着陸中など)でのセンサー測定値のスナップショットデータが記録されています。スナップショットデータは6つの飛行状態のいずれかで取得され、各エンジンのフライト毎にラベル付けがされています。「訓練用データセット」(後述4.データセット a)に詳細記載)では、エンジンは始動から最初の時期は正常に稼動し、寿命を迎えるまで、時間の経過とともに劣化します。監視するエンジン(「検証用データセット」後述4.データセット b)に詳細記載)は、時間の経過と共にある程度の劣化がありますが、リタイヤする迄にまだ寿命が残っています。
提供されるデータセット
以下の2つのデータセットを提供します。
※データ出所:A. Saxena and K. Goebel (2008). “Turbofan Engine Degradation Simulation Data Set”(https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/), NASA Ames Prognostics Data Repository , NASA Ames Research Center, Moffett Field, CA.
a)訓練用データセット
合計260のデータファイルが提供されています。各ファイルにはエンジンの始動からリタイアまでの生涯時間でのデータが含まれています。データは25列あり、各行はあるフライトに対応しています。データはフライトごとに、6つの飛行状態(離陸中・巡航中・着陸中など)のうち1つの状態で収集されています。変数の1に飛行状態を示すラベル(列C:Flight Regime)が含まれています。ヘッダー部には、25個の列に対応する名前が含まれています。いくつかのエンジンは他のエンジンよりも寿命が異なる為、行(フライト)の数はエンジンごとに異なります。
b)検証用データセット
検証用データファイルも同じように構成されています。但し、各エンジンにはある程度の劣化はありますが、エンジンがリタイアするまでまだ寿命が残っています。今回の目的は、エンジン毎にどれだけの余命(フライト数)を残しているかを予測することです。検証用のテストデータセットには100個のデータファイルがあるので、100個すべてのエンジンの残寿命予測をして下さい。
精度評価基準
実際の残フライトと予測した残フライトとの差を誤差とし、その平均絶対誤差により精度を評価します。
(下記参照)

この式では、MAE(平均絶対誤差)は各フライトの実際のRUL(Remaining Useful Life:残寿命)値(RULactual)と予測RUL値(RULpredicted)との絶対差を考慮しており、テストデータには合計N個のフライトがあります。(N=100)
分析結果のサブミット
参加者は、事務局より提供されるテンプレートを使用して結果を指定の宛先へ送信して頂きます。(テンプレートは単なる残寿命値の一例です。残寿命が100機すべてのエンジンで同じになる事はありません。)サブミットは1日につき1度まで認められます。事務局ではサブミットを受けた後にスコア算出を致しますが、テンプレートに従った入力内容になっていないと、スコア算出時にエラーで弾かれます。この場合は事務局より連絡をいたしますので再度ご提出頂くことが可能です。
送信するテンプレートのファイル名は「AccountID_dd_mm_yyyy.csv」の形式として提出して下さい。
コンテスト結果について
スコアは無作為に選択された検証用のエンジン(30%)による結果で算出され、スコアに基づくランキングに掲載されます。ランキングは適宜更新され、アップデートされます。サブミット後にスコアのフィードバッグを都度メールにて返信します。(スコア自動算出・自動メール返信ではありませんので、スコアフィードバックにはお時間をいただく場合もございます。)ランキング掲載のスコアは、全サブミットの中で最良のスコアを掲載します。
ランキング締め切り後に、最後に提出されたサブミットに基づき100すべてのエンジンでの結果でスコアを算出し、最終ランキングとして公表いたします。
ルール
参加規約
1.
参加者は「日本の製造業に所属勤務する者」とし、勤務先のメールアドレスを含む名刺情報を事務局へ開示するものとします。
2.
入賞者は2019年6月6日に東京・品川で開催される表彰式に参加するものとします。(遠隔地の方の交通費は事務局で負担を検討します)
3.
入賞者は開発したモデルのソースコードを事務局へ提出するものとします。
また、提出したソースコードから事務局が分析アプローチを読み説き、それに関するコメントを表彰式で事務局より講評することについて同意するものとします。
4.
入賞者は賞品の権利を他人へ譲渡することは出来ません。
モデルの権利等
1.
入賞者が提出するモデルの著作権は参加者に留保されますが、事務局が本コンテストを遂行するのに必要な利用については許諾されるものとし、当該利用に対し、参加者は著作者人格権に基づくものを含め、何ら異議申し立てや対価の請求等を行わないものとします。
2.
事務局は、本コンテスト遂行のために提出されたモデルを使用するものとし、表彰式終了後破棄いたします。
3.
参加者は、開発したモデルが自らのオリジナルであり、第三者の著作権等の知的財産権その他の権利を侵害するものではなく、また公序良俗に反するものではないことを保証するものとします。
モデル作成方法
1.
予測モデルの作成にあたって、使用するツールは、Python、R、Matlabのいずれかに限定されるものとします。
情報の取扱に関して
1.
参加者は事務局より提供された情報について、本コンテストに関する利用以外の用途には使用しないものとします。
2.
本コンテストの参加者同士での予測に関する情報のやり取りは認められません。
3.
参加者は事務局より提供されるデータ以外のデータを用いてモデルを学習することは出来ません。
個人情報の取り扱い
1.
参加者は、本チャレンジコンテストへの参加申し込み及び参加にあたって事務局に提供した個人情報が、以下の目的のために、事務局及び事務局の指定する第三者により、処理、保存、及び使用されることに同意するものとします。
(1)本チャレンジコンテストの開催、運営及びこれに関連する事項のため
(2)事務局または協力者からの案内情報の提供や各種アンケート送付のため
2.
事務局の個人情報の取り扱い方針は、以下のURLを参照してください。
https://www.isid.co.jp/policy.html
スケジュール
2019年3月19日(火):コンテスト告知、募集開始
2019年5月10日(金):コンテスト応募受付終了
2019年5月15日(水):最終順位の確定
2019年5月17日(金):入賞者2名のモデル提出
2019年6月6日(木):表彰式※
※同日に東京コンファレンスセンター・品川にて開催される「PHMConference in JAPAN 2019」内にて表彰式開催
主催者/事務局
株式会社電通国際情報サービス
ビジネスイノベーション本部 DXマーケティング部内
PHMC2019データチャレンジコンテスト事務局(森賀、長谷川、荻野)
E-mail: g-ex-phmc2019-datachallenge@group.isid.co.jp
TEL: 03-6713-6134
分析ツール協力
運営協力会社
Predictronics Corp.(https://predictronics.com/)
所在:米国オハイオ州
代表者:Edzel Lapira, President, CEO
株式会社博展(https://www.hakuten.co.jp/index.html)
所在:東京都中央区築地
代表者:田口徳久