Usage


Fujitsu AutoMLの利用手順

Fujitsu AutoMLでは、サンプルデータセットを利用して手軽にお試しするチュートリアルモードと、お手持ちのCSVをアップロードして試す本番モードの2種類を用意しています。 事前に利用規約をご覧になり、同意いただけた後に上記のいずれかをクリックするとご利用いただけます。クリックした時点で利用規約に同意いただいたものとします。

チュートリアルモード 本番モード

ここでは、チュートリアルモードで進めた場合の利用手順について紹介します。

フロー(目次)

  1. データセット、機械学習の要件を指定する
  2. コード生成を実行する
  3. 結果を詳しく見る
  4. 生成コードで構築したモデルで予測を実行する

1.データセット、機械学習の要件を指定する

データセットの指定方法として、サンプルデータセットを利用して手軽にお試しするチュートリアルモード(このまま「確定」ボタンを押してください)と、お手持ちのCSVをアップロードして試す本番モードの2種類があります。 データセットのアップロードを終えると、学習データのプレビューと機械学習の要件の設定項目が表示されます。

本番モードを試したい場合は左側の「アプリへ進む」ボタンをクリックして下さい

ここにはALT属性を記述します。

ここにはALT属性を記述します。

機械学習の要件の各項目の説明は以下の通りです。

目的変数
(必須項目) 機械学習タスクで予測させたいカラム名を選択します。

タスクの種類
(必須項目) 機械学習タスクの種類として classification (分類)、 regression (回帰)のいずれかを選択します。目的変数を選択した後であれば、Fujitsu AutoMLが目的変数の中身を解析して自動選択されます。

学習に利用しないカラム
機械学習モデルの学習時に無視させたいカラム名を選択します。

評価指標
機械学習モデルの評価するための評価指標を選択します。選択可能な評価指標は以下の通りです。

  • classification → F1, AUC, Accuracy, Gini, LogLoss, ROC_AUC, MCC
  • regression → R2, RMSLE, RMSE, MAE

タイムアウト
Fujitsu AutoMLにより生成した機械学習プログラムを実際に実行して構築されるモデルの評価を行う際の、1回のコード実行に対するタイムアウトを指定します。

ランダムシード
乱数生成用のランダムシードを指定します。

データ分割時の学習データの割合
Fujitsu AutoMLでは指定されたデータセットを内部で学習データ、テストデータに分割しますが、その際の学習データの割合を指定します。

ハイパーパラメータ探索
「有効にする」をチェックすることで、モデルのハイパーパラメータ探索を行うコードを生成コードに含めます。その際の「試行回数」と「ランダムシード」も指定します。

データの説明
Exprolatory Data Analysis (EDA)等のコードを生成コードに含めます。

「Permutation Feature Importanceを計算する」については、データセットのカラム数が100を超えると膨大な時間を要するようになるため、チェックしていても計算がスキップされる点にご注意ください。

2.コード生成を実行する

データセット、機械学習の要件を指定した後、「コード生成を開始」をクリックして開始します。 データセットの大きさ、パラメータの内容によりに実行にかかる時間は大きく変わります。 コード生成結果では、選択された前処理とその順序、機械学習モデルの候補上位3つと検証時のスコアを確認することができます。 Fujitsu AutoMLでは、検証時のスコアの最も良かったモデルを選択し、それに合わせた生成コードを出力します。 最良スコアの生成コードの真下に「生成コードをダウンロードする」ボタンがあります。これをクリックすると、表示されたコード以外にEDAを含めたJupyter Notebook (.ipynb)形式のノートブックや、モデル学習、予測用のコード等を含めたzipファイルをダウンロードすることができます。

注意:EDAが含まれているのは.ipynb形式の方のみです。

ここにはALT属性を記述します。

3.結果を詳しく見る

コード生成結果の下では、モデルに対する特徴量の重要度や目的変数と特徴量の関係を可視化しています。

ここにはALT属性を記述します。

ここにはALT属性を記述します。

4.生成コードで構築したモデルで予測を実行する

最後に、生成されたコードで構築したモデルを用いて予測を実行することができます。 予測するデータを学習データと同様にアップロードします。サンプルデータセットを用いた場合は「確定」をクリックしてください。 予測するデータのプレビューの下の「予測」ボタンをクリックすると予測の実行が始まり、予測結果とメトリクスを見ることができます。

ここにはALT属性を記述します。

ここにはALT属性を記述します。

ここにはALT属性を記述します。

Fujitsu AutoMLはお客様の環境でのトライアルも実施可能となります。お客様業務適用のユースケースや要件を検討することも可能です。お手数ですが、詳細についてはお問い合わせください。

Fujitsu AutoMLはこちらから