第1章 データモデルの開発の概要

このセクションでは、Red Hat OpenShift Data Science を使用して作成された予測モデルを使用するアプリケーションの、開発およびデプロイに必要な作業を説明します。

組織では、このプロセスの担当をデータサイエンティストやアプリケーション開発者などの複数のロールに分割したり、この作業を 1 つのロールで行ったりする場合があります。各ステップに適切なロールについて記載しています。

表1.1 ロール別の開発タスク

アプリケーション開発者データサイエンティストタスクの説明

 

OpenShift Data Science アプリケーションテンプレートを使用して、Python S2I プロジェクトを Git に作成します。

 

データサイエンティストが、リポジトリーへのプッシュやリポジトリーからのプルを実行できるように、Git プロジェクトへのユーザーアクセスを設定 します。

この時点で、モデルとそのモデルを使用するアプリケーションを同時に開発できます。

 

プロジェクトリポジトリーを使用して OpenShift アプリケーションを作成 します。

 

OpenShift アプリケーションをビルド してコードを検証します。

 

Webhook を使用してビルドプロセスを自動化 します。

 

Jupyter を起動 し、ノートブックを 作成 または インポート します。

 

アプリケーションの Git プロジェクトを JupyterLab に インポート します。

 

JupyterLab のノートブックを使用して、モデルを開発およびテストします。

 

別の Python ファイルに 独立した Python 関数としてモデルを保存 します。

 

関数に必要な依存関係で requirements.txt ファイルを更新 します。

 

ノートブックサーバーで関数をテスト します。

 

更新をリモート Git プロジェクトに再プッシュ します。

デプロイされたアプリケーションエンドポイントをテスト します。