アマゾン ウェブ サービス ジャパン株式会社 機械学習ソリューションアーキテクトの大渕です。AWS Japan 目黒オフィスでは「Amazon SageMaker 事例祭り」(Twitter: #sagemaker_fes) を定期的に開催しています。2019年8月29日に開催された第7回 Amzon SageMaker 事例祭りでは、AWS Japan のソリューションアーキテクトによるサービスの最新情報や技術情報と、Amazon SageMaker をご利用いただいているお客様をゲストスピーカーにお招きし、実際に導入頂いたお客様による「体験談」をお話し頂きました。
アマゾン ウェブサービス ジャパン株式会社機械学習ソリューションアーキテクト 鮫島 正樹
AWS が提供する機械学習サービスの全体像について、Machine Learning サービススタックという、AWS のコンセプトにもとづいて紹介をしました。Machine Learning サービススタックでは、AWS の機械学習サービスを、AI サービス、ML サービス、ML フレームワーク&インフラストラクチャの 3層に分けて説明します。この中でも特に、お客様がデータを用意するだけで、API から機械学習を利用できる AI サービスについてご紹介しました。静止画・動画認識の Amazon Rekognition や、Amazon で利用されている技術と同様のものを利用したリコメンデーションサービス Amazon Personalize など、様々な機械学習アルゴリズムをご利用頂けます。最後に、8月23日に GA となった時系列データ予測を行う AI サービス Amazon Forecast について、デモを交えて紹介しました。Amazon Forecast は、AWS コンソールだけでなく、Amazon SageMaker 上の Jupyter ノートブック等からも、API経由でご利用いただけます。
アマゾン ウェブ サービス ジャパン株式会社機械学習ソリューションアーキテクト 宇都宮 聖子
AWS が提供する機械学習のマネージドサービスである Amazon SageMaker についてお話し致しました。2019年8月現在、Amazon SageMaker は東京リージョンを含む 17のリージョンでお使いいただくことが可能です。機械学習システムの開発において、お客様がモデル開発などビジネスの差別化につながる部分に注力いただけるよう、Amazon SageMaker は環境構築の負荷を軽減します。Amazon ECR にあらかじめ準備されたコンテナイメージを活用いただくことで、数分で Jupyter 環境を立ち上げていただくことができ、学習ジョブを秒単位の課金で実行することが可能です。APIで簡単にエンドポイントをホストすることができ、推論環境をコスト削減いただ区ための、Elastic Inferenceやバッチ推論など様々な機能があります。Amazon SageMaker は、継続的な新機能のリリースが行われています。本発表では、学習時にスポットインスタンスが使えるようになったことや、学習時のデータダウンロードに Amazon EFS や Amazon FSx for Lustre が使えるようになったことを紹介しました。そのほかにも、Jupyter ノートブックの R 対応、ハイパーパラメーターのランダム探索、トレーニングジョブの検索機能などの新機能も紹介しました。お客様からのフィードバックを元に多くの機能改善が進んでいます、ぜひお客様の声をお聞かせください。
アマゾン ウェブ サービス ジャパン株式会社ソリューションアーキテクト 針原 佳貴
独自のデータを利用した教師あり学習を行うためには、ラベル付きデータを準備する必要があります。アノテーション(データへのラベル付け)にはコスト・時間がかかるため、今日では機械学習のビジネス活用の一つの大きなハードルとなっていることも多いのではないでしょうか。アノテーションのための機能を提供するのが Amazon SageMaker Ground Truth です。Amazon SageMaker Ground Truth を使って画像にラベルを付ける画像分類、画像中に枠を付ける物体検出、ピクセル単位でラベルを付けるセマンティックセグメンテーション、テキスト分類といった様々なタスクに対し、GUIを用いて容易なアノテーションを実現します。2019年8月に、テキストに固有表現(人名、地名、日付等)をラベリングするためのテンプレートが追加され、全部で 5つの組み込みラベリングツールを利用できるようになりました。また、アノテーションを行うワーカーは、クラウドソーシング(Amazon Mechanical Turk)から提供されるパブリック、友人や社員などを登録して活用するプライベート、登録済みのアノテーション専門企業へ依頼するベンダーの3種類からお選びいただくことができます。アノテーションの精度を上げるために、1つのデータに複数人がラベル付けした結果を組み合わせて統合する方法についても紹介しました。Amazon SageMaker Ground Truth を使って作成したラベリングデータは、Amazon SageMaker でそのままお使いいただくことが可能です。
株式会社CACクロアファーマコビジランス・スペシャリスト:髙木 毅 様システムアーキテクト/機械学習エンジニア:井上 秀樹 様
株式会社CACクロアでは医薬品に関する安全性情報の管理(副作用情報の収集と分析)に取り組まれています。これまで、一例一例データベースに人手で情報を登録し、副作用か否かを評価し、副作用である場合は副作用として報告する、というプロセスを行ってきました。この作業を効率化するのが目的です。株式会社CACクロアは、AWS の 66サービスを現在利用されており、そのうちの 1つである Amazon SageMaker を使った取り組みを紹介しました。医薬品の副作用情報を分析するにあたり、まずは収集した情報を MedDRA という医療用製品のための辞書で使用される用語に統一する必要がありました(たとえば、「体がだるい」という表現を「倦怠感」に置き換えるなど)。収集した情報内の用語を MedDRA 用語に対応づける分類問題として扱い、 そのための分類モデルを Amazon SageMaker を使って開発しました。膨大な MedDRA 用語への分類モデルを学習するため、複数の自然言語系のアルゴリズムを検証されました。Amazon SageMaker のご利用にあたっては、コストを節約するためのリージョン選択や、ローカルからの実行方法、複数モデルのデプロイ方法についてご紹介いただきました。
サントリーシステムテクノロジー株式会社先端技術部・スペシャリスト:高木 基成 様
サントリーシステムテクノロジー株式会社の先端技術部では、生命科学を最新の情報科学で支援できる体制の構築と、新規事業開発に取り組まれています。先端技術部の実績として、遺伝⼦データ解析などをご紹介いただき、機械学習活用の事例としては、Amazon SageMaker を使った文書分類システム開発についてお話いただきました。文書分類としては、これまで機械学習や CNN 等のディープラーニング手法で検討される中で期待される性能が出なかったとのことで、現在は BERT を使って実装されています。 Amazon SageMaker をお使いいただくことで、フルマネージドな環境のおかげで PoC からすぐに現場での活用に移ることができたそうです。独自の機械学習アルゴリズムを Amazon SageMaker で使うために必要な変更点としては、環境変数の渡し方や HPO の渡し方など、具体的な変更方法について詳しくご説明いただき、変更点はあまり多くなく楽に環境移行いただけたことをお話いただきました。また、Optuna を用いたハイパーパラメータのチューニングを取り入れるにあたり、AWSブログ をご参考に実装を進めていただいています。最後に、Amazon SageMaker を使って変わったこととして、パートナー様と PoC をスピーディに進められること、自社オフィス内の GPU サーバに縛られることなく海外のエンジニアも開発に参加できること、セキュリティ設定やユーザー管理などの運用業務が簡素化されたことなどをお話いただきました。
今回は AWS の機械学習サービス全体の話から Amazon SageMaker とアノテーションサービス Amazon SageMaker Ground Truth をご紹介ののち、Amazon SageMaker を活用されているゲストの方々をお迎えし、実際の実例についてお話しいただきました。次回、第8回 Amazon SageMaker 事例祭り|体験ハンズオンの開催は2019年9月19日を予定しています。なお、過去の Amazon SageMaker 事例祭りの開催概要と登壇スライドは下記のリンクからご覧いただけます。