re:Invent 2020の1発目のKey Note(Andy Jassy)で発表されたAI/機械学習系サービスの振り返りと、ちょっとProtonの話、さらにちょっとだけ気になる各種アップデート、などについて話したよ。re:Inventのキャッチアップが追いつかないよ。
今回もre:Inventネタ。
re:Inventキャッチアップつらい問題…
例年は現地で数日間集中してだったのが、オンラインだと無限にセッション見れるかつ3週間ということで頑張ろうとするとキリがない。 Twitterとか見てると最初からみんな飛ばし過ぎなような…?
re:Inventがオンラインで3週間という人類がいまだかつて経験したことのない事態に
身体がもたない人が続出するのでは…?という心配すらある。
(ていうかオンラインで在宅からだと普通の仕事もあんのよ…)
テンションがあがるのは分かるのだが、最新情報を追うだけが主目的ではないはず。
少し冷静になって、身体に無理がない程度にキャッチアップしていくのが良いかと思われる。
ここでも自分たちが興味のあるものに絞る。
最初に情報収集としておすすめリンクをまとめて貼っておく。(言わずとしれたものばかりだけど…)
12/2の最初のCEO Andy Jassy Key Noteで発表された。
Ken Noteの内容は
re:Invent 2020 Liveblog: Andy Jassy Keynoteで記事にされている。
Machine LearningのKey Noteは2週目に控えているが、早くもAI/Machine Learning系でアップデートがたくさん公開されている。
SageMakerの英語トップページも更新されており「Prepare」と「Deploy & Manage」のところが強化されているのが分かる。
ここではSageMakerの新3機能について。
Key Noteで↓と言われていた。
Data preparation is the next frontier, and it is hard.
その通りで、GCPのAutoMLやSageMaker Autopilotのようにモデリングを自動化してくれる機能はたくさん出てきている。
ただ機械学習やデータ分析で本当に大変なのはデータ準備のところで、これに大半の時間を費やす。
SageMaker Data Wranglerはそのあたりを楽にしようというサービス。
具体的には以下のようなことをやってくれる。
これらで準備ができたら、今までのSageMaker Autopilotなりで学習ということだろうと思う。
ただ、こういった内容のサービス自体は目新しいものではない。
GCPでは
DataPrepという同等のサービスが以前から提供されているし、
AWSでも
AWS Data WranglerというPythonライブラリが提供されていた。
今回のアップデートでは、これらの機能がSageMaker Studioに統合されたというのが主旨だろうと思う。
実際、GCPでは1つのUIで統合されてはおらず、DatePrep => DataFlow => AI Platformのようにサービスを行き来する必要はあるが
SageMaker Studioはそれらをすべて同じUIで利用できるようにする、というのが昨年からの思想だと思われる。(使っている人が周りにいるかというとあまり聞いたこと無いが)
機械学習に必要なデータ特性を「特徴量(Feature)」と呼ぶ。
文字通り、このFeatureを保存するのがSageMaker Feature Store。
このFeatureは実験を繰り返す過程でコロコロ変わるし、「このモデルってどの特徴量で作られたんだっけ?」となっていくのはよくある困りごと。
また、学習時と推論時で同じ加工をした特徴量を扱う必要がある。
これらの特徴量を管理するのがFeature Storeで、これも発想自体は新しいものではなく
同じくSageMaker Studio内で統合して使えるようになったのが利用者にとっては嬉しいポイント。
MLのCI/CDパイプライン。
要はここまでに出てきたデータ準備+加工, 前処理, 学習, 評価, モデル管理などをワークフローとして定義し管理する。
これも概念としては新しいものではなく(ry
同様のツールとしては
MLflowや
kubeflowなどがあげられると思う。
kubeflowは「
AI Platform Pipelines」の一部としてGCPのマネージド・サービスとしても提供されている。
気になったやつをダイジェストで。(詳しくはまだ調べられていない)
同様のサービスとしてはGCPの
AutoML Visionや
AWSだと
Amazon Rekognition Custom Labels。
特にMonitronとの関係性がよく分からん…