Contents

0.1 Polly【音声発話サービス】
0.2 Rekognition【動画や画像認識】

1 Sage Maker【機械学習構築】
2 Transcribe
3 Mechanical Turk（MTurk）

Polly
【音声発話サービス】

文章をリアルな音声に変換するサービス。発話できるアプリケーションを作成できる。

Rekognition
【動画や画像認識】

イメージや保存済みのビデオから有名人を認識できる。また、Lambda関数を使用するとスケーラブルでコスト効率の高いアプリケーション層が得られる。イメージ内の有名人を認識し、認識した有名人に関する追加情報（時間など）を取得するには非ストレージ型のAPIオペレーション「RekognizeCelebrities」を使用する。Rekognition APIにイメージや動画を指定すると、モノ、人物、テキスト、シーン、アクティビティを識別。

Sage Maker
【機械学習構築】

すべての開発者とデータサイエンティストに機械学習モデルを迅速に構築、トレーニング、デプロイできる手段を提供。

【セルフサービスで安全なデータサイエンス】
AWS Service Catalog、Amazon SageMaker、AWS Key Management Service (KMS) を連携させることで、データサイエンティストが煩雑な設定に触れずに、安全なセルフサービス環境で機械学習を活用する方法が紹介されている。

AWS Service Catalog を使って、あらかじめ設定された KMS キー付きの製品を提供し、ノートブックインスタンスのストレージを暗号化。
セキュリティチームやインフラチームが事前に設定した製品で、統制のとれた環境を実現。
SageMaker のノートブックやトレーニングジョブ作成時に、KMS キー ID を指定して暗号化を適用。
出力先の Amazon S3 バケット も KMS キーで暗号化し、モデルの成果物の安全性を確保。

つまり、AWS の複数サービスを活用することで、コストとセキュリティの両立を図りながら、柔軟かつ安全にデータサイエンスを展開できるようにしているのがポイント。

[参照サイト]

Transcribe

音声を自動的にテキストに変換する。

リアルタイムまたは録音済みの音声を高精度で文字起こしできる。
100以上の言語と方言に対応しており、日本語もサポートされている。
話者の識別（話者ダイアライゼーション）や自動句読点の挿入、カスタム語彙の登録など、実用的な機能が豊富。
字幕ファイルの生成や医療分野向けのTranscribe Medicalも利用可能。
コールセンターの通話分析や会議の議事録作成、動画の字幕生成など、幅広いユースケースに活用されている。

使い方も比較的シンプルで、音声ファイルをS3にアップロードし、Transcribeでジョブを作成するだけでテキスト化できる。

Mechanical Turk（MTurk）

コンピュータでは困難なタスクを人間に依頼できるクラウド型のサービス。MTurkは大量の小さな作業を人の力でこなすことで、アプリケーションに疑似的な“知能”を組み込める仕組み。

依頼者は、ウェブUIやAPIを通じてタスクを提出し、人間の作業者がそれを完了・提出します。
作業者はタスクを選んで実施し、完了後に報酬を受け取ります。
APIを用いたやり取りは、リモートプロシージャコールのような形式で行われます。
実質的には「人力による人工知能」のような仕組みで、柔軟で多様なタスク処理が可能です。

[公式サイト引用]

AWS 勉強機械学習

機械学習

Polly
【音声発話サービス】

Rekognition
【動画や画像認識】

Sage Maker
【機械学習構築】

Transcribe

Mechanical Turk（MTurk）

No responses yet

コメントを残すコメントをキャンセル

最近の投稿

最近のコメント

機械学習

Polly【音声発話サービス】

Rekognition【動画や画像認識】

Sage Maker【機械学習構築】

Transcribe

Mechanical Turk（MTurk）

No responses yet

コメントを残す コメントをキャンセル

最近の投稿

最近のコメント

Polly
【音声発話サービス】

Rekognition
【動画や画像認識】

Sage Maker
【機械学習構築】

コメントを残すコメントをキャンセル