Contents
Polly
【音声発話サービス】
文章をリアルな音声に変換するサービス。発話できるアプリケーションを作成できる。
Rekognition
【動画や画像認識】
イメージや保存済みのビデオから有名人を認識できる。また、Lambda関数を使用するとスケーラブルでコスト効率の高いアプリケーション層が得られる。イメージ内の有名人を認識し、認識した有名人に関する追加情報(時間など)を取得するには非ストレージ型のAPIオペレーション「RekognizeCelebrities」を使用する。Rekognition APIにイメージや動画を指定すると、モノ、人物、テキスト、シーン、アクティビティを識別。
Sage Maker
【機械学習構築】
すべての開発者とデータサイエンティストに機械学習モデルを迅速に構築、トレーニング、デプロイできる手段を提供。
【セルフサービスで安全なデータサイエンス】
AWS Service Catalog、Amazon SageMaker、AWS Key Management Service (KMS) を連携させることで、データサイエンティストが煩雑な設定に触れずに、安全なセルフサービス環境で機械学習を活用する方法が紹介されている。
- AWS Service Catalog を使って、あらかじめ設定された KMS キー付きの製品を提供し、ノートブックインスタンスのストレージを暗号化。
- セキュリティチームやインフラチームが事前に設定した製品で、統制のとれた環境を実現。
- SageMaker のノートブックやトレーニングジョブ作成時に、KMS キー ID を指定して暗号化を適用。
- 出力先の Amazon S3 バケット も KMS キーで暗号化し、モデルの成果物の安全性を確保。
つまり、AWS の複数サービスを活用することで、コストとセキュリティの両立を図りながら、柔軟かつ安全にデータサイエンスを展開できるようにしているのがポイント。
[参照サイト]
Transcribe
音声を自動的にテキストに変換する。
- リアルタイムまたは録音済みの音声を高精度で文字起こしできる。
- 100以上の言語と方言に対応しており、日本語もサポートされている。
- 話者の識別(話者ダイアライゼーション)や自動句読点の挿入、カスタム語彙の登録など、実用的な機能が豊富。
- 字幕ファイルの生成や医療分野向けのTranscribe Medicalも利用可能。
- コールセンターの通話分析や会議の議事録作成、動画の字幕生成など、幅広いユースケースに活用されている。
使い方も比較的シンプルで、音声ファイルをS3にアップロードし、Transcribeでジョブを作成するだけでテキスト化できる。
Mechanical Turk(MTurk)
コンピュータでは困難なタスクを人間に依頼できるクラウド型のサービス。MTurkは大量の小さな作業を人の力でこなすことで、アプリケーションに疑似的な“知能”を組み込める仕組み。
- 依頼者は、ウェブUIやAPIを通じてタスクを提出し、人間の作業者がそれを完了・提出します。
- 作業者はタスクを選んで実施し、完了後に報酬を受け取ります。
- APIを用いたやり取りは、リモートプロシージャコールのような形式で行われます。
- 実質的には「人力による人工知能」のような仕組みで、柔軟で多様なタスク処理が可能です。
[公式サイト引用]
No responses yet