Polly
【音声発話サービス】

文章をリアルな音声に変換するサービス。発話できるアプリケーションを作成できる。

Rekognition
【動画や画像認識】

イメージや保存済みのビデオから有名人を認識できる。また、Lambda関数を使用するとスケーラブルでコスト効率の高いアプリケーション層が得られる。イメージ内の有名人を認識し、認識した有名人に関する追加情報(時間など)を取得するには非ストレージ型のAPIオペレーション「RekognizeCelebrities」を使用する。Rekognition APIにイメージや動画を指定すると、モノ、人物、テキスト、シーン、アクティビティを識別。

Sage Maker
【機械学習構築】

すべての開発者とデータサイエンティストに機械学習モデルを迅速に構築、トレーニング、デプロイできる手段を提供。

【セルフサービスで安全なデータサイエンス】
AWS Service Catalog、Amazon SageMaker、AWS Key Management Service (KMS) を連携させることで、データサイエンティストが煩雑な設定に触れずに、安全なセルフサービス環境で機械学習を活用する方法が紹介されている。

  • AWS Service Catalog を使って、あらかじめ設定された KMS キー付きの製品を提供し、ノートブックインスタンスのストレージを暗号化。
  • セキュリティチームやインフラチームが事前に設定した製品で、統制のとれた環境を実現。
  • SageMaker のノートブックやトレーニングジョブ作成時に、KMS キー ID を指定して暗号化を適用。
  • 出力先の Amazon S3 バケット も KMS キーで暗号化し、モデルの成果物の安全性を確保。

つまり、AWS の複数サービスを活用することで、コストとセキュリティの両立を図りながら、柔軟かつ安全にデータサイエンスを展開できるようにしているのがポイント。

[参照サイト]

Transcribe

音声を自動的にテキストに変換する。

  • リアルタイムまたは録音済みの音声を高精度で文字起こしできる。
  • 100以上の言語と方言に対応しており、日本語もサポートされている。
  • 話者の識別(話者ダイアライゼーション)や自動句読点の挿入、カスタム語彙の登録など、実用的な機能が豊富。
  • 字幕ファイルの生成や医療分野向けのTranscribe Medicalも利用可能。
  • コールセンターの通話分析や会議の議事録作成、動画の字幕生成など、幅広いユースケースに活用されている。

使い方も比較的シンプルで、音声ファイルをS3にアップロードし、Transcribeでジョブを作成するだけでテキスト化できる。

Mechanical Turk(MTurk)

コンピュータでは困難なタスクを人間に依頼できるクラウド型のサービス。MTurkは大量の小さな作業を人の力でこなすことで、アプリケーションに疑似的な“知能”を組み込める仕組み。

  • 依頼者は、ウェブUIやAPIを通じてタスクを提出し、人間の作業者がそれを完了・提出します。
  • 作業者はタスクを選んで実施し、完了後に報酬を受け取ります。
  • APIを用いたやり取りは、リモートプロシージャコールのような形式で行われます。
  • 実質的には「人力による人工知能」のような仕組みで、柔軟で多様なタスク処理が可能です。

[公式サイト引用]

No responses yet

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

error: Content is protected !!