Google Cloud のエンタープライズ向け統合 ML / 生成 AI プラットフォーム。Gemini を含む Model Garden、IAM、VPC-SC、SLA、MLOps、Provisioned Throughput を備える。
概要
Vertex AI は Google Cloud が提供する機械学習・生成 AI のフルマネージド基盤。生成 AI 領域では Gemini モデルへのアクセス、プロンプト評価、RAG Engine、Agent Builder などを統合的に提供する。
Google AI Studio と同じ Gemini モデルを呼び出せるが、Vertex AI は**エンタープライズ要件(IAM・VPC-SC・SLA・監査ログ)**に対応する点が大きな違い。
AI Studio との比較
| 項目 | AI Studio | Vertex AI |
|---|---|---|
| 対象 | PoC・個人開発 | エンタープライズ・本番運用 |
| 認証 | APIキー | IAM・サービスアカウント・WIF |
| セキュリティ | 基本的 | VPC-SC、Private Service Connect |
| SLA | なし | あり |
| MLOps | なし | Model Registry、モニタリング、評価 |
| マルチテナント | 困難 | IAM で柔軟に対応 |
| コンプライアンス | 限定的 | SOC2、ISO、FedRAMP |
| SDK | google-genai | 同じ SDK で切替可能 |
SDK での切り替え
vertexai=True の引数追加だけで AI Studio から切り替えられる。
from google import genai
# AI Studio
client = genai.Client(api_key="YOUR_KEY")
# Vertex AI(差分はこれだけ)
client = genai.Client(
vertexai=True,
project="your-gcp-project",
location="asia-northeast1",
)
主要メニュー(生成 AI 観点)
- Model Garden — Gemini / Claude / Llama 等のモデル一覧
- Vertex AI Studio — プロンプトテスト UI
- バッチ推論 — Batch API と同等の 50% オフ
- RAG Engine — マネージド RAG 構築
- ベクトル検索 — 大規模ベクトル DB
- エンドポイント — 推論 API のホスティング
- Provisioned Throughput — 専用スループット契約
関連記事
- Vertex AI 移行ガイド — AI Studio からの移行
- Gemini API モデル移行ガイド — 2.5 → 3 への準備
関連用語
- Gemini — Vertex AI で利用できるモデル本体
- Google AI Studio — 軽量姉妹サービス
- Provisioned Throughput — 専用スループット
- Batch API — 非同期処理 50% オフ