クリエイティブなAIツールが一か所で使える「Google AI Studio」
※このページを読む時期によっては情報が古くなっているかもしれませんので、あらかじめご了承ください(2025年9月中旬)
昨今では、様々なAIツールが開発され利用できるようになっています。
ですが、高機能なものになるほど有料となり、無料で使うことが出来なかったり制限が厳しかったりするのが当たり前になってきているのですが、このページでは無料で高機能のAIが使える「Google AI Studio」というAIプラットフォームを簡単に紹介します。
※「ツール」ではなく「プラットフォーム」と表現したのは、1つのツールではなく目的別に複数のツールが集まっているため、あえてこのような表現にしています。
この記事の目次
「Google AI Studio」とは?
Googleには、もともと「Gemini」というAIツールがあるのですが、この「Google AI Studio」は「開発者向けに提供されているサービス」となっています。
「開発者向け」と聞くと大層な感じがしますが、基本的にGoogleアカウントがあれば誰でも基本無料で利用できるプラットフォームです。
この「Google AI Studio」には様々なクリエイティブなAIツールが用意されており、2025年8月に話題になった画像加工に特化したAI「Nano Banana」も利用することができます。
他にも、通常のチャットAI「Gemini」はもちろん、
- 音声やカメラを使って、リアルタイムでAIとやり取りできる「Stream」
- 高画質画像生成AI「Imagen」
- AIボイスでナレーション音声を生成できる「Gemini speech generation」
- 音楽生成AI「Lyria Realtime」
- 動画生成AI「Veo」
- アプリやゲームを開発する「Build Apps with Gemini」
など、クリエイティブな活動はこの「Google AI Studio」だけでほぼ完結できそうなぐらい充実しています。
「Google AI Studio」で使えるAIツール
先ほど紹介したAIツールの概要をご紹介していきます。(Googleの回し者ではありません)
もちろん全てのツール覚えないといけないわけではありません。
必要なツールだけ使ったり、他のAIツール(ChatGPTなど)も状況によって使い分けられるのが理想だと思います。
「Chat」(Gemini?)

最初に開いた画面がこの「Chat」ですが、右上の項目からAIのモデルを変更することができます。

初期設定は「Nano Banana」ですが、普通にチャットでやり取りする場合は「Gemini 2.5 Flash」で良いかと思います(Proは高性能らしいですが、有料っぽい表記があるので未確認です)
「Stream(Talk to Gemini live)」

マイクやカメラを使って、「Gemini」とリアルタイムの対話ができ、3通りの方法で「Gemini」とのやり取りができます。
- Talk:音声通話
マイクを使って会話することができ、キーボードが不要。
日常会話はもちろん、就活のアイデアとしてはAIを「面接官」という役割を与えて、面接の練習とかできるかも? - Webcam:カメラの映像を認識
カメラを使うことで、映っているものを認識し、それに関する質疑応答ができます。
こちらも日常会話はもちろん、就活アイデアとしては「身だしなみチェック」や「姿勢のチェック」などができるかもしれません。 - Share Screen:画面共有
自分が作業していウィンドウを「Gemini」と共有することで、サポートを受けながら作業することができるようになります。
コードの修正だけでなく、自分がデザインした制作物を「Gemini」が認識し、それに対してのフィードバックと修正のやり取りをリアルタイムでできるようになります。
一応「Gemini」のテキストチャットでもリアルタイムでのやり取りになるのですが、音声や映像を使って何かを「認識」したり、実際に「会話」できるのが大きな違いとなっています。
「Generate media」

この「Generate media」では、上でも紹介したように、様々な素材をAIで生成することができます。
「Nano Banana」
「Nano Banana」というのは開発時のコードネームで、正式名称は「Gemini 2.5 Flash image」で、画像の加工に特化した生成AIです。
分かりやすいのが「画像(写真)から3Dフィギュアを作る」という加工で、一部で盛り上がっていました。
例えばこの画像が、

※この写真もAI(後述するImagen4)で生成したものになります。
こうなります。

フィギュアというより、剥製に近いような気がしますが…
この加工する際のプロンプトは「Nano Banana フィギュア」で検索すると沢山でてきますので、興味があれば一度お試しください。
また、特筆すべき点として「一貫性」が挙げられています。
どういうことかと言いますと、「各素材の特徴をキープしたまま加工することができる」という点で、例えば人物の特徴をキープしたまま、
- 「カラーリング(色味)を変更」
- 「背景だけ変更」
- 「ポーズを変更」
- 「上半身→全身を表示」
- 「表情だけを変える」
といった、手書きでこの修正をやろうとするとかなりの時間を要する作業が、1分程度できてしまうのが「Nano Banana」の最大の特徴かと思います。
1.人物の画像を用意する(これは後述するImagen4で生成)

2.アニメ調に変更する。

3.全身を表示し、背筋を伸ばす。

4.表情を柔らかくする。

5.ネンドロイド風(頭が極端に大きく、ぷっくりした人形)にする
(これだけ変わっても原形のイメージをある程度保てています)

他にも「プロンプト(指示文)」で正確に伝えることができれば、いろんな加工をすることができるようになります。コツとしては「箇条書きではなく一連の文章で伝える」と良いらしいです。
「Imagen」

こちらは画像生成AIで、「Nano Banana」との違いは「0から画像を生成する」ことに特化しています。
画像のアスペクト比(横長、縦長、正方形)を指定できたり、解像度を設定(標準は2K)できます。
またプロンプト(指示文)を細かく指定するほど精密な画像を生成できますが、少ない情報量でもいい感じに仕上げてくれます。

プロンプト「二匹の子猫,三毛猫とハチワレ,じゃれ合っている」
少し情報を多めに指示した場合

プロンプト「40代の男性,やせ型,エレキギターを弾いている,ギターはビンテージのストラトキャスター,場所はライブハウス,高めの椅子に座っててスポットライトに当たっている」
他にも質感や雰囲気も指示できるので、アニメ調やイラストも生成できますので、「Imagen4」で高品質な画像を生成し、それをもとに「Nano Banana」や後述する「Veo2」で加工していくのが良いかと思います。
「Gemini speech generation」

「Google speech generation」はAIボイスを使って原稿を読み上げることができるAIツールです。
日本語の原稿を渡せば日本語で読み上げてくれますし、標準では2人の人物で掛け合いトークの設定となっていますが、1人で原稿を読んでもらうこともできます。

読み上げ音声の設定を変えることで、性別や声質を変更することもできます。

日本語はたまにおぼつかないところがありますが、動画制作でのナレーション音声を作成する際にこのAIツールを使うと非常に便利になるんじゃないかなと思います。
「Lyria Realtime」

「Lyria realtime」は楽曲生成AIです。
未確認のため詳しい説明は各自で調べていただくとして、プロンプト(指示文)をもとに作曲をしてくれるので、動画制作の際に映像のイメージに合ったBGMを作曲することができるのではないかと思います。
「Veo」

「Veo」は動画生成AIで、バージョン2がこの「Google AI Studio」で利用することができます。
※音声入りの動画生成ができる「Veo3」というものもありますが「Google AI Studio」ではまだ利用できません。
「Veo2」では、音声は入らないものの、基本的に8秒間の横長・縦長の動画を生成することができます。
プロンプト(指示文)を使って0から動画を生成することはもちろん、アップロードした画像にプロンプト(指示文)を入れることで静止画を自然に動かす。といったことも得意なのが「Veo2」の特徴です。
例えば先ほどの「Imagen4」で生成した猫の画像を「Veo2」にアップロードし、プロンプトを入れると

このような動画になりました。
プロンプト「二匹の猫がじゃれ合う動画」
また、「Imagen4」で生成したギタリストの画像を「Veo2」で動かすとこのようになりました。
プロンプト「play guitar,emotional」
ただの静止画がちゃんとギターを弾いている動画になるので、趣味でギターを弾いている自分もかなり驚きました(笑)
再生時間は8秒と短いですが、作成した動画を「Premiere Pro」などの動画編集ソフトでつなぎ合わせることで、1つの映像を作っていくことも可能です。
「Genetrate media」に関しては、今のところは5項目ですが今後増えたり減ったりする可能性があります。
「Build apps with Gemini」

「Build apps with Gemini」では、Web上で動くアプリやゲームを作成することができます。
こちらも未確認のため調べた情報になりますが、プロンプト(指示文)を出すことでAIがプログラミングしてくれる流れとなり、出来上がったアプリやゲームはWeb上に公開することもできるそうです。
どの程度のアプリができるかはプロンプト(指示文)にもよると思いますが、叩き台(初期の段階)として利用することで初期の時間短縮になるのではないかと思っています。
「Google AI Studio」を利用する上での注意点
Googleアカウントがあれば、誰でも無料で利用できる「Google AI Studio」ですが、重要な注意点がありますので、実際に使い始める前に確認しておいてください。
基本的には「日本語に翻訳しない」
UI(ユーザーインターフェース)が全て英語になっているので日本語に翻訳した状態で使いたいのも良く分かりますが、日本語に翻訳すると不具合が起こる(生成したコードが変わってしまう)可能性があります。
パッと見ただけで何が書かれているか何となくわかる程度の英語なので、翻訳機能は使わずに利用しましょう。(もちろん日本語のプロンプトは対応しており、日本語で返してくれます)
入力した内容(プロンプト)はデータ学習に利用される
どのサービスでもそうなのですが、これだけのツールが無料で使えるのには、何かしらの理由があります。
この「Google AI Studio」はあくまでも開発者向けコンテンツのため、ユーザーが実際に利用したデータを価値として、それをもとにAI学習を行っていると言われています。
そのため、機密情報や個人情報に関わるものは入力しないようにしましょう。
※どのタイミングでどこに流れるかわかりませんからね
無料ユーザーは、利用回数に制限があります。
基本的に無料で使える「Google AI Studio」ですが、もちろん利用回数に制限があります。
- チャット(Nano Banana含む)はトークンに上限あり
- 動画生成は10回/月まで
「トークン」というのは簡単に言うと「やり取りするデータ量」のようなものです。
このトークンの上限はアカウントごとに決まっていて、一日の利用上限を超えると警告が表示されて画像が生成できなくなったり、チャットに返答がもらえなくなります。
(警告の内容には英語で「~tomorrow」と書かれていたので翌日には利用できるようになります)
また、1スレッド(チャット)ごとにも上限があり、画像の場所から確認できます。

見たところ、入力するトークンの上限が32,768トークンとのことで、入力側で判断しているみたいです。
ただし、現在利用している1日当たりのトークンは確認できないため、とりあえず警告が出るまでは使っていけば良い感じです。
「Veo2」の方は上にも書いたように「10回/月」となっており、ここから確認できます。

「Google AI Studio」に関しては、良いところ・注意するところを含めこんな感じのプラットフォームとなっています。
軽めのものから、ある程度しっかりしたものまでここだけで完結できそうなぐらい、いろんなことができるのが「Google AI Studio」の特徴だと思います。
ですが、これまでに使い慣れたツール(ChatGPTなど)があれば、そちらも並行して利用することも全然OKなので、自分に合ったツールを上手く使い分けていただけたらと思います。