ChatGPTを超える生成AI Google「 Gemini 」の初期設定の注意点

フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 CapCut を書きます。

GPT-4の最大の対抗馬とされていた「Gemini(ジェミニ)1.0」がGoogleから発表されました。

実際に使えるようになるのは12月13日の公開を待つことになります。

そこで予行演習をすることにしました。

ChatGPTを超える生成AIサービス Google「 Gemini 」

2023年12月7日、Googleの新AI「 Gemini」(ジェミナイ)のデモが発表されました

Gemini – Google DeepMind

Google Japan Blog: 最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに

Google「 Gemini 」がなぜChatGPTを超えるかというと、正解率に差があるからといわれます。

難しいことはさておいて、特徴はざっくり言うと

  • 「GPT4」より早い
  • テキスト画像音声が同時に生成可能
  • Geminiと会話もできる

と言う点に惹かれますよね。

「Gemini」には松竹梅のように三つのランクがあります。

松にあたる「Ulutra」は研究者用。まだリリースされていません。

梅にあたる「Nano」は携帯端末用なので、私たちが一般的に使うのは「Gemini Pro」になります。

「Gemini Pro」はBardにアクセスすることで誰でも使用することができます。

BardとはGoogleが開発した生成AIのことです。初めての人はBardを開きましょう。

Google Bardの使い方

Google Bardは日本語で無料で利用できます。

Google Bard

画面をスクロールダウンして[Bardを試す]をクリックします。

プライバシーと試験運用中のお断りを確認するとコントロールパネルが現れます。

2023年5月11日より、Google Bardは日本語でも使えるようになりました。

[Press/to open the commands menu]の枠内に聞きたいことをテキストで質問します。

「大谷翔平」と記入するだけで下のような答えが返ってきました。

すると、ChatGPTのように、そのリクエストに応じた回答を返してくれます。

GeminiとBardはどこがどう違うのですか。

GeminiとBardはどちらもGoogleが開発したAIサービスです。

同じAI生成サービスですが、違いがあります。

Bardは、テキストのみを処理するように設計されたものに対し、Geminiは、テキスト、画像、音声の組み合わせを処理するように設計されたAIです。

Geminiは意識することなしにBard上で利用できます。

Google「Gemini」の初期設定方法とは

Gemini の普及版ともいえる「Gemini Pro」は開発途上。

日本語対応版はまだリリースされていないので、しばらくの間は英語版でしか利用できません。

なので、英語版を利用できるようにGoogleの設定をいじる必要があります。

Google Chromeの右上にあるドットメニューアイコンからアカウントをクリック

[アカウント]から[個人情報][ウェブ向けの全般設定]をクリックします。

言語が開くので、英語(English)に変更します。

優先言語が日本語になっている場合は、言語を追加から[English]、[United States]を選択します。

[English]の項目にある矢印マークをクリックすると優先順位が上がり、表記が英語に切り替わります。

これで準備完了です。

Google サービスの優先言語と、あなたが理解できるその他の言語。もっと詳しく知る 優先言語への変更は Web に反映されます。 Google は、アプリやサービスに関するより関連性の高いコンテンツを表示するために言語情報を使用する場合があります。モバイル アプリの優先言語を変更するには、デバイスの言語設定に移動します。

優先言語がEnglishになっている場合は、Google検索の優先度が英語圏中心に切り替わります。いつものように検索しても日本語の記事がヒットしなくなったりします。
日本語検索に支障がある場合は、適宜「言語を日本語優先」に戻しましょう。

Bardにアクセスすると表記が英文になっていると思います。

「Gemini」が利用できるようになるはずです。

Google Geminiの設定手順

12月13日Geminiがリリースされました。入り方の手順をおさらいします。

Gemini – Google DeepMind

上記のURLから「Gemini era」のページを開きます。

上部のバーから[Bard]を選択し、[ai.google.dev]をクリックします。

[Bard with Gemini]が開くので[Get API key in Google AI Studio]をクリックします。

利用規約を確認します。

利用規約

 Google AI Studio および Generative Language API の使用には、Google API の利用規約および Generative AI API の追加利用規約が適用されます。

知っておくべきこと

API は本番環境で使用できますが、Google がレート制限を適用する場合があります。機密情報、機密情報、または個人情報を API に送信しないでください。品質、安全性を高め、製品を改善するために、人間のレビュー担当者が API の入力と出力を読み取り、注釈を付け、処理する場合があります。 Google は、このプロセスの一環として、レビュー担当者がデータを確認したり注釈を付けたりする前に、このデータを Google アカウントまたは API キーから切断するなど、プライバシーを保護するための措置を講じます。生成 AI モデルは実験的なテクノロジーであり、Google の見解を代表しない不正確または不適切な情報が提供される場合があります。回答を医学的、法律的、財務的、またはその他の専門的なアドバイスとして信頼しないでください。

・Generative AI API の追加利用規約と Google API の利用規約に同意し、Google プライバシー ポリシーを読んだことを認めます 

・Google AI に関するモデルの更新、オファー、役立つヒント、ニュースに関する電子メールの受け取りを希望します

・ I Google AI の改善に役立つ調査研究に参加するための招待状を受け取りたい

「利用規約に同意し、Google プライバシー ポリシーを読んだことを認めます 」にチエックを入れて[Continue]をクリックします。

Geminiの編集画面が表示されました。

Geminiでは、[自由形式のプロンプト][構造化プロンプト][チャット プロンプト]という、三つのプロンプトを使い分けることができます。また、これ以外にも設定済みの[チューニング済みモデル]が用意されています。

使い方

サンプル写真からその作者を当てさせる質問をしてみます。

左側のパネルで、[Create new] > [Freeform prompt] を選択します。

右側の [モデル] フィールドで、Gemini Pro Vision モデルなど、画像をサポートするモデルを選択します。

look at the following picture and tell me who is the architect

プロンプトのテキスト領域に、上記の質問「次の写真を見て、建築家が誰なのか教えてください」をコピペします。

プロンプト領域の上にある [Insert] バーから [Image] を選択し[Add to Prompt]をクリックします。

ここでは「サグラダファミリア教会」を選択します。

アプリ ウィンドウの下部にある [Run] をクリックすると作業が始まります。

使途を尋ねるポップアップが出るので右上の×をクリック。

The Basilica of the Sagrada Familia (in Catalan: Temple Expiatori de la Sagrada Família) is a large unfinished Roman Catholic church in Barcelona, Catalonia, Spain. Designed by Catalan architect Antoni Gaudí (1852–1926), his work on the building is part of a UNESCO World Heritage Site.

サグラダ ファミリア大聖堂 (カタルーニャ語: Temple Expiatori de la Sagrada Familia) は、スペインのカタルーニャ州バルセロナにある未完成の大きなローマ カトリック教会です。 カタルーニャの建築家アントニ ガウディ (1852 ~ 1926 年) によって設計されたこの建物は、彼の作品でユネスコの世界遺産に登録されています。

するとGeminiによる回答が英文で表示されます。

破棄して最初に戻るには左メニューの上から二つ目[Create New]をクリックします。

Google AI Studio のクイックスタート  |  Google AI for Developers

チュートリアル動画