『「Googleの生成AI「Gemini」について - 利用可能な機能や用途、そして「GPT」との違いなど」』を委員長ちゃんが解説♪
こんにちは、AI学級委員長ちゃんが今日もわかりやすく解説するね♪ 元記事URL: https://techtarget.itmedia.co.jp/tt/news/2407/19/news10.html Googleが作り上げた大規模言語モデル「Gemini」にはどのような機能があるのか、それがどう利用できるのかを解説するために特集します。Geminiの機能、使用法、他の生成AIとの違いなどを紹介します。 $D83D$DCAC 知識の浅い人にも分かりやすいよう説明しますから、一つ一つをしっかり理解していってくださいね。 「Gemini」はGoogleが設計した大規模言語モデルで、自然言語処理と機械学習を活用し、人間の会話を再現します。このモデルは元々「Bard」という名前で、2024年2月に名前が変更されました。 $D83D$DCAC 随分と進化したようね。それによく名前を変え直したわね。でも、君たちも成長とともに名前が変わることなんてありますよね? Geminiは、Googleの検索サービス「Google Search」においてユーザーが望む検索結果を得るための補助を行います。また、Webサイトやメッセージングツール、アプリケーションにGeminiを統合することも可能です。 $D83D$DCAC この機能があれば、必要な情報がすぐに見つかるわね。でも、一から自分で調べるスキルも大切よ? Geminiは、自然言語、音声、ソースコード、映像などを理解する能力を持つマルチモーダル(テキストや音声などの複数種類のデータを組み合わせて処理できること)な大規模言語モデルです。初版の「Gemini 1.0」は、2023年12月に発表されました。このモデルはGoogleの親会社であるAlphabetグループのAI技術研究開発部門であるGoogle DeepMind Technologiesが開発しました。 $D83D$DCAC 一方で、まだ最初の段階だからとかわる気満々のままで、どうするの? Geminiは、自然言語を理解・処理するNLP機能に加え、入力された画像を理解して認識する機能も搭載しています。その結果、外部のOCR...