Google I/O 2023 と Google Bardが日本語対応したらしいので試す

Google I/O 2023

Google I/O 2023について

Google I/Oは、毎年開催されるGoogleの開発者向けカンファレンスです。 2023年のGoogle I/Oが昨日(今日朝)開催されました。

様々なトピックがありましたが、個人的に気になったものは下記です

Bardの日本語対応

Googleの対話型AI「Bard」が日本語に対応しました。Bardは、ユーザーのメッセージに応じて、詩や物語、コード、歌詞など、さまざまなコンテンツを生成することができます。また、ユーザーのコンテンツを改善または最適化することもできます。

ChatGPTやBing AIに対抗するGoogle版のAIと言えますが、学習モデルがGPTではないため、まさにライバルといえるでしょう。

以前からプレビュー版が提供されていましたが、本日から日本語にも対応したため、日本人にとってもより実用的なAIとなりました。

これは後述します。

Pixel Foldの発表

Pixelシリーズ初の折りたたみ端末「Pixel Fold」が発表されました。技術仕様は以下の通りです。

  • ディスプレイ: 内側には7.6インチ1840 x 2208のOLEDディスプレイ、外側には5.8インチ1080 x 2092のOLEDディスプレイがあります。両方とも、120Hzに対応しています。
  • チップセット: Google Tensor G2Googleが独自に開発したチップで、高速で安全なパフォーマンスと機械学習の能力を提供します。
  • メモリ: 12GBのRAMと、256GBまたは512GBの内部ストレージがあります。
  • カメラ: 背面には5000万画素のメインカメラ、1200万画素の超広角カメラ、4800万画素の望遠カメラがあります。前面には1200万画素のセルフィーカメラがあります。
  • バッテリー: 4821mAh。ワイヤレス充電とリバースワイヤレス充電に対応しています。
  • デザイン: 折りたたみ時のサイズは139.7 x 79.5 x 12.1mm、開いた時のサイズは139.7 x 158.7 x 5.8mmです。重量は283gで、防水性能はIPX8に対応しています。背面はゴリラガラスビクタス、フレームはアルミニウムです。

ということで、予定通り・リーク通りの技術仕様となっていますね。ただ、値段が 253,000円 というところで、Galaxy Fold 4よりも高いのは予想外でした。てっきりGalaxy Foldより安価でスペックはやや劣る、みたいな製品になるのかと思っていました。

個人的には、Galaxy Foldのカバーディスプレイのアスペクト比よりはマシですが、内側ディスプレイのアスペクト比があまり好みではありません。折りたたみデバイスにおいては、横長は使い勝手が良くないんですよね。縦長が理想だと思います。

スペック的にも特別優れている点はなく、Pixelのカメラ品質とOS面でのカバーに期待したいところですね。Androidが折りたたみデバイスに最適化されることによって、Galaxy Foldなどにも恩恵があると思うので楽しみです。

折りたたみスマートフォンを使っていて、奇異の目で見られている自分としても、このプロダクトで打ち切りとならず、Fold 2、Fold 3と練り込まれていくことを期待したいです。

ジェネレーティブ AIの新しいツールスイート

ジェネレーティブAIは、Googleの大規模言語モデルをベースにしています。これにより、データやテキストから新しいコンテンツや知識を生成することができます。Google CloudやGoogle Colabでも簡単に利用できます。

つまり、Microsoft 365 Copilotのようなものです。この分野において、Googleは珍しく後追いになってしまいました。

Android 14

次期のAndroid 14が発表されました。Pixel Foldにも搭載される予定です。

Android 14は、Googleの最新のモバイルオペレーティングシステムで、パフォーマンス、プライバシー、セキュリティなどが向上しています。開発者向けの機能も充実しており、Jetpack Composeやウェブビューなどが含まれています。

ただし、発表内容を見る限り、プライバシー、セキュリティ、国際化(アプリごとの言語対応)に重点が置かれており、個人的には興奮するような新機能は見られません。

「要らねえだろこれ」と思いつつも先端技術にワクワクするものをリリースしていく役が AppleAndroidAppleで推移しつつありますね。 事故検出機能とか衛星通信機能とかiPhone14のDynamic Islandとかね。少し前ならAndroidがやってた役だと思うんですが。

個人的にはジェネレーティブAIをAndroidGoogleアシスタントに統合するような動きを見せてほしいと思っています。(Appleが動き出していない内に)

Google Bardについて

さて、本題に入ります。日本語対応したGoogle Bardを早速使ってみました。 最初に、BingとGPT4に比べて、Bardがどのように優れているかを聞いてみました。

BardがBingとGPT4よりも優れている点を教えてください。

確かに、日本語の質問にも回答できるようになっています!回答内容は無難ですが、英語オンリーだった時と同じように、情報のソースは自発的に提供されません。

複数の回答案がある

印象的なのは、回答案が自動で複数表示される点です。Bardは回答内容が誤りである可能性があることを前提としており、こちらが取捨選択することを推奨しているようです。実際、この機能は便利で、何かおかしいな、と思った場合、GPTやBingAIでは再生成する必要がありましたが、Bardでは選択するだけでOKです。また、回答の生成は早く、快適です。GPT4やBingAIより遥かに早いです。

次に、Google I/O 2023についてまとめるようにお願いしました。

Google I/O 2023をまとめてください

Google I/O 2023 は、2023 年 5 月 10 日に開催された Google の年次開発者会議です。イベントはカリフォルニア州マウンテンビューのShoreline Amphitheatreで開催されました。

イベントの基調講演では、GoogleのCEOであるSundarPichaiが、Googleの最新の製品とサービスのいくつかを発表しました。これらの製品には、次のものがあります。

Googleは、次のような新しい人工知能(AI)ツールやサービスも発表しました。

  • Duet AI for Google Cloud:Google Cloudでのシステム開発を支援するAIサービス。
  • Duet AI for AppSheet:自然言語でAIと対話するだけで誰でもアプリを作成できるサービス。
  • Bard:日本語に対応した生成的AI。

Google I/O 2023は、Googleが最新の製品とサービスを発表する機会でした。また、GoogleがAIの分野での取り組みを示す機会でもありました。

ChatGPTとは異なり、Bardでは最新情報もカバーできます。ただし、回答精度はBingAIよりは劣るように感じます。

先の回答にあったPixel WatchやPixel Buds Pro2は、Google I/O 2023で公開されたわけではありません。なお、この回答には先ほどの、複数の選択肢が表示されておらず、必ずしも複数の回答が生成されるわけではないようです。

Pixel Watchは以前からある

指摘したところ、2セッションで理解してくれました。

Google Bardの立ち位置

普段の生活でも仕事でも、ChatGPT、Bing AIをフル活用している僕が、日本語対応を機にGoogle Bardを使うか?というと、答えは・・・「Yes」です。

使用してみた感覚として、Google Bardの能力は、ChatGPTとBing AIの間くらいに位置しているように感じられます。最新の情報をカバーする点ではBing AIに近く、正確性ではBing AIに劣るという印象です。ジェネレーティブな点では、GPT-4に劣ると感じました。

ただ、裏を返せば、Bing AIよりもジェネレーティブであるという特徴があります。ただのWebサイトからの引用ではない文章を生成されるため、インスピレーションを受ける用途にはBing AIのどのモードよりも優れているように感じます。

GPT-4と比べて、最新の情報もカバーしています。正確性は高く、平気な顔をして嘘をつく、頻度は低いです。(まあそれでも嘘は頻繁につきますが)

また、GPT-4と比べて、最新の情報もカバーしているので、正確性が高く、嘘をつく頻度も低いです(もちろん、比較して、という意味で全ての対話型AIが嘘を頻繁につきますが)。

バランスがとれていると感じる一方で、インターフェースや機能などは後追いで後進的であるため、今後更に洗練されていくことが期待されます。

自分としては、ChatGPTでは得られない最新情報を得たいとき、Bing AIでのWebサイトからのただの引用を避けたいような用途の場合には、Google Bardは充分に実用的だと感じました。

まとめ

AI メリット デメリット
Bing AI 正確性が高く、情報の信頼性が高い。精度の高い情報を提供することができる。 新しいコンテンツの生成には向いていない。
Chat GPT ジェネレーティブであり、新しいコンテンツを生成することができる。 正確性とリアルタイム性には課題がある場合がある。
Google Bard Bing AIよりもジェネレーティブであり、GPT-4よりも最新の情報をカバーすることができる。 正確性ではBing AIよりも劣る場合がある。また、GPT-4よりも生成力に劣る場合がある。

僕はこれからこんな運用をしたいと思います。

まず、Bing AIを使用して情報を精査します。Web検索に近いため、比較的正確な情報を多く得られます。情報を確認して解決できる場合は、他のAIを使用せずに問題を解決します。

ただし、Bing AIで検索される偏ったWebサイトやアフィリエイトサイトの情報では、客観的な観点で見ることができず、完全に引用された文章だけの場合には困ることがあります。

その場合は、ChatGPTを使用します。ChatGPTはジェネレーティブなので、インスピレーションを受けたい場合や、定型的な疑問や質問、解決策が確定している技術用語などの相談やバグ発見に強みがあります。これで問題を解決できる場合は、他のAIを使用せずに問題を解決します。

ただし、ChatGPTは2021年以前の情報しか持っていないため、回答が得られない場合があります。

この場合、Google Bardを使用します。Google Bardは、ジェネレーティブさと情報の最新性を兼ね備えています。複数の選択肢から正しい情報を精査できます。ただ、現在はまだ未熟なので、できるだけ使用を控える方が理想的なイメージです。

こういう感じ(よく見たら間違ってるけどもういいか)
また、文章作成には「Notion」に搭載された「Notion AI」や、簡単な調べ物やWebサイトでのGPT連携に「Sider - ChatGPT Sidebar with GPT-4」というChrome拡張機能を活用しています。

AIに依存してしまっていますが、仕事もプライベートも効率が飛躍的に向上しています。仕事に対するモチベーションも高まり、使ったことのないネットワークアプライアンスに対するバグ対応や、英語フォーラムでこっそり解決している解決策などについても、すぐに情報を引き出すことができるため、楽しく作業することができています。

今後も、言語処理モデルを用いた対話型AIに期待し、情報を追い続けたいと思います

(実ははてなブログ上で、Mermaidでフローチャートを書きたいだけの記事だったけど、スクリプトを埋め込んでも「Syntax error」でダメでした。何がダメなのかまた調べよう。)