Google Pixel 8を使い始めてからひと月少々が過ぎました。使っている中でストレスらしきものを感じる場面は皆無です。AQUOS sense7にストレスがそれほどあったわけではないのですが、操作へのキビキビした反応など、明らかな差は感じます。さすがに1年型落ちとはいえひとクラス上の機種に乗り換えているわけですから、このあたりは当たり前です。
AQUOS sense7を使っていた頃と比べて、Pixel 8らしさを感じる場面はいくつかありますが、いちばん面白いことの一つが「この曲なに?」機能です。Pixel 8は常時周辺の音を聴いていて、ロック画面にその場で流れている楽曲の曲名・アーティストを表示します。これは、画面を常時表示モードにしているときでも、指紋認証のマークが出るちょっと下のあたりに表示されるようになっていて、ホントに「いつでも」聴いていることがわかります。


設定画面の説明によると、「この曲なに?」機能は「デバイスに保存された曲データベースを使って音楽を認識」するのだそうです。わざわざ「Googleに送信されることは一切ありません」と断りを入れていることからしても、基本的には自動認識の処理も含めてすべてPixel 8の端末内で完結しているようです。
「この曲なに?」機能はクラウドを使って「強化」できるようになっていますが、このときにもGoogleに送られるのは「短いデジタル音声フィンガープリント」のみなのだとか。おそらく、Googleのサーバーに膨大な曲を「聴かせる」ことで特徴的な断片を取り出し、さらにAIが判定しやすい形に処理した小さなデータを指して「フィンガープリント(指紋)」と呼んでいるのだと思います。
Googleに送るためのフィンガープリントは、ナマの音データからPixel 8が生成しなくてはなりません。また、通信せずにPixel 8内だけで判別するときにも、フィンガープリントを照合しているはずです。当然これらの作業を担うのはプロセッサー・Tensor G3に内蔵されたNPU(GoogleではTPUと呼びますが)でしょう。AIに関してもちょっと囓ったことがあるワタシとしては、どんなことをすればこの機能が実現できるのか?は何となくイメージできるのですが、それがこんな小さなスマートフォンの中だけで実現できるようになっているとは、感慨深いものがあります。

楽曲の認識精度自体は結構高いと感じています。静かな環境で音楽を鑑賞している状況なら、まず曲名は間違えません。ただ、曲が判別できるまでの時間を見ると、数秒から数分まで、結構バラツキが大きいと感じます。フィンガープリントが特徴として取り出した断片の位置が影響しているのではないかな?と思っています。何万曲という曲を端末内に抱えるデータベースのみで判別しようとするのですから、個々の曲は相当短い断片になっているはずです。
今どきのJ-POPなどはだいたい3分以内に終わってしまいますが、それでも曲が終わるまで認識できないことはまずありません。こうした曲たちは、最初の数秒のインパクトを重視して、そこにエネルギーを注ぎ込んだ構成にしている曲が多いせいか、比較的速く認識できていることが多いです。それこそテレビCMに流れている曲でも認識するほどです。



「この曲なに?」が認識した曲の履歴は、後から確認することができるようになっています。これを見ると、意識して聴いている曲以外にも結構認識しているのがわかります。
例えば、隣の部屋でお義父さんが見ているスカパー!の音楽チャンネルの歌謡曲が、こっそり割り込んでいたりします。リビングのテレビよりもずいぶん小さな音に聞こえているはずなのに、大したものです。あとは、テレビ番組のBGMでちょっと使われているような曲でも、拾って認識していることがあります。
平日は毎日のように、午後12時30分過ぎにAI(「えーあい」ではなく歌手の「あい」さん)の「アルデバラン」が、45分過ぎにB’zの「イルミネーション」が記録されていました。職場の昼休みにテレビでNHK総合が受信されているのが、ハッキリわかりますね(笑)。行動履歴とも言えるわけで、これが常時Googleに送信されていたとしたら、確かに怖いです。



なお、Android標準搭載の「Google」アプリの中には、「楽曲検索」という機能もあります。こちらはもっと高度なシステムになっていて、テレビなどから流れている曲どころか、鼻歌からでも曲の候補を探してくれます。試しに自宅にあったオルゴールを聴かせてみましたが、これも一発で正解を見つけ出しました。さすがにこちらはクラウドサーバーの力を借りた仕事になっていますが、タイヘンな時代になったものです。
「この曲なに?」は、いかにもAIらしさを感じる機能の一つと言えるわけですが、コンピューターが何かしら考えて回答を返しているように見えるものは何でも「AI」と呼ばれ、それが大量に巷に溢れかえるようになりました。とはいえ、実際にやっていることは、巨大なデータベースからの検索作業ということが多く、本当に「考えて」いるのか?となると疑問も多いです。
いかにも「考えて」いそうな文章や画像を生成するAIだって、実際には既存のモノをベースに「自然につながりそうなものを適当につなげているだけ」という説明でもほぼ間違いありません。とはいえ、人間が普段から行っている創作活動だって、実はやっていることはそう変わらないのでは?と思ったりもするわけで…。AIって何だろう?というネタだけでも、もっと語れそうですが、それはまた気が向いたときにしましょう。
コメントを残す