, ,

この曲なに?が面白い

Google Pixel 8を使い始めてからひと月少々が過ぎました。使っている中でストレスらしきものを感じる場面は皆無です。AQUOS sense7にストレスがそれほどあったわけではないのですが、操作へのキビキビした反応など、明らかな差は感じます。さすがに1年型落ちとはいえひとクラス上の機種に乗り換えているわけですから、このあたりは当たり前です。

AQUOS sense7を使っていた頃と比べて、Pixel 8らしさを感じる場面はいくつかありますが、いちばん面白いことの一つが「この曲なに?」機能です。Pixel 8は常時周辺の音を聴いていて、ロック画面にその場で流れている楽曲の曲名・アーティストを表示します。これは、画面を常時表示モードにしているときでも、指紋認証のマークが出るちょっと下のあたりに表示されるようになっていて、ホントに「いつでも」聴いていることがわかります。

設定画面の説明によると、「この曲なに?」機能は「デバイスに保存された曲データベースを使って音楽を認識」するのだそうです。わざわざ「Googleに送信されることは一切ありません」と断りを入れていることからしても、基本的には自動認識の処理も含めてすべてPixel 8の端末内で完結しているようです。

「この曲なに?」機能はクラウドを使って「強化」できるようになっていますが、このときにもGoogleに送られるのは「短いデジタル音声フィンガープリント」のみなのだとか。おそらく、Googleのサーバーに膨大な曲を「聴かせる」ことで特徴的な断片を取り出し、さらにAIが判定しやすい形に処理した小さなデータを指して「フィンガープリント(指紋)」と呼んでいるのだと思います。

Googleに送るためのフィンガープリントは、ナマの音データからPixel 8が生成しなくてはなりません。また、通信せずにPixel 8内だけで判別するときにも、フィンガープリントを照合しているはずです。当然これらの作業を担うのはプロセッサー・Tensor G3に内蔵されたNPU(GoogleではTPUと呼びますが)でしょう。AIに関してもちょっと囓ったことがあるワタシとしては、どんなことをすればこの機能が実現できるのか?は何となくイメージできるのですが、それがこんな小さなスマートフォンの中だけで実現できるようになっているとは、感慨深いものがあります。


楽曲の認識精度自体は結構高いと感じています。静かな環境で音楽を鑑賞している状況なら、まず曲名は間違えません。ただ、曲が判別できるまでの時間を見ると、数秒から数分まで、結構バラツキが大きいと感じます。フィンガープリントが特徴として取り出した断片の位置が影響しているのではないかな?と思っています。何万曲という曲を端末内に抱えるデータベースのみで判別しようとするのですから、個々の曲は相当短い断片になっているはずです。

今どきのJ-POPなどはだいたい3分以内に終わってしまいますが、それでも曲が終わるまで認識できないことはまずありません。こうした曲たちは、最初の数秒のインパクトを重視して、そこにエネルギーを注ぎ込んだ構成にしている曲が多いせいか、比較的速く認識できていることが多いです。それこそテレビCMに流れている曲でも認識するほどです。

「この曲なに?」が認識した曲の履歴は、後から確認することができるようになっています。これを見ると、意識して聴いている曲以外にも結構認識しているのがわかります。

例えば、隣の部屋でお義父さんが見ているスカパー!の音楽チャンネルの歌謡曲が、こっそり割り込んでいたりします。リビングのテレビよりもずいぶん小さな音に聞こえているはずなのに、大したものです。あとは、テレビ番組のBGMでちょっと使われているような曲でも、拾って認識していることがあります。

平日は毎日のように、午後12時30分過ぎにAI(「えーあい」ではなく歌手の「あい」さん)の「アルデバラン」が、45分過ぎにB’zの「イルミネーション」が記録されていました。職場の昼休みにテレビでNHK総合が受信されているのが、ハッキリわかりますね(笑)。行動履歴とも言えるわけで、これが常時Googleに送信されていたとしたら、確かに怖いです。

なお、Android標準搭載の「Google」アプリの中には、「楽曲検索」という機能もあります。こちらはもっと高度なシステムになっていて、テレビなどから流れている曲どころか、鼻歌からでも曲の候補を探してくれます。試しに自宅にあったオルゴールを聴かせてみましたが、これも一発で正解を見つけ出しました。さすがにこちらはクラウドサーバーの力を借りた仕事になっていますが、タイヘンな時代になったものです。


「この曲なに?」は、いかにもAIらしさを感じる機能の一つと言えるわけですが、コンピューターが何かしら考えて回答を返しているように見えるものは何でも「AI」と呼ばれ、それが大量に巷に溢れかえるようになりました。とはいえ、実際にやっていることは、巨大なデータベースからの検索作業ということが多く、本当に「考えて」いるのか?となると疑問も多いです

いかにも「考えて」いそうな文章や画像を生成するAIだって、実際には既存のモノをベースに「自然につながりそうなものを適当につなげているだけ」という説明でもほぼ間違いありません。とはいえ、人間が普段から行っている創作活動だって、実はやっていることはそう変わらないのでは?と思ったりもするわけで…。AIって何だろう?というネタだけでも、もっと語れそうですが、それはまた気が向いたときにしましょう。



コメント

コメントを残す

1回のみ
毎月

記事を気に入っていただけましたか?よろしければ、今後のSSK Worldの活動に向けてご支援をお願いいたします。

SSK Worldを「面白い!」と思っていただける方がありましたら、今後の当サイトの活動継続に向けて、ご支援をお願いいたします。

金額を選択

¥100
¥500
¥1,000
¥500
¥1,000
¥2,000

またはカスタム金額を入力

¥

ご協力いただき、ありがとうございます。

ご協力いただき、ありがとうございます。

送金送金

タグクラウド

2年縛り Amazon Android BESS Bluetooth CF-B5 CF-R2 CF-R4 CF-RZ4 CF-SV8 DIY iPhone LTE Movable Type Nintendo Switch NuAns NEO Reloaded SNS SSD USB PD Webサイト Webブラウザー Windows 10 Windows XP カメラ カーナビ クルマ ショップ ステップワゴンスパーダ スマートフォン バージョンアップ ブログ マラソン レッツノート ログハウス 中日ドラゴンズ 伊豆 倉庫 健康 写真 合唱 塗装 家族 携帯電話 旅行 日本プロ野球 映画 暮らし 東京 槇原敬之 浜松 無線LAN 自作PC 芝生 花壇 薪ストーブ 薪割り 記念日 野球 音楽 食べる