スマートスピーカーの仕組みがなんとなく分かった

スマートスピーカーがあれば、情報の検索や聞きたい音楽の再生、そして家電を音声で操作することができるようになります。
これってどういう仕組みになっているのか不思議ですね。

そこで、話しかけてから応答するまで、どのような仕組みか調べてみたら結構面白かったので紹介したいと思います。

命令が実行されるまでの流れ

まず、「明日の天気は?」と話しかけてから、答えるまでのザックリした流れでみていきましょう。

スマートスピーカー→認識作業→情報処理→データ処理→認識作業→スマートスピーカー

この様に見るとシンプル。でも、色々な過程を経ての流れである事は言うまでもありません。
それでは、もう少しだけ掘り下げていきます。

スマートスピーカーの仕組み

ただ置いてあるだけに見えるスマートスピーカー。
ネットを利用してデータのやり取りや処理を行うので、検索するにも家電を操作するにもネットワークが必要となります。
つまり、スマートスピーカー自体で情報をあれこれ処理して実行している訳ではありません。

それでは、スマートスピーカーの仕組みはどうなっているのでしょうか。

・マイク
・コンピューター
・スピーカー

と大きく分けると、この3つで構成されています。

スマートスピーカーの役割とは

スマートスピーカーの大きな役割は、

①音声を聞き取ってその音声ファイルを生成し音声認識を行うサーバに送信
➁処理されたデータを音声化して応答する

ということ。

ただ音を収集しているだけに見えるでしょうが、ユーザーの声を聞き分けたり、OK Googleなどのコマンドを認識、そして音声のデータ化など他にも色々処理を行っています。

音声認識作業の仕組み

次に音声データとしてデータ化されたもの(ここで言えば「明日の天気は」)はサーバーに送信されて、何をすればいいかの認識作業に入ります。
これは「明日の天気は」とは、どういう意味で、どのサービスに送れば処理できるのかを判断してデータ化する作業です。

流れで言えば、認識作業→情報処理にあたる過程にあたります。

この音声を認識する作業が、正確に応答するまでの一番重要な作業となります。
認識処理の一言で片づけていますが、こちらもこんな単純ではなく、音声を認識するための色々な作業を経ています。
この認識作業の性能が、スマートスピーカーの実力を示すといってよいでしょう。

主なスマートスピーカーと認識技術

Google home Amazon echo LINE Clova Apple HomePod
Google home アシスタント Alexa Clova siri

スマートスピーカーは、この中のどの認識技術を採用するかで能力に差が出たり、出来る事・出来ない事が変わってくる訳です。

作業処理からスマートスピーカーまでの仕組み

音声が認識され、どの様なデータ処理をするかデータ化されると、その処理が出来る適切なサービスに送られそこで処理されます。

流れで言えば、データ処理→認識作業→スマートスピーカーにあたる作業です。

「明日の天気は」というデータが、天気予報サービスへ送られ処理されます。そして、処理されたデータ、ここで言う「明日の天気は晴れ。最高気温23℃、最低気温18℃」などの情報を認識の方に戻します。

認識作業まで戻ってきたデータは、用意されている対話モデルに合わせて音声データ化します。
これで音声データに戻った質問の答えは、スマートスピーカーで再生されます。

家電を操作するまでの流れ

ここまで質問に対して返答するまでの流れを見てきましたが、家電を操作する場合は、もう1つの過程が必要となります。
では、「テレビをつけて」と話しかければ、TVの電源がONになるまでの流れでみていきましょう。

スマートスピーカー→認識作業→情報処理
→データ処理→認識作業→スマートスピーカー
→データ処理→スマート家電

まず、「テレビを操作しました」など、返答までの流れは先ほどと全く同じ。
「テレビをつけて」が音声データとなり、認識サービスでデータ化され適切なサービスへ送信。そこで処理されたデータが返ってきて再び音声データとなりスマートスピーカーで再生されます。

もう一つは、スマート家電を操作する過程です。
家電操作の命令は、自宅のルーターからWi-Fi経由で家電に送信しています。
つまり、ルーターは返答のための音声データはスマートスピーカーへ、家電を操作するデータは家電へ別々に送信している事になります。
スマートスピーカーから指令を出している訳ではないのですね。

この事から、スマートスピーカーで操作する家電は、ネットにつながるスマート家電である必要があるのも納得です。
※Clovaの場合、家電に接続する専用の赤外線リモコンのみでの操作。

赤外線で家電を操作

家電を操作するためにルーターからWi-Fi経由でスマート家電へ命令が出ていることが分かりました。
ただこれだと買い替えなければいけません。
そこでリモコンと同じ赤外線で操作できるスマートリモコンを利用する方法もあります。

これは、ルーターから送られる命令を直接家電にではなくスマートリモコンへ送信。スマートリモコンから赤外線で操作する仕組みです。

流れで言えば、データ処理→スマートリモコン→スマート家電です。

ルーターと家電の間にスマートリモコンを設置すればいいだけですから、家電を買い替えせずにスマートリモコンの購入だけで済みますね。

スマートリモコンと言っても、いろいろあるので、こちらの記事を参考にしてください。

赤外線の家電にも!Google home対応スマートリモコンの比較
Google homeなどのスマートスピーカーで家電を操作する場合、対応のスマート家電でなければ操作できないと思っている方も多いようです。 しかし、スマートリモコンがあれば、自宅の家電も声で操作できるようになります。 これで近くにリ...

まとめ

今回はかなり大まかな仕組みを紹介しましたが、これだけでも幾つもの処理を行っている事が分かりました。
もっと深く知りたい方は、「スマートスピーカー 自作」などで検索するとより仕組みが分かると思います。

現時点では、Googleの音声認識が優れているといわれていますが、スマートスピーカーによって「できる・できない」があり、使えるサービスにも違いがあります。選ぶときは、何ができるかに注目して、お好みのものを選んでみてください。