Monthly FB NEWS 月刊FBニュース 月刊FBニュースはアマチュア無線の電子WEBマガジン。ベテランから入門まで、楽しく役立つ情報が満載です。

FB LABO ~エレクトロニクス研究所~

近未来の運用を提案するAI Communication BOX

月刊FB NEWS編集部

ハムフェア2018のアイコムブースでは、「近未来の運用スタイル」として、音声で無線機をコントロールするスタンドアロン型の“AI Communication BOX”と、クラウド型の”HF transceiver powered by Alexa”(AIスピーカーAmazon Echoを使ったシステム)が展示されていた。このような未来を見据えた展示は初めてだったこともあり、多くの来場者が足を止め、実際に音声による操作を試すなど、大いに注目を集めていた。

そこで、月刊FB NEWSでは、“AI Communication BOX”と、”HF transceiver powered by Alexa”について、さらに詳しい話を聞くために、開発/研究が行われているアイコム(株)ならやま研究所を訪問した。


奈良県奈良市にあるアイコム(株)ならやま研究所

スタンドアロン型 “AI Communication BOX”

AI Communication BOXには、音声認識エンジンJulius(c)と音声合成ソフトMMDAgent(c)が組み込まれており、音声によりCI-V(アイコムのリモートコントロールシステム)を通して無線機を操作する仕組みとなっている。音声認識エンジンには、あらかじめ単語や基本的な文法を登録しておき、CI-Vコマンドに関連付けることで、音声による無線機制御を実現している。また、音声合成ソフトによるアシストも可能となっている。


AI Communication BOXと無線機をUSB(CI-V)で接続している

開発担当者のN研究員にAI Communication BOX開発のポイントや苦労した点を聞いてみた。
「一番苦労したのはハード的には、マイク選びと感度調整です。デザイン面も重視したかったので、フラットな天面構造やシンプルな筐体構造を保ったまま内蔵マイクの装着を検討しました。しかし、どうしても天面により音声がさえぎられ、マイクの入力レベルが低くなってしまい思うように動作しませんでした。そのため、デザインを崩さないように隙間を作り、音声がマイクに届くような検討や、最適なマイクを採用するため、コンデンサマイク、デジタルマイク、アナログマイク、会議用のマイク、アレーマイクなど、20以上のマイクを試しました。これらの検討により、ハムフェア会場で展示したデモ機に最適なマイクを内蔵し、さらに会場の騒音下でも動作するように、念のために指向性の強いスタンドマイクロホンSM-50も外部マイクとして用意しました。それから、ちょっとした工夫として、3色LEDを使用し、視覚的にも動作状態を確認できるようにしました」

さらに、ソフト面では音声の認識の精度向上に苦労されたそうだ。今後の課題については、
「音声認識の精度ですが、音声認識エンジンの基本性能は90%以上あります。しかし、プログラムの作り方や、ハムフェア会場など騒音がある場所の外部環境により、認識精度は下がってしまいます。今後はさらなる音声認識率の向上とCI-Vコマンドの追加、さらにはBluetooth機器による操作も考えていきたいと思います」とのことだ。

■”AI Communication BOX”による無線機操作

なお、スタンドアロン型の特長は下記の通りとなっている。
・音声認識エンジンにより、詳細な発話登録が可能
・音声合成ソフトにより、自由な対話表現が設定可能
・ネットワーク環境が不要で、回線の状況に左右されないため安定した動作が可能
・セキュリティに配慮する必要がない

ハムフェアの会場では、「いつ発売ですか」、「モービルで使えたら便利ですね」、「なまりがあっても大丈夫ですか」などの質問があったそうだ。

クラウド型 ”HF transceiver powered by Alexa”

市販のAIスピーカーAmazon Echo経由で、クラウドサービスAmazon Alexaに音声を送り、そこで音声を認識する。アイコムのサーバは、その認識結果からCI-Vコマンドを選択し、Raspberry PiがCI-Vコマンドで無線機を操作するようになっている。

クラウド型の開発を担当したY研究員に開発のポイントをお聞きした。
固定IPアドレスの契約、ポートフォワーディングを不要にするため、専用サーバとRaspberry Pi間の通信を工夫しました。スタンドアロン型とは異なり、音声認識についてはクラウドのAmazon Alexaに依存します。一番大変だったのは専用サーバとコンピュータ(Raspberry Pi)との協調です。コンピュータの電源を入れると自動的に専用サーバとハンドシェイクし、完了後はサーバから任意のタイミングでデータを送信できるようになるのですが、この双方向の通信を協調させる作業に苦労しました」

現在の課題と今後の開発についてもお話を聞いた。
「現時点での問題として、スタンドアロン型と比較すると、指令が長くなることがあります。スタンドアロン型の場合は“周波数を変更”→“値をお願いします”→“7MHz”で周波数を変更できますが、
クラウド型の場合“アレクサ 無線機操作で 周波数を 7MHzに設定して”という指令になります。
今後はクラウド型でも、もう少し指令が短くて済むようにしたいと思います。また、インターネットを経由するため、どうしても遅延が生じてしまうので、通信の効率化を図ることが今後の課題の1つです」


左からAmazon Echo、Raspberry Pi、IC-7610

■”HF transceiver powered by Alexa”による無線機操作

なお、クラウド型の特徴は下記の通りになっている。
・Amazon Echoの代わりにスマートフォンからも操作できる
・認識精度が高いAmazonのサービスを利用できる
・音声認識エンジン、音声合成ソフトを用意する必要がない

今後についてN研究員によると「商品化は考えていませんが、今後もこのような研究は続けていきます。来年のハムフェアでも、何か新しいものを発表できればと思っています。ご期待ください」とのことだった。来年以降も、AIやIoT技術を応用した展示やデモンストレーションが行われるとのことなので、わくわくしながら待ちたい。


写真右がハムフェアで展示されたAI Communication BOX、左が新しいマイクを搭載した試作機。
ハムフェア後も研究は続けられていた

[音声認識]
・「大語彙連続音声認識エンジン Julius」
Copyright (c) 1991 京都大学 河原研究室
Copyright (c) 1997 情報処理振興事業協会(IPA)
Copyright (c) 2000 奈良先端科学技術大学院大学 鹿野研究室
Copyright (c) 2005 名古屋工業大学 Julius開発チーム
・「Juliusディクテーションキット」
Copyright (c) 1991 京都大学 河原研究室
Copyright (c) 2005 名古屋工業大学 李研究室

[音声合成]
・「The Toolkit for Building Voice Interaction Systems "MMDAgent"」
Copyright (c) 2009  Nagoya Institute of Technology Department of Computer Science
・「MMDAgent HTS Voice "Mei"」

FB LABO ~エレクトロニクス研究所~ バックナンバー

2018年10月号トップへ戻る

次号は 12月 1日(木) に公開予定

サイトのご利用について

©2024 月刊FBニュース編集部 All Rights Reserved.