VoiceAssistantRobot

ハードウェア

本体: RaspberryPi4 ModelB 4GB
パンチルトハット: Pimoroni Pan-Tilt HAT
カラーLEDスティック: Adafruit NeoPixel Stick 8
熱対策(オプション) GeeekPi Fan Hat for Raspberry Pi 4 Model B
気温・湿度・照度・水分計測（オプション）: WioNode
USBマイク・USBスピーカー: RaspberryPiで使用可能なものを適宜使用してください

ソフトウェア

OS: Raspberry Pi OS (64-bit) / Raspberry Pi 設定チートシート
Python3.9.2: requirements
音声認識: Vosk / vosk-model-small-ja-0.22
音声発話: Aques Talk Pi / AquesTalk Installer
画像処理: OpenCV 64bit 4.5.5 / Install OpenCV on Raspberry 64 OS
- 顔認識モデル: yunet.onnx
- 顔識別モデル: face_recognizer_fast.onnx
- 性別識別モデル: gender_net.caffemodel / gender_deploy.prototxt
- 年令識別モデル: age_net.caffemodel / age_deploy.prototxt
- 物体識別モデル: frozen_inference_graph.pb / ssd_mobilenet_v3_large_coco_2020_01_14.pbtxt / coco.names
モーター制御・LED制御: pantilt-hat

Note Voskモデルはリンク先よりダウンロードしてください。

AquesTalkPiは利用許諾を確認の上ダウンロードしてください。

OpenCVはyunet.onnxを使用する場合、バージョン4.5.4以上が必要です。また4.8以降は別のモデルが必要になります。

Raspberry Pi OSにOpenCVを入れる際、ソースからビルドが必要です。リンク先のサイトに行き、指示に従って進めてください。サイトの運営者がインストール用のスクリプトを提供しているので、そちらを活用してください。

画像認識用のDNNモデルは各リンク先よりダウンロードしたものです。

リビングの気温・湿度・照度・鉢植えの水分データの取得にはSeeed日本法人が用意した日本のサーバーを使用しています（日本にWioサーバーを設置しました）。サーバーのアクセストークンは.envファイルに記述しています。

仕組み

音声発話（ユーザー）

ユーザーの音声発話は、RaspberryPiに接続したUSBマイクから得た音声をPythonのオーディオライブラリPyAudioを使ってストリーミングします。

音声認識（Vosk）

ストリーミングデータを音声認識エンジンVoskを使いテキストに変換します。

コマンド実行（analyze関数）

独自関数analize()により、入力されたテキストが事前に登録されたコマンドと一致するか、条件分岐により振り分けを行います。

実験用に登録した実行コマンドは以下の通りです

日時データ取得（datetimeモジュール）
WioNodeからのデータ取得(requestsモジュールを利用したGETメソッド)
顔認証・物体認識（OpenCVとDNNモデルを使ったリアルタイム顔認識、物体認識）
サーボモーター・LEDライト制御（PanTiltHATライブラリを使用）

コマンドの実行と合わせて、ロボットの回答は事前に記述しておきます。

音声合成（Aques Talk Pi）

各コマンドの回答テキストはAques Talk Piを使って音声合成を行います。Pythonのsubprocessを使い、合成音声されたwavファイルをパイプでつなぎaplayで再生出来るようになっており、記述がシンプルに行えます。

合成音声発話（ロボット）

aplayで再生されたwavファイルをスピーカーで再生します。

使い方

各ライブラリをインポート後、必要なモデルをダウンロードしディレクトリに配置します。ユーザー情報の登録は

python bot_face_data_creator.py

を実行し、ユーザーID、ユーザー名、興味のあることを登録し、顔認証用の写真を撮影してください。年令・性別は自動で判別されますが、かけ離れている場合はdata/user_data.jsonを手動で修正することも可能です。

data/command_data.jsonでウェイクワードを設定できますので、好みのものに変更可能です。同様に終了ワードやコマンドワードも自由に変更できます。

python main.py

で実行してください。ctrl + cでウェイクワード待機のループが終了します。

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
data		data
dnn_models		dnn_models
face_dataset		face_dataset
image		image
.env		.env
.gitattributes		.gitattributes
LICENSE		LICENSE
README.md		README.md
bot_analyzer.py		bot_analyzer.py
bot_face_data_creator.py		bot_face_data_creator.py
bot_face_track_recognizer.py		bot_face_track_recognizer.py
bot_listener.py		bot_listener.py
bot_motor_controller.py		bot_motor_controller.py
bot_object_detecter.py		bot_object_detecter.py
bot_voice_synthesizer.py		bot_voice_synthesizer.py
bot_wio_node.py		bot_wio_node.py
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

VoiceAssistantRobot

ハードウェア

ソフトウェア

仕組み

音声発話（ユーザー）

音声認識（Vosk）

コマンド実行（analyze関数）

音声合成（Aques Talk Pi）

合成音声発話（ロボット）

使い方

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

PonDad/VoiceAssistantRobot

Folders and files

Latest commit

History

Repository files navigation

VoiceAssistantRobot

ハードウェア

ソフトウェア

仕組み

音声発話（ユーザー）

音声認識（Vosk）

コマンド実行（analyze関数）

音声合成（Aques Talk Pi）

合成音声発話（ロボット）

使い方

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages