Add configurable input device selection

2026-03-01 12:49:39 +03:00
parent a87840c78d
commit 7ca6958488
6 changed files with 50 additions and 2 deletions
--- a/app/audio/stt.py
+++ b/app/audio/stt.py
@@ -128,13 +128,16 @@ class SpeechRecognizer:
    def _get_stream(self):
        """Открывает аудиопоток PyAudio, если он еще не открыт."""
        if self.stream is None:
+            device_index, device_info = get_audio_manager().resolve_input_device()
            self.stream = self.pa.open(
                rate=SAMPLE_RATE,
                channels=1,
                format=pyaudio.paInt16,
                input=True,
+                input_device_index=device_index,
                frames_per_buffer=4096,
            )
+            print(f"🎙️ STT input: {device_info.get('name', 'unknown')}")
        return self.stream

    async def _process_audio(
--- a/app/audio/wakeword.py
+++ b/app/audio/wakeword.py
@@ -54,14 +54,18 @@ class WakeWordDetector:
                pass

        # Открываем поток с параметрами, которые требует Porcupine
+        device_index, device_info = get_audio_manager().resolve_input_device()
        self.audio_stream = self.pa.open(
            rate=self.porcupine.sample_rate,
            channels=1,
            format=pyaudio.paInt16,
            input=True,
+            input_device_index=device_index,
            frames_per_buffer=self.porcupine.frame_length,
        )
        self._stream_closed = False
+        device_name = device_info.get("name", "unknown")
+        print(f"🎙️ Wake word input: {device_name}")

    def stop_monitoring(self):
        """Явная остановка и закрытие потока (чтобы освободить микрофон для других задач)."""
--- a/app/core/audio_manager.py
+++ b/app/core/audio_manager.py
@@ -1,6 +1,8 @@
 import pyaudio
 import threading

+from .config import AUDIO_INPUT_DEVICE_INDEX, AUDIO_INPUT_DEVICE_NAME
+

 class AudioManager:
    _instance = None
@@ -17,6 +19,35 @@ class AudioManager:
    def get_pyaudio(self):
        return self.pa

+    def resolve_input_device(self):
+        """
+        Возвращает индекс и информацию о входном устройстве.
+        Если индекс/имя не заданы в .env, используем системное default устройство.
+        """
+        if AUDIO_INPUT_DEVICE_INDEX is not None:
+            info = self.pa.get_device_info_by_index(AUDIO_INPUT_DEVICE_INDEX)
+            if info.get("maxInputChannels", 0) <= 0:
+                raise ValueError(
+                    f"AUDIO_INPUT_DEVICE_INDEX={AUDIO_INPUT_DEVICE_INDEX} не является входным устройством."
+                )
+            return AUDIO_INPUT_DEVICE_INDEX, info
+
+        if AUDIO_INPUT_DEVICE_NAME:
+            wanted = AUDIO_INPUT_DEVICE_NAME.lower()
+            for index in range(self.pa.get_device_count()):
+                info = self.pa.get_device_info_by_index(index)
+                if info.get("maxInputChannels", 0) <= 0:
+                    continue
+                name = str(info.get("name", ""))
+                if wanted in name.lower():
+                    return index, info
+            raise ValueError(
+                f"Не найдено входное устройство по AUDIO_INPUT_DEVICE_NAME={AUDIO_INPUT_DEVICE_NAME!r}."
+            )
+
+        default_info = self.pa.get_default_input_device_info()
+        return None, default_info
+
    def cleanup(self):
        if self.pa:
            self.pa.terminate()
--- a/app/core/config.py
+++ b/app/core/config.py
@@ -75,6 +75,12 @@ PORCUPINE_SENSITIVITY = float(os.getenv("PORCUPINE_SENSITIVITY", "0.8"))
 # Частота дискретизации для микрофона (стандарт для распознавания речи)
 SAMPLE_RATE = 16000
 CHANNELS = 1
+# Явный выбор входного устройства. Можно задать либо индекс, либо часть имени.
+_audio_input_device_index = os.getenv("AUDIO_INPUT_DEVICE_INDEX", "").strip()
+AUDIO_INPUT_DEVICE_INDEX = (
+    int(_audio_input_device_index) if _audio_input_device_index else None
+)
+AUDIO_INPUT_DEVICE_NAME = os.getenv("AUDIO_INPUT_DEVICE_NAME", "").strip() or None

 # --- Настройка времени ---
 # Устанавливаем часовой пояс на Москву, чтобы будильник работал корректно