Фикс произношения дат и температуры + wheather -лишние файлы

This commit is contained in:
2026-01-10 23:50:02 +03:00
parent 3818f0ad22
commit 8f44fd2460
10 changed files with 295 additions and 82 deletions

View File

@@ -20,6 +20,8 @@ from ..core.config import TTS_SPEAKER, TTS_EN_SPEAKER, TTS_SAMPLE_RATE
# Подавляем предупреждения Silero о длинном тексте (мы сами его режем) # Подавляем предупреждения Silero о длинном тексте (мы сами его режем)
warnings.filterwarnings("ignore", message="Text string is longer than 1000 symbols") warnings.filterwarnings("ignore", message="Text string is longer than 1000 symbols")
_EN_WORD_RE = re.compile(r"[A-Za-z][A-Za-z0-9'-]*")
class TextToSpeech: class TextToSpeech:
"""Класс синтеза речи с поддержкой прерывания.""" """Класс синтеза речи с поддержкой прерывания."""
@@ -109,19 +111,52 @@ class TextToSpeech:
return [c for c in chunks if c] return [c for c in chunks if c]
def speak(self, text: str, check_interrupt=None, language: str = "ru") -> bool: def _split_mixed_language(self, text: str) -> list[tuple[str, str]]:
""" """
Основная функция: генерирует аудио и воспроизводит его. Разбивает текст на сегменты русского и английского текста.
Английские слова (латиница) будут озвучены английской моделью.
Args:
text: Текст для озвучки.
check_interrupt: Функция, возвращающая True, если надо прерваться (например, check_wakeword_once).
language: "ru" или "en".
Returns:
True, если договорил до конца.
False, если был прерван.
""" """
matches = list(_EN_WORD_RE.finditer(text))
if not matches:
return [(text, "ru")]
segments = []
idx = 0
for match in matches:
if match.start() > idx:
segments.append((text[idx : match.start()], "ru"))
segments.append((match.group(0), "en"))
idx = match.end()
if idx < len(text):
segments.append((text[idx:], "ru"))
# Склеиваем соседние сегменты и прикрепляем чистую пунктуацию к предыдущему.
merged = []
for segment, lang in segments:
if not segment:
continue
if not any(ch.isalnum() for ch in segment):
if merged:
merged[-1] = (merged[-1][0] + segment, merged[-1][1])
else:
merged.append((segment, lang))
continue
if merged and merged[-1][1] == lang:
merged[-1] = (merged[-1][0] + segment, lang)
else:
merged.append((segment, lang))
if merged and not any(ch.isalnum() for ch in merged[0][0]) and len(merged) > 1:
merged[1] = (merged[0][0] + merged[1][0], merged[1][1])
merged = merged[1:]
return merged
def _speak_single_language(
self, text: str, check_interrupt=None, language: str = "ru"
) -> bool:
"""Озвучивание текста одной моделью языка."""
if not text.strip(): if not text.strip():
return True return True
@@ -197,6 +232,45 @@ class TextToSpeech:
else: else:
return False return False
def _speak_mixed(
self, segments: list[tuple[str, str]], check_interrupt=None
) -> bool:
"""Озвучивание текста с переключением RU/EN по сегментам."""
for segment, lang in segments:
if not segment.strip():
continue
completed = self._speak_single_language(
segment, check_interrupt=check_interrupt, language=lang
)
if not completed:
return False
return True
def speak(self, text: str, check_interrupt=None, language: str = "ru") -> bool:
"""
Основная функция: генерирует аудио и воспроизводит его.
Args:
text: Текст для озвучки.
check_interrupt: Функция, возвращающая True, если надо прерваться (например, check_wakeword_once).
language: "ru" или "en".
Returns:
True, если договорил до конца.
False, если был прерван.
"""
if not text.strip():
return True
if language == "ru":
segments = self._split_mixed_language(text)
if any(lang == "en" for _, lang in segments):
return self._speak_mixed(segments, check_interrupt=check_interrupt)
return self._speak_single_language(
text, check_interrupt=check_interrupt, language=language
)
def _check_interrupt_worker(self, check_interrupt): def _check_interrupt_worker(self, check_interrupt):
""" """
Фоновая функция для потока: постоянно опрашивает check_interrupt. Фоновая функция для потока: постоянно опрашивает check_interrupt.

View File

@@ -22,7 +22,6 @@ class WakeWordDetector:
self.pa = None self.pa = None
self._stream_closed = True # Флаг состояния потока (закрыт/открыт) self._stream_closed = True # Флаг состояния потока (закрыт/открыт)
self._last_hit_ts = 0.0 self._last_hit_ts = 0.0
self._hit_streak = 0
def initialize(self): def initialize(self):
"""Инициализация Porcupine и PyAudio.""" """Инициализация Porcupine и PyAudio."""
@@ -136,15 +135,10 @@ class WakeWordDetector:
keyword_index = self.porcupine.process(pcm) keyword_index = self.porcupine.process(pcm)
if keyword_index >= 0: if keyword_index >= 0:
now = time.time() now = time.time()
if now - self._last_hit_ts < 0.6: if now - self._last_hit_ts < 0.4:
self._hit_streak += 1 return False
else:
self._hit_streak = 1
self._last_hit_ts = now self._last_hit_ts = now
print("🛑 Wake word обнаружен во время ответа!")
if self._hit_streak >= 2:
self._hit_streak = 0
print("🛑 Wake word подтвержден во время ответа!")
return True return True
return False return False
except Exception: except Exception:

View File

@@ -237,7 +237,7 @@ def numbers_to_words(text: str) -> str:
preps_list = "|".join(map(re.escape, PREPOSITION_CASES.keys())) preps_list = "|".join(map(re.escape, PREPOSITION_CASES.keys()))
text = re.sub( text = re.sub(
rf"(?i)\b((?:{preps_list})\s+)?(\d+(?:[.,]\d+)?)(?=(\s+[а-яА-ЯёЁ]+))?\b", rf"(?i)(?<!\w)((?:{preps_list})\s+)?([+-]?\d+(?:[.,]\d+)?)(?=(\s+[а-яА-ЯёЁ]+))?\b",
replace_cardinal_match, replace_cardinal_match,
text, text,
) )

View File

@@ -52,3 +52,8 @@ TTS_SPEAKER = "eugene" # Доступные (ru): aidar, baya, kseniya, xenia,
TTS_EN_SPEAKER = os.getenv("TTS_EN_SPEAKER", "en_0") TTS_EN_SPEAKER = os.getenv("TTS_EN_SPEAKER", "en_0")
# Частота дискретизации для воспроизведения (качество звука) # Частота дискретизации для воспроизведения (качество звука)
TTS_SAMPLE_RATE = 48000 TTS_SAMPLE_RATE = 48000
# --- Настройки погоды ---
WEATHER_LAT = os.getenv("WEATHER_LAT")
WEATHER_LON = os.getenv("WEATHER_LON")
WEATHER_CITY = os.getenv("WEATHER_CITY", "Ухта")

144
app/features/weather.py Normal file
View File

@@ -0,0 +1,144 @@
"""
Weather feature module.
Fetches weather data from Open-Meteo API.
"""
import requests
from datetime import datetime
from ..core.config import WEATHER_LAT, WEATHER_LON, WEATHER_CITY
def get_wmo_description(code: int) -> str:
"""Decodes WMO weather code to Russian description."""
codes = {
0: "ясно",
1: "преимущественно ясно",
2: "переменная облачность",
3: "пасмурно",
45: "туман",
48: "изморозь",
51: "легкая морось",
53: "умеренная морось",
55: "плотная морось",
56: "ледяная морось",
57: "плотная ледяная морось",
61: "слабый дождь",
63: "умеренный дождь",
65: "сильный дождь",
66: "ледяной дождь",
67: "сильный ледяной дождь",
71: "слабый снег",
73: "снегопад",
75: "сильный снегопад",
77: "снежные зерна",
80: "слабый ливень",
81: "умеренный ливень",
82: "сильный ливень",
85: "слабый снегопад",
86: "сильный снегопад",
95: "гроза",
96: "гроза с градом",
99: "сильная гроза с градом"
}
return codes.get(code, "осадки")
def get_weather_report() -> str:
"""
Fetches detailed weather report.
Structure:
1. Current temp and precipitation.
2. Today's min/max temp.
3. Next 4 hours forecast (temp + precipitation).
"""
if not all([WEATHER_LAT, WEATHER_LON, WEATHER_CITY]):
return "Настройки погоды не найдены. Проверьте конфигурацию."
url = "https://api.open-meteo.com/v1/forecast"
params = {
"latitude": WEATHER_LAT,
"longitude": WEATHER_LON,
"current": "temperature_2m,precipitation,weather_code",
"hourly": "temperature_2m,precipitation,weather_code",
"daily": "temperature_2m_max,temperature_2m_min",
"timezone": "auto",
"forecast_days": 2
}
try:
response = requests.get(url, params=params, timeout=5)
response.raise_for_status()
data = response.json()
# --- 1. Current Weather ---
curr = data["current"]
temp_now = round(curr["temperature_2m"])
precip_now = curr["precipitation"]
code_now = curr["weather_code"]
desc_now = get_wmo_description(code_now)
report = f"Сейчас в городе {WEATHER_CITY} {temp_now} градусов, {desc_now}."
if precip_now > 0:
report += f" Выпало {precip_now} миллиметров осадков."
# --- 2. Today's Range ---
# daily arrays usually start from today [0]
daily = data["daily"]
t_max = round(daily["temperature_2m_max"][0])
t_min = round(daily["temperature_2m_min"][0])
report += f" Сегодня температура будет от {t_min} до {t_max} градусов."
# --- 3. Forecast Next 4 Hours ---
current_hour = datetime.now().hour
hourly_temps = data["hourly"]["temperature_2m"]
hourly_precip = data["hourly"]["precipitation"]
hourly_codes = data["hourly"]["weather_code"]
# Start from next hour
start_idx = current_hour + 1
end_idx = min(start_idx + 4, len(hourly_temps))
next_temps = hourly_temps[start_idx:end_idx]
next_precip = hourly_precip[start_idx:end_idx]
next_codes = hourly_codes[start_idx:end_idx]
if next_temps:
report += " Прогноз на ближайшие 4 часа: "
# Group by roughly similar weather to avoid repetition?
# Or just list them simply.
# "В 14:00 -5, ясно. В 15:00 -5, снег." -> a bit verbose.
# Simplified: "Температура около -5, возможен слабый снег."
# Let's verify if weather changes significantly.
# If consistent, summarize. If not, list.
# Simple approach for TTS:
avg_temp = round(sum(next_temps) / len(next_temps))
# Check if any precipitation is expected
will_precip = any(p > 0 for p in next_precip)
unique_codes = set(next_codes)
# Determine dominant weather description
if len(unique_codes) == 1:
weather_desc = get_wmo_description(list(unique_codes)[0])
else:
# Priority to precipitation codes
precip_codes = [c for c in unique_codes if c > 3] # >3 implies not clear/cloudy
if precip_codes:
weather_desc = get_wmo_description(max(precip_codes)) # Take the most severe
else:
weather_desc = "переменная облачность"
report += f"температура около {avg_temp} градусов, {weather_desc}."
if will_precip:
report += " Ожидаются осадки."
else:
report += " Без существенных осадков."
return report
except Exception as e:
print(f"❌ Ошибка получения погоды: {e}")
return "Не удалось получить полные данные о погоде."

View File

@@ -23,7 +23,13 @@ import os
from collections import deque from collections import deque
# Для воспроизведения звуков (mp3) # Для воспроизведения звуков (mp3)
from pygame import mixer try:
from pygame import mixer
except Exception as exc:
mixer = None
_MIXER_IMPORT_ERROR = exc
else:
_MIXER_IMPORT_ERROR = None
# Импорт наших модулей # Импорт наших модулей
from .audio.wakeword import ( from .audio.wakeword import (
@@ -38,6 +44,7 @@ from .core.cleaner import clean_response
from .audio.tts import speak, initialize as init_tts from .audio.tts import speak, initialize as init_tts
from .audio.sound_level import set_volume, parse_volume_text from .audio.sound_level import set_volume, parse_volume_text
from .features.alarm import get_alarm_clock from .features.alarm import get_alarm_clock
from .features.weather import get_weather_report
# Список стоп-слов, чтобы прервать диалог или остановить ассистента # Список стоп-слов, чтобы прервать диалог или остановить ассистента
STOP_WORDS = { STOP_WORDS = {
@@ -134,10 +141,20 @@ def main():
# Предварительная инициализация моделей # Предварительная инициализация моделей
print("⏳ Инициализация моделей...") print("⏳ Инициализация моделей...")
# Инициализация звуковой системы для эффектов # Инициализация звуковой системы для эффектов (опционально)
mixer.init()
ding_sound_path = "assets/sounds/ding.wav"
ding_sound = None ding_sound = None
if mixer is None:
print(
"Warning: pygame mixer not available; sound effects disabled."
f" ({_MIXER_IMPORT_ERROR})"
)
else:
try:
mixer.init()
except Exception as exc:
print(f"Warning: pygame mixer init failed; sound effects disabled. ({exc})")
else:
ding_sound_path = "assets/sounds/ding.wav"
if os.path.exists(ding_sound_path): if os.path.exists(ding_sound_path):
ding_sound = mixer.Sound(ding_sound_path) ding_sound = mixer.Sound(ding_sound_path)
ding_sound.set_volume(0.3) ding_sound.set_volume(0.3)
@@ -242,8 +259,10 @@ def main():
# Проверка команд будильника ("поставь будильник на 7") # Проверка команд будильника ("поставь будильник на 7")
alarm_response = alarm_clock.parse_command(user_text) alarm_response = alarm_clock.parse_command(user_text)
if alarm_response: if alarm_response:
speak(alarm_response) clean_alarm_response = clean_response(alarm_response, language="ru")
last_response = alarm_response speak(clean_alarm_response)
last_response = clean_alarm_response
skip_wakeword = False
continue continue
# Проверка команды громкости ("громкость 5") # Проверка команды громкости ("громкость 5")
@@ -256,8 +275,9 @@ def main():
if level is not None: if level is not None:
if set_volume(level): if set_volume(level):
msg = f"Громкость установлена на {level}" msg = f"Громкость установлена на {level}"
speak(msg) clean_msg = clean_response(msg, language="ru")
last_response = msg speak(clean_msg)
last_response = clean_msg
else: else:
speak("Не удалось установить громкость.") speak("Не удалось установить громкость.")
else: else:
@@ -265,10 +285,34 @@ def main():
"Я не понял число громкости. Скажите число от одного до десяти." "Я не понял число громкости. Скажите число от одного до десяти."
) )
skip_wakeword = True
continue continue
except Exception as e: except Exception as e:
print(f"❌ Ошибка громкости: {e}") print(f"❌ Ошибка громкости: {e}")
speak("Не удалось изменить громкость.") speak("Не удалось изменить громкость.")
skip_wakeword = True
continue
# Проверка команды "Погода"
weather_triggers = [
"погода",
"погоду",
"что на улице",
"какая температура",
"сколько градусов",
"холодно ли",
"жарко ли",
"нужен ли зонт",
"брать ли зонт",
"прогноз погоды",
]
if any(trigger in user_text.lower() for trigger in weather_triggers):
weather_report = get_weather_report()
clean_report = clean_response(weather_report, language="ru")
speak(clean_report)
last_response = clean_report
skip_wakeword = True
continue continue
# Проверка запроса на перевод # Проверка запроса на перевод

BIN
ding.wav

Binary file not shown.

View File

@@ -1,28 +0,0 @@
import wave
import math
import struct
def generate_ding(filename="assets/sounds/ding.wav", frequency=800, duration=0.15):
sample_rate = 44100
n_frames = int(sample_rate * duration)
with wave.open(filename, "w") as wav_file:
wav_file.setnchannels(1)
wav_file.setsampwidth(2)
wav_file.setframerate(sample_rate)
data = []
for i in range(n_frames):
# Затухающая синусоида
t = i / sample_rate
value = int(
32767.0 * math.sin(2 * math.pi * frequency * t) * (1 - t / duration)
)
data.append(struct.pack("<h", value))
wav_file.writeframes(b"".join(data))
if __name__ == "__main__":
generate_ding()

View File

@@ -1,20 +0,0 @@
# Простые проверки для модуля cleaner (запуск вручную).
from app.core import cleaner
import traceback
try:
print("Testing cleaner...")
text = "В 1999 году."
res = cleaner.clean_response(text)
print(f"Result: {res}")
text = "![image](http://example.com)"
res = cleaner.clean_response(text)
print(f"Result: {res}")
text = "[link](http://example.com)"
res = cleaner.clean_response(text)
print(f"Result: {res}")
except Exception:
traceback.print_exc()