New readme

2026-01-24 23:49:02 +03:00
parent d6181cccb7
commit e5047a1297
1 changed files with 111 additions and 74 deletions
--- a/README.md
+++ b/README.md
@@ -1,99 +1,136 @@
-# Умная колонка «Alexandr»
+# 🎙️ Умная колонка «Alexandr»

-Небольшой голосовой ассистент для Linux: реагирует на wake word, распознает речь, обращается к AI, озвучивает ответы, умеет переводить и работать с будильником.
+![Python](https://img.shields.io/badge/Python-3.9%2B-blue?logo=python&logoColor=white)
+![Platform](https://img.shields.io/badge/Platform-Linux-linux?logo=linux&logoColor=white)
+![License](https://img.shields.io/badge/License-MIT-green)

-## Возможности
- Wake word: «Alexandr» (Porcupine).
- Распознавание речи (Deepgram, RU/EN).
- Озвучка (Silero TTS, RU/EN).
- Перевод RU↔EN (Perplexity).
- Будильник с голосовым отключением.
- Таймер с голосовым отключением.
- Управление громкостью (ALSA amixer).
+**Alexandr** — это персональный голосовой ассистент для Linux, объединяющий современные нейросетевые технологии для создания естественного диалога. Он слушает, понимает, переводит, рассказывает о погоде и следит за временем.

-## Требования
- Linux
- Python 3.9+
- Системные утилиты: `mpg123`, `amixer` (ALSA)
- Драйверы/библиотеки для микрофона (PortAudio)
+---

-## Установка
+## ✨ Возможности
+
+### 🧠 Искусственный интеллект
+*   **Умный диалог**: Поддержка контекста беседы на базе **Perplexity AI** (Llama 3.1).
+*   **Переводчик**: Мгновенный двусторонний перевод (RU ↔ EN) с озвучкой на целевом языке.
+
+### 🗣️ Голосовой интерфейс
+*   **Wake Word**: Активация по фразе **«Alexandr»** (технология Porcupine).
+*   **Распознавание речи**: Быстрое и точное STT от **Deepgram**.
+*   **Синтез речи**: Естественная офлайн-озвучка с помощью **Silero TTS**.
+
+### 🛠️ Инструменты
+*   **⛅ Погода**: Точный прогноз погоды (текущая, на день, на ближайшие часы) через Open-Meteo.
+*   **⏰ Будильник**: Голосовая установка будильников и таймеров.
+*   **🔊 Управление**: Регулировка громкости системы.
+
+---
+
+## ⚙️ Установка
+
+### 1. Системные требования
+*   OS: Linux
+*   Python 3.9+
+*   Библиотеки: `portaudio19-dev` (для микрофона), `libasound2-dev` (ALSA), `mpg123` (для будильника).
+
+### 2. Сборка проекта
 ```bash
+# Клонирование репозитория
+git clone https://github.com/your-username/alexander_smart-speaker.git
+cd alexander_smart-speaker
+
+# Создание виртуального окружения
 python -m venv venv
 source venv/bin/activate
+
+# Установка зависимостей
 pip install -r requirements.txt
 ```

-## Настройка окружения
-Создайте `.env` в корне проекта:
+### 3. Конфигурация
+Создайте файл `.env` на основе примера:
+```bash
+cp .env.example .env
 ```
-PERPLEXITY_API_KEY=...
-PERPLEXITY_MODEL=llama-3.1-sonar-small-128k-chat
+
+Заполните ключи в `.env`:
+```ini
+# AI & Speech
+PERPLEXITY_API_KEY=pplx-...
 DEEPGRAM_API_KEY=...
 PORCUPINE_ACCESS_KEY=...
+
+# TTS Settings
 TTS_EN_SPEAKER=en_0
+TTS_RU_SPEAKER=eugene
+
+# Weather (Координаты вашего города)
+WEATHER_LAT=63.56
+WEATHER_LON=53.69
+WEATHER_CITY=Ухта
 ```

-## Запуск
+---
+
+## 🚀 Запуск и Использование
+
 ```bash
-python main.py
+python run.py
 ```

-## Примеры команд
- Активировать: «Alexandr»
- Перевод: «переведи на английский как пройти в библиотеку»
- Перевод: «переведи с английского» → сказать фразу на английском
- Громкость: «громкость 5»
- Будильник: «будильник на 7:30», «разбуди на 8 15»
- Таймер: «таймер на 6 минут», «поставь будильник через 6 минут»
- Отмена будильников: «отмени будильник»
- Отмена таймеров: «отмени таймер»
- Стоп/сброс: «стоп», «хватит»
+### Примеры команд

-## Объяснение работы
-1) Система ждет wake word («Alexandr») через Porcupine.
-2) После активации включается распознавание речи (Deepgram).
-3) Команда распознается и проверяется на спец‑действия: будильник, громкость, перевод.
-4) Если это перевод — отправляется отдельный запрос в Perplexity и результат озвучивается.
-5) Если это обычный запрос — идет в AI, ответ очищается от разметки и озвучивается.
-6) После ответа включается режим продолжения диалога без повторного wake word.
+| Категория | Команда пользователя | Действие |
+|-----------|---------------------|----------|
+| **Активация** | «Alexandr» | Ассистент начинает слушать |
+| **Диалог** | «Почему небо голубое?» | Запрос в AI с сохранением контекста |
+| **Погода** | «Какая сейчас погода?», «Нужен ли зонт?» | Прогноз погоды |
+| **Перевод** | «Переведи на английский: привет, как дела?» | Перевод и озвучка (EN) |
+| **Будильник** | «Разбуди меня в 7:30», «Поставь таймер на 5 минут» | Установка сигнала |
+| **Громкость** | «Громкость 5», «Громкость 8» | Изменение системной громкости |
+| **Управление** | «Стоп», «Хватит», «Повтори» | Остановка речи или повтор фразы |

-## Архитектурная схема
-```
-Микрофон
-  │
-  ▼
-Wake word (Porcupine) ──► STT (Deepgram) ──► Логика команд
-                                           │
-                                           ├─► Будильник (alarm.py)
-                                           ├─► Громкость (sound_level.py)
-                                           ├─► Перевод (ai.py)
-                                           └─► Диалог (ai.py)
-                                           │
-                                           ▼
-                                   Очистка текста (cleaner.py)
-                                           │
-                                           ▼
-                                      TTS (tts.py)
-                                           │
-                                           ▼
-                                       Динамик
+---
+
+## 🏗️ Архитектура
+
+```mermaid
+graph TD
+    Mic[🎤 Микрофон] --> Wake[Wake Word<br>(Porcupine)]
+    Wake -->|Activated| STT[STT<br>(Deepgram)]
+    
+    STT --> Router{Анализ команды}
+    
+    Router -->|Прогноз| Weather[⛅ Погода<br>(Open-Meteo)]
+    Router -->|Время| Alarm[⏰ Будильник/Таймер]
+    Router -->|Настройки| Vol[🔊 Громкость]
+    Router -->|Перевод| Translator[A↔B Переводчик]
+    Router -->|Вопрос| AI[🧠 Perplexity AI]
+    
+    Weather --> TTS
+    Alarm --> TTS
+    Vol --> TTS
+    Translator --> TTS
+    AI --> Cleaner[Очистка текста]
+    Cleaner --> TTS[🗣️ TTS<br>(Silero)]
+    
+    TTS --> Speaker[🔊 Динамик]
 ```

-## Структура проекта
- `main.py` — основной цикл работы ассистента.
- `wakeword.py` — детектор wake word (Porcupine).
- `stt.py` — потоковое распознавание речи (Deepgram).
- `tts.py` — озвучивание (Silero TTS).
- `ai.py` — запросы к Perplexity (чат и перевод).
- `cleaner.py` — очистка ответа и преобразование чисел (RU).
- `alarm.py` — будильник и логика расписания.
- `sound_level.py` — управление громкостью.
+## 📂 Структура проекта
+*   `app/main.py` — Точка входа, основной цикл событий.
+*   `app/audio/` — Модули работы со звуком (STT, TTS, Wake Word).
+*   `app/core/` — Логика AI, конфиги, очистка текста.
+*   `app/features/` — Навыки (Погода, Будильник, Таймер).
+*   `assets/` — Модели (Porcupine) и звуки.
+*   `data/` — Сохранение состояния (будильники).

-## Частые проблемы
- Ошибка Deepgram 400: проверьте `DEEPGRAM_API_KEY` и доступность модели.
- Нет звука: проверьте `amixer` и настройки ALSA.
- Будильник не играет: установите `mpg123`.
+---

-## Лицензия
-См. `LICENSE.txt`.
+## 🛠️ Решение проблем
+- **Ошибка Deepgram 400**: Проверьте баланс и правильность `DEEPGRAM_API_KEY`.
+- **Нет звука**: Убедитесь, что `amixer` установлен и устройство вывода настроено по умолчанию.
+- **Будильник не играет**: Убедитесь, что установлен `mpg123`.
+
+## 📄 Лицензия
+MIT License. См. `LICENSE.txt`.