Python · FastAPI · Elasticsearch · PostgreSQL · ClickHouse · Redis · SQLite · REST API
CUDA · LLM on-premise (Mistral · LLaMA · Qwen) · Whisper · EasyOCR · Claude · Deepseek
Cisco CCNA · Cisco Security · Zabbix · Docker
Полноценный SaaS-сервис для автоматической генерации и публикации контента (фото и текст) в Telegram-каналы. Биллинг, управление пользователями, роли, сессии. Построен — от дизайна до деплоя.
AI-конвейер: DeepSeek LLM генерирует текст с web-контекстом (DuckDuckGo + trafilatura + BeautifulSoup). Leonardo AI генерирует изображения с polling результата. Автогенерация тем через веб-поиск.
Асинхронная архитектура: наращиваемые независимые воркеры — generator_worker (генерация контента), publisher_worker (публикация по расписанию с учётом часов и лимитов), scheduler_worker (управление очередями каналов). Биллинг с резервами: SELECT FOR UPDATE → атомарное списание.
Полная система из двух частей: Windows-приложение на PyQt6 (~11 000 строк GUI, 346 методов) база Sqllite + серверная часть (FastAPI + PostgreSQL). Парсинг двух маркетплейсов с обходом anti-bot защит, аналитика цен, алерты о скидках в Telegram и на email. Старт по расписанию
Anti-bot система (Playwright): fingerprint spoofing — подмена navigator.webdriver, canvas noise injection (imageData.data[0] += random*0.1), спуфинг plugins/languages/deviceMemory/hardwareConcurrency/outerWidth. Human behavior simulation — движение мыши с рандомными задержками между точками. При детекции капчи — автоматическое переключение headless→visible: пользователь решает капчу, парсер возвращается в headless. Evasion-скрипты вынесены в отдельный модуль src/evasion.py с конфигурируемыми параметрами.
Серверная аналитика: триграммный поиск (pg_trgm) для дедупликации похожих товаров. Динамические CSS-селекторы из БД — при смене вёрстки маркетплейса не нужен перевыпуск приложения. Алерты двух типов: абсолютные (цена ниже X руб.) и процентные (скидка > Y%). Региональное ценообразование — выбор города меняет цены Ozon.
Система индексирования и поиска по терабайтным массивам разнородных данных на Elasticsearch. On-premise — данные не покидают инфраструктуру компании.
Индексация: параллельный ETL (Python threading + multiprocessing) для разных форматов — тексты, JSON, логи, PDF, документы. Оптимизированные маппинги, custom analyzers для русского языка (PyMorphy3 — морфологический анализ, нормализация). Нечёткий поиск и дедупликация (RapidFuzz, FuzzyWuzzy) для поиска паттернов в данных.
LLM on-premise: развернул Mistral, LLaMA, Qwen на собственной инфраструктуре (CPU + GPU с CUDA). Семантический анализ, поиск паттернов в данных. Интеграция с поисковой платформой для обогащения индексов. Данные не уходят в облако.
Набор независимых AI-микросервисов для обработки неструктурированных данных, упакованных в Docker-контейнеры с REST API. Всё on-premise.
OCR-сервис: мультиязычное распознавание текста на EasyOCR + BERT (Hugging Face Transformers) + PyMorphy3 для нормализации русского языка. Веб-интерфейс для загрузки документов, пакетная обработка.
Whisper-транскрибация: распознавание аудио.
LLM-сервис: DeepSeek, Mistral Large 2 и другие на локальных серверах (CPU и GPU). Интеграция с поисковой платформой для семантического обогащения индексов.
— руководитель и инженер с профильным техническим образованием факультета информационных систем и технологий (радиотехника), дополнительным экономическим образованием и опытом работы в нескольких направлениях. С 2023 года — руководитель команды разработки и аналитики (15+ человек).
Специализируюсь на разработке решений и построении систем работы с большими данными: Elasticsearch ТБ данных, ETL-конвейеры, полнотекстовый и семантический поиск. Разворачивал LLM on-premise (Mistral, LLaMA, Qwen) — данные не уходят в облако, критично для корпоративного использования.
Сочетание разработки, инфраструктуры и требованиий информационной безопасности.
Использую AI как инструмент ускорения разработки — два личных продакшн-проекта (~30K строк кода) построены в одиночку за срок, который обычно требует команды из 2–3 человек.
Помимо разработки: сетевой инженер Cisco (CCNA + Security). Понимаю инфраструктуру на уровне L2/L3 сетей, маршрутизации и безопасности периметра — сочетание с backend-экспертизой.