Резюме BEI — Engineering Manager | Big Data · AI

Проекты

Что я построил

PROJECT_01

SaaS · AI · Telegram · Fullstack

Платформа автопубликации AI-контента в Telegram-каналы

Полноценный SaaS-сервис для автоматической генерации и публикации контента (фото и текст) в Telegram-каналы. Биллинг, управление пользователями, роли, сессии. Построен — от дизайна до деплоя.

AI-конвейер: DeepSeek LLM генерирует текст с web-контекстом (DuckDuckGo + trafilatura + BeautifulSoup). Leonardo AI генерирует изображения с polling результата. Автогенерация тем через веб-поиск.

Асинхронная архитектура: наращиваемые независимые воркеры — generator_worker (генерация контента), publisher_worker (публикация по расписанию с учётом часов и лимитов), scheduler_worker (управление очередями каналов). Биллинг с резервами: SELECT FOR UPDATE → атомарное списание.

~8 300строк кода

55API эндпоинтов

14таблиц БД

АРХИТЕКТУРА И КЛЮЧЕВЫЕ РЕШЕНИЯ

асинхронные воркеры на asyncio — параллельная обработка каналов без блокировок, supervisor для перезапуска при сбоях

Биллинг: резервирование средств в таблице reservations → FOR UPDATE при списании → транзакционный лог. Защита от двойного списания

Web scraping: DuckDuckGo → trafilatura (основной) → BeautifulSoup (fallback) с cancellation event для потоков и таймаутами

Динамические настройки из БД: часы публикации, лимиты постов, системные промпты — без перезапуска

bcrypt-авторизация, сессионные токены, math-капча при регистрации, бонусная система за первый тест канала

Пауза каналов при нехватке баланса → автоматическое возобновление при пополнении

статитскика по расходам, расширенная статитскика админу

Python 3.11+FastAPIasyncpgasyncio PostgreSQLDeepSeek API Leonardo AITelegram Bot API DuckDuckGotrafilaturaBeautifulSoup Jinja2Vanilla JSbcrypt

PROJECT_02

Parser · Anti-bot · Desktop · Server

Мониторинг цен Ozon & Wildberries: десктоп + сервер

Полная система из двух частей: Windows-приложение на PyQt6 (~11 000 строк GUI, 346 методов) база Sqllite + серверная часть (FastAPI + PostgreSQL). Парсинг двух маркетплейсов с обходом anti-bot защит, аналитика цен, алерты о скидках в Telegram и на email. Старт по расписанию

Anti-bot система (Playwright): fingerprint spoofing — подмена navigator.webdriver, canvas noise injection (imageData.data[0] += random*0.1), спуфинг plugins/languages/deviceMemory/hardwareConcurrency/outerWidth. Human behavior simulation — движение мыши с рандомными задержками между точками. При детекции капчи — автоматическое переключение headless→visible: пользователь решает капчу, парсер возвращается в headless. Evasion-скрипты вынесены в отдельный модуль src/evasion.py с конфигурируемыми параметрами.

Серверная аналитика: триграммный поиск (pg_trgm) для дедупликации похожих товаров. Динамические CSS-селекторы из БД — при смене вёрстки маркетплейса не нужен перевыпуск приложения. Алерты двух типов: абсолютные (цена ниже X руб.) и процентные (скидка > Y%). Региональное ценообразование — выбор города меняет цены Ozon.

~18Kстрок кода

346методов GUI

32API эндпоинтов

2маркетплейса

АРХИТЕКТУРА И КЛЮЧЕВЫЕ РЕШЕНИЯ

PyQt6 GUI: 6 вкладок (Products, Notifications, Data, Charts, Settings, Help), matplotlib встроен в Qt, drag&drop сортировка, HyperlinkDelegate, SortableTreeWidgetItem. PyMorphy3 — морфологический анализ, нормализация, пороги

Парсеры OzonProductParser, OzonSearchParser, WBProductParser, WBSearchParser

Двойное хранилище: SQLite локально (история цен, настройки, кэш) + PostgreSQL на сервере (аналитика, алерты, пользователи, транзакции)

Динамические CSS-селекторы из БД обновляются с сервера — защита от изменений вёрстки маркетплейса без перевыпуска .exe

PyInstaller сборка в .exe — Playwright-браузер упакован внутрь, работает на Windows без установки зависимостей

PythonPyQt6PlaywrightQThread FastAPIPostgreSQLpg_trgmSQLite matplotlibopenpyxlTelegram Bot API PyInstallerfingerprint spoofingBeautifulSoup

PROJECT_03

Big Data · LLM · Search Platform

Корпоративная платформа полнотекстового поиска с локальными LLM

Система индексирования и поиска по терабайтным массивам разнородных данных на Elasticsearch. On-premise — данные не покидают инфраструктуру компании.

Индексация: параллельный ETL (Python threading + multiprocessing) для разных форматов — тексты, JSON, логи, PDF, документы. Оптимизированные маппинги, custom analyzers для русского языка (PyMorphy3 — морфологический анализ, нормализация). Нечёткий поиск и дедупликация (RapidFuzz, FuzzyWuzzy) для поиска паттернов в данных.

LLM on-premise: развернул Mistral, LLaMA, Qwen на собственной инфраструктуре (CPU + GPU с CUDA). Семантический анализ, поиск паттернов в данных. Интеграция с поисковой платформой для обогащения индексов. Данные не уходят в облако.

Парралельноеиндексирование в фоне

10+форматов данных

on-premiseбез облака

КЛЮЧЕВЫЕ РЕШЕНИЯ

Elasticsearch кластер: шардирование, реплики, оптимизированные маппинги, ранжирование по релевантности

Параллельная индексация threading + multiprocessing — ускорение ETL на больших объёмах данных

LLM on-premise (Mistral, LLaMA, Qwen): CUDA GPU-инференс, поиск паттернов в данных без выхода в интернет

Мониторинг: свой для метрик сервиса

Docker Compose: ES + FastAPI + PostgreSQL (метаданные) + Redis (кэш запросов) в единой инфраструктуре

ElasticsearchPython threadingmultiprocessing FastAPIPostgreSQLRedis PandasRapidFuzzFuzzyWuzzyPyMorphy3 MistralLLaMAQwen CUDADocker ComposeGrafanaPrometheus

PROJECT_04

AI · OCR · NLP · GPU · On-premise

AI-микросервисы: мультиязычный OCR · Whisper · LLM · NLP

Набор независимых AI-микросервисов для обработки неструктурированных данных, упакованных в Docker-контейнеры с REST API. Всё on-premise.

OCR-сервис: мультиязычное распознавание текста на EasyOCR + BERT (Hugging Face Transformers) + PyMorphy3 для нормализации русского языка. Веб-интерфейс для загрузки документов, пакетная обработка.

Whisper-транскрибация: распознавание аудио.

LLM-сервис: DeepSeek, Mistral Large 2 и другие на локальных серверах (CPU и GPU). Интеграция с поисковой платформой для семантического обогащения индексов.

4+микросервиса

on-premiseбез облака

CUDAGPU-параллелизм

СТЕК И РЕШЕНИЯ

EasyOCR + BERT (Hugging Face) — распознавание и классификация текста на нескольких языках одновременно

Whisper + CUDA: выполнение задач транскрибации на GPU

PyMorphy3 — морфологический анализ: нормализация токенов перед индексацией в Elasticsearch

Каждый сервис — отдельный Docker-контейнер с GPU-проброской

Mistral Large 2, DeepSeek — деплой GPU, REST API для интеграции с другими сервисами

EasyOCRWhisperBERT Transformers (HF)PyTorchCUDA PyMorphy3DeepSeekMistral Large 2 FastAPIDockerFlaskHTML/CSS/JS

Опыт работы

Профессиональный путь

Руководитель команды разработки и аналитики данных

2023 — настоящее время

Big Data · AI/ML · Fullstack · DevOps · Команда 15+ чел

Построил систему индексирования и полнотекстового поиска на Elasticsearch (терабайты данных): разнородные форматы данных, параллельный ETL (threading, multiprocessing), оптимизированные маппинги, шардирование, горизонтальное масштабирование.
Развернул LLM on-premise (Mistral, LLaMA, Qwen, DeepSeek) на собственной CPU/GPU инфраструктуре — семантический анализ, поиск паттернов в данных без передачи во внешние сервисы.
Реализовал AI-микросервисы: мультиязычный OCR (EasyOCR + BERT + PyMorphy3), транскрибация аудио (Whisper + CUDA), упаковка в Docker.
Разработал SaaS-платформу автопубликации контента в Telegram с AI-генерацией текста (DeepSeek) и изображений (Leonardo AI), асинхронным pipeline (3 воркера на asyncio), биллингом с резервами, FastAPI + asyncpg + PostgreSQL. 1 месяц, в одиночку.
Построил систему мониторинга цен Ozon & Wildberries: десктоп PyQt6 (~11K строк GUI) + FastAPI-сервер, обход anti-bot защит (Playwright, fingerprint spoofing, canvas noise, human behavior), триграммный поиск pg_trgm, алерты в Telegram.
Настроил мониторинг и логирование: собсственная система, Docker Compose production-инфраструктура.
Управлял командой 15+ человек (разработчики, аналитики, смежные специалисты): Agile/Scrum/Kanban, архитектурные решения, декомпозиция задач.

Руководитель группы связи

2020 — 2023

Network Engineering · Security · Automation · Cisco / Alcatel

Обеспечение информационной безопасности и защиты данных на уровне сетевой инфраструктуры
Проектировал и сопровождал сетевую инфраструктуру (Cisco, Alcatel): BGP, OSPF, VLAN, ACL, HSRP, GRE, NAT — полное резервирование каналов связи (E1, STM, Ethernet).
Автоматизировал мониторинг и конфигурацию: многопоточные Python-скрипты, массовое применение настроек на Cisco-устройствах через SSH, backup конфигураций.
Реализовал централизованную систему логирования и мониторинга сетевого оборудования.
Обеспечил информационную безопасность (Cisco Security, фильтрация трафика, VPN, ACL, разграничение зон VLAN).
Повысил отказоустойчивость инфраструктуры — оптимизация маршрутизации, HSRP для резервирования шлюзов.
Обеспечил полное резервирование каналов связи

Старший инженер группы связи

до 2020

Telecom · IP Networking · VoIP · Multiplexing

Настройка и обслуживание оборудования мультиплексирования, маршрутизации, коммутации: Cisco, Huawei, Alcatel; синхронные и первичные мультиплексоры, каналы E1/STM/Ethernet.
IP-телефония, ведомственные АТС — конфигурирование и поддержка.
Написание скриптов автоматизации на Python и Bash для рутинных задач администрирования.

Навыки

Области экспертизы

⚙️

Backend & Data

Серверная разработка

FastAPI / Flask / asyncio / asyncpg
Elasticsearch TB данных: маппинги, шарды
PostgreSQL: транзакции, pg_trgm
threading, multiprocessing, asyncio
ClickHouse, MySQL, Redis, SQLite
VDS, Nginx, SSL, SSH, Certbot, Gunicorn

🤖

AI / ML / NLP

LLM · OCR · GPU

On-premise LLM: Mistral, LLaMA, Qwen
DeepSeek API, Mistral Large 2
EasyOCR + BERT + PyMorphy3
Whisper (CUDA + threading)
Transformers, PyTorch, CUDA
RapidFuzz, FuzzyWuzzy

🕵️

Web Scraping

Anti-bot & Парсинг

Playwright: fingerprint spoofing
Canvas noise injection
navigator / plugins / languages подмена
trafilatura, BeautifulSoup
Динамические CSS-селекторы из БД

🖥️

Desktop

GUI-разработка Windows

PyQt6 / QThread / QTimer
matplotlib встроенный в Qt
Кастомные делегаты и виджеты
PyInstaller сборка .exe
Экспорт xlsx (openpyxl), csv

🌐

Network & Security

Сети и безопасность

Cisco CCNA / Cisco Security (сертификаты)
BGP, OSPF, VLAN, ACL, VPN, HSRP, GRE
Cisco, Huawei, Alcatel, мультиплексоры
Автоматизация
IPv4/IPv6, NAT, DNS, DHCP, E1/STM

📡

Infra & Monitoring

Инфраструктура

Docker
VMware — виртуализация
Linux / Bash / systemd
Kubernetes (базово)

📊

Data Engineering

ETL · Аналитика

Pandas, NumPy — ETL-конвейеры
ClickHouse — аналитические запросы
Elasticsearch маппинги, ранжирование
Нечёткий поиск, дедупликация
GPU-оптимизация (CUDA)

👥

Management

Управление командой

Команда 15+ человек
Разработчики, аналитики, смежные роли
Agile / Scrum / Kanban
Архитектурные решенияli>
Декомпозиция задач, техническое ТЗ

🔗

Integrations

API и интеграции

Telegram Bot API — алерты, рассылки
DeepSeek / OpenAI-совместимые API
Leonardo AI (polling результата)
REST API: FastAPI, Flaskli>
SSL/TLS, SSH, FTP/SFTP, Git

Cisco CCNA — Routing & Switching

ННГУ им. Лобачевского, 2021–2022. Маршрутизаторы и коммутаторы Cisco, OSPF / BGP / EIGRP, VLAN, STP, IPv4/IPv6, резервирование каналов связи.

Cisco Security — сетевая безопасность

ННГУ им. Лобачевского, 2022–2023. Firewall, IDS/IPS, VPN, ACL, AAA-аутентификация, защита периметра, анализ угроз и инцидентов.

О себе

Кто я такой

— руководитель и инженер с профильным техническим образованием факультета информационных систем и технологий (радиотехника), дополнительным экономическим образованием и опытом работы в нескольких направлениях. С 2023 года — руководитель команды разработки и аналитики (15+ человек).

Специализируюсь на разработке решений и построении систем работы с большими данными: Elasticsearch ТБ данных, ETL-конвейеры, полнотекстовый и семантический поиск. Разворачивал LLM on-premise (Mistral, LLaMA, Qwen) — данные не уходят в облако, критично для корпоративного использования.

Сочетание разработки, инфраструктуры и требованиий информационной безопасности.

Использую AI как инструмент ускорения разработки — два личных продакшн-проекта (~30K строк кода) построены в одиночку за срок, который обычно требует команды из 2–3 человек.

Помимо разработки: сетевой инженер Cisco (CCNA + Security). Понимаю инфраструктуру на уровне L2/L3 сетей, маршрутизации и безопасности периметра — сочетание с backend-экспертизой.

1999–2005

НГТУ Нижегородский государственный технический университет им. Р.Е. Алексеева

Факультет информационных систем и технологий. Радиотехника, инженер.

2006–2010

Нижегородский институт менеджмента и бизнеса

экономист.

до 2020

Старший инженер группы связи НИИИС

Cisco, Huawei, Alcatel — маршрутизация, коммутация, мультиплексоры, IP-телефония.

2020–2023

Руководитель группы связи НИИИС

Cisco CCNA (2021–22) + Cisco Security (2022–23). BGP, OSPF, автоматизация на Python/Bash.

2023 — н.в.

Team Lead / Engineering Manager НИИИС

Big Data, AI/ML, Fullstack. Elasticsearch TB+, LLM on-premise, команда 15+ человек.

Engineering Manager/ Team Lead