Вайбкодинг на практике: пишем оптимизатор медиа архива для Windows на .BAT с помощью Gemini, ChatGPT и Qwen

Начитавшись за последние пару месяцев статей про вайбкодинг и воодушевившись, что сейчас в микрофон ноута скажу «ОК Гугл, сделай мне скрипт для кодирования фото и видео архива» и далее как в фильме Она (2013), нейросеть мне разберет по полочкам, то что откладывалось 15 лет.. Но дальше я столкнулся с суровой реальность:(

Вайбкодинг на практике: пишем оптимизатор медиа архива для Windows на .BAT с помощью Gemini, ChatGPT и Qwen

Все никак не доходили руки разобрать семейный цифровой архив фото и видео за 15 лет. Десятки папок, сотни гигабайт медиа данных. Разношерстный контент — от видео с древних зеркалок с избыточным битрейтом до HEIC изображений с современных смартфонов.

Решил писать на нативном Batch (CMD), чтобы скрипт работал на любой Windows‑машине «из коробки» без установки Python или Node.js. В качестве движков нейронка на стадии обсуждения предложила консольную версии FFmpeg для видео и jpg и даже установила его сама в скрипте через winget позже пришлось еще подключать ImageMagick для heic, который через ffmpeg обрабатывался некорректно.

Я не использовал IDE с AI‑плагинами, только чат, выступая в роли менеджера с компетенциями разработчика, но не программиста, в итоге сам не написал ни строчки кода, но иногда приходилось указывать сети в какой части кода нужно исправлять баг чтобы она меньше галлюцинировала. Использовал следующие технологии:

1. Google Gemini 3

Поскольку на Google One уже есть подписка и она тесно интегрирована в сервисы Android, я начал с этой нейронки, обсудив стек технологий и общие задачи. Она отлично справилась с обсуждением и MVP. Сгенерировал с ней за вечер скелет на 500 строк и базовую логику.

Скрипт уже работал с жестко заданными параметрами и за ночь обработал несколько десятков гигибайт данных, подтвердив жизнеспособность гипотезы. Но как только ТЗ усложнилось (добавил больше настраиваемых по ходу работу параметров, возможность запуска из консоли через CLI, Drag & Drop, обработку длинных путей файлов на кириллице), модель поплыла. Начались галлюцинации: код терял куски логики, модель постоянно пыталась его сократить, чинила одно и ломала другое даже когда явно писал что делать, новые диалоги и скелет тз с описанием логики не помогали, Gemini 3 забывала, что мы фиксили 5 сообщений назад и снова это ломала, в результате за второй вечер я пришел к выводу, что небольшие усложнения скрипта в области настроек и параметров уперлись в потолок сообразительности этой нейронки и попробвал следующую.

2. ChatGPT 5.2

На ChatGPT у меня кончилась подписка, так как в последнее время для повседневных задач мне хватает гугла, но он продолжал работать в полном режиме с ограниченным количеством токенов в день, так что я попробовал его использовать для рефакторинга и фикса багов. И честно говоря помогло слабо, буквально после 1–2 фикса начиналсиь примерно такие же баги как у гугла. Примечательно что он отвечал почти мгновенно, очевидно начиная работать над задачей еще до того как я закончу полностью писать очередное ТЗ в окне задачи и нажму Enter. Однако я быстро уперся в суточный потолок токенов и активные попытки склонить меня к новой супер подписке по скидке и чуда даже от последней версии для кода под Windows не увидел. Хотя до этого создавал с его помощью короткие скрипты и конфигурацию сервисов для Linux Shell намного проще чем сейчас шло под Windows.

3. Qwen 3-Max (Alibaba)

На днях попадалась статья что китайцы сильно прокачали свою сеть в области обработки изображений, решил проверить как она справится с кодом. И не пожалел. Qwen смогла проглотить весь забагованный код, поняла логику, намного подробнее расписала комментарии на каждый блок и провела грамотный рефакторинг. Она дописала систему меню, корректную обработку аргументов и пофиксила процедуры с которыми были проблемы у американских сетей ошибаясь раза в три меньше. Итоговый скрипт вырос почти до 1000 строк и заработал стабильно, однако на этом объеме данных и тут начались галлюцинации — при попытке добавить новые функции, такие как более точный расчет времени работы и дополнительных проверок все начало опять сыпаться и новые диалоги не помогали. Так что я сделал вывод что на текущий момент уровень сложности и в этой сети достигнут.

Что умеет итоговый скрипт

В итоге за 3 вечера «вайб‑кодинга», который честно говоря был вообще не вайб и не изи, получился.BAT скрипт

Media Optimizer

  1. Полная автоматизация установки: сам ставит FFmpeg/ImageMagick если их нет в системе

  2. Два режима:

    • Drag & Drop папки или ручной запуск.

    • CLI: Для запуска по расписанию/в пайплайнах.

  3. Логика работы:

    • Рекурсивный обход любой глубины вложенности.

    • Зеркалирование структуры папок в целевую директорию (включая копирование не-медиа файлов, вроде текстовых заметок или нестандартных форматов, если нужно).

    • Видео: Конвертация в H.264/H.265 с использованием NVIDIA NVENC (автодетект GPU).

    • Фото: Ресайз и компрессия визуально без потери качества, в итоге фото выглядят даже лучше чем со старых камер, открываются быстрее, а места занимают раза в 3 меньше.

    • Защита от перезаписи (пропуск уже существующих файлов).

Результаты

Самое главное — результат, ради которого всё затевалось.

Скрипт был запущен на обработку всего 15-летнего архива.

  • Время: 2 ночи работы ПК

  • Эффективность: Общий объем архива уменьшился более чем в 3 раза.

    • Старые видео с зеркалок сжались до 10 раз.

    • Современные фото/видео — в 2–4 раза.

  • Качество: Визуально на 2K мониторе разницы между исходником не видно.

Код выложил на GitHub, пользуйтесь. Для новых апдейтов машинным способом вероятно уровень нейронок должен подрасти, но это уже отличный прогресс, год назад я генерировал изображения с некорректным числом пальцев...

Кстати, сколько подобное решение заняло бы времени у продвинутого сисадмина не программиста вручную? И справились бы вы без нейронок? Я вот откладывал 15 лет.... )


Внимание!

Официальный сайт бота по ссылке ниже.

Официальный сайт