- Сообщения
- 14
- Лайки
- 14
Всем привет! Я увлекаюсь нейросетями, машинным обучением и в частности нейросетью Stable Diffusion. По сравнению с Midjourney она опенсорсная, да к тому же имхо еще и более гибкая. Так вот на просторах интернета есть куча моделей для стилизованного рисования на любой вкус и цвет, однако модели стилизованной под нашу любимую игру к сожалению нету. Поэтому я решил натренить ее самостоятельно, чтобы можно было генерить крутые изображения и арты.
Пример моей работы
Итак для того, чтобы натренировать модель нужны были данные, тобишь - картинки. Тут я стартанул на всем известные ArtStation и Pinterest в поисках крутых артов, к сожалению изображений по нашей стилистике относительно немного, потому пришлось несколько часов ковырять нескончаемую ленту. После чего идем в фотошоп и приводим каждую картинку к нужному нам разрешению, кадрируем и убираем всякие ненужности типа надписей, иначе нейронка при обучении будет думать, что это часть рисунка и периодически будут всплывать надписи в генерациях.
Итого у меня вышло 144 картинки, скармливаем их нейронке и ждем, ждем довольно долго, потому я оставил комп на ночь. И вот наконец дождались! захожу в нейронку, загружаю нашу свежеиспеченную модель и пишу самый простой промпт:
Конечно же 4K картинку мы сразу не получаем (изначальная картинка была с разрешением 512х512), но все детали тут нарисованы именно нейронкой, в фотошопе я только добавил хроматическую абберацию, чуток зернистости и слегка подкрутил уровни для кинематографичности картинки.
На вскидку результат относительно неплох, но дьявол кроется в деталях, узоры на одежде, руки, меч получился относительно неплохо, однако как всегда проблема с руками, это впринципе поправимо. Однако я решил заглянуть в BLIP файлы датасета (это краткое описание которое дает нейросеть) и выяснилось, нейронка не может различить расы (человек, эльф, орк и тд), кстати именно поэтому мы получили эльфийку с "бюстом" темной эльфийки
Выход из этого есть, либо расписывать BLIP файлы вручную, но у меня нет столько времени, в конце концов платят мне не за это)) поэтому я решил просто поделить модель на разные субмодели (женщина эльф, мужчина человек и тд). К тому же стоит переработать датасет, чтобы нейронка могла рисовать детали и генерить предметы из игры (оружие, доспехи и тд).
Этот пост будет обновляться по мере появления апдейтов в моей работе.
P.S. Для любителей 18+ контента сразу отвечаю: да, нейронка не цензурирована, потому есть возможность генерить взрослый контент со всеми возможными деталями
Тем кому интересно ставьте огоньки в реакциях, сделаю канал в телеге
Пример моей работы
Итак для того, чтобы натренировать модель нужны были данные, тобишь - картинки. Тут я стартанул на всем известные ArtStation и Pinterest в поисках крутых артов, к сожалению изображений по нашей стилистике относительно немного, потому пришлось несколько часов ковырять нескончаемую ленту. После чего идем в фотошоп и приводим каждую картинку к нужному нам разрешению, кадрируем и убираем всякие ненужности типа надписей, иначе нейронка при обучении будет думать, что это часть рисунка и периодически будут всплывать надписи в генерациях.
Итого у меня вышло 144 картинки, скармливаем их нейронке и ждем, ждем довольно долго, потому я оставил комп на ночь. И вот наконец дождались! захожу в нейронку, загружаю нашу свежеиспеченную модель и пишу самый простой промпт:
и получаем вот такой результат:a woman with a sword
Конечно же 4K картинку мы сразу не получаем (изначальная картинка была с разрешением 512х512), но все детали тут нарисованы именно нейронкой, в фотошопе я только добавил хроматическую абберацию, чуток зернистости и слегка подкрутил уровни для кинематографичности картинки.
На вскидку результат относительно неплох, но дьявол кроется в деталях, узоры на одежде, руки, меч получился относительно неплохо, однако как всегда проблема с руками, это впринципе поправимо. Однако я решил заглянуть в BLIP файлы датасета (это краткое описание которое дает нейросеть) и выяснилось, нейронка не может различить расы (человек, эльф, орк и тд), кстати именно поэтому мы получили эльфийку с "бюстом" темной эльфийки

Выход из этого есть, либо расписывать BLIP файлы вручную, но у меня нет столько времени, в конце концов платят мне не за это)) поэтому я решил просто поделить модель на разные субмодели (женщина эльф, мужчина человек и тд). К тому же стоит переработать датасет, чтобы нейронка могла рисовать детали и генерить предметы из игры (оружие, доспехи и тд).
Этот пост будет обновляться по мере появления апдейтов в моей работе.
P.S. Для любителей 18+ контента сразу отвечаю: да, нейронка не цензурирована, потому есть возможность генерить взрослый контент со всеми возможными деталями

