Генерація зображення нейронною мережею: 5 безкоштовних сервісів

Генерація зображення нейронною мережею
Генерація зображення нейронною мережею

Головне:

  • Нейронна мережа — це штучний інтелект, який працює за принципом роботи людського мозку. Нейрони приймають, обробляють і дають інформацію, а з’єднання передають її. Основна відмінність нейронів комп’ютерної мережі полягає в тому, що їх потрібно постійно тренувати. Людина розширює нейронну мережу, коли сам дізнається щось нове.
  • В останні роки великий розвиток отримали комп’ютерні нейронні мережі. В основному вони використовуються для завдань, де потрібно обробити текстову, відео-, аудіо та іншу інформацію.
  • Особливою популярністю стали нейронні мережі, здатні швидко генерувати зображення з текстового запиту, об’єднувати графічні об’єкти або відтворювати відсутні елементи, включаючи людські обличчя. Вони не замінюють роботи дизайнерів і художників, а допомагають оптимізувати рутинні процеси.

Як нейронні мережі генерують зображення

Нейронна мережа — це програма, здатна до самонавчання, але її робота потребує «доопрацювання» і вдосконалення в ході практики. Користувач нейронної мережі вводить в неї нову інформацію про те, як виглядають елементи, додає їх назви, за допомогою певних алгоритмів «вчить» програму знаходити однакові і різні фрагменти. Це схоже на те, як маленькі діти запам’ятовують з картинок тварин, кольори, букви алфавіту.

Наприклад, в гугл-пошуку зображення також задіяна нейронна мережа, яку навчили аналізувати картинки і визначати схожість. Після завантаження оригінального зображення нейронна мережа «запускає» його через свою базу, порівнюючи з іншими, і пропонує аналогічні.

За схожим принципом нейронні мережі генерують ілюстрації за допомогою текстового запиту. Ви вказуєте імена об’єктів і істот, описуєте їх, а алгоритм вводить всі можливі елементи зі своєї бази даних для вираження вашого повідомлення. Деякі нейронні мережі не розпізнають текст, але можуть застосовувати візуальні ефекти, стилі та елементи інших зображень до готових рішень.

Хоча напрямок нейронних мереж в останні роки пройшло довгий шлях, і такі програми стають все більш ефективними, генеруються зображення ще далекі від реального мистецтва. Тому поки не варто переживати, що ілюстратори і художники залишаться без роботи. Однак у відкритому доступі вже є десятки сервісів, що дозволяють генерувати зображення онлайн. ForkLog знайшов п’ять таких ресурсів.

DALL-E 2

Нейронна мережа DALL-E 2 є продуктом однієї з провідних компаній-розробників штучного інтелекту OpenAI. Дана програма працює на основі сучасного і популярного алгоритму GPT-3, також створеного компанією OpenAI. Друга версія DALL-E здатна аналізувати текстові запити англійською мовою і швидко генерувати на їх основі зображення.

У жовтні 2022 року відбувся публічний реліз сервісу, який дав можливість вільно реєструватися в сервісі і користуватися ним. При цьому для створення профілю в DALL-E 2 знадобиться номер телефону з обмеженого списку країн.

Генерация изображений нейросетью: 5 работающих сервисов
Портрет Сатоші Накамото, створений DALL-E 2. Дані: ForkLog
У новій версії нейронної мережі доступна функція Outpanting. З її допомогою користувач може намалювати готове зображення. Програма зберігає тіні, відображення, структури, поєднання кольорів у масштабному варіанті картинки.

Реєстрація на DALL-E 2 безкоштовна. Після активації аккаунта у користувача залишається 50 кредитів: кредит списується при відправці чергового текстового запиту. З другого місяця кількість кредитів зменшиться до 15, і накопичити їх буде неможливо, але можна купити.

Функціонал DALL-E 2 вже використовується компаніями і відомими брендами. Наприклад, журнали Cosmopolitan і The Economist використовували нейронну мережу для генерації зображень для своїх обкладинок. Microsoft запустила на базі сервісу власний додаток Designer, яке може генерувати різний контент: тексти, рекламні банери, листівки, логотипи і т.д.

Deep Dream Generator

Deep Dream Generator — це платформа не тільки для створення, але і для редагування зображень з можливістю безкоштовно генерувати кілька зображень після реєстрації профілю. На сайті проекту доступні три формати робіт.

Text 2 Dream

Генерація зображення з тексту. Необхідно ввести запит, який описує потрібне зображення, і нейронна мережа збере його за своїми алгоритмами. Також доступний список готових запитів, таких як стиль малювання і ім’я художника, чия робота буде використовуватися в якості еталона.

Хоча режим Text 2 Dream в цілому дає цікаві та художні результати, його зображення не дотягують до рівня DALL-E 2. Це стосується як інтепретації слів, так і якості картинки. Процес створення займає трохи більше часу.

Генерация изображений нейросетью: 5 работающих сервисов
Зображення, створене Deep Dream Generator за запитом «NFT єдиноріг, що їде в космосі Space X». Дані: ForkLog

Deep Dream

Цей інструмент дозволяє глибоко обробляти вихідне зображення за допомогою алгоритмів AI. Для цього потрібно завантажити оригінальний файл і задати параметри: початкову глибину вивчення, рівень залученості ШІ і номер «шару». Останнє означає, наскільки сильно трансформується зображення: зміни можуть бути дійсно істотними.

Deep Style

Служба обробки зображень, яка використовує напрямки та жанри мистецтва як графічні фільтри. Щоб використовувати Deep Style, вам потрібно завантажити оригінальне зображення та вибрати еталонне зображення зі списку.

Deep Dream Generator безкоштовний у використанні, але протягом обмеженого часу. При реєстрації нараховується 30 балів, які знімаються за використання інструментів: 5 балів за один запит в Deep Style і Text 2 Dream і 2 бали за Deep Dream. Додаткові бали оплачуються: найдешевший план коштує $19 на місяць і дає ліміт в 120 балів, який відновлюється зі швидкістю 12 балів на годину.

Hotpot

Hotpot — ще одна умовно-безкоштовна служба, яка має службу для створення зображень за текстовим запитом. Крім самого запиту, потрібно вказати тип візуального ефекту картинки і бажаний розмір. Нейронним мережам потрібно від 2 до 20 секунд для обробки результату, але якщо сайт перевантажений, очікування може затягнутися на термін до 2 годин і навіть цілого дня. Недоліком безкоштовної версії є повільна швидкість генерації і невеликий розмір зображення.

На практиці довге очікування обробки починається після четвертої спроби згенерувати нову картину. Щоб не витрачати час на обробку запитів, Hotpot пропонує оплатити їх кредитами. Їх можна придбати у вигляді упаковки або підписатися. Наприклад, 800 кредитів коштують 10 доларів, а з щомісячним платежем 1,000 кредитів доступні за 10 доларів.

На готовому зображенні можна застосувати фільтри, додати текст, відредагувати передачу кольору і т.д. Є можливість перетворити картинку в NFT. Hotpot також має багато послуг, пов’язаних з обробкою зображень: відновлення, колоризація, поліпшення обличчя, видалення об’єктів і фону та інші.

Крім того, незабаром у Hotpot з’явиться послуга, яка допоможе писати текстові запити під назвою AI Sparkwriter. Для тих, хто хоче генерувати великі обсяги зображень, Hotpot надає API.

Hotpot також пропонує платні функції для створення NFT-колекцій, що складаються з різноманітних зображень. Для цього є кілька інструментів: Collection Mixer допомагає комбінувати різні об’єкти із завантажених користувачем зображень, AI NFT Photo Maker накладає шари на оригінальні зображення. При створенні цифрових предметів поштучно також потрібно купити ліцензію на послугу.

Night Cafe

Популярний генератор зображень, який не просто збирає графічні елементи з пошукової системи, а вбудовує їх щодо обраного вами стилю.

Основною послугою нейронної мережі є Text To Image. Він малює різні візуалізації Зв’язного, Художнього або Стабільного. У відповідь на запит програма генерує відразу 4 варіанти картинки, які можна завантажити без водяного знака і у високій якості.

Створювати картинки тут можна без реєстрації. На старті вам буде призначено 5 кредитів, вартість одного покоління — 1 кредит. Як тільки пробна версія закінчиться, за кожен новий кредит потрібно буде платити 0,08 долара. Бали нараховуються і за активність в співтоваристві: розміщення повідомлень, коментарів та інші дії.

Незважаючи на те що в Night Cafe використовуються різні готові графічні елементи, всі права власності на готові зображення належать користувачеві.

Dream by WOMBO

На сайті Dream можна генерувати зображення без реєстрації. Програма також доступна у вигляді мобільного додатку для Android і iOS. Щоб отримати нові зображення, досить заповнити текстовий запит, вибрати стиль візуалізації і почекати 10-20 секунд. Нейронна мережа виробляє картинки, які можна завантажити або опублікувати в стрічці на сайті сервісу.

Крім того, готові зображення в Dream можна випустити у вигляді NFT в мережі Ethereum або Polygon. Для цього знадобиться гаманець Web3. Випуск токена безкоштовний, але вам потрібно заплатити комісію мережі.

Мінус сервісу: зображення генеруються в кадрі і в низькому дозволі.

Генерация изображений нейросетью: 5 работающих сервисов
Картина, згенерована в Dream для «Рожевого єдинорога». Дані: ForkLog

Source