LegoGPT: Штучний інтелект перетворює текстові запити на створення з Lego

Image by Xavi Cabrera, from Unsplash

LegoGPT: Штучний інтелект перетворює текстові запити на створення з Lego

Reading Time: 2 min

Updated 2 times since publishing

Дослідники з університету Карнегі Меллон представили LegoGPT, нову систему штучного інтелекту, яка створює реальні конструкції з Lego за письмовими описами.

У поспіху? Ось основні факти:

  • Забезпечує фізичну стабільність за допомогою фізики-орієнтованого відкату.
  • Навчена на 47 000 стабільних конструкціях Lego та підписах GPT-4o.
  • Використовує лише 8 типів цеглинок у просторі 20×20×20.

Це перший штучний інтелект такого роду, який не лише слідує текстовому підказу – наприклад, “динамічний, видовжений судноплавний споруд” – але й гарантує, що отримана конструкція є фізично стабільною та може бути побудована, цеглиною за цеглиною.

“Щоб досягти цього, ми створюємо масштабний, фізично стабільний набір даних про дизайни LEGO, разом з їхніми відповідними підписами”, – пояснила команда у своїй науковій статті.

LegoGPT було навчено за допомогою понад 47 000 стабільних моделей Lego, спарених з детальними підписами, згенерованими GPT-4o. Вони були створені з 3D-форм, перетворені в структури Lego, а потім перевірено на стабільність у реальному світі за допомогою фізичних симуляцій.

Кожну структуру також описували з 24 кутів, щоб штучний інтелект міг навчитися, як мають виглядати різні дизайни, описані словами.

Команда використовувала спеціальну техніку, яку називають “зворотний рух, що враховує фізику”, при якому нестабільні частини дизайну видаляють та знову будують, доки вся структура не буде стійкою. Це покращило ефективність будівництва з 24% до 98,8%.

Модель штучного інтелекту, що базується на LLaMA-3.2-Instruct від Meta, передбачає, який наступний кубик Lego слід поставити – це схоже на те, як ChatGPT передбачає наступне слово. Кожен запропонований кубик перевіряється на розміщення, розмір і потенційні зіткнення перед додаванням до моделі.

Створення LegoGPT можуть будувати як люди, так і роботи. “Наші експерименти показують, що LegoGPT створює стабільні, різноманітні та естетично приємні конструкції з Lego, які тісно відповідають вхідним текстовим підказкам”, – написали дослідники.

Наразі, LegoGPT використовує лише вісім базових типів цеглинок і працює у просторі 20×20×20, але команда сподівається його розширити.

Їх повний набір даних, код та модель можна вільно використовувати, так що інші можуть продовжувати роботу над цим дослідженням. Або ви можете просто поекспериментувати з їхнім демо.

Did you like this aricle? Rate It!
Average form Rating Comment 1 Average form Rating Comment 2 Average form Rating Comment 3 Average form Rating Comment 4 Average form Rating Comment 5

We're thrilled you enjoyed our work!

As a valued reader, would you mind giving us a shoutout on Trustpilot? It's quick and means the world to us. Thank you for being amazing!

Rate us on Trustpilot
0 Voted by 0 Users
Title
Comment
Thanks for your Feed Back