Учені з Техаського університету в Остіні створили технологію, яка з високою точністю перетворює звук міського середовища на візуальні образи.

“ШІ тепер здатен генерувати зображення, що відповідають звуковому ландшафту”, – оголосили фахівці.

Зазначається, що модель дифузії звукового ландшафту в зображення пройшла “навчання” на 10-секундних роликах. Вони складалися з нерухомої картинки і звуків, що супроводжують візуальний ряд. Картинки були взяті із зображенням ландшафтів Азії, Європи, Північної та Південної Америки, Африки.

Генеруючи картинки за допомогою звуків, ШІ перетворював початкові зображення в режим дня або ночі, залежно від рівня шумів. А також моделював кількість людей на вулицях.

У цей же час відтворювали звукову доріжку, на основі якої ШІ створив картинку. Люди вгадували, яку картинку на основі цих звуків створив ШІ у 80 випадках зі ста.

Вчені вважають, що їхня розробка може бути корисною криміналістам, які на основі звукового ряду зможуть відтворити місце злочину, наприклад.

“Отримані результати можуть розширити знання про вплив зорового і слухового сприйняття на психічне здоров’я, стати основою для розроблення нових підходів до міського планування і сприяти підвищенню загальної якості життя в громадах”, – стверджують учені.

Джерело

Від tatuanaru