Goodnews.ua


Алгоритм научился имитировать объемный звук для большинства видео

Декабрь 31
23:02 2018

Благодаря асимметричной форме ушей и расстоянию между ними человек определяет направление к источнику звука. Специалисты Facebook Research и Техасского университета нашли способ правдоподобно сымитировать объемный звук при помощи машинного обучения и пары искусственных ушей.

Мозг человека использует различные приспособления для того, чтобы понять, откуда из трехмерного пространства доносится звук. Один из них — разное время, которое требуется звуку, чтобы достигнуть каждого уха. Звук, идущий слева, очевидно, достигнет до левого уха чуть раньше. Другой способ — разница в объеме. Тот же звук будет восприниматься как более громкий левым ухом, чем правым. Форма уха также помогает мозгу определить, откуда исходит звук, рассказывает MIT Technology Review.

Таким образом, перед желающими воссоздать эту систему искусственно стоит непростая задача. Один из способов — стереофоническая запись. Если разместить в каждом ухе по микрофону, можно зафиксировать эти мельчайшие вариации восприятия звука.

Проанализировав их, ученые могут воспроизвести их при помощи математического алгоритма. Тогда обычные наушники можно превратить в аппарат, создающий трехмерное звучание.

Но поскольку уши у всех разные, все слышат звуки по-своему. Пришлось бы проводить измерения для каждого в отдельности, прежде чем воспроизводить запись. В лаборатории это возможно, но на практике — нет.

Однако, есть способы приблизиться к 3D-звуку без учета индивидуальной формы ушей. Один из них и применили Жохань Гао и Кристен Грауман, чтобы определить, с какой стороны приближается звук, при помощи визуальных подсказок. Система машинного обучения, получив в свое распоряжение видеозапись сцены и монофонического звука, находит его источник и рассчитывает время достижения звуковыми волнами ушных каналов и объем звука.

В результате слушатель воспринимает почти трехмерный звук.

К примеру, на видеозаписи два музыканта, барабанщик и клавишник, один слева, другой справа. Алгоритм распознает это и распределяет звуковые потоки соответственно: ударные — налево, синтезатор — справа.

Для обучения алгоритма ученые собрали базу данных примеров и сделали стереофонические записи свыше 2000 видеоклипов. Чтобы сымитировать слуховой аппарат человека, они изготовили два искусственных уха, закрепили их на болванке шириной с голову человека и дополнили систему камерой GoPro.

3fc95326-827a-465f-a518-ff1a67292255.jpeg (64 KB)

Результат можно услышать тут (не забудьте надеть наушники):

Авторы назвали свой звук 2,5D по причине того, что система не персонализирует звук под отдельного пользователя. Также она не распознает источник звука, если его нет на видео. Грауман и Гао планируют продолжить работу над своим изобретением и расширить его функциональность.

Источник: hightech.plus

Share

Статьи по теме







0 Комментариев

Хотите быть первым?

Еще никто не комментировал данный материал.

Написать комментарий

Комментировать

Залишаючи свій коментар, пам'ятайте, що зміст та тональність вашого повідомлення можуть зачіпати почуття реальних людей, що безпосередньо чи опосередковано пов'язані із цією новиною. Виявляйте повагу та толерантність до своїх співрозмовників. Користувачі, які систематично порушують це правило, будуть заблоковані.

Website Protected by Spam Master


Останні новини

«Не поведусь на провокации»: Ротань — о победе над Кривбассом и неожиданном лидерстве Александрии в УПЛ

Читать всю статью

Ми у соцмережах




Наші партнёри

UA.TODAY - Украина Сегодня UA.TODAY
Goodnews.ua