Adobe VoCo — новый инструмент для работы с аудио от Adobe

Adobe хорошо известна за счет разработки инструментов для работы с графикой и видео, а такие программные продукты как Photoshop или Premiere являются обязательными участниками креативной индустрии на протяжении уже многих лет. В то же самое время, компания пробовала свои силы на поприще аудиообработки, результатом чего стал довольно мощный многодорожечный редактор Audition. Проблема в том, что долгое время Audition оставался побочной разработкой компании, чей основной доход приходит от тех, кто работает с визуальным контентом. Тем не менее Adobe не оставляет надежд на освоение рынка аудиообработки — на прошедшей недавно презентации Adobe MAX 2016 компания показала новый продукт, получивший название Adobe VoCo.

Adobe VoCo (от первых букв в словосочетании «Voice Conversion») — инструмент, анализирующий голос человека и разбивающий звук на фонемы, то есть на индивидуальные звуки, используемые для произнесения слов. Компания уверяет, что теперь любой пользователь сможет записывать новые аудиоклипы, а программа будет «переводить» звук в текст, который можно свободно редактировать. Конечно, возможность подобной работы с голосом и речью далеко не нова, и в Adobe это прекрасно понимают. Именно поэтому главной особенностью Adobe VoCo можно назвать возможность синтезировать новые слова, которые изначально не было частью оригинального аудиоклипа. При этом новые слова будут произноситься тем же голосом, что и записанный аудиоотрезок с речью.

Презентация проекта Adobe VoCo:

Что-то подобное уже встречалось в индустрии. К примеру, Vocaloid может превращать текст в вокальную линию и «пропевать» набранный текст на основе пресетов голоса. ПО Dragon Dictate, на основе анализа голоса, выполняет транскрипцию речи в обыкновенный текст, хотя результаты оставляют желать лучшего. Нельзя не отметить Melodyne и встроенные в DAW возможности обработки голоса, пусть они и не настолько амбициозны, как Adobe VoCo.

Самое интересное в VoCo — это высокое качество синтезированного голоса. При прослушивании голос создает впечатление живого человека, а не запрограммированного пресета, как это происходит при работе с Vocaloid. Если Adobe сможет довести технологию до логического завершения, то, по заверениям разработчиков, возможности VoCo будут поистине безграничны. На данный момент результаты синтеза голоса вряд ли смогут одурачить кого-либо — отличить голос реального человека и его синтез в Adobe VoCo все еще можно, но не стоит забывать, что речь идет о прототипе, находящемся в активной разработке. Кстати говоря, пока что остается до конца не ясным, в каком виде Adobe VoCo будет существовать: в качестве надстройки над Adobe Audition или в качестве самостоятельного продукта в рамках пакета Adobe Creative Cloud.

Перспективы

Комментаторы и пользователи на просторах Сети уже размышляют на тему потенциальных вариантов использования Adobe VoCo. Некоторые даже окрестили разработку «Photoshop для аудио». В частности, пользователи предполагают, что благодаря возможностям VoCo можно будет «заставлять» людей делать то, чего они не делали: подобно фотожабам и различным картинкам, VoCo позволит «заставить» людей говорить то, чего они не говорили. Конечно, если технология окажется достаточно качественной. Кстати говоря, в Adobe прекрасно понимают опасности своей новой разработки — компания обещает придумать какой-либо выход из ситуации наподобие водяных знаков, которые позволят отличить оригинальную речь от синтезированной.

С точки зрения производства музыки, Adobe VoCo также выглядит интересным инструментом. Если Adobe доведет разработку до релиза, то у продюсеров, композиторов и музыкантов появится возможность не просто корректировать голос по высоте, а полностью ресинтизировать его. Еще ни одна предыдущая разработка не позволяла добавлять в вокальную линию новые слова: теоретически, звукорежиссер и продюсер смогут доработать или изменить текст песни даже после того, как вокалист покинул студию после удачной записи. Да и в целом, потенциал Adobe VoCo пока еще сложно представить.

Будем надеяться, что компания сможет представить технологию Adobe VoCo в виде законченного продукта. Вполне возможно, что это станет большим шагом вперед для всего цифрового аудио.