Если вы слышите в телефонной трубке или на диктофонной записи голос
знакомого — вы верите, что это действительно он. Скоро нам придется не
доверять своему слуху. На днях ФСБ заказала интересную техническую
разработку: систему имитации голоса. Задачу «исследовать для русского
языка возможность имитации голоса заданной личности с cохранением
высокой разборчивости речи» силовики предлагают решить за 13 месяцев.
Войсковая
часть № 35533 из подмосковного города Железнодорожного опубликовала на
официальном сайте госзакупок сообщение о конкурсе. В одном из его лотов
речь идет об «антропоморфных методах анализа и обработки речи». Задача
ставится такая: разработать «способ автоматической верификации личности
по голосу, а также способы изменения и имитации голоса заданной
личности». На эти цели заказчик готов потратить 6 млн руб. Срок
выполнения работ — не больше 13 месяцев.
Войсковая часть № 35533
— одно из подразделений ФСБ. В интернете легко найти подтверждения
этому: например, решение о передаче профилактория и дошкольного
учреждения с баланса в/ч 35533 ФСБ России в муниципальную собственность
г. Железнодорожного.
Среди других проектов этого подразделения —
автоматизированное составление текстового резюме звукозаписи (на это
выделено 20 млн руб.); определение психоэмоционального состояния
говорящего (7 млн руб.); нахождение в большом количестве записей тех, в
которых звучит голос нужного человека (13 млн руб.).
По словам
экспертов, прототипы систем имитации голоса уже существуют. Но пока
специалисты легко отличают подделку. Сегодня для создания имитации
требуется не менее часа речи нужного человека. Речь разрезают на
мельчайшие кусочки (так называемые аллофоны звуков) и из них собирают
нужные слова. Затем на сигнал надо наложить индивидуальную интонацию.
Пока что «швы» между звуками видны специалистам. Но эта задача будет
решена, это вопрос времени. Источник: сайт "Третий Рим".