Евразийский сервер публикаций

Евразийская заявка № 202291304

Библиографические данные
(21)202291304 (13) A1
(22)2019.11.15

[ A ] [ B ] [ C ] [ D ] [ E ] [ F ] [ G ] [ H ]

Текущий раздел: G


Документ опубликован 2022.08.11
Текущий бюллетень: 2022-08
Все публикации: 202291304

(51) G10L 15/16 (2006.01)
G10L 15/20 (2006.01)
G10L 25/51 (2013.01)
G10L 25/30(2013.01)
(43)A1 2022.08.11 Бюллетень № 08 тит.лист описание (WO)
(86)RU2019/000818
(87)2021/096380 2021.05.20
(71)ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ЦРТ-ИННОВАЦИИ" (RU)
(72)Меденников Иван Павлович, Присяч Татьяна Николаевна, Романенко Алексей Николаевич, Кореневская Мария Максимовна, Сорокин Иван Витальевич, Хохлов Юрий Юрьевич (RU)
(74)Нилова М.И. (RU)
(54)СПОСОБ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ РАСПОЗНАВАНИЮ ЗВУКОВЫХ СОБЫТИЙ В ЗВУКОВОМ СИГНАЛЕ
Реферат [ENG]
(57) Предложен способ обучения нейронной сети распознаванию звуковых событий в звуковом сигнале. Способ обучения вспомогательной нейронной сети определять импульсную характеристику помещения включает получение множества реверберированных звуковых сигналов путём применения ко множеству нереверберированных звуковых сигналов операции свёртки с множеством импульсных характеристик помещения; выделение обучающих признаков, характеризующих каждый из полученного множества реверберированных звуковых сигналов; подачу на вход нейронной сети указанных обучающих признаков реверберированного звукового сигнала вместе с идентификатором импульсной характеристики помещения, соответствующей указанному реверберированному звуковому сигналу, для каждого из полученного множества реверберированных звуковых сигналов. При этом способ обучения нейронной сети распознаванию звуковых событий в звуковом сигнале включает вычисление R-векторов для множества звуковых сигналов, которое включает подачу звукового сигнала на вход вспомогательной нейронной сети и считывание R-вектора для соответствующего звукового сигнала на выходе одного из скрытых слоёв вспомогательной нейронной сети. Способ также включает выделение обучающих признаков, характеризующих каждый из указанного множества звуковых сигналов; и подачу на вход нейронной сети указанных обучающих признаков звукового сигнала, информации о разметке в отношении звукового сигнала, а также соответствующего R-вектора для звукового сигнала для каждого из указанного множества звуковых сигналов. Техническим результатом является повышение точности распознавания речи в условиях реверберации.

Загрузка данных...