Евразийский сервер публикаций

Евразийская заявка на изобретение № 202291304

Библиографические данные

(11) Номер патентного документа	202291304
(21) Номер евразийской заявки	202291304
(22) Дата подачи евразийской заявки	2019.11.15
(51) Индексы Международной патентной классификации	*G10L 15/16* (2006.01) *G10L 15/20* (2006.01) *G10L 25/51* (2013.01) G10L 25/30 (2013.01)
(43)(13) Дата публикации евразийской заявки, код вида документа	A1 2022.08.11 Бюллетень № 08 тит.лист описание (WO)
(86) Номер и дата подачи международной заявки	RU2019/000818
(87) Номер и дата публикации международной заявки	2021/096380 2021.05.20
(71) Сведения о заявителе(ях)	ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ЦРТ-ИННОВАЦИИ" (RU)
(72) Сведения об изобретателе(ях)	Меденников Иван Павлович, Присяч Татьяна Николаевна, Романенко Алексей Николаевич, Кореневская Мария Максимовна, Сорокин Иван Витальевич, Хохлов Юрий Юрьевич (RU)
(74) Сведения о представителе(ях) или патентном поверенном	Нилова М.И. (RU)
(54) Название изобретения	СПОСОБ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ РАСПОЗНАВАНИЮ ЗВУКОВЫХ СОБЫТИЙ В ЗВУКОВОМ СИГНАЛЕ

Реферат [ENG]

(57) Предложен способ обучения нейронной сети распознаванию звуковых событий в звуковом сигнале. Способ обучения вспомогательной нейронной сети определять импульсную характеристику помещения включает получение множества реверберированных звуковых сигналов путём применения ко множеству нереверберированных звуковых сигналов операции свёртки с множеством импульсных характеристик помещения; выделение обучающих признаков, характеризующих каждый из полученного множества реверберированных звуковых сигналов; подачу на вход нейронной сети указанных обучающих признаков реверберированного звукового сигнала вместе с идентификатором импульсной характеристики помещения, соответствующей указанному реверберированному звуковому сигналу, для каждого из полученного множества реверберированных звуковых сигналов. При этом способ обучения нейронной сети распознаванию звуковых событий в звуковом сигнале включает вычисление R-векторов для множества звуковых сигналов, которое включает подачу звукового сигнала на вход вспомогательной нейронной сети и считывание R-вектора для соответствующего звукового сигнала на выходе одного из скрытых слоёв вспомогательной нейронной сети. Способ также включает выделение обучающих признаков, характеризующих каждый из указанного множества звуковых сигналов; и подачу на вход нейронной сети указанных обучающих признаков звукового сигнала, информации о разметке в отношении звукового сигнала, а также соответствующего R-вектора для звукового сигнала для каждого из указанного множества звуковых сигналов. Техническим результатом является повышение точности распознавания речи в условиях реверберации.

Загрузка данных...

Новый поиск