Евразийский сервер публикаций

Евразийская заявка на изобретение № 202291304

Библиографические данные

(11) Номер патентного документа

202291304

(21) Номер евразийской заявки

202291304

(22) Дата подачи евразийской заявки

2019.11.15

(51) Индексы Международной патентной классификации

G10L 15/16 (2006.01)
G10L 15/20 (2006.01)
G10L 25/51 (2013.01)
G10L 25/30 (2013.01)

(43)(13) Дата публикации евразийской заявки, код вида документа

A1 2022.08.11 Бюллетень № 08 тит.лист описание (WO)

(86) Номер и дата подачи международной заявки

RU2019/000818

(87) Номер и дата публикации международной заявки

2021/096380 2021.05.20

(71) Сведения о заявителе(ях)

ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ЦРТ-ИННОВАЦИИ" (RU)

(72) Сведения об изобретателе(ях)

Меденников Иван Павлович, Присяч Татьяна Николаевна, Романенко Алексей Николаевич, Кореневская Мария Максимовна, Сорокин Иван Витальевич, Хохлов Юрий Юрьевич (RU)

(74) Сведения о представителе(ях)
или патентном поверенном

Нилова М.И. (RU)

(54) Название изобретения

СПОСОБ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ РАСПОЗНАВАНИЮ ЗВУКОВЫХ СОБЫТИЙ В ЗВУКОВОМ СИГНАЛЕ

Реферат [ENG]
(57) Предложен способ обучения нейронной сети распознаванию звуковых событий в звуковом сигнале. Способ обучения вспомогательной нейронной сети определять импульсную характеристику помещения включает получение множества реверберированных звуковых сигналов путём применения ко множеству нереверберированных звуковых сигналов операции свёртки с множеством импульсных характеристик помещения; выделение обучающих признаков, характеризующих каждый из полученного множества реверберированных звуковых сигналов; подачу на вход нейронной сети указанных обучающих признаков реверберированного звукового сигнала вместе с идентификатором импульсной характеристики помещения, соответствующей указанному реверберированному звуковому сигналу, для каждого из полученного множества реверберированных звуковых сигналов. При этом способ обучения нейронной сети распознаванию звуковых событий в звуковом сигнале включает вычисление R-векторов для множества звуковых сигналов, которое включает подачу звукового сигнала на вход вспомогательной нейронной сети и считывание R-вектора для соответствующего звукового сигнала на выходе одного из скрытых слоёв вспомогательной нейронной сети. Способ также включает выделение обучающих признаков, характеризующих каждый из указанного множества звуковых сигналов; и подачу на вход нейронной сети указанных обучающих признаков звукового сигнала, информации о разметке в отношении звукового сигнала, а также соответствующего R-вектора для звукового сигнала для каждого из указанного множества звуковых сигналов. Техническим результатом является повышение точности распознавания речи в условиях реверберации.

Загрузка данных...


Назад Новый поиск