Хотите всегда оставаться в курсе событий? Подписывайтесь на @cryptochan и получайте новости в нашем Telegram канале.
×
Главная » #STREAM » Новости криптовалют за 27.11.2016
15:35

Технология "Глубинное обучение" (Deep Mind) может распознавать речь.

Некоторые использовали для этого такие приемы, как DCT (дискретное косинусное преобразование) и DBF (глубокое распознавание особенностей дикторской речи). В общем, раньше исследования в этой области состояли из двух направлений. Первое — с помощью CTC (нейросетевая темпоральная классификация) покадрово распознавать информацию, а потом преобразовывать ее в набор вероятностных распределений среди всех возможных фонем. Недостаток данного направления заключается в том, что слова не связывались друг с другом. Второе направление — тренировка последовательности — модели последовательностей. При этом сначала считывается отрезок последовательной информации, а потом уже производится анализ ее вероятности. Для этой же системы большую роль сыграла статья «Listen, attend and spell». В статье был выдвинут метод точного последовательного преобразования звуков в символы — модель последовательностей.

Обсудить в чате
Похожие новости

В мире за неделю

Pro banner