Технология "Глубинное обучение" (Deep Mind) может распознавать речь.
Некоторые использовали для этого такие приемы, как DCT (дискретное косинусное преобразование) и DBF (глубокое распознавание особенностей дикторской речи). В общем, раньше исследования в этой области состояли из двух направлений. Первое — с помощью CTC (нейросетевая темпоральная классификация) покадрово распознавать информацию, а потом преобразовывать ее в набор вероятностных распределений среди всех возможных фонем. Недостаток данного направления заключается в том, что слова не связывались друг с другом. Второе направление — тренировка последовательности — модели последовательностей. При этом сначала считывается отрезок последовательной информации, а потом уже производится анализ ее вероятности. Для этой же системы большую роль сыграла статья «Listen, attend and spell». В статье был выдвинут метод точного последовательного преобразования звуков в символы — модель последовательностей.
- 9 Дек, 11:57
Больше, чем Uber: технология блокчейна может сделать экономику совместного потребления реальной и стабильной
Новый документ , озаглавленный «блокчейн как главная технология для распространения равноправной рыночной экономики», написанный экономистами из Центра изучения технологии блокчейна при University College London (UCL) и из Impact Institute, бросает в...