СОПОСТАВИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ДОБУЧЕНИЯ МОДЕЛЕЙ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ ДЛЯ УЗБЕКСКОГО ЯЗЫКА
Ключевые слова:
автоматическое распознавание речи, узбекский язык, добучение моделей, малоресурсные языки, Whisper, Wav2Vec 2.0, тюркские языки, WER, трансферное обучение.Аннотация
В статье проведён сопоставительный анализ десяти моделей автоматического распознавания речи (ASR) применительно к узбекскому языку, относящемуся к категории малоресурсных. Рассмотрены архитектуры Whisper, Wav2Vec 2.0 XLSR-53, XLS-R, HuBERT, Conformer, MMS, DeepSpeech2, NeMo Conformer и w2v-BERT 2.0. Проведена серия экспериментов по добучению (fine-tuning) предобученных моделей на корпусе узбекской речи объёмом 120 часов. Оценка качества выполнена по метрике WER (Word Error Rate). Результаты показывают, что добученная модель w2v-BERT 2.0 демонстрирует наименьший показатель WER (13,8%), а Whisper large-v3 после добучения достигает 12,4%. Выявлены специфические трудности обработки узбекской речи, связанные с агглютинативной морфологией, вариативностью фонетической реализации и ограниченностью размеченных данных.
Библиографические ссылки
1. Кипяткова И.С. Карпов А.А. Разновидности глубоких искусственных нейронных сетей для систем распознавания речи // Труды СПИИРАН. – 2016. № 6(49). – С. 80-103.
2. Radford A., Kim J.W., Xu T., Brockman G., McLeavey C., Sutskever I. Robust Speech Recognition via Large-Scale Weak Supervision // OpenAI Technical Report. – 2022. https://cdn.openai.com/papers/whisper.pdf
3. Гапочкин А. В. Нейросетевые методы для распознавания речи // Альманах современной науки и образования. – 2014. № 3 (82). – С. 55-58.
4. Conneau A., Baevski A., Collobert R., Mohamed A., Auli M. Unsupervised Cross-Lingual Representation Learning for Speech Recognition // Proc. Interspeech – 2021. Brno, Czechia, – 2021. – P. 2426-2430.
5. Хлопенкова А. Ю., Белов Ю. С. Исследование алгоритмов автоматического распознавания речи на основе акустического и языкового моделирования // Научное обозрение. Технические науки. – 2018. № 1. – С. 32-36.
6. https://www.iksmedia.ru/news/6077097-V-Kazaxstane-razrabotana-ASRmodel.html