O‘ZBEK TILI UCHUN AVTOMATIK NUTQNI TANISH MODELLARINI QO‘SHIMCHA O‘QITISH NATIJALARINING QIYOSIY TAHLILI

Mualliflar

  • Сухроб Авезов Buxoro davlat universiteti Author

Kalit so‘zlar:

avtomatik nutqni tanish, o‘zbek tili, modellarni qo‘shimcha o‘qitish, kam resursli tillar, Whisper, Wav2Vec 2.0, turkiy tillar, WER, transfer o‘qitish.

Annotatsiya

Maqolada kam resursli tillar toifasiga kiruvchi o‘zbek tiliga nisbatan avtomatik nutqni tanish (ASR) bo‘yicha o‘nta modelning qiyosiy tahlili amalga oshirilgan. Whisper, Wav2Vec 2.0 XLSR-53, XLS-R, HuBERT, Conformer, MMS, DeepSpeech2, NeMo Conformer va w2v-BERT 2.0 arxitekturalari ko‘rib chiqilgan. Oldindan o‘qitilgan modellarni 120 soat hajmdagi o‘zbek nutqi korpusida qo‘shimcha o‘qitish (fine-tuning) bo‘yicha bir qator tajribalar o‘tkazilgan. Sifatni baholash WER (Word Error Rate) metrikasi asosida bajarilgan. Natijalar shuni ko‘rsatadiki, qo‘shimcha o‘qitilgan w2v-BERT 2.0 modeli eng past WER ko‘rsatkichini (13,8%) namoyish etadi, Whisper large-v3 esa qo‘shimcha o‘qitilgandan so‘ng 12,4% ga erishadi. O‘zbek nutqini qayta ishlashning agglutinativ morfologiya, fonetik realizatsiyaning variativligi hamda belgilangan ma’lumotlarning cheklanganligi bilan bog‘liq o‘ziga xos qiyinchiliklari aniqlangan.

Iqtiboslar

1. Кипяткова И.С. Карпов А.А. Разновидности глубоких искусственных нейронных сетей для систем распознавания речи // Труды СПИИРАН. – 2016. № 6(49). – С. 80-103.

2. Radford A., Kim J.W., Xu T., Brockman G., McLeavey C., Sutskever I. Robust Speech Recognition via Large-Scale Weak Supervision // OpenAI Technical Report. – 2022. https://cdn.openai.com/papers/whisper.pdf

3. Гапочкин А. В. Нейросетевые методы для распознавания речи // Альманах современной науки и образования. – 2014. № 3 (82). – С. 55-58.

4. Conneau A., Baevski A., Collobert R., Mohamed A., Auli M. Unsupervised Cross-Lingual Representation Learning for Speech Recognition // Proc. Interspeech – 2021. Brno, Czechia, – 2021. – P. 2426-2430.

5. Хлопенкова А. Ю., Белов Ю. С. Исследование алгоритмов автоматического распознавания речи на основе акустического и языкового моделирования // Научное обозрение. Технические науки. – 2018. № 1. – С. 32-36.

6. https://www.iksmedia.ru/news/6077097-V-Kazaxstane-razrabotana-ASRmodel.html

Yuklab Olishlar

Nashr qilingan

2026-04-14