Загальне
Терейковська Л.О., Терейковський І.А.
Київський національний університет будівництва і архітектури
ВИЗНАЧЕННЯ НАЙБІЛЬШ ЕФЕКТИВНОЇ АРХІТЕКТУРИ НЕЙРОННОЇ МЕРЕЖІ, ПРИЗНАЧЕНИОЇ ДЛЯ РОЗПІЗНАВАННЯ ГОЛОСОВИХ СИГНАЛІВ В MOODLE
Аналіз тенденцій розвитку сучасних систем дистанційного навчання (СДО) вказує на те, що одним з основних напрямів їх вдосконалення є розширення функціональних можливостей за рахунок впровадження інтерактивних засобів, що базуються на методах голосового взаємодії.
Вважається, що досягти цього можна за рахунок використання нейромере-жевих методів обробки та розпізнавання голосової інформації. При цьому, ефективність застосування нейронної мережі (НМ) багато в чому залежить від того, наскільки її архітектура відповідає умовам поставленого завдання.
Відповідно [2, 4, 5] в основу проектування нейромережевої архітектури покладена концеп-ція - вимоги поставленої задачі повинні бути оптимальним чином забезпечені в НМ. При цьому базову постановку задачі визначення найбільш ефективної архі-тектури запишемо у вигляді:
{Rk(xi)}→max, xiєX, i=1,2,…I (1),
де Rk- k-ий критерій оптимізації, xi- і-а архітектура НМ, X - множина допустимих архітектур, І - кількість допустимих архітектур, K - кількість критеріїв оптимізації.
У виразі (1) під k-им критерієм оптимізації будемо розуміти деяку k-ту вимогу, яка повинна виконуватися НМ. Відзначимо, що допустимі архітектури НМ мають різні можливості з точки зору забезпечення навчання, обчислювальної потужності і ресурсоємкості в процесі прийняття рішення. Тому представляє інтерес розробка принципів визначення найбільш ефективної архітектури.
У першому наближенні для i-ої допустимої архітектури значення k-го критерію дорівнює 1, якщо відповідна k-та вимога повністю в ній забезпечується і дорівнює 0, якщо не забезпечується. При цьому вираз (1) можливо переписати так:
∑αkβ kRk(xi) →max, xiєX (2),
де αk - ваговий коефіцієнт k-го критерію, β k - ваговий коефіцієнт, який вра-ховує можливість забезпечення k-го вимоги в i-ой допустимої архітектурі, Rk(xi) - отримане в першому наближенні значення k-го критерію оптимізації для мере-жі i-го типу.
При цьому коефіцієнти αk вказують на значимість для поставленої задачі k-ої вимоги. Значення αk та β k можливо визначити за допомогою експертних оці-нок на підставі аналізу поставленого завдання голосового взаємодії.
Розглянута задача визначення найбільш ефективної архітектури НМ призначеної для розпізнавання фонем в процесі обробки голосових сигналів в СДО, що використовує навчальне середовище Moodle. Базуючись на результатах [2, 3, 6] досліджено наступні архітектури: багатошаровий перспетрон, мережу радіальної базисної функції, топографічну карту Кохонена та глибокі нейронні мережі.
Відзначимо, що розпізнавання фонем є одним із типових блоків розпізна-вання мови, який передує блоку розпізнавання окремих слів. При цьому під поняттям фонеми розуміють граничний елемент, що виділяється лінійним розчле-новуванням мови.
Застосувавши наведену вище концепцію та результати [5] визначено, що серед розглянутих найбільш ефективною нейромережевою архітектурою є ба-гатошаровий перспетрон. Основними факторами, що вплинули на це визначен-ня є його доведена надійність, апробованість в схожих задачах та відносно низька ресурсоємкість яка вкрай важлива для типової СДО, що використовує навчальне середовище Moodle [1].
Список використаних джерел
- Белозубов А.В.. Система дистанционного обучения Moodle / А. В. Бело-зубов, Д.Г. Николаев // СПб. : СПбГУ ИТМО, 2007. – 108 с.
- Ле Н. В. Распознавание речи на основе искусственных нейронных сетей / Н. В. Ле, Д. П. Панченко // Технические науки в России и за рубежом: материа-лы междунар. заоч. науч. конф. – М.: Ваш полиграф партнер, 2011. – С. 8-11.
- Кладов С. А. Распознавание голосовых команд с помощью самоорга-низующейся нейронной сети Кохонена. [Электронный ресурс]. Молодежный на-учно-технический вестник №05, май 2012. – Режим доступа: http://sntbul.bmstu.ru/doc/ 458.html
- Кушнир Д.А. Исследование и разработка нейросетевых методов ана-лиза и обработки речевого сигнала в задаче распознавания речи: дис. … канд. техн. наук: 05.13.01 / Кушнир Д.А. М., 2006. - 182 с.
- Терейовська Л.О. Проблема голосової взаємодії в дистанційному на-вчанні вищого навчального закладу / Л.О. Терейковська, І.А.Терейковський // Управління розвитком складних систем: зб. наук. праць. – 2013. – Випуск 13. – С. 157–161.
- Geoffrey Hinton Deep Belief Nets. [Электронный ресурс]. – Режим досту-па: http://www.cs.toronto.edu/~hinton/nipstutorial/nipstut3.pdf.