Краткие теоретические сведения. Аппроксимация функции одной переменной

Лабораторная работа № 4

Аппроксимация функции одной переменной

Цель работы

Научиться работать с сетью прямой передачи сигнала, функция newff [1]. Разобраться с алгоритмом обратного распространения ошибки.

 

Краткие теоретические сведения

В лабораторной работе рассматривается нейронная сеть с прямой передачей сигнала (с прямой связью) [2], то есть сеть, в которой сигналы передаются только в направлении от входного слоя к выходному, и элементы одного слоя связаны со всеми элементами следующего слоя. Важнейшим для реализации нейронных сетей является определение алгоритма обучения сети.

В настоящее время одним из самых эффективных и обоснованных методов облучения нейронных сетей является алгоритм обратного распространения ошибки, который применим к однонаправленным многослойным сетям. В многослойных нейронных сетях имеется множество скрытых нейронов, входы и выходы которых не являются входами и выходами нейронной сети, а соединяют нейроны внутри сети, то есть скрытые нейроны. Занумеруем выходы нейронной сети индексом , а обучающие примеры индексом . Тогда в качестве целевой функции можно выбрать функцию ошибки как сумму квадратов расстояний между реальными выходными состояниями нейронной сети, выдаваемых сетью на входных данных примеров, и правильными значениями функции , соответствующими этим примерам. Пусть – столбец входных значений, где i=1,2,..,n. Тогда – выходные значения, где j=1,2,…,m. В общем случае nm. Рассмотрим разность , где – точное (правильное) значение из примера. Эта разность должна быть минимальна. Введем расстояния согласно евклидовой метрике, определив норму

. (1)

Пусть целевая функция имеет вид

. (2)

Коэффициент ½ выбран из соображений более короткой записи последующих формул. Задача обучения нейронной сети состоит в том, чтобы найти такие коэффициенты , при которых достигается минимум (Е 0).

На рис. 1 показана архитектура нейронной сети с прямой передачей сигнала.

Рис. 1. Схема архитектуры нейронной сети с прямой передачей сигнала

 

Здесь приняты обозначения, используемые в [1], а именно, ‑ вектор входа, , ‑ матрицы весов входа и выхода, ‑ смещение, ‑ выход слоя, ‑ выход сети, tansig (гиперболическая тангенциальная), purelin (линейная) ‑ соответствующие функции активации.

Веса и смещения определяются с помощью алгоритма обратного распространения ошибок [3].

Обучение сети обратного распространения требует выполнения следующих операций:

1. Выбрать очередную обучающую пару из обучающего множества; подать входной вектор на вход сети.

2. Вычислить выход сети.

3. Вычислить разность между выходом сети и требуемым выходом (целевым вектором обучающей пары).

4. Скорректировать веса сети так, чтобы минимизировать ошибку.

5. Повторять шаги с 1 по 4 для каждого вектора обучающего множества до тех пор, пока ошибка на всем множестве не достигнет приемлемого уровня.