Метод группового учета аргументов мгуа

Содержание

Метод группового учёта аргументов

Метод группового учёта аргументов — раздел Образование, Прогнозирование рыночного поведения и мгуа подход Метод Группового Учета Аргументов, Мгуа (Group Method Of Dat.

Метод группового учета аргументов, МГУА (Group Method of Data Handling, GMDH) — метод порождения и выбора регрессионных моделей оптимальной сложности. Под сложностью модели в МГУА понимается число параметров. Для порождения используется [базовая модель], подмножество элементов которой должно входить в искомую модель. Для выбора моделей используются внешние критерии, специальные функционалы качества моделей, вычисленные на тестовой выборке.

МГУА рекомендуется к использованию в том случае, когда выборка содержит несколько элементов. Тогда при построении регрессионных моделей использовать статистические гипотезы о плотности распределения, плотности распределения например, гипотезу о Гауссовском распределении, невозможно. Поэтому используется индуктивный подход, согласно которому последовательно порождаются модели возрастающей сложности до тех пор, пока не будет найден минимум некоторого критерия качества модели. Этот критерий качества называется внешний критерий, так как при настройке моделей и при оценке качества моделей используются разные данные. Достижение глобального минимума внешнего критерия при порождении моделей означает, что модель, доставляющая такой минимум, является искомой.

Один из авторов этого метода А.Г. Ивахненко пишет: «Осуществляется целенаправленный перебор многих моделей-претендентов различной сложности по ряду критериев. В результате находится модель оптимальной структуры в виде одного уравнения или системы уравнений. Минимум критерия селекции определяет модель оптимальной структуры».

Содержание [убрать] 1 Описание алгоритма МГУА 2 Внешние критерии МГУА 2.1 Критерий регулярности 2.2 Критерий минимального смещения 2.3 Критерий absolute noise-immune 2.4 Критерий предсказательной способности 2.5 Комбинированный критерий 2.6 Парето-оптимальный фронт в пространстве критериев 3 Алгоритм порождения моделей МГУА 3.1 Комбинаторный алгоритм 3.2 Многорядный алгоритм 4 Смотри также 5 Литература 6 Внешние ссылки

Описание алгоритма МГУА

Индуктивный алгоритм отыскания модели оптимальной структуры в состоит из следующих основных шагов.

1. Пусть задана выборка , . Выборка разбивается на обучающую и тестовую. Обозначим — множества индексов из . Эти множества удовлетворяют условиям разбиения . Матрица состоит из тех векторов-строк , для которых индекс . Вектор состоит из тех элементов , для которых индекс . Разбиение выборки представляется в виде

2. Назначается базовая модель. Эта модель описывает отношение между зависимой переменной и свободными переменными . Например, используется функциональный ряд Вольтерра, называемый также полиномом Колмогорова-Габора:

В этой модели — множество свободных переменных и — вектор параметров — весовых коэффициентов

В некоторых случаях имеет смысл увеличить число элементов вектора свободной переменной за счет добавления нелинейных преобразований отдельных переменных. Например, задано конечное множество нелинейных функций . Дополнительная свободная переменная получается путем применения некоторого преобразования из к одной или к нескольким переменным из множества . Базовая модель линейна относительно параметров и нелинейна относительно свободных переменных .

3. Исходя из поставленных задач выбирается целевая функция — внешний критерий, описывающий качество модели. Ниже описаны несколько часто используемых внешних критериев.

4. Индуктивно порождаются модели-претенденты. При этом вводится ограничение на длину полинома базовой модели. Например, степень полинома базовой модели на не должно превышать заданное число . Тогда базовая модель представима в виде линейной комбинации заданного числа произведений свободных переменных:

здесь — линейная комбинация. Аргументы этой функции переобозначаются следующим образом:

Для линейно входящих коэффициентов задается одноиндексная нумерация . Тогда модель может быть представлена в виде линейной комбинации

Каждая порождаемая модель задается линейной комбинацией элементов , в которой множество индексов является подмножеством .

5. Настраиваются параметры моделей. Для настройки используется внутренний критерий — критерий, вычисляемый с использованием обучающей выборки. Каждому элементу вектора — элемента выборки ставится в соответствие вектор , алгоритм построения соответствия указан выше. Строится матрица — набор векторов-столбцов . Матрица разбивается на подматрицы и . Наименьшую невязку , где доставляет значение вектора параметров , который вычисляется методом наименьших квадратов:

При этом в качестве внутреннего критерия выступает среднеквадратичная ошибка

В соответствии с критерием происходит настройка параметров и вычисление ошибки на тестовой подвыборке, обозначенной , здесь . При усложнении модели внутренний критерий не дает минимума для моделей оптимальной сложности, поэтому для выбора модели он не пригоден.

6. Для выбора моделей вычисляется качество порожденных моделей. При этом используется контрольная выборка и назначенный внешний критерий. Ошибка на подвыборке обозначается

где , . Это означает что ошибка вычисляется на подвыборке при параметрах модели, полученных на подвыборке .

7. Модель, доставляющая минимум внешнему критерию, считается оптимальной.

Если значение внешнего критерия не достигает своего минимума при увеличении сложности модели или значение функции качества неудовлетворительно, то выбирается лучшая модель из моделей заданной сложности. Под сложностью модели подразумевается число настраиваемых параметров модели. Существуют следующие причины, по которым глобальный минимум может не существовать:

данные слишком зашумлены,

среди данных нет необходимых для отыскания модели переменных,

неверно задан критерий выбора,

при анализе временных рядов существует значительная временная задержка отыскиваемой причинно-следственной связи.

Внешние критерии МГУА

Авторами метода рассмотрены весьма большое число различных критериев выбора моделей. Значительная часть этих критериев опубликована на сайте http://www.gmdh.net.

Критерий выбора модели может быть назван внешним, если он получен с помощью дополнительной информации, не содержащейся в данных которые использовались при вычислении параметров моделей. Например, такая информация содержится в дополнительной, тестовой выборке.

Алгоритм МГУА использует и внутренний критерий и внешний. Внутренний критерий используется для настройки параметров модели, внешний критерий используется для выбора модели оптимальной структуры. Возможен выбор моделей по нескольким внешним критериям.

Эта тема принадлежит разделу:

Прогнозирование рыночного поведения и мгуа подход

Критерий absolute noise immune.. утверждается что с помощью этого критерия из сильно зашумленных данных..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Метод группового учёта аргументов

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Прогнозирование рыночного поведения и МГУА подход
Для финансовых рынков характерна нестабильность и неустойчивость. При этом известные модели на практике часто оказываются непригодными для прогнозирования. В такой ситуации для анализа, моделирован

Основные Принципы
Предложен академиком А.Г. Ивахненко. Метод использует идеи самоорганизации и механизмы живой природы – скрещивание (гибридизацию) и селекцию (отбор).

Практическое Применение
На Рис.3 представлены прогнозы на один бар переменных High, Low, Close, Average(Close, 5), полученные в результате расчетов многорядным полиномиальным методом МГУА. Отдельно следует подчеркнуть, чт

Метод группового учета аргументов
Метод группового учета аргументов (МГУА) — семейство индуктивных алгоритмов для математического моделирования мультипараметрических данных. Метод основан на рекурс

Метод наименьших квадратов
Перед тем, как начинать рассмотрение МГУА, было бы полезно вспомнить или узнать впервые метод наименьших квадратов — наиболее распространенный метод подстройки линейно зависимых параметров.

Критерий регулярности
Критерий регулярности включает среднеквадратичную ошибку на обучающей подвыборке

Критерий минимального смещения
Иначе критерий непротиворечивости модели: модель которая имеет на обучающей выборке одну невязку, а на контрольной — другую, называется противоречивой. Этот критерий включает разность между зависим

Комбинированный критерий
Этот критерий позволяет использовать при выборе моделей линейную комбинацию нескольких критериев. Комбинированный критерий

Парето-оптимальный фронт в пространстве критериев
Парето-оптимальный фронт — альтернатива комбинированным критериям. Выбирается множество внешних критериев, условиям оптимальности которых должна удовлетворять модель. Каждой модели ставится в соотв

Комбинаторный алгоритм
Комбинаторный (однорядный) алгоритм использует только один ряд выбора. При этом порождаются все возможные линейные комбинации ограниченной сложности. Так как под сложностью понимается число линейно

Многорядный алгоритм
На первом ряде алгоритма порождения моделей задано множество из переменных

Прогнозирование акций Сбербанка методом группового учета аргументов

В данной статье рассмотрим прогнозирование акций Сбербанка на бирже ММВБ с помощью индуктивного метода самоорганизации сложных систем произвольной природы — метода группового учета аргументов (МГУА).

Он основывается на методе нахождения лучшего решения через перебор постепенно усложняющихся вариантов. Метод группового учета аргументов успешно применяется в самых разнообразных областях знания (экономика, биология, медицина) для параметрической и структурной идентификации, моделирования систем, анализа данных и добычи знаний, а также для прогнозирования. Метод предложен украинским академиком Ивахненко А.Г (70-е года прошлого века) и базировался на принципе внешнего дополнения и теореме Вейерштрасса о возможности любую непрерывную функцию с любой точностью представить в виде полинома. Преимущества метода МГУА:
1. Дает аналитическую формулу
2. Отбирает наиболее существенные входы
3. Не требует априорного выбора множества опорных функций
4. Может конструировать очень сложные модели

Суть метода заключается в следующем: Нам дана матрица входных факторов X и вектор выходного показателя Y, задача идентифицировать (описать) зависимость
Y=F(x1,x2,…,xn).
Описание зависимости F будем производить полиномом Колмогорова-Габора.

Замечено, что при увеличении степени этого полинома точность описания им функции F(x) сначала увеличивается, а потом уменьшается. Момент, когда точность описания полиномом максимальна, процесс увеличения степени заканчивается. На первом этапе мы выбираем опорные функции. Это могут быть функции вида:
y=a0+a1xixj ; y=a0+a1xi+a2xj ; y=a0+a1xi+a2xj+a3xixj и другие. Для определения коэффициентов будем использовать метод наименьших квадратов.
Общий алгоритм работы МГУА: имеем зависимость yk=f(xi,xj) где f – одна из указанных выше зависимостей (к примеру, зависимость котировки акции от объема выпуска, капитализации, уровня цен, инфляции, уровня безработицы в секторе и т.д.) или подобная им, k – количество зависимостей. После определения k зависимостей по внешнему критерию отбираем лучшие по МНК и получаем s – количество отобранных зависимостей. Первый шаг отбора закончен. Процесс повторяем по кругу пока не получим модель оптимальной сложности описывающей процесс изменения котировки акции. Структура оптимальной сложности соответствует минимуму внешнего критерия.

Попробуем спрогнозировать динамику изменения акций Сбербанка с помощью метода группового учета аргументов. Временной ряд котировок Сбербанка представлен ценами закрытия часовых сессий в период с января до ноября 2010 года (рисунок 1).

Рисунок 1. Котировки Сбербанка за 11 месяцев

Для работы воспользуемся программой GMDH Shell. Настройки МГУА:
Количество точек для тестирования модели: 20
Количество точек для обучения модели: 300
Интервал прогнозирования: 10
Класс базовой модели: a+xi
Алгоритм перебора модели: комбинаторный

Входные параметры для алгоритма МГУА возьмем сглаженные Moving Average (5) данные по ценам открытия, закрытия, минимумам и максимумам за час:
x1=Close[60];
x2=Open[60];
x3=Low[60];
x4=High[60];

Выходные данные будут равны значениям цен закрытия за час:
y=Close[60];

После завершения работы алгоритма МГУА получим модель y= x1*1,015 изменения котировок акций Сбербанка. Из этой формулы можно сделать вывод, что основной компонент модели – x1, а компоненты x2, x3,x4 можно из модели убрать. На рисунке 2 серая линия отражает котировки Сбербанка, синяя – построенная модель и красные точки – тестирование модели (10 точек) и прогнозирование (10 последних точек).

Рисунок 2. Построение модели

Если рассмотреть поближе правый часть графика, то видно прогноз Сбербанка на 10 часов вперед.

Сначала акции банка немного вырастут, а затем дадут небольшую коррекцию.

10 точек изображенных над серой линией нужны для тестирования созданной модели, а 10 точек за серой линией это уже прогноз в будущее.

Рисунок 3. Прогноз Сбербанка на 10 часов вперед

Обобщенные показатели точности нашего прогноза:
MAPE (Mean absolute percentage error, абсолютная процентная ошибка)-0,9 %
RMSPE (Root mean square percentage error – корень из средней процентной ошибки в квадрате)-1,2 %

Лекции по Методам Социально-Экономического Прогнозирования — файл МСЭП_методичка.doc

Доступные файлы (1):

МСЭП_методичка.doc 2529kb. 19.01.2010 00:17 скачать

содержание

    Смотрите также:
  • по Социально-экономическому прогнозированию[ лекция ]
  • по Методам социально-экономического прогнозирования[ лабораторная работа ]
  • Статистические методы прогнозирования в экономике[ лекция ]
  • Экономика стран Юго-Восточной Азии[ лабораторная работа ]
  • Логинов В.Г. Социально-экономическая оценка развития природно-ресурсных районов Севера[ документ ]
  • Курсовой проект — Программы социально-экономического развития проблемных регионов на примере России и ЕС[ курсовая работа ]
  • Методы прогнозирования экономических процессов[ лабораторная работа ]
  • Мониторинг и оценка в управлении муниципальным социально-экономическим развитием[ документ ]
  • Анализ и диагностика финансово-экономической деятельности предприятия[ документ ]
  • Дипломный проект — Взаимоотношения власти, Бизнеса и общества как фактор социально-Экономического развития[ дипломная работа ]
  • Теория экономического анализа[ лекция ]
  • Конспект для сдачи Теории экономического анализа[ документ ]

МСЭП_методичка.doc

4.4. Метод группового учета аргументов

Алгоритмы, использующие метод группового учёта аргументов (МГУА), предназначены для получения модели исследуемого процесса [13 16, 26]. Это моделирование осуществляется путём перебора различных моделей-претендентов по внешним критериям, при этом внешний критерий сначала уменьшается, проходя через точку минимума при оптимальной модели, после чего начинает возрастать в области переусложнённых моделей.

Алгоритмы МГУА являются чрезвычайно помехоустойчивыми – при соотношении помеха/сигнал  = 20-30% алгоритмы позволяют получить точную физическую модель; алгоритмы не теряют работоспособности вплоть до соотношения  = 300-400%. В этой области алгоритм МГУА применяется для краткосрочного прогнозирования; и только при отношении помеха/сигнал, большем 400%, алгоритмы МГУА полностью теряют свою пригодность для моделирования

Оптимальная модель процесса, полученная при помощи МГУА, может служить для прогнозирования данных на будущее.

4.4.1. Модели и их представление. 4.4.1.1. Полиномиальная модель. Полиномиальная модель представляет собой полином некоторой максимальной степени от всех аргументов. В случае максимальной степени m = 2 и количества переменных n = 3 полином имеет членов и выглядит так:

Иногда в состав аргументов требуется ввести обратные величины , их степени или другие нелинейные функции (целесообразность введения новых аргументов определяется по уменьшению минимального значения основного критерия). В любом случае полный полином является линейным по коэффициентам, для определения которых применяется МНК.

Одна из возможных схем работы этого алгоритма выглядит так. Сначала определяются все модели, состоящие из одного аргумента:

Далее рассматриваются всевозможные модели, состоящие из двух аргументов, и т.д. При этом модель, описываемая полиномом, проверяется на оптимальность и соответствие критериям селекции.

^ 4.4.1.2. Гармоническая модель. При построении гармонической модели интервал главных значений частот искомых гармоник длиной 2 разбивается (вообще говоря, произвольно) на n промежутков. Каждому полученному дискретному значению частоты i ставится в соответствие «переобозначенный гармонический аргумент» вида

где коэффициенты Ci, Ai, Bi определяются по методу наименьших квадратов на всех N точках исходных данных.

Далее выполняется полный перебор всех частных моделей различной сложности. При этом, начиная с того момента, когда рассматриваются модели, имеющие более двух гармоник, определяются коэффициенты моделей по отношению к уже вычисленным «гармоническим аргументам»:
^

4.4.2. Критерии селекции моделей

Критерием модели называется в общем случае мера количественного сравнения моделей различной сложности, которая позволяет выделить некоторое подмножество лучших моделей из всего их множества, генерируемого в процессе самоорганизации.

Все критерии можно разделить на две группы:

  • критерии точности, выражающие ошибку проверяемой модели на различных частях выборки;
  • критерии согласованности, являющиеся мерой близости оценок, полученных на различных частях выборки.

Обе группы критериев могут применяться как в симметричной, так и в несимметричнойформе. Симметричная форма критерия означает, что в этом критерии равноправно используется информация как из обучающей последовательности (далее – A), так и из первой проверочной последовательности (далее – B). Несимметричным критерий называется в противном случае. Кроме уже введённых обозначений последовательностей A и B, введём ещё одну последовательность: W, .

Итак, рассмотрим основные критерии, применяющиеся для селекции моделей.

^ 4.4.2.1. Критерии точности. Критерии точности порождены формулой квадратичной ошибки аппроксимации (ошибки МНК). Внешний характер этих критериев обеспечивается учётом проверочных выборок. Другими словами, критерии точности, имеющие один вид формулы, могут использоваться и как внутренние (для оценки коэффициентов модели), и как внешние (для оценки качества модели) 1 .

Критерий регулярности

Это исторически первый критерий, использующийся при отборе моделей, и записывается следующим образом:

где означает “ошибка на ^ B модели, коэффициенты которой получены на модели A ”.

Очевидно, что данный критерий несимметричен – выборка A является обучающей; B – проверочной. Поменяв A и B местами, получим ещё один критерий регулярности:

в котором модель создаётся на последовательности B, а проверяется на A.

Теперь легко сконструировать симметричный критерий регулярности:

где подпоследовательности A и B используются равноправно.

Этот критерий позволяет более надёжно выбирать модель по сравнению с обычным критерием регулярности, так как позволяет сглаживать влияние помех на обеих подвыборках A и B.

Критерий стабильности

Этот критерий используется в тех случаях, когда необходимо, чтобы модель имела удовлетворительную точность как на обучающей, так и на проверочной последовательностях. Его выражение:

где – точность метода наименьших квадратов (МНК).

Как нетрудно видеть, этот критерий также несимметричен.

Как и в случае критерия регулярности, можно сконструировать аналогичный критерий и, соответственно, симметричный критерий регулярности:

где d 2 – симметричный критерий регулярности.

Усреднённый критерий регулярности

Согласно этому критерию, вычисляется среднее значение NW критериев регулярности для каждой проверяемой частной модели в условиях, когда проверочная последовательность – поочерёдно каждая точка из W, обучающая последовательность состоит из прочих (NW 1) точек. Такой критерий имеет следующий вид:

^ 4.4.2.2. Критерии согласованности. Критерии этой группы не учитывают в явном виде ошибку модели и поэтому даже формально (в отличие от критериев точности) не могут быть использованы в качестве внутренних (для оценки коэффициентов). Эти критерии строятся как количественное выражение какого-либо дополнительного требования к свойствам искомой модели.

Критерий минимума смещения коэффициентов

Данный критерий требует, чтобы оценки коэффициентов моделей на A и B отличались минимально:

где – вектор коэффициентов модели, вычисленный на A, а – вектор коэффициентов, вычисленный на B.

Критерий минимума смещения решений

Это более распространённая версия предыдущего критерия (4.43):

Этот критерий требует, чтобы минимально отличался выход на ^ W моделей с коэффициентами, полученными на A и B.

Абсолютно помехоустойчивый критерий

Данный критерий требует максимальной согласованности оценок выхода модели при коэффициентах, полученных на трёх частях выборки – A, B и W:

Название этого критерия связано с тем, что он теоретически удовлетворяет одному из наиболее важных условий работоспособности внешнего критерия – надёжно отсеивать избыточные (переусложнённые) модели при любом шуме.

^ 4.4.3. Виды алгоритмов МГУА. Особенность алгоритмов МГУА состоит в том, что вид опорной функции, класс уравнений и структура моделей устанавливаются объективным способом при помощи перебора вариантов по целесообразно выбранному ансамблю критериев (индуктивный метод). Способ введения критериев обеспечивает объективное нахождение структуры единственной модели оптимальной сложности при высокой помехоустойчивости метода. Допустимое ограничение шум/сигнал может достигать значения единицы и более (без учёта информации о помехах).

Илон Маск рекомендует:  Вывод случайного изображения из папки на php

Наиболее существенными признаками, отличающими алгоритмы МГУА, являются:

— число рядов селекции;

— наличие или отсутствие вычисления остатка;

— число уравнений в системе.

Структуры алгоритмов МГУА остаются аналогичными друг другу для различных опорных функций. Так, для полиномиальных и гармонических алгоритмов можно указать три основных вида структуры: однорядные (комбинаторные); многорядные, без вычисления остатков после каждого ряда селекции; многорядные, с вычислением остатков.

Однорядные алгоритмы МГУА предназначены для решения переопределенных задач самоорганизации моделей по опытным данным, в которых число точек измерения равно или превышает некоторый (различный для разных типов моделей) алгебраический минимум.

Многорядные алгоритмы МГУА применяются для решения некорректных или недоопределённых задач моделирования, т.е. в случае, когда число точек N в таблице опытных данных меньше числа аргументов n, входящих в синтезируемую модель (N ^

5. Прогнозирование на основе

имитационного моделирования

Имитационное моделирование является мощным инструментом анализа технических, экономических и управленческих задач. Имитационный эксперимент является эффективным аналогом реального процесса и позволяет заменить конкретное явление экспериментом с математической моделью на персональном компьютере.

В учебном пособии основное внимание уделяется двум прикладным задачам:

— задаче прямоугольного раскроя с неявно заданной технологической последовательностью выполнения резов;

— задаче определения параметров альтернативного графа (графа с возвратами).

Реализация имитационной процедуры выбора карт раскроя позволяет рационально использовать банки карт раскроя заготовительных цехов и участков.

Проведение имитационного эксперимента на графах с возвратами позволяет рассматривать большое число альтернатив при функционировании систем и изучении их особенностей. Излагается широкий спектр алгоритмов для определения временных, стоимостных и ресурсных характеристик альтернативных сетевых моделей.

Особое внимание в учебном пособии уделяется изучению современных математических приемов автоматизации процесса моделирования, в частности, рассматриваются критерии автоматической остановки.

^ 5.1. Основные понятия имитационного моделирования

Имитационное моделирование — это метод проведения вычислительных экспериментов с математическими моделями сложных систем с целью изучения поведения систем в течение продолжительных периодов времени [44, 46].

Пусть — вектор, описывающий множество выходных (эндогенных) переменных изучаемой системы, — вектор, составленный из множества входных (эндогенных) переменных (или переменных управления).

Предположим, что переменная воздействует на переменную в соответствии с функциональным соотношением

где — факторы системы (входы системы); — реакция системы; поверхность реакции системы.

В условиях имитационного эксперимента заменяется конкретным математическим выражением и строится математическая модель следующего вида:

где — оценка по модели (5.2); — вектор параметров имитационной модели; — случайная величина (тренд).

Случайная величина моделируется при помощи методов Монте-Карло [21, 47, 48].

Отметим, что при изучении реальных технико-экономических систем в модель (5.2) можно включить преобразования реакции и элементов вектора , а также учесть закон изменения случайной величины [25, 53, 54].

Постановка и проведение имитационного эксперимента предполагает решение целого ряда сопутствующих проблем, которые кратко перечислены в следующем разделе.

^ 5.1.1. Этапы организации имитационного эксперимента. Перечислим основные этапы организации имитационного эксперимента, подробно изложенные в [38]:

  1. формулировка проблемы;
  2. формулировка математической модели;
  3. выбор метода анализа и генерации случайных чисел;
  4. выбор ПК, языков моделирования, программирование алгоритмов;
  5. оценка пригодности модели;
  6. планирование машинного эксперимента;
  7. анализ результатов эксперимента.

Формулировка проблемы, подлежащей исследованию с помощью метода имитационного моделирования, начинается с постановки задачи. Изучаются входные и выходные переменные системы, выделяются управляющие переменные. Составляется описание среды, в которой функционирует изучаемая система. Этап завершается ясным изложением вопросов, на которые исследователь хочет получить ответы.

На втором этапе выбирается вид математической модели, описывающей основные зависимости между переменными задачи. Анализируется способ включения в модель случайных величин, а также изучаются особенности законов распределения вводимых случайных величин. Принимается решение о характере используемых статистических методов обработки результатов имитационного эксперимента.

После выбора методов анализа и генерации случайных чисел решается проблема автоматизации процесса моделирования — от использования отдельных компонент объектно-ориентированных языков моделирования до применения специализированных пакетов прикладных программ.

Оценка пригодности имитационной модели может производиться по двум критериям:

1) оценка степени совпадения имитированных данных с известными за прошлые периоды данными (если эти данные имеются);

2) оценка точности предсказания имитационной модели относительно поведения реальной системы в будущем.

Решение перечисленных задач является сложной проблемой, поскольку затрагивает многие практические и теоретические аспекты.

^ 5.1.2. Правила автоматической остановки имитационного эксперимента. Пусть — число повторений имитационного эксперимента.

Правило, определяющее число , обеспечивающее заданный уровень статистической точности, называется правилом остановки [см. Нейлор Т. Машинные имитационные эксперименты с моделями больших систем.- М.: Мир,1975.- 500 с.].

Правило остановки при фиксированном объеме выборки

Рассмотрим правило остановки в случае, когда объем выборки (количество случайных величин в одном испытании) постоянен и определяется до начала эксперимента. В этом правиле дисперсия предполагается известной.

Пусть имеется выборка, состоящая из независимых одинаково распределенных случайных чисел , дисперсия которых известна, а математическое ожидание неизвестно. Предположим, что мы хотим оценить математическое ожидание и нами вычислена несмещенная оценка по формуле

Будем искать такое правило остановки, которое гарантирует, что вероятность попадания числа в доверительный интервал

равна , где — стандартное отклонение величины , а — процентиль нормального распределения , оставляющий в каждом отбрасываемом “ хвосте ” случайных чисел по вероятности. Обозначим длину доверительного интервала , эта длина вычисляется по формуле

Если и известны, то остановку следует произвести, когда

По центральной предельной теореме можно считать, что распределение величины нормально, поскольку все независимы и одинаково распределены.

Правило остановки последовательных испытаний

Имитационные эксперименты с фиксированным объемом выборки требуют большего машинного времени, чем методы, где число наблюдений заранее не фиксируется и объем выборки рассматривается как случайная величина, зависящая от исхода предыдущих наблюдений. Такой подход называется методом последовательных испытаний. Затраты машинного времени на проведение имитационного эксперимента методом последовательных испытаний определяются только тем количеством наблюдений, которое необходимо , чтобы получить результат с заранее заданной точностью. Рассмотрим один из способов включения в статистический эксперимент правила автоматического определения на каждом шаге имитации.

Пусть имеется выборка из независимых, одинаково распределенных случайных величин , полученных в результате проведения опытов по имитации. Значение на первом этапе реализации имитационной модели определяется из практических соображений , как правило, . Определим выборочное среднее и выборочную дисперсию по следующим формулам [3, 21]:

где — объем выборки; — значение случайной величины в -м опыте.

Требуется найти такое правило остановки, чтобы истинное значение математического ожидания лежало в доверительном интервале [21]:

с вероятностью , где — вероятность доверия к полученным результатам имитации , — квантиль распределения случайной величины при условии , что множество значений задается в виде . Величина характеризует рассеяние распределения случайной величины и показывает отклонение от среднего , выраженное в единицах стандартного отклонения . Значение определяется по таблицам в зависимости от значения величины и типа распределения случайной величины.

Задавая величину доверительного интервала , можем оценить объем выборки :

Полученное значение используется для проведения второго этапа имитационного эксперимента по правилам:

а) если , то эксперимент заканчивается ; качество статистических характеристик случайной величины оценивается вероятностью ;

б) если , то продолжается эксперимент для получения выборочных значений.

В случае необходимости можно провести повторную корректировку по формуле (5.10).

^ 5.1.3. Пример задачи имитационного моделирования.

Классическим примером для постановки имитационного эксперимента является задача массового обслуживания [38]. Рассмотрим одну из возможных экономических интерпретаций одноканальной модели массового обслуживания.

Пусть имеется очередь деталей для обработки на одном токарном станке. Предположим, что промежутки времени между поступлениями деталей на обработку распределены равномерно в интервале от 1 до 10 минут. Пусть время на обработку каждой детали распределено равномерно от 1 до 6 минут. Мы хотим узнать, какое среднее время пребывает каждая деталь на токарной обработке, включая ожидание и обслуживание. Кроме того, необходимо определить процент времени простоя токаря. Чтобы моделировать, необходимо поставить искусственный эксперимент, отражающий условия предлагаемой ситуации. Необходимо придумать способ имитации искусственной последовательности поступления деталей на станок и времени обработки их токарем.

Рассмотрим следующий способ имитации:

  1. возьмем 10 карточек и один кубик с шестью гранями;
  2. перенумеруем карточки от 1 до 10;
  3. положим 10 карточек в шляпу и будем их перемешивать;
  4. вынем карточку из шляпы и считаем с нее число, которое будет представлять промежутки времени между появлением предыдущей и последующей деталей;

5) бросим кубик и прочитаем с его верхней грани число очков, которое будет представлять время обработки детали на станке;

6) повторим эти операции в указанной последовательности, возвращая каждый раз карточки обратно и встряхивая шляпу перед каждым вытягиванием; в результате повторений получаем временные ряды;

7) запишем результаты десяти экспериментов в табл. 5.1.

Автоматика.
Автоматизация.
Электротехнические
комплексы и системы.

Маркута О.В., Мысак В.Ф.

Стремительное развитие компьютерной техники существенно расширяет сферу использования методов математического моделирования для проектирования и управления сложными технологическими (техническими, экономическими, экологическими, финансовыми и др.) системами, прогнозирования результатов их деятельности, создания экспертно-диагностических подсистем и тренажерных комплексов по обучению персонала и т.п.

Эффективное использование методов моделирования требует простых и адекватных, как правило, формальных математических моделей. Одним из универсальных экспериментальных методов идентификации многомерных систем, применимым в режиме нормальной эксплуатации объектов исследования, есть метод группового учета аргументов (МГУА) [1,2]. Полученные по этому методу модели отображают неизвестные закономерности функционирования исследуемого объекта ( вида “ n входов – 1 выход”) , информация о котором неявно содержится в выборке экспериментальных данных. В МГУА для построения моделей применяются принципы автоматической генерации вариантов, промежуточных решений и последовательной селекции лучших моделей по определенным критериям. Алгоритм метода основан на делении выборки на части, при этом оценивание параметров и проверка качества моделей выполняются на разных подмножествах экспериментальной выборки. Эффективность метода подтверждена решением многочисленных реальных задач в таких областях как экология, гидрометеорология, экономика, техника [3].

Согласно МГУА решение трудоемкой задачи получения n -мерной (по входам) модели заменяется многостадийным процессом решения большого числа относительно простых задач аппроксимации экспериментальных данных функциями двух переменных. На каждой из стадий производится отбор наилучших полиномов, которые используются на последующих стадиях в качестве фиктивных аргументов новых полиномов.

Подобная процедура построения сложной функции от полинома продолжается до тех пор, пока на какой-либо из стадий не будет достигнута заданная точность аппроксимации.

Вместе с тем метод имеет ряд особенностей, не получивших строгого математического обоснования и требующих оперативного уточнения под конкретные условия использования получаемой модели. К таким особенностям относятся влияние на адекватность модели уровня шумов, количества отбираемых полиномов, размерности задачи, размеров подмножеств и т.п. Трудоемкая процедура таких уточнений требует использования современных программных средств моделирования.

В статье представлена программная реализация МГУА с генерированием исходных данных, ориентированная на широкий спектр возможных применений, и проведены исследования:

· определение возможных пределов работы приложения (максимального числа факторов);

· исследование влияния шума на точность полученной модели;

· исследование влияния количества отбираемых наилучших частных описаний на каждом шаге;

· исследование влияния размеров подмножеств экспериментальных данных на точность искомой модели;

· влияние вида частных описаний на качество полученной модели.

1. Программная реализация МГУА

Для исследования метода группового учета аргументов была выполнена его программная реализация. Разработанное приложение решает задачу построения модели объекта (вида “ n входов – 1 выход”) по выборке экспериментальных данных.

На рис.1 показана общая блок-схема алгоритма работы приложения.

Алгоритмы МГУА воспроизводят схему массовой селекции. Входные аргументы и промежуточные переменные сопрягаются попарно, и сложность комбинаций на каждом ряду обработки информации возрастает (как при массовой селекции), пока не будет получена единственная модель оптимальной сложности [1].

Алгоритм работы программы:

Этап 1. Искусственная генерация исходных (экспериментальных) данных.

На этом этапе производится генерация значений векторов аргументов. При этом начальное количество аргументов ( n ) и размер выборки (число точек условного эксперимента) N изначально заданы. Количество аргументов n задается непосредственно, а размер выборки N определяется как сумма размеров трех ее подмножеств: обучающего ( N 1), проверочного ( N 2) и контрольного ( N 3):

Значения аргументов х і генерируются в соответствии со следующим выражением:

где α i и φ i каждый раз генерируются псевдослучайным образом из множеств [- A ; A ] и [- Fi ; Fi ] соответственно, где значения A и Fi изначально задаются.

Полученные векторы аргументов содержат нормированные псевдослучайные значения.

Значения y l генерируются следующим образом:

где b ­ i и Sh l каждый раз генерируются псевдослучайным образом из множеств [-В; В] и [- Sh ; Sh ], где значения В и Sh изначально задаются. Параметр Sh содержит значение уровня зашумления в % от величины значений y l .

Этап 2. Реализация алгоритма МГУА.

Из множества аргументов x =( x 1 , x 2 . x n ) выбираются пары аргументов ( x i , x j ) i , j =1, n ; i ≠ j . Для них составляются функции частных описаний квадратичного вида [1]:

Используя метод наименьших квадратов (МНК) [4] для каждого описания по обучающему подмножеству ( ) находится вектор неизвестных коэффициентов .

По полученным моделям каждого частного описания вычисляются значения ординат (вектор ) для всех точек проверочного подмножества

Рис. 1. Структурная блок-схема алгоритма разработанного приложения.

Далее производится расчет критерия селекции (среднеквадратической ошибки) для каждого частного описания по формуле:

По критерию минимума на проверочном подмножестве отбираются m лучших моделей, т.е. реализуется процедура селекции.

Для отобранных моделей вычисляются значения ординат по контрольному подмножеству .

Далее для них вычисляются значения критерия селекции (так же по контрольному подмножеству):

Этап 3. Вывод результатов.

Производится вывод результатов в соответствующее поле окна приложения.

Выполняется проверка критерия останова:

где ε = е (наперед заданная величина).

Если условие выполняется, то процесс поиска модели считается завершенным . В противном случае производится возврат на начало этапа 2 с предварительным пересчетом векторов аргументов (в качестве новых аргументов используются отобранные модели частных описаний).

2. Определение возможных пределов работы приложения (максимального числа факторов)

Число факторов (входов объекта) в принципе не ограничено. На практике работа приложения была проверена до n = 25. Но при таком количестве аргументов наблюдалось существенное увеличение времени работы программы (длительности всех необходимых расчетов). Если при n =3, m =3 время, затраченное на расчет одного шага алгоритма, составляло доли секунды, а загрузка ЦП составляла 11%, то при n =25 и m =3 время расчета одного шага увеличилось до 40 секунд, а загрузка ЦП – до 100%.

Вообще ограничения в отношении числа факторов могут накладываться только исходя из технических характеристик компьютера, на котором производится расчет модели программой. С увеличением числа факторов резко возрастает число их частных описаний и, следовательно, объем обрабатываемой информации, что в свою очередь вызывает увеличение требуемых ресурсов и приводит к существенному увеличению длительности расчетов.

3. Исследование влияния шума на точность полученной модели

При увеличении значения шума ухудшается точность искомой модели, как показано на рис.2. Это приводит к увеличению количества шагов, необходимых для нахождения модели, и к существенному ее усложнению.

Не во всех случаях удалось найти модели с заданной точностью аппроксимации. Некоторые из искусственно сгенерированных зависимостей приняли вид, который трудно адекватно аппроксимировать квадратичным полиномом.

Рис. 2 Влияние уровня шума на точность полученной модели

4. Исследование влияния количества отбираемых наилучших частных описаний на каждом шаге

В плане выбора оптимального количества отбираемых на каждом шаге полиномов частных описаний однозначного ответа быть не может. Это обусловлено тем фактом, что с увеличением числа факторов существенно возрастает число их парных взаимодействий.

На практике прослеживается закономерность, что с увеличением числа отбираемых частных описаний на каждом шаге увеличивается точность полученной модели (рис.3). В свою очередь чрезмерное увеличение этого числа ( m ) приводит к б о льшим объемам обрабатываемой информации.

Слишком же малое число отбираемых парных взаимодействий отрицательно сказывается на адекватности полученной модели.

Рис. 3 Влияние числа отбираемых частных описаний на точность полученной модели для разных значений числа аргументов

Об оптимальном значении m можно говорить только в отношении конкретного n (числа исходных факторов). При решении конкретной задачи рекомендуется выполнить промежуточное исследование с использованием разработанного приложения для определения оптимального значения m .

5. Исследование влияния размеров подмножеств экспериментальных данных на точность искомой модели

В ходе исследования влияния размеров подмножеств О (обучающего), П (проверочного) и К (контрольного) исходной выборки данных были получены следующие результаты:

1) При равномерном разбиении выборки (О=П=К) точность модели прямо пропорциональна объему выборки (рис.4). Хотя чрезмерный объем данных может привести к существенному увеличению объема обрабатываемой информации.

Рис. 4 Влияние размеров подмножеств экспериментальных данных на точность искомой модели при равномерном разбиении выборки (О=П=К)

2) При неравномерном разбиении выборки было установлено, что увеличение обучающего подмножества по отношению к проверочному и контрольному (О=П+К, П=К) приводит к увеличению точности полученной модели по сравнению со случаем равномерного разбиения и разбиения в пользу П либо К, как показано на рис.5.

Рис. 5 Влияние размеров подмножеств экспериментальных данных на точность искомой модели при неравномерном разбиении выборки:

а) N =200; б) N =400

3) При включении в состав К дополнительно подмножеств О либо П, либо О+П увеличивается точность полученной модели (изначально О=П=К). Наилучшая точность была получена при К=О+П (рис.6), т.е. вся выборка делится на две части: обучающее и проверочное подмножества. А выбор оптимальной модели происходит при этом по всей выборке (всему множеству экспериментальных данных). Следующее по точности разбиение К=О+П+К. Опять же при выборе модели учитывается вся выборка. Точность незначительно снижалась при разбиении К=П+К.

Рис. 6 Влияние включения в подмножество К дополнительных подмножеств экспериментальных данных на точность искомой модели (изначально О=П=К=200)

Дополнительное включение в контрольное подмножество подмножеств О и П повышает точность модели, поскольку в таком случае выбирается модель наиболее адекватная всей выборке. При стандартном разбиении (без включения подмножеств в состав К) есть риск, что на контрольном подмножестве функция, в целом не являющаяся наиболее точной моделью, будет иметь наименьшее среднеквадратическое отклонение от оригинала, что приведет к выбору модели не являющейся самой точной на всем исследуемом интервале экспериментальной выборки.

6. Влияние вида частных описаний на качество полученной модели

Изначально приложение реализовывало метод группового учета аргументов с функциями частных описаний квадратичного вида:

В ходе исследований возник вопрос о влиянии вида полинома частных описаний на точность и сложность полученной модели.

Для сравнения были взяты функции частных описаний следующего вида:

В ходе исследований было установлено, что такое упрощение вида функций частных описаний практически не сказалось на качестве полученной модели (наблюдалось незначительное снижение точности, как показано на рис.7). При этом происходит существенное упрощение вида искомой модели (даже при возможном увеличении количества шагов расчета) при практически неизменной точности модели. П ри n =3, m =3, e =0,75 модель объекта в обоих случаях была найдена за два шага расчетов, но если для варианта с частными описаниями вида (10) модель содержала 64 слагаемых, а точность (δ) составила 0.46, то для случая с частными описаниями вида (11) модель уже содержала 16 слагаемых и δ=0.70.

При некотором запасе точности использование упрощенного вида функций частных описаний может привести к существенному упрощению искомой модели.

Илон Маск рекомендует:  Нестандартные методы продвижения и раскрутки сайта своими руками.

Исследования проводились при следующих условиях: n =3. 5, N 1= N 2= N 3=50..500, m =2..15, B =10, A =0.25, Fi =100, Sh =0..20, e =0.1..5.

Рис. 7 Влияние вида частных описаний на точность искомой модели:

Выводы

На сегодняшний день одним из универсальных экспериментальных методов идентификации многомерных систем есть метод группового учета аргументов. Вместе с тем метод имеет ряд особенностей, уточнение которых являлось основной задачей проведенной работы.

В статье представлена программная реализация МГУА, ориентированная на широкий спектр возможных применений – от решения исследовательских задач до решения прикладных задач построения модели объекта (вида “ n входов – 1 выход”) по выборке экспериментальных данных. С помощью разработанного приложения возможно решение каждой конкретной задачи несколькими вариантами (при разных значениях параметров алгоритма) с целью получения модели объекта или системы оптимальной точности и сложности.

В ходе исследования практической (программной) реализации МГУА было установлено следующее:

1. С увеличением уровня шума и уменьшением числа отбираемых на каждом шаге частных описаний ( m ) ухудшается точность искомой модели, при этом возможно увеличение количества шагов, необходимых для нахождения модели, что может привести к существенному ее усложнению. При решении каждой конкретной задачи для определения оптимального значения m рекомендуется выполнить промежуточное исследование с использованием разработанного приложения.

2. При равномерном разбиении выборки (О=П=К) экспериментальных данных точность модели прямо пропорциональна объему выборки. При неравномерном разбиении выборки увеличение обучающего подмножества по отношению к проверочному и контрольному (О=П+К, П=К) приводит к увеличению точности полученной модели по сравнению со случаем равномерного разбиения и разбиения в пользу П либо К. При включении в состав К дополнительных подмножеств наилучшая точность была получена при К=О+П.

3. Вид частных описаний влияет на сложность полученной модели. Упрощение функций частных описаний от вида (10) к виду (11) приводит к упрощению модели, но при этом происходит незначительное ухудшение ее точности (при n =3, m =3, e =0,75 модель объекта в обоих случаях была найдена за два шага расчетов, но если для варианта с частными описаниями вида (10) модель содержала 64 слагаемых, а точность (δ) составила 0.46, то для случая с частными описаниями вида (11) модель уже содержала 16 слагаемых и δ=0.70).

При решении каждой отдельной задачи, для нахождения модели с оптимальными параметрами сложности и точности, рекомендуется поварьировать с использованием разработанного программного продукта такие параметры как число отбираемых частных описаний на каждом шаге и вид полинома частных описаний.

In the article the program application of the method of the group calculation of the arguments is represented. The following special features of method were investigated with the aid of the developed application: influence on the adequacy of the model of the level of noise, quantity of selected polynomials, dimensionality of task, sizes of subsets. The results of studies were represented.

1. Ивахненко А. Г. Долгосрочное прогнозирование и управление сложными системами. – Киев: Техн і ка, 1975.

2. Ивахненко А.Г. Индуктивные методы самоорганизации моделей сложных систем. – Киев: Наук. мысль, 1982.

3. Степашко В.С. Теоретические аспекты МГУА как метода индуктивного моделирования . – Труды I Международной конференции по индуктивному моделированию, Львов, 20-25 мая 2002 г.

4. Демидович Б.П., Марон И.А., Шувалова Э.З. Численные методы анализа. Приближение функций, дифференциальные и интегральные уравнения. – М.: Наука, 1967.

Метод группового учёта аргументов

  • Метод группового учёта аргументов (МГУА) — семейство индуктивных алгоритмов для математического моделирования мультипараметрических данных. Метод основан на рекурсивном селективном отборе моделей, на основе которых строятся более сложные модели. Точность моделирования на каждом следующем шаге рекурсии увеличивается за счет усложнения модели.

Автор метода — академик НАНУ Алексей Григорьевич Ивахненко. Юрген Шмидхубер ссылается на МГУА как наиболее ранний метод глубокого обучения, отмечая, что он был использован для обучения восьмислойной нейронной сети уже в 1971.

Связанные понятия

В статистике, машинном обучении и теории информации снижение размерности — это преобразование данных, состоящее в уменьшении числа переменных путём получения главных переменных. Преобразование может быть разделено на отбор признаков и выделение признаков.

Ядерные методы в машинном обучении — это класс алгоритмов распознавания образов, наиболее известным представителем которого является метод опорных векторов (МОВ, англ. SVM). Общая задача распознавания образов — найти и изучить общие типы связей (например, кластеров, ранжирования, главных компонент, корреляций, классификаций) в наборах данных. Для многих алгоритмов, решающих эти задачи, данные, представленные в сыром виде, явным образом преобразуются в представление в виде вектора признаков посредством.

Метод группового учета аргументов

Эту статью следует викифицировать.

Метод группового учета аргументов (МГУА) — семейство индуктивных алгоритмов для математического моделирования мультипараметрических данных. Метод основан на рекурсивном селективном отборе моделей, на основе которых строятся более сложные модели. Точность моделирования на каждом следующем шаге рекурсии увеличивается за счет усложнения модели.

История Править

Алгоритм Править

Даны данные наблюдений: $ \vec, y $ . Необходимо построить наилучшую в определенном смысле модель $ Y(x_1,\dots,x_n) $ .

  1. Выбирается общий вид перебираемых моделей, так называемые опорные функции. Часто используется полином Колмогорова-Габора: $ Y(x_1,\dots,x_n) = a_0+\sum\limits_^n x_i+\sum\limits_^n <\sum\limits_^n > > x_i x_j+\sum\limits_^n <\sum\limits_^n<\sum\limits_^n > > >x_i x_j x_k+\cdots $ Выбор полиномов обусловлен тем свойством, что согласно теореме Вейерштрасса, любую непрерывную на конечном интервале функцию можно со сколь угодно высокой точностью представить в виде полинома определенной степени. Сложность модели в таком случае определяется количество коэффициентов $ a_ $
  2. Используя опорные функции строятся различные варианты моделей для некоторых или всех аргументов. Например строятся полиномы с одной переменной, полиномы со всевозможными парами переменных, полиномы со всевозможными тройками переменных, и т.д, полином со всеми переменными. Для каждой модели определяются её коэффициенты $ a_ $ методом регрессионного анализа.
  3. Среди всех моделей выбираются несколько (от 2 до 10) наилучших. Качество моделей определяется коэффициентом детерминации, или среднеквадратическим отклонением ошибки, или корреляцияей Y и исходных данных.
  4. Если найдена достаточно «хорошая» модель или достигнута максимально допустимая сложность моделей, то алгоритм заканчивается.
  5. Иначе, найденные на 3-ем шаге модели используются как аргументы ( $ x_1,\dots,x_n $ ) для опорных функций следующего этапа итерации (переход на 2-ой пункт). То есть уже найденные модели участвуют в формировании более сложных.

Обычно степень полинома опорной функции выбирается не выше $ N-1 $ , где $ N $ — количество точек выборки. Часто бывает достаточно использовать в качестве опорных функции полиномы второй степени. В таком случае на каждом шаге итерации степень результирующего полинома удваивается.

Вместо полинома Колмогорова-Габора можно использовать ряды Фурье. Их имеет смысл применять, если в исходных данных наблюдается периодичность (например, уровень воды в реках, температура воздуха, объём осадков). Полученная в таком случае модель будет полигармонической [1].

Часто исходную выборку разбивают на две подвыборки $ A $ и $ B $ . Подвыборка $ A $ используется для определения коэффициентов модели, а подвыборка $ B $ — для определения качества (коэффициента детерминации или среднеквадратического отклонения). При этом соотношение количества данных в обеих выборках может быть как 50%/50% так и 60%/40%.

Статистика показывает, что с каждым шагом итерации уменьшается среднеквадратическое отклонение. Но после достижения определенного уровня сложности (зависит от характера и количества данных, а также общего вида модели), СКО начинает расти.

Моделирование режимов работы газоперекачивающих агрегатов на основании метода группового учета аргументов

Рубрика: Технические науки

Дата публикации: 13.05.2014 2014-05-13

Статья просмотрена: 753 раза

Библиографическое описание:

Назаренко И. В., Николайчук Н. Я., Козовик Н. И. Моделирование режимов работы газоперекачивающих агрегатов на основании метода группового учета аргументов // Молодой ученый. — 2014. — №7. — С. 162-171. — URL https://moluch.ru/archive/66/10965/ (дата обращения: 12.11.2020).

Проведен анализ методов построения детерминированных и вероятностных моделей сложных технологических объектов для их дальнейшего применения при разработке и эксплуатации систем автоматизированного управления. Реализовано процедуры сбора и обработки экспериментальных данных для создания базы данных среды моделирования MATLAB Simulink. Определены основные технологические параметры необходимые для реализации модели (входные и выходные температура и давление газа, частота вращения турбины нагнетателя, перепад давления на конфузоре). Для расширения функциональных возможностей имитационной модели нагнетателя ГПА (газоперекачивающий агрегат) реализовано как стационарный режим работы, так и режимы переходных процессов (пуск и остановка ГПА). В качестве алгоритмического обеспечения применен метод группового учета аргументов для расчета коэффициентов аппроксимирующих полиномов. Проведен сравнительный анализ зависимостей основных технологических параметров нагнетателя ГПА на основе экспериментальных данных и расчетных значений при различных режимах работы. Предложены и апробированы процедуры преобразования компонентов имитационных моделей в программные функциональные блоки PLC на основании стандарта IEC 61131 для их интеграции на уровне аппаратных средств для систем управления технологическим оборудованием компрессорных цехов газотранспортной системы.

Ключевые слова: газоперекачивающий агрегат, система автоматизированного управления, аппроксимирующий полином, имитационная модель, режимы работы ГПА, стандарт IEC 61131, функциональные блоки PLC.

В настоящее время проведение экспериментальных исследований на объектах нефтегазовой отрасли связано со значительными сложностями обусловленными необходимостью оформления соответствующих согласований и режима экономии энергоресурсов (изменение режимов работы ГПА требует дополнительных затрат энергоресурсов), поэтому разработка алгоритмического обеспечения и создания инструментальных средств для исследований на основе имитационных моделей объектов и средств управления является актуальной научно-технической задачей.

Анализ исследований и публикаций

Сравнительный анализ методов построения детерминированных и вероятностных моделей сложных технологических объектов указывает на возможность и эффективность применения метода группового учета аргументов (МГУА) для решения задач моделирования сложных технологических объектов [1, с.3–4, 90–93; 2, с.64].

В математических моделях, построенных на основе МГУА, учитываются вероятностные взаимосвязи состояний и признаков состояний технологических объектов. Это позволяет заменить процесс изучения особенностей, например, с точки зрения заданного объекта моделирования, газодинамических процессов протекающих в ГПА, статистической обработкой технологической информации, собираемой системой автоматизированного управления (САУ) ГПА. Поэтому модели, построенные на основе МГУА, позволяют оценивать изменение технического состояния объекта управления используя, например, значение абсолютного отклонения между измеренным технологическим параметром и значением, рассчитанным на основе модели.

МГУА можно использовать для решения следующих задач [2, с.64; 3 с.1]:

— идентификации физических закономерностей;

— аппроксимации многомерных процессов;

— краткосрочного пошагового прогнозирования процессов и событий;

— долгосрочного пошагового прогнозирования процессов и событий;

— экстраполяции физических полей;

— нормативного векторного прогнозирования процессов.

Основной результат теории МГУА состоит в том, что при неточных зашумленных данных с объекта управления и коротких выборках, минимум критерия указывает на нефизическую модель (решающее правило), точность которой выше, а структура более простая в сравнении с структурой полной физической модели.

Математическое моделирование сложных объектов имеет следующие отличительные особенности:

— высокая размерность вектора входных координат ;

— наличие значительного количества внутренних источников случайных помех, статистические характеристики которых, как правило, неизвестны;

— неизученность механизмов, определяющих направление и особенности протекания процессов в объектах;

— сложность постановки экспериментов для получения значительного количества сигналов ( – одномерный выход объекта).

Указанные особенности усложняют построение неформальных математических моделей сложных объектов. Как следствие, статистические режимы их функционирования приходится описывать уравнениями вида:

Целью данной работы является разработка модели нагнетателя ГПА на основе метода группового учета аргументов, исследование режимов работы технологических объектов и интеграция результатов моделирования в программные функциональные блоки PLC системы управления технологическим оборудованием компрессорных цехов газотранспортной системы.

Ниже приведены основные процедуры и алгоритм применения метода группового учета аргументов для построения математических моделей технологических параметров.

Алгоритм МГУА включает следующие процедуры (рис. 1):

создание вектора , в который заносятся n первых значений одного из выходных технологических параметров (рис. 1, блок 1);

— — создание матрицы размерностью n × m, в столбцах которой размещаются первые n значений m входных технологических параметров (рис. 1, блок 3);

— — последовательный выбор из матрицы всех возможных комбинаций номеров столбцов — переменные (рис. 1, блок 4);

— — нахождение значений коэффициентов аппроксимирующего полинома :

где для каждой из возможных комбинаций номеров столбцов матрицы и вектора с помощью метода наименьших квадратов (МНК) (рис. 1, блок 5);

— вычисление, используя найденные наборы коэффициентов аппроксимирующих полиномов , их значений в каждой из точек k=1,2. N:

где (рис. 1, блок 6);

— вычисления среднеквадратического отклонения (СКО) остатков-разностей между вектором , k=1,2. N и соответствующим значением каждого аппроксимирующего полинома:

где (рис. 1, блок 7);

— отбор полиномов с минимальной дисперсией, которые будут использованы для построения аппроксимирующих полиномов второго и выше уровней (каждый уровень соответствует номеру итерации) (рис. 1, блок 10) и переход на следующий шаг (рис. 1, блок 12);

— сравнение СКО на предыдущем и текущем шагах (рис. 1, блок 9).

Если СКО на текущем шаге превышает СКО на предыдущем, то из всех полученных полиномов выбирается полином с минимальной дисперсией (рис. 1, блок 11).

Учитывая значимость влияния входных и выходных параметров на адекватность модели нагнетателя ГПА, предлагается применить следующие технологические параметры.

— Твх — температура на входе нагнетателя;

— N — обороты турбины нагнетателя.

— Рвых — давление на выходе нагнетателя;

— Твых — температура на выходе нагнетателя;

— dP — перепад давления на конфузоре нагнетателя.

Для построения математической модели применены экспериментальные выборки значений определенных технологических параметров САУ ГПА, которые занесены в электронную таблицу Excel.

Данные выборки получены за период с 10:00 04.02.2014 до 15:00 08.02.2014, в различных режимах работы ГПА компрессорной станции (КС) «Бердичев» управления магистральных газопроводов «Киевтрансгаз» (рис. 2).

Рис. 1. Блок-схема алгоритма МГУА

Рис. 2. Выборки технологических параметров нагнетателя ГПА КС «Бердичев»

Для трансляции данных из MS Excel в среду MATLAB апробирована процедура на основании функций импорта данных:

где — переменная, в которую записывается результат;

— переменная, содержащая путь к файлу;

— переменная, содержащая название листа в электронной таблице Excel;

— переменная, содержащая диапазон полей таблицы, который необходимо считать.

В результате после выполнения заданных функций данные из таблицы Excel будут записаны в указанную переменную в соответствии с заданным листом и диапазоном [4, с.1].

Для решения задачи поиска коэффициентов аппроксимирующего полинома необходимо применить функцию:

где — переменная, в которую записываются рассчитанные коэффициенты;

— начальное приближение для нахождения коэффициентов аппроксимирующей функции;

— значения аргументов аппроксимирующей функции;

— значения аппроксимирующей функции.

Данная функция предназначена для расчета коэффициентов аппроксимирующих полиномов, решая при этом следующую оптимизационную задачу (минимизация квадрата разницы между экспериментальными и расчетными значениями аппроксимирующего полинома):

где — вектор коэффициентов аппроксимирующего полинома (целевая величина);

Таким образом, функция (6) рассчитывает коэффициенты для аппроксимирующей функции с помощью МНК [5, с.1].

Ниже приведен фрагмент программы (m-файл MATLAB), реализующей расчет коэффициентов аппроксимирующих полиномов согласно МГУА.

N = 363480 % количество значений параметров

x1 = transpose(P_in_1s); % давление до нагнетателя

x2 = transpose(T_in_1s); % температура до нагнетателя

x3 = transpose(n_1s); % обороты турбины нагнетателя

y = transpose(P_out_1s); % давление после нагнетателя

z = transpose(T_out_1s); % температура после нагнетателя

d = transpose(delta_P_1s); % перепад давления на конфузоре

% Комбинации входных параметров

% Определение коэффициентов аппроксимирующих полиномов для давления на выходе

% Вычисление значений аппроксимирующих полиномов для давления на выходе

y12 = myfun(a12, [x1 x2])

y13 = myfun(a13, [x1 x3])

y23 = myfun(a23, [x2 x3])

% Среднеквадратичные отклонения полиномов от эталонных значений

sigma_y12 = sqrt(sum((y — y12).^2)/length(y));

sigma_y13 = sqrt(sum((y — y13).^2)/length(y));

sigma_y23 = sqrt(sum((y — y23).^2)/length(y));

% Определение коэффициентов аппроксимирующих полиномов для давления

a1 = lsqcurvefit(@myfun,zeros(1,6), [y12(1:N) y23(1:N)],y(1:N))

a2 = lsqcurvefit(@myfun,zeros(1,6), [y12(1:N) y13(1:N)],y(1:N))

a3 = lsqcurvefit(@myfun,zeros(1,6), [y13(1:N) y23(1:N)],y(1:N))

% Вычисление значений аппроксимирующих полиномов

y1 = myfun(a1, [y12 y23])

y2 = myfun(a2, [y12 y13])

y3 = myfun(a3, [y13 y23])

% Среднеквадратичные отклонения полиномов от эталонных значений

sigma_y2 = sqrt(sum((y — y2).^2)/length(y))

sigma_y3 = sqrt(sum((y — y3).^2)/length(y))

% Задание аппроксимирующего полинома

function F = myfun(a, x)

F = a(1) + a(2) * x(:,1) + a(3) * x(:,2) + a(4) * x(:,1).* x(:,2) + a(5) * x(:,1).^2 + a(6) * x(:,2).^2;

Полученные среднеквадратические отклонения полиномов на первой и второй итерациях по каждому выходному параметру приведены в табл. 1, 2, при этом комбинации входных параметров обозначены (PT — давление-температура, PN — давление-обороты, TN — температура-обороты).

Метод группового учета аргументов

Эту статью следует викифицировать.

Метод группового учета аргументов (МГУА) — семейство индуктивных алгоритмов для математического моделирования мультипараметрических данных. Метод основан на рекурсивном селективном отборе моделей, на основе которых строятся более сложные модели. Точность моделирования на каждом следующем шаге рекурсии увеличивается за счет усложнения модели.

История Править

Алгоритм Править

Даны данные наблюдений: $ \vec, y $ . Необходимо построить наилучшую в определенном смысле модель $ Y(x_1,\dots,x_n) $ .

  1. Выбирается общий вид перебираемых моделей, так называемые опорные функции. Часто используется полином Колмогорова-Габора: $ Y(x_1,\dots,x_n) = a_0+\sum\limits_^n x_i+\sum\limits_^n <\sum\limits_^n > > x_i x_j+\sum\limits_^n <\sum\limits_^n<\sum\limits_^n > > >x_i x_j x_k+\cdots $ Выбор полиномов обусловлен тем свойством, что согласно теореме Вейерштрасса, любую непрерывную на конечном интервале функцию можно со сколь угодно высокой точностью представить в виде полинома определенной степени. Сложность модели в таком случае определяется количество коэффициентов $ a_ $
  2. Используя опорные функции строятся различные варианты моделей для некоторых или всех аргументов. Например строятся полиномы с одной переменной, полиномы со всевозможными парами переменных, полиномы со всевозможными тройками переменных, и т.д, полином со всеми переменными. Для каждой модели определяются её коэффициенты $ a_ $ методом регрессионного анализа.
  3. Среди всех моделей выбираются несколько (от 2 до 10) наилучших. Качество моделей определяется коэффициентом детерминации, или среднеквадратическим отклонением ошибки, или корреляцияей Y и исходных данных.
  4. Если найдена достаточно «хорошая» модель или достигнута максимально допустимая сложность моделей, то алгоритм заканчивается.
  5. Иначе, найденные на 3-ем шаге модели используются как аргументы ( $ x_1,\dots,x_n $ ) для опорных функций следующего этапа итерации (переход на 2-ой пункт). То есть уже найденные модели участвуют в формировании более сложных.

Обычно степень полинома опорной функции выбирается не выше $ N-1 $ , где $ N $ — количество точек выборки. Часто бывает достаточно использовать в качестве опорных функции полиномы второй степени. В таком случае на каждом шаге итерации степень результирующего полинома удваивается.

Вместо полинома Колмогорова-Габора можно использовать ряды Фурье. Их имеет смысл применять, если в исходных данных наблюдается периодичность (например, уровень воды в реках, температура воздуха, объём осадков). Полученная в таком случае модель будет полигармонической [1].

Часто исходную выборку разбивают на две подвыборки $ A $ и $ B $ . Подвыборка $ A $ используется для определения коэффициентов модели, а подвыборка $ B $ — для определения качества (коэффициента детерминации или среднеквадратического отклонения). При этом соотношение количества данных в обеих выборках может быть как 50%/50% так и 60%/40%.

Статистика показывает, что с каждым шагом итерации уменьшается среднеквадратическое отклонение. Но после достижения определенного уровня сложности (зависит от характера и количества данных, а также общего вида модели), СКО начинает расти.

Лекции по Методам Социально-Экономического Прогнозирования — файл МСЭП_методичка.doc

Доступные файлы (1):

МСЭП_методичка.doc 2529kb. 19.01.2010 00:17 скачать

содержание

    Смотрите также:
  • по Социально-экономическому прогнозированию[ лекция ]
  • по Методам социально-экономического прогнозирования[ лабораторная работа ]
  • Статистические методы прогнозирования в экономике[ лекция ]
  • Экономика стран Юго-Восточной Азии[ лабораторная работа ]
  • Логинов В.Г. Социально-экономическая оценка развития природно-ресурсных районов Севера[ документ ]
  • Курсовой проект — Программы социально-экономического развития проблемных регионов на примере России и ЕС[ курсовая работа ]
  • Методы прогнозирования экономических процессов[ лабораторная работа ]
  • Мониторинг и оценка в управлении муниципальным социально-экономическим развитием[ документ ]
  • Анализ и диагностика финансово-экономической деятельности предприятия[ документ ]
  • Дипломный проект — Взаимоотношения власти, Бизнеса и общества как фактор социально-Экономического развития[ дипломная работа ]
  • Теория экономического анализа[ лекция ]
  • Конспект для сдачи Теории экономического анализа[ документ ]

МСЭП_методичка.doc

4.4. Метод группового учета аргументов

Алгоритмы, использующие метод группового учёта аргументов (МГУА), предназначены для получения модели исследуемого процесса [13 16, 26]. Это моделирование осуществляется путём перебора различных моделей-претендентов по внешним критериям, при этом внешний критерий сначала уменьшается, проходя через точку минимума при оптимальной модели, после чего начинает возрастать в области переусложнённых моделей.

Алгоритмы МГУА являются чрезвычайно помехоустойчивыми – при соотношении помеха/сигнал  = 20-30% алгоритмы позволяют получить точную физическую модель; алгоритмы не теряют работоспособности вплоть до соотношения  = 300-400%. В этой области алгоритм МГУА применяется для краткосрочного прогнозирования; и только при отношении помеха/сигнал, большем 400%, алгоритмы МГУА полностью теряют свою пригодность для моделирования

Оптимальная модель процесса, полученная при помощи МГУА, может служить для прогнозирования данных на будущее.

4.4.1. Модели и их представление. 4.4.1.1. Полиномиальная модель. Полиномиальная модель представляет собой полином некоторой максимальной степени от всех аргументов. В случае максимальной степени m = 2 и количества переменных n = 3 полином имеет членов и выглядит так:

Иногда в состав аргументов требуется ввести обратные величины , их степени или другие нелинейные функции (целесообразность введения новых аргументов определяется по уменьшению минимального значения основного критерия). В любом случае полный полином является линейным по коэффициентам, для определения которых применяется МНК.

Одна из возможных схем работы этого алгоритма выглядит так. Сначала определяются все модели, состоящие из одного аргумента:

Далее рассматриваются всевозможные модели, состоящие из двух аргументов, и т.д. При этом модель, описываемая полиномом, проверяется на оптимальность и соответствие критериям селекции.

^ 4.4.1.2. Гармоническая модель. При построении гармонической модели интервал главных значений частот искомых гармоник длиной 2 разбивается (вообще говоря, произвольно) на n промежутков. Каждому полученному дискретному значению частоты i ставится в соответствие «переобозначенный гармонический аргумент» вида

где коэффициенты Ci, Ai, Bi определяются по методу наименьших квадратов на всех N точках исходных данных.

Далее выполняется полный перебор всех частных моделей различной сложности. При этом, начиная с того момента, когда рассматриваются модели, имеющие более двух гармоник, определяются коэффициенты моделей по отношению к уже вычисленным «гармоническим аргументам»:
^

4.4.2. Критерии селекции моделей

Критерием модели называется в общем случае мера количественного сравнения моделей различной сложности, которая позволяет выделить некоторое подмножество лучших моделей из всего их множества, генерируемого в процессе самоорганизации.

Все критерии можно разделить на две группы:

  • критерии точности, выражающие ошибку проверяемой модели на различных частях выборки;
  • критерии согласованности, являющиеся мерой близости оценок, полученных на различных частях выборки.

Обе группы критериев могут применяться как в симметричной, так и в несимметричнойформе. Симметричная форма критерия означает, что в этом критерии равноправно используется информация как из обучающей последовательности (далее – A), так и из первой проверочной последовательности (далее – B). Несимметричным критерий называется в противном случае. Кроме уже введённых обозначений последовательностей A и B, введём ещё одну последовательность: W, .

Итак, рассмотрим основные критерии, применяющиеся для селекции моделей.

^ 4.4.2.1. Критерии точности. Критерии точности порождены формулой квадратичной ошибки аппроксимации (ошибки МНК). Внешний характер этих критериев обеспечивается учётом проверочных выборок. Другими словами, критерии точности, имеющие один вид формулы, могут использоваться и как внутренние (для оценки коэффициентов модели), и как внешние (для оценки качества модели) 1 .

Критерий регулярности

Это исторически первый критерий, использующийся при отборе моделей, и записывается следующим образом:

где означает “ошибка на ^ B модели, коэффициенты которой получены на модели A ”.

Очевидно, что данный критерий несимметричен – выборка A является обучающей; B – проверочной. Поменяв A и B местами, получим ещё один критерий регулярности:

в котором модель создаётся на последовательности B, а проверяется на A.

Теперь легко сконструировать симметричный критерий регулярности:

где подпоследовательности A и B используются равноправно.

Этот критерий позволяет более надёжно выбирать модель по сравнению с обычным критерием регулярности, так как позволяет сглаживать влияние помех на обеих подвыборках A и B.

Критерий стабильности

Этот критерий используется в тех случаях, когда необходимо, чтобы модель имела удовлетворительную точность как на обучающей, так и на проверочной последовательностях. Его выражение:

где – точность метода наименьших квадратов (МНК).

Как нетрудно видеть, этот критерий также несимметричен.

Как и в случае критерия регулярности, можно сконструировать аналогичный критерий и, соответственно, симметричный критерий регулярности:

где d 2 – симметричный критерий регулярности.

Усреднённый критерий регулярности

Согласно этому критерию, вычисляется среднее значение NW критериев регулярности для каждой проверяемой частной модели в условиях, когда проверочная последовательность – поочерёдно каждая точка из W, обучающая последовательность состоит из прочих (NW 1) точек. Такой критерий имеет следующий вид:

^ 4.4.2.2. Критерии согласованности. Критерии этой группы не учитывают в явном виде ошибку модели и поэтому даже формально (в отличие от критериев точности) не могут быть использованы в качестве внутренних (для оценки коэффициентов). Эти критерии строятся как количественное выражение какого-либо дополнительного требования к свойствам искомой модели.

Критерий минимума смещения коэффициентов

Данный критерий требует, чтобы оценки коэффициентов моделей на A и B отличались минимально:

где – вектор коэффициентов модели, вычисленный на A, а – вектор коэффициентов, вычисленный на B.

Критерий минимума смещения решений

Это более распространённая версия предыдущего критерия (4.43):

Этот критерий требует, чтобы минимально отличался выход на ^ W моделей с коэффициентами, полученными на A и B.

Абсолютно помехоустойчивый критерий

Данный критерий требует максимальной согласованности оценок выхода модели при коэффициентах, полученных на трёх частях выборки – A, B и W:

Название этого критерия связано с тем, что он теоретически удовлетворяет одному из наиболее важных условий работоспособности внешнего критерия – надёжно отсеивать избыточные (переусложнённые) модели при любом шуме.

^ 4.4.3. Виды алгоритмов МГУА. Особенность алгоритмов МГУА состоит в том, что вид опорной функции, класс уравнений и структура моделей устанавливаются объективным способом при помощи перебора вариантов по целесообразно выбранному ансамблю критериев (индуктивный метод). Способ введения критериев обеспечивает объективное нахождение структуры единственной модели оптимальной сложности при высокой помехоустойчивости метода. Допустимое ограничение шум/сигнал может достигать значения единицы и более (без учёта информации о помехах).

Наиболее существенными признаками, отличающими алгоритмы МГУА, являются:

— число рядов селекции;

— наличие или отсутствие вычисления остатка;

— число уравнений в системе.

Структуры алгоритмов МГУА остаются аналогичными друг другу для различных опорных функций. Так, для полиномиальных и гармонических алгоритмов можно указать три основных вида структуры: однорядные (комбинаторные); многорядные, без вычисления остатков после каждого ряда селекции; многорядные, с вычислением остатков.

Однорядные алгоритмы МГУА предназначены для решения переопределенных задач самоорганизации моделей по опытным данным, в которых число точек измерения равно или превышает некоторый (различный для разных типов моделей) алгебраический минимум.

Многорядные алгоритмы МГУА применяются для решения некорректных или недоопределённых задач моделирования, т.е. в случае, когда число точек N в таблице опытных данных меньше числа аргументов n, входящих в синтезируемую модель (N ^

5. Прогнозирование на основе

имитационного моделирования

Имитационное моделирование является мощным инструментом анализа технических, экономических и управленческих задач. Имитационный эксперимент является эффективным аналогом реального процесса и позволяет заменить конкретное явление экспериментом с математической моделью на персональном компьютере.

В учебном пособии основное внимание уделяется двум прикладным задачам:

— задаче прямоугольного раскроя с неявно заданной технологической последовательностью выполнения резов;

— задаче определения параметров альтернативного графа (графа с возвратами).

Реализация имитационной процедуры выбора карт раскроя позволяет рационально использовать банки карт раскроя заготовительных цехов и участков.

Проведение имитационного эксперимента на графах с возвратами позволяет рассматривать большое число альтернатив при функционировании систем и изучении их особенностей. Излагается широкий спектр алгоритмов для определения временных, стоимостных и ресурсных характеристик альтернативных сетевых моделей.

Особое внимание в учебном пособии уделяется изучению современных математических приемов автоматизации процесса моделирования, в частности, рассматриваются критерии автоматической остановки.

^ 5.1. Основные понятия имитационного моделирования

Имитационное моделирование — это метод проведения вычислительных экспериментов с математическими моделями сложных систем с целью изучения поведения систем в течение продолжительных периодов времени [44, 46].

Пусть — вектор, описывающий множество выходных (эндогенных) переменных изучаемой системы, — вектор, составленный из множества входных (эндогенных) переменных (или переменных управления).

Предположим, что переменная воздействует на переменную в соответствии с функциональным соотношением

где — факторы системы (входы системы); — реакция системы; поверхность реакции системы.

В условиях имитационного эксперимента заменяется конкретным математическим выражением и строится математическая модель следующего вида:

где — оценка по модели (5.2); — вектор параметров имитационной модели; — случайная величина (тренд).

Случайная величина моделируется при помощи методов Монте-Карло [21, 47, 48].

Отметим, что при изучении реальных технико-экономических систем в модель (5.2) можно включить преобразования реакции и элементов вектора , а также учесть закон изменения случайной величины [25, 53, 54].

Постановка и проведение имитационного эксперимента предполагает решение целого ряда сопутствующих проблем, которые кратко перечислены в следующем разделе.

^ 5.1.1. Этапы организации имитационного эксперимента. Перечислим основные этапы организации имитационного эксперимента, подробно изложенные в [38]:

  1. формулировка проблемы;
  2. формулировка математической модели;
  3. выбор метода анализа и генерации случайных чисел;
  4. выбор ПК, языков моделирования, программирование алгоритмов;
  5. оценка пригодности модели;
  6. планирование машинного эксперимента;
  7. анализ результатов эксперимента.

Формулировка проблемы, подлежащей исследованию с помощью метода имитационного моделирования, начинается с постановки задачи. Изучаются входные и выходные переменные системы, выделяются управляющие переменные. Составляется описание среды, в которой функционирует изучаемая система. Этап завершается ясным изложением вопросов, на которые исследователь хочет получить ответы.

На втором этапе выбирается вид математической модели, описывающей основные зависимости между переменными задачи. Анализируется способ включения в модель случайных величин, а также изучаются особенности законов распределения вводимых случайных величин. Принимается решение о характере используемых статистических методов обработки результатов имитационного эксперимента.

После выбора методов анализа и генерации случайных чисел решается проблема автоматизации процесса моделирования — от использования отдельных компонент объектно-ориентированных языков моделирования до применения специализированных пакетов прикладных программ.

Оценка пригодности имитационной модели может производиться по двум критериям:

1) оценка степени совпадения имитированных данных с известными за прошлые периоды данными (если эти данные имеются);

2) оценка точности предсказания имитационной модели относительно поведения реальной системы в будущем.

Решение перечисленных задач является сложной проблемой, поскольку затрагивает многие практические и теоретические аспекты.

^ 5.1.2. Правила автоматической остановки имитационного эксперимента. Пусть — число повторений имитационного эксперимента.

Правило, определяющее число , обеспечивающее заданный уровень статистической точности, называется правилом остановки [см. Нейлор Т. Машинные имитационные эксперименты с моделями больших систем.- М.: Мир,1975.- 500 с.].

Правило остановки при фиксированном объеме выборки

Рассмотрим правило остановки в случае, когда объем выборки (количество случайных величин в одном испытании) постоянен и определяется до начала эксперимента. В этом правиле дисперсия предполагается известной.

Пусть имеется выборка, состоящая из независимых одинаково распределенных случайных чисел , дисперсия которых известна, а математическое ожидание неизвестно. Предположим, что мы хотим оценить математическое ожидание и нами вычислена несмещенная оценка по формуле

Будем искать такое правило остановки, которое гарантирует, что вероятность попадания числа в доверительный интервал

равна , где — стандартное отклонение величины , а — процентиль нормального распределения , оставляющий в каждом отбрасываемом “ хвосте ” случайных чисел по вероятности. Обозначим длину доверительного интервала , эта длина вычисляется по формуле

Если и известны, то остановку следует произвести, когда

По центральной предельной теореме можно считать, что распределение величины нормально, поскольку все независимы и одинаково распределены.

Правило остановки последовательных испытаний

Имитационные эксперименты с фиксированным объемом выборки требуют большего машинного времени, чем методы, где число наблюдений заранее не фиксируется и объем выборки рассматривается как случайная величина, зависящая от исхода предыдущих наблюдений. Такой подход называется методом последовательных испытаний. Затраты машинного времени на проведение имитационного эксперимента методом последовательных испытаний определяются только тем количеством наблюдений, которое необходимо , чтобы получить результат с заранее заданной точностью. Рассмотрим один из способов включения в статистический эксперимент правила автоматического определения на каждом шаге имитации.

Пусть имеется выборка из независимых, одинаково распределенных случайных величин , полученных в результате проведения опытов по имитации. Значение на первом этапе реализации имитационной модели определяется из практических соображений , как правило, . Определим выборочное среднее и выборочную дисперсию по следующим формулам [3, 21]:

где — объем выборки; — значение случайной величины в -м опыте.

Требуется найти такое правило остановки, чтобы истинное значение математического ожидания лежало в доверительном интервале [21]:

с вероятностью , где — вероятность доверия к полученным результатам имитации , — квантиль распределения случайной величины при условии , что множество значений задается в виде . Величина характеризует рассеяние распределения случайной величины и показывает отклонение от среднего , выраженное в единицах стандартного отклонения . Значение определяется по таблицам в зависимости от значения величины и типа распределения случайной величины.

Задавая величину доверительного интервала , можем оценить объем выборки :

Полученное значение используется для проведения второго этапа имитационного эксперимента по правилам:

а) если , то эксперимент заканчивается ; качество статистических характеристик случайной величины оценивается вероятностью ;

б) если , то продолжается эксперимент для получения выборочных значений.

В случае необходимости можно провести повторную корректировку по формуле (5.10).

^ 5.1.3. Пример задачи имитационного моделирования.

Классическим примером для постановки имитационного эксперимента является задача массового обслуживания [38]. Рассмотрим одну из возможных экономических интерпретаций одноканальной модели массового обслуживания.

Пусть имеется очередь деталей для обработки на одном токарном станке. Предположим, что промежутки времени между поступлениями деталей на обработку распределены равномерно в интервале от 1 до 10 минут. Пусть время на обработку каждой детали распределено равномерно от 1 до 6 минут. Мы хотим узнать, какое среднее время пребывает каждая деталь на токарной обработке, включая ожидание и обслуживание. Кроме того, необходимо определить процент времени простоя токаря. Чтобы моделировать, необходимо поставить искусственный эксперимент, отражающий условия предлагаемой ситуации. Необходимо придумать способ имитации искусственной последовательности поступления деталей на станок и времени обработки их токарем.

Рассмотрим следующий способ имитации:

  1. возьмем 10 карточек и один кубик с шестью гранями;
  2. перенумеруем карточки от 1 до 10;
  3. положим 10 карточек в шляпу и будем их перемешивать;
  4. вынем карточку из шляпы и считаем с нее число, которое будет представлять промежутки времени между появлением предыдущей и последующей деталей;

5) бросим кубик и прочитаем с его верхней грани число очков, которое будет представлять время обработки детали на станке;

6) повторим эти операции в указанной последовательности, возвращая каждый раз карточки обратно и встряхивая шляпу перед каждым вытягиванием; в результате повторений получаем временные ряды;

7) запишем результаты десяти экспериментов в табл. 5.1.

Diplom Consult.ru

Перед тем, как начинать рассмотрение МГУА, было бы полезно вспомнить или узнать впервые метод наименьших квадратов — наиболее распространенный метод подстройки линейно зависимых параметров.

Рассмотрим для примера МНК для трех аргументов:

Пусть функция T=T(U, V, W) задана таблицей, то есть из опыта известны числа U­i, Vi, Wi, Ti ( i = 1, … , n). Будем искать зависимость между этими данными в виде:

где a, b, c — неизвестные параметры.

Подберем значения этих параметров так, чтобы была наименьшей сумма квадратов уклонений опытных данных Ti и теоретических Ti = aUi + bVi + cWi, то есть сумма:

Величина  является функцией трех переменных a, b, c. Необходимым и достаточным условием существования минимума этой функции является равенство нулю частных производных функции  по всем переменным, то есть:

то система для нахождения a, b, c будет иметь вид:

Данная система решается любым стандартным методом решения систем линейных уравнений (Гаусса, Жордана, Зейделя, Крамера).

Рассмотрим некоторые практические примеры нахождения приближающих функций:

Задача подбора коэффициентов , ,  сводится к решению общей задачи при T=y, U=x 2 , V=x, W=1, =a, =b, =c.

f(x, y) = sin(x) + cos(y) + /x

Задача подбора коэффициентов , ,  сводится к решению общей задачи при T=f, U=sin(x), V=cos(y), W=1/x, =a, =b, =c.

Если мы распространим МНК на случай с m параметрами,

то путем рассуждений, аналогичных приведенным выше, получим следующую систему линейных уравнений:

Общая схема построения алгоритмов метода группового учета аргументов (мгуа).

Рис. 9. Селекция самого черного тюльпана при расширяющемся опытном поле (эквивалент полного перебора), и при постоянном размере поля (эквивалент селекции при сохранении свободы выбора решений F = const).

Заимствование алгоритмов переработки информации у природы является одной из основных идей кибернетики. «Гипотеза селекции» утверждает, что алгоритм массовой селекции растений или животных является оптимальным алгоритмом переработки информации в сложных задачах. При массовой селекции высевается некоторое количество семян. В результате опыления образуются сложные наследственные комбинации. Селекционеры выбирают некоторую часть растений, у которых интересующее их свойство выражено больше всего (эвристический критерий). Семена этих растений собирают и снова высевают для образования новых, еще более сложных комбинаций. Через несколько поколений селекция останавливается и ее результат является оптимальным. Если чрезмерно продолжать селекцию, то наступит «инцухт» — вырождение растений. Существует оптимальное число поколений и оптимальное количество семян, отбираемых в каждом из них.

Алгоритмы МГУА воспроизводят схему массовой селекции [5], показанной на Рис. 9. В них есть генераторы усложняющихся из ряда в ряд комбинаций и пороговые самоотборы лучших из них. Так называемое «полное» описание объекта

где f — некоторая элементарная функция, например степенной полином, заменяется несколькими рядами «частных» описаний:

Входные аргументы и промежуточные переменные сопрягаются попарно, и сложность комбинаций на каждом ряду обработки информации возрастает (как при массовой селекции), пока не будет получена единственная модель оптимальной сложности.

Каждое частное описание является функцией только двух аргументов. Поэтому его коэффициенты легко определить по данным обучающей последовательности при малом числе узлов интерполяции [4]. Исключая промежуточные переменные (если это удается), можно получить «аналог» полного описания. Математика не запрещает обе эти операции. Например, по десяти узлам интерполяции можно получить в результате оценки коэффициентов полинома сотой степени и т. д.

Из ряда в ряд селекции пропускается только некоторое количество самых регулярных переменных. Степень регулярности оценивается по величине среднеквадратичной ошибки (средней для всех выбираемых в каждом поколении переменных или для одной самой точной переменой) на отдельной проверочной последовательности данных. Иногда в качестве показателя регулярности используется коэффициент корреляции.

Ряды селекции наращиваются до тех пор, пока регулярность повышается. Как только достигнут минимум ошибки, селекцию, во избежание «инцухта», следует остановить. Практически рекомендуется остановить селекцию даже несколько раньше достижения полного минимума, как только ошибка начинает падать слишком медленно. Это приводит к более простым и более достоверным уравнениям.

Илон Маск рекомендует:  Установка локального сервера (Denwer).
Понравилась статья? Поделиться с друзьями:
Кодинг, CSS и SQL