генератор прогнозов  

Генератор прогнозов создает модель с помощью обучающих данных и набора элементарных функций.
Результат работы генератора - прогноз и структура модели данных.

20.05.2012
Главное меню
Полезные ссылки
Задачи и решения
Авторизация

Кто на сайте
Сейчас 2 гостей онлайн
Облако тегов
Least angle regression  MVR Composer  Matlab  SourceForge  financial forecast  Линейная регрессия  Метод k взвешенных ближайших соседей  Метод Парзеновского окна  Метод наименьших углов  Однослойный персептрон  Поисковая машина нового поколения  Регрессионный анализ  Функции радиального базиса  автомат для прогнозирования  алгоритм LASSO  алгоритм Левенберга-Марквардта  банковский скоринг  генератор прогнозов  генетические алгоритмы  линейная регрессия  логистическая регрессия  медицина  метод наименьших квадратов  модель LARS  нейронные сети  нелинейная регрессия  оптимизация  прикладная регрессия  пример  прогноз  прогноз потребления электроэнергии  прогнозирование  регрессионная модель  регрессионный анализ  регрессия  сингулярное разложение  скоринговые карты  скоринговые модели  список обозначений  финансовый прогноз

feed-image Экспорт новостей

Контакты: strijov@gmail.com

Порождение и выбор моделей при построении скоринговых карт

PDF Печать E-mail

Лекция в АНХ, 14 дек.

План: что такое банковский скоринг, постановка задачи и требования к скоринговым моделям, порождение признаков, выбор моделей, визуализация пространства параметров моделей.

Слайды к лекции "Порождение и выбор моделей (на примере кредитного скоринга)" (pdf/3,5 Mb)

 

Регрессионный анализ, список обозначений

PDF Печать E-mail

Матрицы обозначены заглавными буквами, векторы — полужирными прописными буквами, множества (как правило) — каллиграфическими буквами.

 

Материалы по практикуму 3-го курса

PDF Печать E-mail

Материалы по практикуму 3-го курса: задания и выполненные работы в весеннем семестре 2009 года на Кафедре интеллектуальных систем ФУПМ МФТИ.


    Описание заданий и форматов выполнения

    Численные методы обучения по прецедентам (практика, В.В. Стрижов)
    Примеры и справочные материалы

       1. Пример оформления работы: "Логистическая регрессия (пример)"
       2. Введение в Матлаб
       3. Документирование функций Матлаб
       4. Как работать с репозиторием алгоритмов

    Выполненные работы

       1. EM алгоритм (пример)
       2. EM-алгоритм с последовательным добавлением компонент (пример)
       3. Однослойный персептрон (пример)
       4. Метод Парзеновского окна (пример)
       5. Метод k взвешенных ближайших соседей (пример)
       6. Функции радиального базиса (пример)
       7. Логистическая регрессия для решения задач классификации (пример)

    Дополнительно
    Некоторые примеры, выполненные в стиле Matlb-report находятся здесь.

 

 

Поисковая машина нового поколения

PDF Печать E-mail

В отличие от классических поисковых машин, WolframAlpha ищет в интернете систематизированные знания. Так как автор этой машины Стефен Вольфрам – создатель программы Mathematica, то с помощью этой машины можно решать задачи, рисовать графики, анализировать данные.

Примеры:

Ну и наконец, самое для нас актуальное знание - это отвечать на вопросы типа:

 

Least angle regression

PDF Печать E-mail

LARS is one of the most effective algorithms to select linear regression models. It is not so greedy as step-wise regression and takes not so much steps as Lasso.

 

Метод наименьших углов (пример)

PDF Печать E-mail

Метод наименьших углов (англ. least angle regression, LARS) - алгоритм отбора признаков в задачах линейной регрессии. Алгоритм предложили Бредли Эфрон, Тревор Хасти и Роберт Тибширани [1].

LARS решает следующую задачу. Пусть назначена линейная регрессионная модель. При большом количестве свободных переменных возникает проблема неустойчивого оценивания весов модели. LARS предлагает метод выбора такого набора свободных переменных, который имел бы наиболее значимую статистическую связь с зависимой переменной. Также LARS предлагает метод оценки весов.

Алгоритм LARS похож на алгоритм шаговой регрессии. Различие в том, что вместо последовательного добавления свободных, на каждом шаге алгоритмов происходит измерение весов модели. Веса увеличиваются так, чтобы доставить наибольшую корреляцию с вектором регрессионных остатков. Основным достоинством LARS является то, что он выполняется за число шагов, не превышающее число свободных переменных. Частным случаем алгоритма LARS является алгоритм LASSO.

 

Прогноз зависимости геометрии белковой последовательности

PDF Печать E-mail
Прогноз зависимости геометрии белковой последовательности от изменения последовательностей аминокислотных остатков

Ключевые слова:

  1. Исследование геометрических конфигураций белков
  2. Алгоритм поиска метрических конфигураций, связывающих конформационное состояние и физико-химические свойства информационных единиц

1. Первоначальная постановка задачи

Для ответа на вопрос "Как изменения в последовательностях аминокислотных остатков влияют на изменение в геометрии белка?", необходимо, во-первых, определить что такое изменение, то есть ввести некоторую меру изменения структуры домена, и, во-вторых, отыскать меру изменения геометрической конфигурации белка. Пользуясь этими двумя мерами предлагается создать алгоритм прогноза зависимости геометрии белковой последовательности от изменения структуры домена. (Ниже терминология изменена, принят синоним домен--информационная единица, IU.)

Задано множество аминокислотных остатков \{A,B,\ldots,T\}. Каждому остатку соответствует вектор из более четырехсот элементов, где каждый элемент — значение какого-либо измеряемого физико-химического свойства остатка.

Задано пространство доменов S=(\{s_i\},\nu). Здесь и далее домен s — упорядоченная последовательность остатков фиксированной длиныK и\nu — функция расстояния между двумя доменами, \nu=\nu(s_i,s_j), заданная с помощью набора правил.

Очевидно, что возможно исследовать не все пространство доменов фиксированной длины, в котором \frac{20!}{K!(20-K)!} элементов, а его небольшое подмножество и этот факт будет подразумеваться далее. Каждому домену поставлена в соответствие частота его встречаемости в различных белках.

 

Численные методы обучения по прецедентам (практика, В.В. Стрижов)

PDF Печать E-mail

Содержание

Московский физико-технический институт, Факультет управления и прикладной математики

’’Численные методы обучения по прецедентам’’ — практические занятия, включающие прикладные аспекты создания алгоритмов машинного обучения. Семестровый курс содержит 32 часа практических занятий. В ходе занятий студент получает несколько заданий на исследование свойств алгоритмов. Результатом практики являются отчеты о выполнении заданий. Все задания нужно сдать по меньшей мере за неделю до экзамена, чтобы успеть получить рецензию и исправить недочеты.

 

SourceForge - репозиторий программ

PDF Печать E-mail

SourceForge — репозиторий программ, разрабатываемых на условиях открытого доступа к исходному коду (open source). Репозиторий предоставляет удобный интерфейс разработчикам, позволяющий отслеживать версии создаваемых программ (version control), вести список ошибок (bug tracing) и выпускать версии, готовые для использования (file releases).

Содержание

Обзор

SourceForge — крупнейший сайт, посвященный разработке программ с открытым кодом. Сайт предоставляет разработчикам ресурсы для управления проектами, совместной работы распространения программного обеспечения. Сейчас на сайте 176,000 свободно распространяемых программ и более 1,800,000 зарегистрированных пользователей.

В разделе Scientific/Engineering находится более 23,000 программ, в том числе более 2600 посвящено математике.

 

Порождение регрессионных моделей биржевых опционов

PDF Печать E-mail

Индуктивное построение регрессионных моделей волатильности опционных торгов

В. В. Стрижов, Р. А. Сологуб

Предложен алгоритм индуктивного порождения регрессионных моделей оптимальной структуры. Алгоритм использован для построения моделей опционных торгов. Уточняется заданная экспертами модель зависимости вычисленной волатильности опционов от времени и цены исполнения. Используются данные торгов опционами Brent Crude Oil.

Введение

Существуют, по крайней мере, два подхода к созданию регрессионных моделей. Первый подход — модель назначается, исходя из информации о моделируемом явлении, второй подход — модель выбирается из множества универсальных моделей. Оба подхода имеют свои преимущества и недостатки. Предложенный алгоритм сохраняет сильные стороны обоих подходов: получаемые модели, с одной стороны являются интерпретируемыми в рамках рассматриваемой прикладной области, а с другой стороны достаточно точно аппроксимируют измеряемые данные.

В этой работе алгоритм используется для уточнения модели опционных торгов, предложенной экспертами. Опцион — договор, по которому покупатель получает право (но не обязанность) совершить покупку или продажу базового инструмента по заранее оговоренной цене — цене исполнения опциона в момент, называемый временем исполнения опциона, см. [1]. В качестве базового инструмента рассматривается нефть (Brent Crude Oil, символ NYM).

 

Matlab — язык программирования и система научных и инженерных расчетов

PDF Печать E-mail

Matlab — язык программирования и система научных и инженерных расчетов, построенная на основе интерпретатора этого языка. Matlab, сокращение от «Matrix Laboratory», предназначен в первую очередь для выполнения алгоритмов, использующих векторы и матрицы.

Язык программирования Matlab (иногда также называется M-code) изначально был разработан с целью упрощения работы с процедурами широко распространенной в 70-80 годы библиотеки алгоритмов линейной алгебры LINPACK. Впоследствии он развился в мощный язык с богатым набором типов данных.

Оболочка Matlab состоит из командной строки, текстового редактора со встроенным отладчиком и окнами со списком файлов, списком видимых переменных и с историей введенных команд.

Matlab имеет большое число пакетов (toolboxes) — как собственных, так и распространяемых независимыми разработчиками часто на условиях открытого кода. В Matlab включен Simulink — визуальный редактор для моделирования динамических систем.

Теги: Matlab
 

Документирование функций Matlab

PDF Печать E-mail

Документирование функций Matlab — способ передачи кода программ, написанных на языке Matlab коллегам или в общественное пользование. Система Matlab имеет ряд инструментов для работы с документированными функциями. В частности:

  1. заголовок функции показывается в поле «Description» окна «Current Directory»;
  2. заголовок функции и ссылка на файл, содержащий функцию показываются при генерации содержания «View->Directory Reports->Contents Report»;
  3. документация функции «help myfunc» показывается в окне «Command Window»;
  4. документация функции «doc myfunc» показывается в окне «Help»;
  5. список незавершенных работ и работ, требующих пересмотра показывается при генерации отчета «View->Directory Reports->TODO/FIXME Report».
 

Часто используемые регрессионные модели

PDF Печать E-mail

Содержание

Ниже приведены модели, которые используются при регрессионном анализе измеряемых данных. Параметры моделей обозначены латинскими и греческими буквами: \{a, b,c,\ldots,\chi,\psi, \omega\}, x, y — свободная и зависимая переменные. Все параметры и переменные вещественные. При соединении параметров в вектор \mathbf{w}, для представления модели в виде y = f(\mathbf{w},\mathbf{x}) + \varepsilon, параметры присоединяются в лексикографическом порядке, то есть в том порядке, в котором они появляются, если представить формулу регрессионной модели в виде строки.

В список не вошли универсальные параметрические модели, например, нейронная сеть — многослойный перцептрон, радиальные базисные функции, полиномы Лагранжа, полиномы Чебышёва. Также не вошли непараметрические модели. Оба эти класса требуют специального описания.

Этот список не является жестко заданным. Выбираемая регрессионная модель зависит прежде всего от экспертных предположений относительно моделируемого явления.

 

Система линейных алгебраических уравнений

PDF Печать E-mail

Содержание

Система m линейных алгебраических уравнений с n неизвестными — это система уравнений вида

\left\{\begin{array}{ccccccccc}  a_{11}x_1 & + & a_{12}x_2 & + & \ldots & + & a_{1n}x_n & = & b_1, \\  a_{21}x_1 & + & a_{22}x_2 & + & \ldots & + & a_{1n}x_n & = & b_2, \\  \vdots    &   & \vdots    &   &   &   & \vdots    &   & \vdots \\  a_{m1}x_1 & + & a_{m2}x_2 & + & \ldots & + & a_{1n}x_n & = & b_m. \\ \end{array}\right.

Здесь x_1, x_2, \ldots, x_n — неизвестные, которые надо определить. Коэффициенты системы a_{11}, a_{12}, \ldots, a_{mn} и её свободные члены b_1,b_2,\ldots,b_m предполагаются известными. Индексы коэффициента a_{ij} системы обозначают номера уравнения i и неизвестного j, при котором стоит этот коэффициент.

Система называется однородной, если все её свободные члены равны нулю, b_1=b_2=\ldots=b_n=0, иначе — неоднородной.

Система называется квадратной, если число m уравнений равно числу n неизвестных.

 

Логистическая регрессия (пример)

PDF Печать E-mail

Содержание

Логистическая регрессия - частный случай обобщенной линейной регрессии. Предполагается, что зависимая переменная принимает два значения и имеет биномиальное распределение. На практике логистическая регрессия используется для решения задач классификации с линейно-разделяемыми классами.

 

MVR Composer readme

PDF Печать E-mail

MVR generates and selects non-linear regression models. It was written in the Matlab language and intended to be used as an open-source code.

Introduction

This software is intended a curve-fitting tool. The models (curves) are generated using the set of primitive functions. More information on the algorithms could be found in the presentation, and in the paper. The complete documentation in English is coming. The fields applications are biology, physics, ecology, economics, etc.

Mathematical modelling has two issues: first, to create a model of a dynamic system using knowledge and second, to discover a model and knowledge using the measured data. So there are the model-driven and the data-driven approaches, and each one has its own strengths and weaknesses. The first one gives models that could be interpreted by experts in a field of application but usually they have poor prediction quality. The second one gives models of good quality but often too complex and non-interpretable by experts. The suggested approach gathers strong sides of these two: the result the model could be explained and it relies on the measured data. It allows getting the model with fair quality and generalization ability in comparison to universal models.

 

Линейная регрессия

PDF Печать E-mail

Содержание

Линейная регрессия — метод восстановления зависимости между двумя переменными. Ниже приведен пример программы, которая строит линейную модель зависимости по заданной выборке и показывает результат на графике.

Для заданного множества из m пар (x_i, y_i), i=1,\ldots, m, значений свободной и зависимой переменной требуется построить зависимость. Назначена линейная модель

y_i= f(\mathbf{w},x_i) + \varepsilon_i

c аддитивной случайной величиной \varepsilon. Переменные x, y принимают значения на числовой прямой \mathbb{R}. Предполагается, что случайная величина распределена нормально с нулевым матожиданием и фиксированной дисперсией \sigma^2_\varepsilon, которая не зависит от переменных x, y. При таких предположениях параметры \mathbf{w} регрессионной модели вычисляются с помощью метода наименьших квадратов.

Например, требуется построить зависимость цены нарезного хлеба от времени. (См. рис. далее по тексту). В таблице регрессионной выборки первая колонка — зависимая переменная y (цена батона хлеба), вторая — свободная переменная x (время). Всего данные содержат 195 пар значений переменных. Данные нормированы.

 

Символьная регрессия

PDF Печать E-mail

Символьная регрессия — метод построения регрессионных моделей путем перебора различных произвольных суперпозиций функций из некоторого заданного набора. Суперпозиция функций при этом называется «программой», а стохастический оптимизационный алгоритм построения таких суперпозиций называется генетическим программированием.

 

MVR Composer - математический инструмент для прогнозирования в любой предметной области

PDF Печать E-mail

MVR Composer (Multivariate Regression Composer) — программа, работающая в системе Matlab. Создает математические регрессионные модели, используя измеряемые данные и экспертные предположения о структуре моделей. Другое название - генератор прогнозов.

Назначение: универсальный математический инструмент для прогнозирования в любой предметной области. Позволяет быстро получить оценочный вариант прогноза без затрат на разработку специального прогнозирующего алгоритма. Основная идея, лежащая в основе генератора - порождение большого множества прогнозирующих алгоритмов (обычно несколько тысяч) и выбор среди них алгоритма, доставляющего наилучший прогноз.

 

Алгоритм Левенберга-Марквардта

PDF Печать E-mail

Алгоритм Левенберга-Марквардта предназначен для оптимизации параметров нелинейных регрессионных моделей. Предполагается, что в качестве критерия оптимизации используется среднеквадратичная ошибка модели на обучающей выборке. Алгоритм заключается в последовательном приближении заданных начальных значений параметров к искомому локальному оптимуму.

Алгоритм отличается от метода сопряженных градиентов тем, что использует матрицу Якоби модели, а не градиент вектора параметров. От алгоритма Гаусса-Ньютона этот алгоритм отличается тем, что использует параметр регуляризации.

Содержание

 

Связанный Байесовский вывод

PDF Печать E-mail
Уильям Оккам — английский философ-схоласт, логик и церковно-политический писатель (ок 1285—1349), автор принципа: «не умножай сущности без необходимости». Этот принцип поддерживается двумя соображениями. Во-первых, эстетическим: «При описании результатов экспериментов у теории с красивой математикой больше шансов на успех, чем у безобразной» — Поль Дирак. Во-вторых, применение бритвы Оккама уже имело большой успех при решении практических задач.
Уильям Оккам — английский философ-схоласт, логик и церковно-политический писатель (ок 1285—1349), автор принципа: «не умножай сущности без необходимости». Этот принцип поддерживается двумя соображениями. Во-первых, эстетическим: «При описании результатов экспериментов у теории с красивой математикой больше шансов на успех, чем у безобразной» — Поль Дирак. Во-вторых, применение бритвы Оккама уже имело большой успех при решении практических задач.

Cвязанный Байесовский вывод — метод сравнения регрессионных моделей основанный на анализе их пространства параметров. Этот метод использует классический Байесовский вывод дважды: для вычисления апостериорной вероятности параметров модели и для вычисления апостериорной вероятности самой модели. Связанность заключается в том, что оба вывода используют общий сомножитель, называемый доcтоверностью модели. Неотъемлемой частью этого метода является анализ пространства параметров модели и зависимости целевой функции от значений параметров. Результатом такого анализа является возможность оценить насколько важны отдельные параметры модели для аппроксимации данных. Cвязанный Байесовский вывод используется как в задачах регрессии, так и в задачах классификации.

Содержание

 

Прикладная регрессия и оптимизация (курс лекций, B.В.Стрижов)

PDF Печать E-mail

При решении задач регрессионного анализа искомая модель может быть назначена аналитиком на основе предположений о характере решаемой задачи или выбрана из некоторого множества индуктивно-порождаемых моделей. При выборе моделей встают вопросы о том, какова должна быть структура модели, ее сложность, устойчивость и точность. Изучаются методы создания и оптимизации линейных и нелинейных регрессионных моделей, методы порождения моделей с участием и без участия экспертов, методы выбора моделей с помощью резличных критериев качества.

Курс лекций состоит теоретической и прикладной частей. Теоретическая часть рассматривает обоснование применимости методов для решения определенных задач. Прикладная часть включает ряд заданий по написанию алгоритмов регрессионного анализа на языке системы Matlab.

Курс читается студентам 6-го курса кафедры «Интеллектуальные системы» (Специализация: Интеллектуальный анализ данных) ФУПМ МФТИ с 2006 года. От студентов требуется знание линейной алгебры и математической статистики.

 

Matlab - язык программирования и система научных и инженерных расчетов

PDF Печать E-mail

Matlab — язык программирования и система научных и инженерных расчетов, построенная на основе интерпретатора этого языка. Matlab, сокращение от «Matrix Laboratory», предназначен в первую очередь для выполнения алгоритмов, использующих векторы и матрицы.

Язык программирования Matlab (иногда также называется M-code) изначально был разработан с целью упрощения работы с процедурами широко распространенной в 70-80 годы библиотеки алгоритмов линейной алгебры LINPACK. Впоследствии он развился в мощный язык с богатым набором типов данных.

Оболочка Matlab состоит из командной строки, текстового редактора со встроенным отладчиком и окнами со списком файлов, списком видимых переменных и с историей введенных команд.

Matlab имеет большое число пакетов (toolboxes) — как собственных, так и распространяемых независимыми разработчиками часто на условиях открытого кода. В Matlab включен Simulink — визуальный редактор для моделирования динамических систем.

 

Список публикаций

PDF Печать E-mail

2009

Strijov V. The Inductive Algorithms of Model Generation // SIAM Conference on Computational Science and Engineering (CSE09). Abstracts. Miami, Florida, USA. March 2-6, 2009. [strijov09_SIAM_cse09.pdf, En]

Стрижов А.В. Стрижов В.В. Объективизация экспертных оценок, выставленных в ранговых шкалах // Математика. Компьютер. Образование. XVI международная конференция. Тезисы докладов. М.: "РХД". 2009. С. ?. [strizhov09mce.pdf, Ru]

Стрижов В.В. Сологуб Р.В. Порождение регрессионных моделей подразумеваемой волатильности опционов // Математика. Компьютер. Образование. XVI международная конференция. Тезисы докладов. М.: "РХД". 2009. С. ?. [sologub09mce.pdf, Ru]

Стрижов В.В. Крымова Е.А. Алгоритмы порождения и выбора регрессионных моделей // Математика. Компьютер. Образование. XVI международная конференция. Тезисы докладов. М.: "РХД". 2009. С. ?. [krymova09mce.pdf, Ru]

Стрижов В.В. Порождение и выбор регрессионных моделей // Математика. Компьютер. Образование. XVI международная конференция. Тезисы докладов. М.: "РХД". 2009. С. ?. [strijov09mce.pdf, Ru]

Стрижов В.В., Сологуб Р.А. Индуктивное порождение регрессионных моделей предполагаемой волатильности для опционных торгов // Журнал вычислительных технологий. 2009. [strijov09inductive.pdf, Ru]

 

Оптимальное прореживание нейронных сетей

PDF Печать E-mail

Оптимальное прореживание нейронных сетей (англ. optimal brain surgery) — метод упрощения структуры регрессионной модели, например, нейронной сети. Основная идея прореживания (англ. pruning) заключается в том, что те элементы модели или те нейроны сети, которые оказывают малое влияние на ошибку аппроксимации, можно исключить из модели без значительного ухудшения качества аппроксимации.

 

Регрессионная модель

PDF Печать E-mail

Термину регрессионная модель, используемому в регрессионном анализе, можно сопоставить синонимы: «теория», «гипотеза». Эти термины пришли из статистики, в частности из раздела «проверка статистических гипотез». Регрессионная модель есть прежде всего гипотеза, которая должна быть подвергнута статистической проверке, после чего она принимается или отвергается.

 

Для чего нужен генератор прогнозов?

PDF Печать E-mail

В последнее время прогнозирование стало важной частью процесса планирования деятельности любого предприятия. По данным аналитиков Aberdeen Group, компании, использующие математические инструменты для прогнозирования спроса, оценки финансовых рисков, принятия решений об инвестициях, достигают хорошей точности прогноза (свыше 70%).

Представленный на сайте strijov.ru генератор прогнозов - это универсальный математический инструмент для прогнозирования в любой предметной области. Он позволяет быстро получить оценочный вариант прогноза без затрат на разработку специального прогнозирующего алгоритма.

Основная идея, лежащая в основе генератора - порождение большого множества прогнозирующих алгоритмов (обычно несколько тысяч) и выбор среди них алгоритма, доставляющего наилучший прогноз.

Знания, получаемые с помощью прогноза используют для извлечения выгоды и минимизации рисков.

Например:

  • Прогноз волатильности, ликвидности, оборачиваемости биржевых инструментов – индексов, акций, опционов позволяет получать прямую выгоду.
  • Прогноз плотности потока клиентов, их поведения позволяет получать выгоду от правильной организации работ обслуживающего предприятия.
  • Прогноз спроса и предложения товаров и услуг позволяет получать выгоду от оптимальной организации торговли.
  • Прогноз погоды, землетрясений, техногенных катастроф позволяет снизить риски наступления неблагоприятных событий.
 

Генератор прогнозов на strijov.ru, анонс

PDF Печать E-mail

Ожидается, что в разделе "эксперимент" этого сайта будет размещен автомат-генератор прогнозов, порождающий краткосрочный прогноз по заданному временному ряду.

Автомат работает следующим образом:

1. Пользователь загружает временной ряд и назначает даты, на которые нужно сделать прогноз.
2. Автомат выполняет вычислительный эксперимент и высылает по указанному адресу прогноз и отчет об эксперименте.

Основное назначение генератора прогнозов - быстро получить черновой вариант прогноза без затрат на разработку специального прогнозирующего алгоритма. Однако, так как генератор использует универсальные алгоритмы (например, линейную и нелинейную регрессию), то не следует ожидать, что точность такого прогноза будет превосходить точность, получаемую с помощью алгоритмов, которые разработаны под конкретную предметную область.

Основная идея, лежащая в основе генератора - порождение большого множества прогнозирующих алгоритмов (обычно несколько тысяч) и выбор среди них алгоритма, доставляющего наилучший прогноз.

 

Метод группового учёта аргументов

PDF Печать E-mail

Метод группового учета аргументов, МГУА (Group Method of Data Handling, GMDH) - метод порождения и выбора регрессионных моделей оптимальной сложности. Под сложностью модели в МГУА понимается число параметров. Для порождения используется [базовая модель], подмножество элементов которой должно входить в искомую модель. Для выбора моделей используются внешние критерии, специальные функционалы качества моделей, вычисленные на тестовой выборке.

МГУА рекомендуется к использованию в том случае, когда выборка содержит несколько элементов. Тогда при построении регрессионных моделей использовать статистические гипотезы о плотности распределения, плотности распределения например, гипотезу о Гауссовском распределении, невозможно. Поэтому используется индуктивный подход, согласно которому последовательно порождаются модели возрастающей сложности до тех пор, пока не будет найден минимум некоторого критерия качества модели. Этот критерий качества называется внешний критерий, так как при настройке моделей и при оценке качества моделей используются разные данные. Достижение глобального минимума внешнего критерия при порождении моделей означает, что модель, доставляющая такой минимум, является искомой.

Один из авторов этого метода А.Г. Ивахненко пишет: «Осуществляется целенаправленный перебор многих моделей-претендентов различной сложности по ряду критериев.В результате находится модель оптимальной структуры в виде одного уравнения или системы уравнений. Минимум критерия селекции определяет модель оптимальной структуры».

 

Сингулярное разложение

PDF Печать E-mail

Сингулярное разложение (Singular Value Decomposition, SVD) декомпозиция вещественной матрицы с целью ее приведения к каноническому виду. Сингулярное разложение является удобным методом при работе с матрицами. Оно показывает геометрическую структуру матрицы и позволяет наглядно представить имеющиеся данные. Сингулярное разложение используется при решении самых разных задач от приближения методом наименьших квадратов и решения систем уравнений до сжатия изображений. При этом используются разные свойства сингулярного разложения, например, способность показывать ранг матрицы, приближать матрицы данного ранга. SVD позволяет вычислять обратные и псевдообратные матрицы большого размера, что делает его полезным инструментом при решении задач регрессионного анализа.

 

Метод наименьших квадратов

PDF Печать E-mail

Метод наименьших квадратов — метод нахождения оптимальных параметров линейной регрессии, таких, что сумма квадратов ошибок (регрессионных остатков) минимальна. Метод заключается в минимизации евклидова расстояния \|A\mathbf{w}-\mathbf{y}\| между двумя векторами -- вектором восстановленных значений зависимой переменной и вектором фактических значений зависимой переменной.

 

Progress-bar in command window

PDF Печать E-mail

Если не предполагается выводить прогресс-бар графически (см, например, waitbar), то можно вывести с помощью функции sprintf строку, а при увечичении счетчика прогресс-бара стирать старое значение и записывать новое.

Теги: matlab , demo
 

Публикуемся в зарубежных журналах, одобренных ВАК

PDF Печать E-mail

Проблема использования опубликованных статей одновременно на родине и за рубежом формулируется так. Материалы диссертационных работ должны быть опубликованы в журналах, рекомендованных ВАК. Однако зарубежные коллеги, как правило, не читают по-русски и часто не знают о существовании наших журналов. Поэтому приходится выбирать: или печатать у нас для диссертации, и не рассчитывать на англо-читающую публику, или считать, что ВАК одобрит статью. Решение предлагает сам ВАК: "к периодическим изданиям, включенным в перечень ... относятся....зарубежные издания, включенные в одну из трех систем цитирования Web of Science: Science Citation Index Expanded (база по естественным наукам)... Список ... доступен в сетях общего пользования."

Теперь: идем в Science Citation Index Expanded. Как работает доступ к их ISI Web of Knowlege непонятно. Если знаете, напишите strijov@ccas.ru. Нашел список журналов за 2007 год, в которых есть интересующие меня журналы SIAM. Файл называется wos_scie_a5021_final.pdf.

 

Регрессионный анализ

PDF Печать E-mail

Регрессионный анализ - метод моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной. Параметры модели настраиваются таким образом, что модель наилучшим образом приближает данные. Критерием качества приближения (целевой функцией) обычно является среднеквадратичная ошибка: сумма квадратов разности значений модели и зависимой переменной для всех значений независимой переменной в качестве аргумента.

Регрессионный анализ - раздел математической статистики и машинного обучения. Предполагается, что зависимая переменная есть сумма значений некоторой модели и случайной величины. Относительно характера распределения этой величины делаются распределения, называемые гипотезой порождения данных. Для подтверждения или опровержения этой гипотезы выполняются статистические тесты, называемые анализом остатков. При этом предполагается, что независимая переменная не содержит ошибок. Регрессионный анализ используется для прогноза, анализа временных рядов, тестирования гипотез и выявления скрытых взаимосвязей в данных.

 

Evaluation in matlab

PDF Печать E-mail
a = eval('1') is more clear than eval('a=1')
similar,
[U L V] = eval('svd(rand(5))')
Теги: Факт
 

Об отчете РФФИ (-a), как сделать прикрепленный файл

PDF Печать E-mail

На сайте написано: Внимание! По конкурсам “a” (в том числе международным и региональным) грантодержатели должны в обязательном порядке дополнить электронный вариант отчета (в «Грант-Экспресс») файлом в формате ТеХ, RTF или PDF, содержащим копии заполненных отчетных форм, а также рисунки, формулы, таблицы и т.д., если таковые имеются.

 

Отчет за 2007 год по научной работе (для Отдела вычислительных методов прогнозирования)

PDF Печать E-mail

Статьи в рецензируемых журналах (см. первые страницы публикаций)

Стрижов В.В. Поиск параметрической регрессионной модели в индуктивно заданном множестве. Журнал вычислительных технологий. 2007. No 1. С. 93-102.

Стрижов В.В., Казакова Т.В. Устойчивые интегральные индикаторы с выбором опорного множества описаний. Заводская лаборатория. Диагностика материалов. 2007 (7). C. 72-76.

Монография

Стрижов В.В, Пташко Г.О.  Алгоритмы поиска суперпозиций при выборе оптимальных регрессионных моделей. М.: ВЦ РАН. 2007. -- 56 с.

 

Книги

PDF Печать E-mail
Посмотреть:
  • С. П. Новиков, И. А. Тайманов, Современные геометрические структуры и поля. Издательство: МЦНМО, 2005 г. 584 стр. ISBN 5-94057-102-6. Вышла в издетельстве Springer.
  • К. Иосида. Функциональный анализ. Серия: Физико-математическое наследие: математика. Издательство: ЛКИ, 2007 г., 624 стр. ISBN 978-5-382-00190-6
Взять метод: сложение двух множеств векторов, иллюстрация при доказательстве теорем
  • А.С. Солодовников. Системы линейных неравенств (серия "Популярные лекции по математике"). М.: Наука, 1977. 112 с
Много материала по современной линейной алгебре (вычислительной)
  • Hogben, Leslie. Handbook of linear algebra (см. на амазоне, 119 usd), в магазине стоит 125 euro и уже купили.
 

Генетическое программирование

PDF Печать E-mail
Задачу порождения нелинейной регрессионной модели, в случае, когда нет предположений о структуре суперпозиции элементов модели решают с помощью генетического программирования (википедия). Текст написан рыхло, но много хороших ссылок. Пакет GPLAB сделан неплохо. Demo показывает создание одномерной регрессионный модели из библиотечных функций. Суперпозиция - дерево состоит из вложенных cells. Не уверен, что это удобно. Делал то же без вложения. Так же неудобно.
 

Семинар по Matlab'у 4 Октября 2007, новые инструменты

PDF Печать E-mail
Publish выводит программу вместе с результатами работы для отчета. См. Matlab report generator.

Guide сохраняет figures. Toolbar появился в версии 2007b. См. Edit M-file configuration.

Компилятор mcc fname -m. Для запуска cскомпилированных M-файлов на машине без Матлаба нужен Matlab Component Runtime Environment. Поставляется бесплатно, no fees, no royalty. Его Setup находттся в папке \toolbox\compiler\deploy\win32\*.exe.

Поменялся язык. См. par for и список новых ключевых слов Матлаба.
 

Выпуклая оптимизация

PDF Печать E-mail
Издательство Meboo pub. выпустило несколько книг по выпуклой оптимизации, в том числе две книги Dattorro: Convex Optimization and Euclidian Distance Geometry, Convex Optimization. На сайте много графиков и кратких пояснений, выдержки из книги. См. http://convexoptimization.com/
 

Математическое моделирование в иммунопатологии

PDF Печать E-mail
Страничка со ссылкой на наши семинары по иммунопатологии: http://www.crc.jussieu.fr/crc/index.php?cible=actualite&id=40 на сайте Centre de Recherche de Cordelieres. Институт Пьера и Марии Кюри, Париж.
 

Графические модели

PDF Печать E-mail
В Яндексе 21 июля выступала Рина Дектер с лекцией "From Constraint Programming to Graphical Models". Графические модели - инструмент для решения задач целочисленного программирования, в тех случаях, когда задана взаимосвязь между объектами, на множестве которых выполняется оптимизация. Исключительно милая и умная дама. И лекция у нее была неплохая. Ее сайт находится здесь http://www.ics.uci.edu/~dechter/.
Байесовские сети в графических моделях рассматриваются как одна из прикладных задач. Меня заинтересовала тема Linkage analysis в задачах анализа биомаркеров. Оказывается, вероятности мутации в генетических известны, что делает возможным строить байесовские графические модели не беспокаясь о точности модели и доверительных интервалах.
 

MVR Composer

PDF Печать E-mail

Программа для Матлаба, порождающая нелинейные регрессионные модели. Написана в процессе чтения курса "Прикладная регрессия и оптимизация" при участии студентов.

Cмотри:

1. репозиторий SourceForge.net, проект MVR,
2. краткое описание на machinelearning.ru.

Для того, чтобы скачать текущую версию программы нужно установить TortoiseSVN.
Адрес проекта в ToiroiseSVR->RepoBrowser: https://mvr.svn.sourceforge.net/svnroot/mvr.

 

Журнал "Фундаментальная и прикладная математика"

PDF Печать E-mail
Спасибо редакции журнала "Фундаментальная и прикладная математика" за то, что все статьи лежат на сайте в полном формате.
Их можно скачать бесплатно, а журнал очень хороший. Рекомендую. RSS там конечно, нет, но можно подписаться на новости по почте.
 

Экспериментируем с Scitation

PDF Печать E-mail
Scitation, http://scitation.aip.org/ объявлен как удобный цитатник. Ищет статьи, коллекционирует и экспортирует ссылки в BibTeX. Удобен или нет, пока неизвестно. Подробнее см. что это такое?

P.S. При регистрации, в качестве affiliation указывайте Russian Academy of Sciences: РАН есть среди участников проекта.
 

генератор прогнозов | краткосрочный прогноз потребления электроэнергии | финансовый прогноз | прогнозирование в экономике | онлайн прогнозирование