Реферат: Прогнозирование поведения биржевых инструментов с использованием моделирования методом информационного арбитража


 
Прогнозирование поведения биржевых инструментов с использованием моделирования методом информационного арбитража
 

В настоящее время выход на биржу и торговля биржевыми инструментами упростилась до того, что каждый желающий может сидя за компьютером сделать через Интернет сделку с биржевым товаром. Такая ситуация своеобразно сказалась на инструментах, которые торгуются только через сеть. Например, практически все инструменты электронной биржи GLOBEX отличаются своей большей волатильностью, правильней сказать раздерганностью по сравнению с теми же инструментами, торгуемыми не только на электронной бирже, из-за большого количества непредсказуемых игроков. Помимо меньшей предсказуемости электронная торговля дает существенное преимущество и удобства, а также, привлекая дополнительные финансы от большего количества игроков, но в малых суммах. Данные рынки делают игроки. Читая новости, выискивая там нужную информацию, они становятся в те позиции, которые им диктует данная новостная информация. Рынок реагируют на большую массу разрозненных, но смотрящих «по бычьи» или «по медвежьи» игроков. Повинуется им и становится или «бычьим» или «медвежьим». То же самое можно сказать о техническом анализе, большая масса игроков изучает или использует одни и те же индикаторы, которые прогнозируют рынок, повинуясь своим индикаторам, они становятся в одни и те же позиции, перетягивая за собой рынок.

Как поведет себя рынок? Большая масса игроков гипнотизирует графики, находясь в двухмерном пространстве цены и времени.

Безусловно, самым большим движущим фактором цен биржевых инструментов является выход на рынок больших институциональных инвесторов, события, влияющие на стоимость, ожидание события.

Мы отбросим использование, то, что называется инсайдерской информации, а возьмем открытые источники информации и попробуем смоделировать связку:

Рисунок 1.



* Ожиданием информации о событии являются также слухи, которые могут влиять на изменение цены, данного биржевого инструмента.

Слухи в бизнесе замечательная вещь. Поразительно, насколько точную картину сильных и слабых мест конкретной компании можно составить из выборки мнений различных людей, связанных с этой компанией тем или иным образом. К примеру, если обойти пять компаний, действующих в одной отрасли, и задать в каждой из них грамотно построенные вопросы о сильных и слабых сторонах остальных четырех, и в девяти случаях из десяти вы получите удивительно подробный и точный портрет всех пяти компаний. Можно очень много узнать от поставщиков и потребителей о сущности людей, с которыми они имеют дело. Также можно узнать о компании от людей когда-либо работавших в компании, но сейчас работающих в другом месте. Только, необходимо учитывать, что сведения, полученные от этих людей, часто могут намеренно искажаться.

Наибольшую информационную и прогностическую роль в инвестиционном процессе несет финансовый анализ. Он предоставляет информацию о прошлом и настоящем и переводит ожидания на язык цифр. Результаты финансового анализа используют при принятии решений о распределении капиталовложений, о финансовой политике корпораций и о разумном отборе ценных бумаг для вложения средств. Для этого применяется также экономический анализ рынков капитала, отраслей и ценных бумаг.

Результатом общего экономического анализа являются краткосрочные (от четырех до восьми кварталов) и долгосрочные (от пяти лет и более) прогнозы экономического развития, которые включают прогнозы национального производства товаров и услуг, производительности, инфляции, прибыли, денежной и фискальной политики. Эти оценки являются фундаментом для прогнозирования состояния рынков капитала, секторов, отраслей и отдельных компаний.

Рассмотрим теперь, то, что обозначает предлагаемый нами термин - информационный или новостной арбитраж (informational arbitration или news arbitration) - сверка информации о биржевом инструменте и его цены путем построения модели для прогноза поведения цены биржевого инструмента. Мы строим нашу модель на краткосрочном инвестировании, в акции, а также в такие инструменты биржевого рынка, как деривативы. Деривативы – производные инструменты, контракты, такие как опционы и фьючерсы, цена которых является производной от цены лежащего в основе финансового актива.

Гипотеза эффективного рынка (^ Efficient market hypothesis) гласит, что вся существующая информация немедленно и полностью отражается на рыночной курсовой стоимости ценных бумаг. Таким образом, для принятия решения о покупке или продаже биржевого инструмента мы имеем очень мало времени, если мы используем спекулятивные стратегии, идентифицирующие тренд. Мгновенной идентификации тренда путем моделирования с использованием новостной информации можно достичь только машинной обработкой текста с применением определенных алгоритмов.

Для того чтобы автоматизировать обработку текста для прогнозирования необходимо использовать ключевые слова, обрабатывать статистику их повторений, отражение ключевыми словами той или иной информации, влияние информации на изменение цены. Слова могут содержать явное указание поведения биржевого инструмента, например bond jump (облигации резко выросли в цене) или dollar weak against euro (доллар подешевел по отношению к евро). Очень важно, как много раз ключевые слова, указывающие на длинную или на короткую позицию, повторяются в различных источниках информации.

Для моделирования с целью прогнозирования необходимо использовать несколько сотен ключевых слов, считать их повторяемость и переводить ее в весомость. В конце весомость слов используется программой для прогнозирования изменения цены биржевого инструмента. Для автоматизации поиска ключевых слов применяются программы, похожие на поисковые роботы, которые используют поисковые сайты.

За основу должны приниматься только авторитетные источники информации, обновляемые несколько раз в день. Например, можно использовать следующие новостные ресурсы:

www.bloomberg.com - Bloomberg.

www.cnnfn.com - CNN finance.

www.iht.com - International Herald Tribune.

www.investool.com - Reuters.

www.ft.com - Financial Times.

http://money.cnn.com/markets/us_markets.html - CNN.

http://online.wsj.com/public/us - The Wall Street Journal.

Эти сайты предоставляют ежедневно обновляемую высококачественную финансовую информацию.

Построим следующую модель. Цель – необходимо спрогнозировать цену на DJ Доу Джонс – индекс, фьючерс на который торгуется на Чикагской бирже CBOT . Если цена закрытия больше чем цена открытия, т.е. фьючерс на индекс вырос, то какова вероятность, что он продолжит свой рост на следующий день. И наоборот, если цена закрытия меньше цены открытия, то какова вероятность, что на следующий день продолжится падение. Если вероятность больше 50%, то мы сможем более чем в 50% случаев правильно предсказать цену.

Следующая модель представляет собой арбитраж между американским индексом и влиянием цены закрытия американских рынков на цену открытия, например Гонконгской биржи. Или как индекс DJ влияет на индекс Hang Seng . Вероятность, что после закрытия DJ с плюсом индекс Hang Seng продолжит рост 1 к 3. Вероятность, что индекс Hang Seng продолжит падение, если DJ закрылся с минусом, также намного превышает случайную величину, если не произошли события непосредственно касающееся Юго-восточной Азии.

Аналитики, использующие технический анализ основываются, на анализе прошлых цен. Технический анализ использует аксиому - все произошедшие и ожидаемые событие уже находятся в цене биржевого инструмента. Они говорят, что мы живем в мире, который создан в прошлом. Все, что мы носим, едим, на чем ездим и т.д. создано в прошлом. Поэтому, если мы проанализируем прошлое в виде проекции цены и времени, то сможем предсказать будущее.

Аналитики, использующие фундаментальный анализ пытаются смоделировать будущее, основываясь на факторах реальной экономики – инфляции, торговом балансе, организационных изменениях в компаниях, требованиях, предъявляемых к продукции компаний и т.д.

С того момента, когда появляется новостной сигнал открыть прибыльную позицию и до момента, когда «новость уже в цене» проходит очень короткий период времени. Должны быть использованы индикаторы двух видов – непосредственно новости и непосредственно цены биржевого инструмента. Для того чтобы преобразовать в индикатор текстовую информацию использовался текст сортировщик, работающий по правилам Байесовского фильтра.

Работа с текстом может быть поделена на следующие составляющие:

Идентификация указателей изменения цен:

выверка, выравнивание новостного текста,

подсчет новостного текста,

метка новостного текста,

Программирование Байесовского текст сортировщика для идентификации движения рынков и применение новостной информации в качестве индикатора.

Предположим, что новости содержат информацию, которая влияет на изменение цен биржевых инструментов. Для каждой новостной статьи мы определяем временной интервал, который мы называем «окно влияния». Окно влияния отдельной новостной статьи d c интервалом времени t может быть охарактеризовано нижней границей отклонения и верхней границей отклонения от t . Отклонение отрицательное, если t + отклонение предшествует t . Например, на рисунке 2 показано слева у d i полученные отклонения нижнее l = -20, верхнее u = +30, справа у d k отклонения составили нижнее l = +20, верхнее u = +40.

 

Рисунок 2.

 



 

На этом рисунке отклонения l и u измеряются минутами.

С того момента, как торги заканчивались, все новости игнорировались. То есть, игнорировались новости, которые выходили в течение выходных дней и после закрытия торгов. Метод оценки основан на волатильности рынков, который известен как коэффициент β. β-коэффициент – определяется, как изменение цены биржевого индекса влияет на изменение цены конкретной ценной бумаги, входящей в индекс. Он высчитывается как линейная регрессия стоимости рыночных инструментов ( D -индекса, D -цены ценной бумаги). Следовательно, рынок с β-коэффициентом 1 характеризуется тем, что всякий раз, когда процент изменения индекса равен d , конкретная ценная бумага изменяет свою стоимость также на d . Аналогично, рынок с β-коэффициентом 2 характеризуется тем, что процент изменения стоимости индекса равен d и ожидается, что стоимость конкретной ценной бумаги изменится на 2 d . Рынки с β-коэффициентом больше, чем 1 сравнительно волатильны, в то время как рынки с β-коэффициентом меньше, чем 1 более стабильны.

Например, с того момента, как используемые нами акции не входят в индекс NASDAQ , мы можем взять их стоимость приблизительно равной средней арифметической, выбранных нами, родственных акций, торгуемых на данном рынке и также не входящих в индекс NASDAQ . Мы можем допустить, что относительные изменения в объеме торгов между двумя родственными акциями, эквивалентно относительному изменению стоимости этих двух родственных акций.

Для устранения эффекта экспонентного изменения рыночной стоимости этих акций для вычисления изменения цены мы используем следующую формулу:

 

D price ( u , v ) = ln

 

Мы определяем m , как изменение цены акции за интервал времени [ u , v ]:

 

m ( u , v )= - D ip ( u , v )

 

где ∆ sp ( u , v ) и ∆ ip ( u , v ) представляют изменения цены в течение интервала времени [ u , v ] для акции и индекса соответственно. Если мы возьмем для временного интервала t нижние и верхний уровень цен акции [ l , u ] , то будем искать m ( t + l , t + u ) .

Если цена биржевого инструмента остается без изменения определенное время, то это означает, что последующее направление движение цены может быть предсказано с большей долей вероятности. Так же, если в дальнейшем цена инструмента изменяется, то, как правило, больше, чем предполагалось. Подсчет ключевых слов в нашем методе может указать на падение на рынке, в то время, как цены будут расти и наоборот. Наша задача, использовать для прогноза не только новости и изменение цены интересующего нас биржевого инструмента, но изменение индекса, в который входит данный биржевой инструмент. Мы определяем три типа изменения цен:

восходящий вверх тренд (UP) ,

нисходящий тренд( DOWN) ,

боковой тренд (EXP) .

Их можно описать следующими правилами:

 

 

mc ( m )=

 

 

Хотя, это правило метки новостных статей может показаться простым, на самом деле это очень большая и сложная работа. Мы обращаем внимание, что быстрое и правильное определение заголовков (темы) новостной статьи это главная задача нашей работы.

Важность и трудность процесса выверки и определения заголовка новостной статьи показана на рисунке 3.

 

Рисунок 3.

 



 


Предположим, что используемая нами, новостная информация не искажает реальные факты, и она делится, как показано над осью на рисунке 2, на три класса. Здесь мы предположим, что каждый класс ассоциируется с традициями языка, которые индивидуальны для каждого языка. В частности мы бы предполагали, что такие слова, как lost , shortfall или bankruptcy встречаются чаще, чем прямое указание на падение цен, а слова incept , propel , или peak , чем обсуждение направления движения цен наверх. Полученный в результате не оптимальной или неправильной выверки новостей, порог оценки и показан на рисунке 3. Как мы видим из рисунка, некоторые новости обсуждающие падение цен определенных биржевых инструментов отмечены, как боковой тренд в нашей модели, некоторые, как восходящий тренд. После того, как мы определили классификации трендов и определили новости для этих классов трендов, наша задача состоит в том, что бы взяв новостную информацию d , мы могли бы спрогнозировать вероятность движение цены c . Для этого мы будем использовать текст сортировщик на основе Байесовского фильтра.



 

После того, как мы предположим, что условная независимость слов в документе, дала классификацию тренда, формулу можно представить в виде:

 



 

Это вероятность, смоделированная на основе Байесовского классификатора. После программирования классификатора для классификации трендов, для каждого выхода новостей d , мы считаем вероятность для каждого изменения тренда c и употребляем, в качестве индикатора. Поэтому для каждого выхода новостей мы получаем три цифровых индикатора: и

Торговая система была протестирована на 12 биржевых инструментах, начиная от некоторых индикаторов, например ( NASDAQ ) и заканчивая акциями, тикера на которые приведены ниже.

CSCO –Cisco Systems Incorporation

SUNW –Sun Microsystems Incorporation

MSFT –Microsoft Corporation

ORCL –Oracle Corporation

WCOM –Word Com Corporation

YHOO –Yahoo Incorporation

RHAT –Red Hat Incorporation

DELL –Dell Incorporation

AMZN –Amazon Com Incorporation

LU –Lucent Technologies Incorporation

EBAY – eBay Incorporation

INTC – Intel Corporation

Для тестирования брались цены и новости для всех 12 инструментов. Цены инструментов были поделены с 14.11.1999 по 02.11.2000 при помощи программы, при этом новости были взяты с периода ранее 01.10.2000. В результате такой обработки получено из 4300-4650 взятых для анализа 1300-1650 новостных статей для теста. Эксперимент показал, что эти 1300-1650 статей содержат всю необходимую информацию для теста.

После того, как были попробованы некоторые установки и опции для текстового классификатора Rainbow , было решено применить сглаживающий метод Wittenbell . Допуская главенство источника информации параллельно с классом документа, убрав все вводные и вспомогательные слова в документе, выделив корни слов, было использовано только 1000 слов наиболее информативных для определения изменения цены.

Выверка новостных статей частично зависит от подсчета ключевых слов, правильность основана на том, что индекс является главным в нашей классификации. В таблице 1 показан -коэффициент полученный линейной регрессией и для линейной регрессии.

Таблица 1.

 

Акция

AMZN

CSCO

DELL

EBAY

INTC

LU

MSFT

ORCL

RHAT

SUNW

WCOM

YHOO

Β- коэффициент

1,01

0,52

0,45

0,83

0,55

0,24

0,41

0,16

1,91

1,38

0,47

1,13



0,22

0,27

0,16

0,83

0,25

0,02

0,2

0,15

0,28

0,22

0,06

0,48

 

Необходимо обратить внимание, что благодаря линейной регрессии для некоторых акций было получено очень низкое значение , таким образом, в нашей модели получено правильное предсказание цены акции. Линейная регрессия и наименьшие и наибольшие значения показаны на рисунке 4.

Рисунок 4.



Оценивая точность прогноза модели, сравниваем лучшие прогнозы, полученные с использованием случайных величин, с нашей моделью. Полученные результаты были также оттестированы, по сравнению с нулевой гипотезой. Нулевая гипотеза утверждает, что всякий результат, полученный в исследовании, не отличается от того, который мог бы быть получен случайно. Результат Chi - square гипотезы по отношению к нулевой гипотезе показан, как z - scores . Результат экспериментов представлен на рисунках 5 и 6. На рисунке 5 слева на графике показано z - scores Chi - square test по отношению к нулевой гипотезе по отношению к различной точности. На графике справа на том же рисунке точность прогноза нашей модели по отношению к случайному прогнозу. На рисунке 6 слева показан график изменения z - scores Chi - square по отношению к нулевой гипотезе. Справа также показана точность прогноза нашей модели по отношению к случайному прогнозу. На этих рисунках видно, что разброс значений вероятностей от =-0,002 до =0,002.

 

Рисунок 5.

Однородное предшествующее распределение.

 



 

Рисунок 6.

Неоднородное предшествующее распределение



Для оценки эффекта различной сверки новостей с биржевыми инструментами, применялись два базовых метода сверки: сверка новостной информации, которая влияет на цены биржевых инструментов до того, как она становится доступна через открытые источники. Сверка новостной информации, которая влияет на изменение цены биржевых инструментов только после ее публикации в открытых источниках. На рисунках 7 и 8 показаны результаты для двух типов информации. На всех графиках на оси абсцисс показана граница отклонений в минутах. Для отрицательной части границы предполагаем, что наибольший предел отклонения есть нуль и отрицательная граница представляет нижнюю границу отклонения. Поэтому точка -30 представляет [-30, 0] нашей выверки. Наоборот, для положительных значений границы предполагаем нулевое значение, есть наименьшая граница отклонений. Поэтому точка +30 представляет [0, 30] нашей сверки. Справа на графике показано z - scores для разных сверок новостей по отношению к нулевой гипотезе. Слева на графике показана точность прогноза модели по отношению к случайному предсказанию.

 

Рисунок 7.



На рисунке 8 на графике показана точность и сигнал, отменяющий предыдущий сигнал, как процент для различных типов сверок. На графике слева показана точность прогноза в процентах, справа количество сигналов, отменяющих предыдущий сигнал, в процентах для разных типов сверки.

Рисунок 8.



Было найдено, что большинство достоверных результатов и наилучших прогнозов были получены с выверкой [-20, 0] и [0, 20]. К тому же обнаруживаем, что как только удлиняются окна влияния, результат становится все менее и менее достоверным. Найдена также сильная корреляция между новостной информацией и поведением биржевых инструментов с 20 минут до и 20 после того, как информация стала общедоступна. Результаты экспериментов подтверждают гипотезу, что предсказываемые прибыли на рынках реализуются, как только возникает возможность их получения. Мы видим очень строгую зависимость между выходом новостей и поведением рынка за 20 минут до и 20 после того, как информация стала общедоступна.

Был представлен новый индикатор для рынка биржевых инструментов, который основан на финансовой информации. Была произведена ранжировка информации о биржевых инструментах вместе с ценами биржевых инструментов. Были идентифицированы три класса изменения цен и запрограммирован Байесовский текст классификатор для трех классов изменения цен. Было обнаружено, что корреляция между информацией и поведением биржевых инструментов высокая за 20 минут до и 20 минут после того, как информация становится широко доступна. Этот результат подтверждает гипотезу эффективного рынка (Efficient market hypothesis), согласно которой вся существующая информация немедленно и полностью отражается на рыночной курсовой стоимости ценных бумаг.

Потенциальный инвестор считает, сколько времени он будет уделять инвестициям, чтобы разместить их правильно. Он думает, как каждую неделю будет по нескольку часов проводить перед экраном компьютера, изучая массу материалов, и перед ним откроется дверь, ведущая к получению крупных прибылей. У него естественно нет времени на то, что бы беседовать с разными людьми, с которыми было бы разумно вступить в контакт, чтобы сделать инвестиции в биржевые инструменты с наибольшей выгодой.

Общей целью всех инвесторов является приобретение умеренно оцененных, а лучше недооцененных активов с целью получения прибыли, избегая при этом, сильных рисков.

Цель данной работы показать возможные аспекты прогнозирования поведения биржевых инструментов с использованием моделирования на основе фундаментальных факторов, а также общедоступной новостной информации, а также предложить новый способ прогнозирования, который предлагается назвать информационный или новостной арбитраж (informational arbitration или news arbitration).


Экономика и финансы, 2004 №23 (74) октябрь Владимир Дорожинский.
еще рефераты
Еще работы по разное