Estratégia de negociação de programação dinâmica
Estratégia de negociação de programação dinâmica
Obter através da App Store Leia esta publicação em nosso aplicativo!
Como seria possível usar a Programação Dinâmica para pesquisar um espaço de estratégias de investimento para encontrar o melhor?
Como minha pergunta afirma, o problema que estou tendo é encontrar uma maneira sensata de pesquisar um grande espaço. Qualquer ajuda ou visão que poderia ser fornecida seria muito apreciada.
Atualmente, estou tentando pesquisar um espaço de possíveis estratégias de investimento. Este espaço foi restrito a 3 ativos possíveis (Equity, Cash and Bonds) em 100 anos, onde as estratégias são constantes por 10 anos de cada vez. Também restringi a área, permitindo apenas um investimento de 100% em um activo ou uma divisão de 50/50 entre dois. Todo o fundo deve ser investido em cada momento. Isso significa que há 10 vezes para escolher entre 6 possíveis combinações de investimentos. Eu já preformei uma pesquisa básica do espaço usando um método intensivo de mão-de-obra de Algoritmos Genéticos que exige que eu escolha estratégias adequadamente ótimas em tempos maiores, trabalhando até décadas a partir de blocos de 50 anos. No entanto, acredito que haveria uma solução melhor, mas minha falta de conhecimento na otimização está me dificultando aqui. Uma estratégia é executada através de um programa para fornecer quantiles de uma vida de fundo que são combinados com critérios determinados. Isso é o que indica a adequação de uma estratégia.
Eu tenho procurado usar a equação de Bellman, mas como isso exige pressupostos markovianos, eu não sei se posso aplicar isso. Se alguém tiver alguma idéia que pudesse ser aplicada, seria de grande ajuda.
Se alguma coisa que eu disse precisava de esclarecimentos ou se eu estivesse um pouco vago em algumas informações, avise-me.
Controle Óptico Estocástico e Otimização de Algoritmos de Negociação.
Embora os fundos quantitativos sejam bastante comuns nos dias de hoje, para a maioria das pessoas eles ainda são "caixas negras" que fazem "matemática avançada" ou "aprendizagem em máquina" ou mesmo "inteligência artificial" dentro. Em um de nossos artigos anteriores, mostramos nosso sistema comercial (você pode lê-lo aqui: https: // medium / tensorbox / the-trading-system-that-maximizes-our-edge-a64e95533959) Em um dos futuros artigos podemos mostrar como construímos e testamos nossos modelos preditivos ou "alfa" (que utilizam estatísticas avançadas e técnicas de aprendizado de máquina). Neste artigo, mostraremos como podemos otimizar a execução de algoritmos de negociação e que tipo de tarefas de otimização surgem. Haverá algumas matemáticas avançadas, mas tentaremos mantê-lo simples no início e passar para modelos mais avançados.
Princípio de programação dinâmico e equação Hamilton-Jacobi-Bellman (HJB).
Vamos assumir que temos um avião (ou um foguete) que voa do ponto A para o ponto B, mas como há muita turbulência no caminho, não pode se mover em linha reta, pois é constantemente jogado em direções aleatórias. Os sistemas de controle têm que ajustar a trajetória ("política de controle") o tempo todo, e uma vez que a quantidade de combustível é limitada, ela deve ser feita da maneira ideal. O método de programação dinâmica quebra este problema de decisão em subproblemas menores. O princípio de otimização de Richard Bellman descreve como fazer isso:
Uma política ótima tem a propriedade de que, independentemente do estado inicial e decisão inicial, as decisões restantes devem constituir uma política ótima em relação ao estado resultante da primeira decisão.
Basicamente, isso significa que parte da trajetória ideal também é uma trajetória ótima: se a linha negativa entre C e D não fosse uma trajetória ótima, devemos substituí-la por outra linha (tracejada). É por isso que esses problemas geralmente são resolvidos para trás no tempo: se estamos em algum ponto (aleatório) C 'perto de C, sabemos como chegar a C, e assim por diante.
Matematicamente, o problema poderia ser formulado assim:
precisamos minimizar a função de valor:
durante o período de tempo [0, T], onde C [] é a função de taxa de custo escalar e D [] é uma função que dá o valor econômico ou utilidade no estado final, x (t) é o vetor do estado do sistema, x (0) é assumido dado, e u (t) para 0≤ t ≤ T é o vetor de controle que estamos tentando encontrar.
Para este sistema simples, a equação diferencial parcial Hamilton-Jacobi-Bellman é:
sujeito a condição terminal:
Em geral, o objetivo dos problemas de controle estocástico é maximizar (minimizar) alguma função de lucro esperado (custo) escolhendo uma estratégia ótima que afeta a dinâmica do sistema estocástico subjacente. Vamos dar uma olhada em alguns problemas de brinquedos clássicos:
- O problema de Merton.
O agente está tentando maximizar a utilidade esperada da riqueza futura ao negociar um ativo de risco e uma conta bancária sem risco. As ações do agente afetam suas riquezas, mas, ao mesmo tempo, a dinâmica aleatória em ativos negociados modula a riqueza do agente de forma estocástica. Ou mais estritamente, o agente está tentando maximizar a expectativa de U (X), onde X - riqueza do agente - é modelado como:
onde W é um movimento browniano, usado para modelar o preço de um bem arriscado:
onde π é uma estratégia de negociação autofinanciada, é esperada uma taxa de crescimento combinada do ativo negociado e r é uma taxa de retorno composta da conta bancária sem risco.
- O Problema de Liquidação Ótima.
Suponha que o nosso modelo alfa nos diga que é rentável liquidar um grande número N de moedas no preço St e desejamos fazê-lo até o final do dia no momento T. Realisticamente, o mercado não tem liquidez infinita, então pode " t absorver uma grande ordem de venda com o melhor preço disponível, o que significa que iremos no livro de pedidos ou mesmo movemos o mercado e executaremos uma ordem a um preço mais baixo (sujeito ao impacto no mercado designado como 'h' abaixo). Portanto, devemos espalhar isso ao longo do tempo e resolver um problema de controle estocástico. Podemos também ter um senso de urgência, representado por penalizar a função de utilidade para manter invenotry não-zero ao longo da estratégia. Deixe ñ indicar a taxa em que agente vende suas moedas no tempo t. A função de valor do agente parecerá:
onde dQ = - tantdt - inventário do agente, dS - preço da moeda (como no problema de Merton acima), S't = St-h (νt) - preço de execução e dX = νtS'tdt - dinheiro do agente.
-O problema de entrada ideal para Arbitragem estatística.
Suponhamos que possamos dois ativos co-integrados A e B (ou, em caso trivial, um recurso em diferentes trocas) e possuímos um portfólio longo e curto, que é uma combinação linear desses dois ativos. A estratégia ideal deve determinar quando entrar e sair de tal carteira e podemos colocar este problema como um ótimo problema de parada. Podemos modelar a dinâmica do εt, fator de co-integração desses ativos, como.
onde W é um Motiom Browniano padrão, κ é uma taxa de reversão média, θ é o nível que o processo significa - reverte para e σ é a volatilidade do processo. O desempenho do agente, por exemplo, para sair da posição longa pode ser escrito como.
onde c é o custo de transação para a venda do portfólio, ρ representa urgência, geralmente dada pelo custo do comércio de margem e E [] denota expectativa condicional em εt = ε.
A função de valor buscará o tempo de parada ideal ao desenrolar a posição (portfólio longo) maximizando os critérios de desempenho. Alternativamente, podemos encontrar critérios de desempenho para entrar em posição longa e, finalmente, critérios para entrar e sair de posições curtas.
Há, é claro, muitos outros problemas de controle estocástico ótimos na negociação e quase qualquer algoritmo de execução pode ser otimizado usando princípios similares. O desempenho de dois algoritmos baseados nos mesmos sinais exatos pode variar muito, e é por isso que não é suficiente ter apenas um bom modelo "alfa" que gera previsões precisas.
Como um grupo de "quants" com formação acadêmica em Métodos Numéricos, Matemática Computacional, Teoria do Jogo e experiência prática em Comércio de Alta Frequência e Aprendizado de Máquinas, nosso interesse foi explorar oportunidades em mercados de criptografia, com o objetivo de explorar várias ineficiências do mercado para gerar rendimentos absolutos constantes (não correlacionados com os movimentos do mercado) com baixa volatilidade, ou simplesmente colocar, lucros estáveis, sem grandes remessas. Para mais informações, visite TensorBox e, se você gosta do que fazemos, você pode participar da nossa Oferta Token Inicial.
Ao bater palmas mais ou menos, você pode nos indicar quais são as histórias que realmente se destacam.
TensorBox.
Como um grupo de "quants", nosso interesse é explorar oportunidades em mercados de criptografia, com o objetivo de explorar várias ineficiências de mercado para gerar retornos absolutos constantes (não correlacionados com os movimentos do mercado) com baixa volatilidade.
Programação dinâmica e estratégias ideais de lookahead na negociação de alta freqüência com custos de transação.
25 Páginas Publicadas: 3 Jan 2000.
Alexander Vigodner.
Bloomberg Financial Markets (BFM)
Data escrita: outubro de 1999.
É considerado um problema de controle de tempo discreto estocástico ótimo com função de penalidade não lisa. Esse problema ocorre naturalmente na negociação de alta freqüência nos mercados financeiros. O princípio da programação dinâmica é formulado para esse problema. A existência e a singularidade da estratégia ideal são comprovadas. Um algoritmo para a construção de uma estratégia sub-ótima é apresentado e as propriedades aproximadas desta estratégia são estudadas. Além disso, é descrita uma estratégia simplificada que é uma solução de um problema de regressão isotônico. Uma classe de problemas é definida em que esta estratégia pode substituir a estratégia sub-óptima básica. Os resultados são ilustrados por exemplos.
Classificação JEL: C2, C53, C61, F17, F47.
Alexander Vigodner (Autor do Contato)
Bloomberg Financial Markets (BFM) (email)
IBM-house 10º andar.
32 Weizmann Street.
Estatísticas de papel.
Jornais relacionados.
Mercado de capitais: eJournal da microstrutura do mercado.
Assine este boletim de taxas para mais artigos com curadoria sobre este tópico.
Papéis recomendados.
Links rápidos SSRN.
Rankings SSRN.
Sobre SSRN.
Os cookies são usados por este site. Para recusar ou aprender mais, visite nossa página Cookies. Esta página foi processada pelo apollo4 em 0.125 segundos.
Execução ótima com funções de impacto ponderadas: uma abordagem de programação quadrática.
Reshma Khemchandani Nishil Gupta Arpit Chaudhary Suresh Chandra Autor de e-mail.
Neste artigo, desenvolvemos melhores estratégias de negociação para um investidor avessado ao risco, minimizando o custo esperado e o risco de execução. Aqui consideramos uma lei de movimento de preço que usa uma combinação convexa de impacto temporário e permanente no mercado. No caso especial de um problema sem restrições para um investidor neutro em termos de risco, obtemos uma solução de formulário fechada para melhores estratégias de negociação usando a programação dinâmica. Para um problema geral, usamos uma abordagem de programação quadrática para obter estratégias de negociação melhores e dinâmicas aproximadas. Além disso, exemplos ilustrativos de estratégias de execução ótimas são fornecidos para fins ilustrativos.
Preview.
Referências.
Informações sobre direitos autorais.
Autores e afiliações.
Reshma Khemchandani 1 Nishil Gupta 2 Arpit Chaudhary 2 Suresh Chandra 2 Email autor 1. Global Algorithmic Solutions, TSI, RBS Gurgaon Índia 2. Departamento de Matemática Indian Institute of Technology New Delhi Índia.
Sobre este artigo.
Recomendações personalizadas.
Cite o artigo.
.RIS Papers Reference Manager RefWorks Zotero.
.BIB BibTeX JabRef Mendeley.
Acesso ilimitado ao artigo completo Download instantâneo Inclua o imposto de vendas local, se aplicável.
Cite o artigo.
.RIS Papers Reference Manager RefWorks Zotero.
.BIB BibTeX JabRef Mendeley.
Mais de 10 milhões de documentos científicos ao seu alcance.
Switch Edition.
&cópia de; 2017 Springer International Publishing AG. Parte de Springer Nature.
Estratégia de negociação de preço de fechamento ótima.
O leilão de encerramento é um dos maiores eventos de liquidez nos mercados de ações globais e é particularmente importante para investidores passivos e gestores de fundos que comparam o preço de fechamento. Executar a ordem completa no leilão de encerramento pode garantir o preço de fechamento, mas também pode causar impacto no mercado. Os comerciantes que comparam o preço de fechamento devem considerar:
O equilíbrio entre o impacto do mercado e o erro de rastreamento A microestrutura do mercado de leilões de fechamento O preço de fechamento como um alvo em movimento e é influenciado pela própria ordem.
No novo artigo Optimal Closing-Price Strategy: Peculiarities and Practicalities, publicado no Journal of Investment Strategies, Gabriel Kan e Sanghyun Park da Bloomberg Tradebook abordam o problema, obtendo uma ótima estratégia de negociação que marca o preço de fechamento. Ao usar as técnicas de programação dinâmica e otimização de variância média, a solução oferece um esquema de negociação eficiente em forma fechada que permite uma implementação fácil e rápida na prática. Além disso, Gabriel e Sanghyun introduzem um método para traduzir os parâmetros do modelo abstrato para uma taxa de participação equivalente, mapeando o perfil de risco da estratégia ideal para a estratégia VWAP (preço médio ponderado em volume) padrão do setor. Essa abordagem permite que os comerciantes especifiquem o comportamento do modelo intuitivamente através da taxa de participação equivalente.
Suporte ao cliente.
Acesso de Cliente.
Os Serviços Profissionais Bloomberg conectam os tomadores de decisão a uma rede dinâmica de informações, pessoas e idéias. Solicite uma demo.
Комментариев нет:
Отправить комментарий