Saturday, November 26, 2016

Trading Estrategia De Minería De Datos

Cómo codificar estrategias comerciales matemáticamente (. Por ejemplo, índices, divisas, materias primas, tipos de interés) Si usted tiene un montón de diferentes datos econométricos que puede tratar de encontrar una fórmula para ver si existe alguna relación en los datos - por ejemplo, para pronosticar por este patrón descubierto. Lo que estoy pidiendo aquí es un poco diferente: ¿Hay otra forma en el sentido de que se puede buscar una fórmula f () de modo que la forma dada representa una estrategia de negociación, donde se encuentran algunos indicadores cuándo ir largo o corto (o cualquier combinación de los derivados)? La idea es que la propia fórmula vive en n-dimensional espacio de indicadores / negociar estrategias y trata de sobrevivir de la mejor manera que puede. Este debe ser un procedimiento estándar para sistemas multi-agente que simulan los mercados de valores artificiales. Por desgracia, no soy capaz de encontrar un método simple para hacer precisamente eso. Data Mining La rápida evolución de la tecnología informática en las últimas décadas ha proporcionado profesionales de la inversión (y aficionados) con la capacidad de acceder y analizar enormes cantidades de datos financieros. Además, los tableros web, correo electrónico y boletines mundiales hacen posible que la gente de todo el mundo tengan acceso a esta información de forma rápida, así como proporcionar un medio para que las personas expresen sus opiniones e interactuar. Como resultado, algunos de los temas más interesantes de debate en los últimos años han girado en torno a la práctica y las consecuencias de "minería de datos". La minería de datos consiste en buscar a través de bases de datos para las correlaciones y patrones que difieren de los resultados que se anticipan que ocurra por casualidad o en condiciones aleatorias. La práctica de la minería de datos en sí misma no es ni buena ni mala y el uso de minería de datos se ha vuelto común en muchas industrias. Por ejemplo, en un intento de mejorar los investigadores la esperanza de vida podrían utilizar la minería de datos para analizar causas y correlaciones con las tasas de mortalidad. Minería de datos también es utilizado por los anunciantes y empresas de marketing para orientar a los consumidores. Pero posiblemente el grupo más notorio de la minería de datos son los investigadores del mercado de valores que tratan de predecir el movimiento futuro precio de las acciones. La mayoría, si no todos de la bolsa anomalías se han descubierto (o al menos documentadas) a través de la extracción de datos de los precios pasados ​​y variables relacionadas (oa veces no relacionados). Cuando las estrategias de batido de mercado se descubren a través de la minería de datos, hay una serie de problemas potenciales en dar el salto a partir de una estrategia de back-probado para invertir con éxito en las futuras condiciones del mundo real. El primer problema es determinar la probabilidad de que las relaciones se produjeron al azar o si la anomalía puede ser única a la muestra específica que fue probado. Estadísticos les gusta señalar que si torturar a los datos de tiempo suficiente, se confesará a nada. En lo que se está convirtiendo en un ejemplo infame David Leinweber fue en busca de correlaciones aleatorias al S & P 500. Peter Coy describió los hallazgos del Leinweber en un artículo de Business Week titulado "El que los datos de las minas puede ganar el oro de los tontos" (06/16/97). El artículo discute la minería de datos, el libro de Michael Drosnin El Código de la Biblia. y el hecho de que los patrones se producirán en los datos por pura casualidad, sobre todo si se tiene en cuenta muchos factores. Muchos casos de minería de datos son inmunes a la verificación estadística o refutación. En la descripción de los peligros de la minería de datos, Leinweber "tamiza a través de un CD-ROM de las Naciones Unidas y descubrió que, históricamente, el mejor predictor de la de los pobres Estándar Índice 500 acciones fue la producción de mantequilla en Bangladesh." La lección a aprender de acuerdo a Coy es una "fórmula que sucede para ajustar los datos del pasado no necesariamente tienen ningún valor predictivo". Pruebas de espalda ha sido siempre una clase sospechosa de la información. Cuando uno mira hacia atrás, que sólo va a mostrar lo que es bueno. Las anomalías descubiertas a través de la minería de datos se consideran más importantes como el periodo de tiempo aumenta y si la anomalía se puede confirmar en salir de las pruebas de muestra en diferentes períodos de tiempo y los mercados comparables (por ejemplo, en bolsas extranjeras). Si una anomalía se descubre en pruebas de espalda, también es importante para determinar cómo los costos (costos de transacción, el comprador-vendedor, los costos de impacto para los comerciantes institucionales) que reduciría los retornos. Algunas anomalías simplemente no son realizables. Ver la anomalía línea de valor y el déficit de aplicación para más información sobre este tema. Además, las estrategias que han funcionado en el pasado pueden simplemente dejar de trabajar a medida que más inversores comienzan a invertir de acuerdo con la estrategia. Consulte la hipótesis del mercado eficiente para más información sobre este tema. The Motley Fool ha sido elogiado por muchos por ofrecer asesoramiento educativo para los inversores individuales (por ejemplo, el Motley Fool ofrece recomendaciones sólidas en el asesoramiento a los inversores a comprar y mantener acciones, a desconfiar de los corredores de bolsa y analistas conflictos de intereses, y tener cuidado de las reclamaciones de rendimiento poco realistas). Pero de la estrategia de la Motley Fool "Foolish Four" y su lógica subyacente han generado críticas. En 1997, la Universidad Brigham Young Profesores de Grant McQueen y Steven Thorley coathored un documento en el Financial Analysts Journal (FAJ) que cuestionaban los perros inmensamente populares de la Estrategia de Dow (Resumen). Después de haber reunido los datos para analizar el Dow Perros, los profesores siguieron por hacer un estudio de caso en la minería de datos de del Motley Fool Foolish Four. McQueen y Thorley analizado la Foolish Four como se describe en The Motley Fool Guía de Inversiones (MFIG), pero los tontos en realidad tienen múltiples variaciones de la Foolish Four (Véase también el Foolish Four explicado y Foolish Four Historia). Que la investigación resultó en otro artículo publicado en la edición de marzo / abril de 1999, de los analistas financieros Journal titulado "Minería de Oro del tonto." En el espíritu del estilo de escritura entretenida y creativa del Loco, los profesores han publicado una versión "ligera" del papel (en WordPerfect) en el servidor de la Universidad Brigham Young. Los datos utilizados en el estudio se pueden descargar aquí. McQueen y Thorley incluyen una explicación completa de los peligros potenciales de la minería de datos y se llevan a cabo fuera de las pruebas de muestra en el Foolish Four. La razón Profesores que la minería de datos puede ser detectado por la complejidad de la regla de comercio, la falta de una historia o teoría coherente, la realización de pruebas fuera de la muestra, y el ajuste de los rendimientos de los riesgos, los costos de transacción e impuestos. Además, sostienen que los necios Cuatro y Dow Diez normas comerciales se han convertido en lo suficientemente popular como para impactar precios de las acciones en el cambio de año. The Motley Fool ha publicado una respuesta enérgica al papel FAJ en sus absurdas Cuatro informes de cartera que se puede acceder en sus archivos de 1999. Ver informes de fecha 05/10. 5.11. 5/12. 5/13. 5.14. 5.17. 5.18. 5.19. 5.20. y 5/21. Se incluyen en estas respuestas son varios argumentos en contra de los de papel FAJ y así reconocimientos de cuestiones válidos discutidos en el papel. Si bien muchas de las cuestiones son discutibles, la prueba de fuego real y hallazgo crítico del papel FAJ fue un fuera de la prueba de la muestra para los necios Cuatro retornos de 1949 a 1972. En ese período, el Foolish Four apenas superó el Dow 30 en un promedio de 0,32% por año con mucho más riesgo. No sólo la estrategia de rentabilidad inferior al Perros Dow para el período, pero después de los costos de transacción y la contabilidad de riesgo que claramente habría quedado el Dow Jones para el período. Esta cuestión crítica se discutió brevemente en el informe de fecha 5/14. Para poner este número en perspectiva, considere un inversionista en el inicio de 1973 mirando hacia atrás en el desempeño DJIA durante los 24 años anteriores. Es difícil de racionalizar la forma en que un inversor podría haber sabido en ese momento que el Foolish Four produciría retornos a los del mercado en el futuro. En otro de prueba de muestra, McQueen y Thorley utilizan la base periodo 1973 -1996 se discutió en MFIG, pero utilizan julio para reequilibrar en lugar de enero. En esas condiciones los necios Cuatro retornos golpearon el DJIA sólo 2.95% por año en promedio, sustancialmente inferior a la ventaja de 12,23% sobre el DJIA con reequilibrio enero. En defensa de los locos, varias revelaciones fueron al menos hacen en MFIG y en el sitio web. En el informe de fecha 07/08/98 Foolish Four. revelan que los rendimientos fueron menores cuando reequilibrio ocurrió en meses distintos de enero. Además, en MFIG una cifra de retorno de 25,5% a partir de un período de veinte años se utiliza muchas veces, pero ellos, al menos, mencionar que investigaron los números de nuevo a 1961 y para el período de tiempo más largo, los rendimientos cayeron a 18,35%. Por otro lado, una vez que se describe que se estudió un período de tiempo más largo, continuando citar el más fuerte números de más corto plazo y argumentos que basan en que los datos sin duda puede ser visto como sospechoso. Revelar y centrarse en los resultados a largo plazo tiende a aumentar la credibilidad del argumento de un minero de datos. Jason Zweig expresó su opinión sobre el Foolish Four y comparte sus propios datos minadas "muy estúpido" y carteras "extra mudos" en falsos beneficios procedentes de la revista Money (agosto, 1999). En el sitio Web de Morningstar también puede leer la opinión de John Rekenthaler en Sólo engaño a alrededor, así como Asesor de Inversiones William Bernstein 's opiniones en un artículo titulado Minadas: Todo Minado (véase también la respuesta de James O'Shaughnessy' s y el debate posterior) . En diciembre de 2000, The Motley Fool anunció que ya no defienden la estrategia de valores "Foolish Four", que habían creado. Ver Repensando la Foolish Four por la razón de el Loco ya no de recomendar una estrategia que habían promocionado durante años a través de su sitio web y los libros. Pasando a otro debate de minería de datos, William Brock. Josef Lakonishok. y Blake LeBaron (BLL) publicó un artículo titulado "Normas sobre Operaciones simple técnicos y las propiedades estocásticas de rendimiento de las acciones", en la edición de la Revista de Finanzas diciembre de 1992. El estudio es uno de los pocos trabajos académicos para documentar una estrategia comercial exitosa basada en el análisis técnico (Ver Anomalías Técnico para una discusión completa del artículo). Los profesores demostrado que tanto los promedios móviles y de soporte y resistencia herramientas tenían valor predictivo en relación con el promedio industrial Dow Jones para el período 1897 hasta 1986. Data-Snooping, Trading Técnico Regla Rendimiento y el Bootstrap es un artículo que revisa el documento de BLL y aparecerá en la edición de octubre 1999 de la revista Journal of Finance. En el artículo, Ryan Sullivan, Allan Timmermann, y Halbert White (STW) intento de determinar el efecto de Data-Curioseando en los resultados BLL. También utilizan los datos recogidos en el período que siguió al estudio original (datos BLL corrieron hasta 1986) con el fin de proporcionar una salida de prueba de muestra. Adición de los últimos años previstos un total de 100 años de datos. STW calculó un punto de equilibrio nivel de costos de transacción de 0.27% por ciento por el comercio de la mejor regla de comercio rendimiento para el período completo. Dado que los datos originales BLL cubrieron un muy largo período de casi 90 años, uno podría esperar que las estrategias para un buen desempeño en el de las pruebas de muestra. Pero las conclusiones del estudio pueden llegar a ser utilizado como un ejemplo más potencial de la hipótesis del mercado eficiente. STW encontró "que los resultados de BLL parecen ser robustos a los datos-espionaje. Sin embargo, también encontramos que el rendimiento superior de la mejor regla de comercio no se repite en el experimento fuera de la muestra que abarca el período 1987-1996" y "hay poca evidencia de que las reglas de negociación técnica eran de ningún valor económico durante el período 1987-1996." Esto puede ofrecer otra advertencia para los mineros de datos del mercado de valores y los inversores activos. Incluso si una anomalía trabajó en el pasado durante períodos muy largos de tiempo, e incluso si los resultados no parecen sufrir de los escollos de datos de espionaje, una vez que se descubrió la anomalía puede dejar de trabajar en el futuro. Las personas razonables pueden tener una diferencia razonable de opinión sin que se convierta una cuestión de ética o la fe. Eficiencia Alarmante (RR) de Dow Jones Asset Management (5-6 / 99) es un interesante artículo que trata sobre la minería de datos y el problema del "sobreajuste". Se incluyen comentarios de los veteranos de la industria de inversión David Shaw. Ted Aronson. y Robert Arnott. El artículo sostiene que, dada una cantidad limitada de datos históricos y una infinidad de modelos complejos, los inversores desinformados podrían ser atraídos a "sobreajuste" los datos. Patrones que se supone que ser sistemático en realidad puede ser la muestra específica y por lo tanto no tiene valor. La gente viene a nosotros todo el tiempo con estrategias de negociación que al parecer hacen muy grandes rendimientos superiores. Pero la gran mayoría de las cosas que las personas descubren mediante la adopción de herramientas matemáticas estándar y tamizado a través de una vasta cantidad de datos son artefactos estadísticos. Aronson argumenta que el mercado es "casi totalmente eficiente" y que "se está engañando a sí mismo si crees que vas a anticiparse al otro tipo en más de aproximadamente 51% o 52% del tiempo." Aronson cree que los inversionistas en busca de las ineficiencias del mercado han reducido el potencial de beneficiarse de esas anomalías en el equivalente de los costos de transacción. Si ese es el caso, lo que minimiza los costos de transacción es fundamental en el intento de superar el mercado. Así que ¿hay anomalías que se han confirmado en la de pruebas de muestra? En otro artículo de próxima aparición Journal of Finance, James L. Davis, Eugene F. Fama. y Kenneth R. French argumentan que la respuesta es un sí definitivo. Las empresas con precios más bajos para reservar relaciones de valor promedio del mercado y el patrón se ha documentado en los dos estadounidenses y extranjeros mercados. En Características, Covarianzas y Promedio de Devoluciones: 1929 a 1997 los autores van un paso más allá en la documentación de los retornos de bajo precio de reserva las acciones de valor entre 1929 y 1963. Para el período anterior, la prima de valor fue aún mayor (0,50% por meses) que el más reciente julio 1963 a junio 1997 período (0,43% mensual). Al final, es lo que siempre realmente sabemos a ciencia cierta qué estrategias superará en el futuro? Opiniones sobre esta cuestión definitivamente varían, pero la renuncia norma se aplica como siempre. El desempeño pasado no es garantía del desempeño futuro. Discusiones matemáticas adicionales se incluyen en el cherry picking. Estafa del Mercado de Valores. y las páginas de la moneda-mueve de un tirón. Por favor envíe sus sugerencias y comentarios a Inversionistas Inicio Última actualización 02/12/2001. 2001 Inversionista Principal. Reservados todos los derechos. Renuncia Soy un profesional que ofrece servicios en las áreas de consultoría estadística y financiera. Tengo un doctorado en Estadística y doctor Minor en Finanzas de la Universidad de Stanford. He trabajado en la industria desde hace cuatro años, centrándose en proyectos relacionados con la minería de datos, análisis factorial, análisis de conglomerados, análisis de series temporales, modelado volatilidad estocástica / valoración de activos, arbitraje estadístico / desarrollo de estrategias de negociación por cuenta propia, y así sucesivamente. Igualmente importante, tengo seis años de experiencia en consultoría financiera y estadística. He consultado empresas, profesionales, investigadores y estudiantes en las áreas de Marketing, Medicina, Biología, Psicología, Sociología, Ciencias Políticas, Educación, Ciencias de la Computación y Finanzas. Cuanto a la ubicación, mis clientes se han basado en Nueva York, Boston, Filadelfia, Washington, Los Ángeles, San Francisco, San José, Stanford, Seattle, Chicago, Toronto, Montreal, Londres, Edimburgo, Bergen, Frankfurt, la ciudad de Kuwait, Hong Kong, Adelaide, Melbourne, Sydney y así sucesivamente. Por lo general, me encuentro en Manhattan o consulto a través de Skype, correo electrónico y teléfono si los clientes están muy lejos de Nueva York. Además de eso, hago proyectos completos para mis clientes, que pueden o no requerir una reunión. Ejemplos de servicios: análisis de datos en cualquiera de los principales paquetes estadísticos (R, Matlab, SAS, SPSS, Stata), diseño de experimentos, el desarrollo de sistemas de fijación de precios y de comercio, asistencia disertación, sesiones de consultoría para mejorar el conocimiento general. Por favor, lea la descripción detallada de los tipos de servicio. experiencia. estudios de casos y las formas de pago. A menos que la urgencia está involucrado, la tasa es de $ 60 por hora para los proyectos estándar (regresión, ANOVA, diseño de encuestas, pruebas no paramétricas) y más para material de alta tecnología (minería de datos, análisis de conglomerados, los datos de panel, serie temporal multivariante, modelos ocultos de Markov , Markov Chain Monte Carlo, modelado bayesiano, GWAS, funcionalidad SAS, las estrategias de arbitraje / comerciales estadísticos, valoración de activos exóticos, la gestión del riesgo de mercado). Me envíe un correo electrónico para obtener información más detallada de precios o cualquier otra aclaración. consultingstanfordphd


No comments:

Post a Comment