Tomando como ejemplo la estructura de doble techo de Bitcoin en 2021: hablemos de qué es la "filtración de datos futuros".

Cuando hacemos backtest a un conjunto de estrategias y examinamos un conjunto de indicadores, ¿estamos realmente en el momento? Este artículo parte de las dos trampas de la "fuga futura de datos" y el "sobreajuste", y analiza la prueba fatal del análisis on-chain de doble techo en 2021. (Sinopsis: Continuación del mercado de la vida: análisis del doble techo más extraño de 2021 con datos on-chain) (Suplemento de antecedentes: Academia de datos on-chain (1): ¿Sabes cuál es el coste medio de BTC en todo el mercado? Puntos clave: Habla sobre el concepto de "sesgo de anticipación" Habla sobre los éxitos en el trading: Sobreajuste Doble techo en 2021: la mayor prueba para tallar la espada Revisión del rendimiento de tres indicadores y un modelo Sesgo de anticipación Imagina un escenario: "Digamos que desarrollo una estrategia de trading y la someto a pruebas rigurosas durante los últimos 50 años 1975 ~ 2024, y obtuvo un muy buen rendimiento en la prueba retrospectiva. Por eso decidí lanzar esta estrategia en 2025". Estimados lectores, para la descripción anterior, ¿alguien ve lo que está mal? Si realmente solo haces backtesting de 1975 ~ 2024, es realmente fácil caer en la trampa de la "futura fuga de datos". Debido a que simplemente usamos todos los datos "hasta ahora" para hacer pruebas retrospectivas, esto conducirá a los parámetros de estrategia que entrenamos, ¡que probablemente sean "impacientes"! Un enfoque más riguroso es, por ejemplo: se puede hacer una prueba retrospectiva del rendimiento de todo el año 2024 para "1975 ~ 2023" (suponiendo que estamos en 2024) y utilizar la estrategia de formación; Por supuesto, también puede usar los datos del período 1975 ~ 2022 para entrenar la estrategia y luego usar la estrategia entrenada para realizar una prueba retrospectiva del rendimiento de 2023 y 2024. Más precisamente, podemos evitar la "fuga de datos en el futuro" tanto como sea posible a través de "rolling backtesting" o "stepping backtesting". La ventaja de esto es "garantizar que la estrategia posterior al entrenamiento pueda resistir la prueba del futuro". Sobreajuste: el veneno más mortal Cualquiera que tenga un poco de concepto básico de desarrollo de estrategias cuantitativas sabrá lo graves que pueden ser los problemas de sobreajuste. El llamado sobreajuste, en términos sencillos, es "tallar el barco para la espada", lo que hará que los datos de la prueba retrospectiva se vean bien (bajo error de entrenamiento), pero difíciles de aplicar al combate real (alto error de prueba). Aquí pretendo introducir un concepto matemático para explicarlo: (a los lectores que les duele la cabeza cuando ven matemáticas, pueden saltar directamente al siguiente párrafo para ver la conclusión) Supongamos que hay una secuencia de números: "1 , 2 , 4 , 8 , 16 , ?" Los lectores que son un poco sensibles a los números deben pensar que el siguiente número es 32, porque los primeros cinco elementos de datos están obviamente relacionados con la "potencia de 2". Pero, de hecho, no podemos predecir cuál será el próximo número. Porque desde un punto de vista matemático, podemos usar la interpolación de Lagrange para construir otro polinomio de orden superior, de modo que el sexto dato no sea 32, sino que también satisfaga la ley. Esto significa: "Las predicciones que se extrapolan únicamente en puntos de datos finitos no son confiables". 2021 Second Top: la prueba más grande para la mayoría de los indicadores Después de hablar de conceptos teóricos aburridos, hablemos del combate real. A continuación, sacaré tres indicadores de datos on-chain y un modelo que desarrollé personalmente para explicar a todos los lectores: 1. MVRV Creo que los lectores que han estudiado un poco el análisis de datos on-chain deben haber oído hablar de MVRV, y mi artículo anterior también ha hecho una enseñanza detallada sobre este indicador ( Escuela de datos on-chain (1): ¿Sabes cuál es el coste medio de BTC en todo el mercado? )。 Como se muestra arriba, este es un gráfico de los datos históricos de MVRV. Los números 1, 2, 3 y 4 marcados en el gráfico corresponden a la parte superior de 13, 17 y 2021, respectivamente. Podemos ver claramente que los máximos del MVRV en la parte superior de cada ronda están "disminuyendo". He escuchado a muchas personas usar los siguientes métodos para lidiar con el fenómeno de los máximos decrecientes: "Sé que está disminuyendo, así que al juzgar el máximo, tomaré un umbral más conservador y más bajo como señal de advertencia". Ahora surge la pregunta: ¿cómo establecer un umbral más conservador? Si nos remontamos a abril de 2021 y vemos solo 13 o 17 años de datos históricos, ¿se puede activar el umbral establecido de forma conservadora el 21 de abril? ¿Se puede activar el umbral establecido de esta manera en el segundo máximo en 2021? Si no crees que abril de 2021 sea el máximo, entonces es aún menos probable que el segundo máximo de 2021 escape de la cima, ¿verdad? Lo que quiero decir es lo siguiente: debido a que el tamaño de la muestra de los datos históricos de BTC es demasiado pequeño, y si simplemente se consideran los ciclos anteriores, es probable que caiga en la trampa de la "fuga de datos futura". Una persona en abril de 2021 (el primer tope) no sabrá que el valor del MVRV en ese momento es en realidad el punto más alto de ese ciclo, porque solo puede ver los datos de 13 o 17 años; Del mismo modo, cuando apareció el segundo techo en 2021, el valor MVRV estaba en una posición muy baja, y si el primer techo no se escapaba, era naturalmente imposible escapar del techo según los datos del segundo máximo, por lo que se perdería la mejor oportunidad de escapar del techo en 2021. 2. Indicador AVIV AVIV puede considerarse como un MVRV corregido y mejor considerado, y tiene una característica de "reversión a la media" más obvia que MVRV. Pero aun así, el fenómeno de los "picos decrecientes (máximos)" sigue siendo evidente: los 1, 2, 3 y 4 marcados en la figura corresponden a los máximos de 13, 17 y 2021, respectivamente. Para la misma pregunta, copiaré directamente el texto anterior para que los lectores lo consideren: ¿Cómo establecer un umbral más conservador? Si nos remontamos a abril de 2021 y vemos solo 13 o 17 años de datos históricos, ¿se puede activar el umbral establecido de forma conservadora el 21 de abril? ¿Se puede activar el umbral establecido de esta manera en el segundo máximo en 2021? Si no crees que abril de 2021 sea el máximo, entonces es aún menos probable que el segundo máximo de 2021 escape de la cima, ¿verdad? RUP (Beneficio relativo no realizado) También presenté los datos on-chain de RUP en detalle antes, Los lectores interesados pueden consultar los siguientes dos artículos: Academia de datos on-chain (9): Barómetro de mercado RUPL(I) - Introducción > datos Aplicación de lectura inferior Academia de datos on-chain (10): Barómetro de mercado RUPL(II) - Señal superior más fuerte y análisis detallado de la parte superior del ciclo histórico Un lector preguntó una vez: "Puede entender la lógica de la divergencia RUP, Pero, ¿deberíamos considerar también los máximos históricos que ha alcanzado RUP? Como se muestra en la figura anterior, este es el gráfico histórico del RUP, y los 1, 2, 3 y 4 marcados en la figura corresponden a la parte superior de 13, 17 y 2021, respectivamente. Se puede ver que incluso si el RUP se ha estandarizado para la capitalización de mercado, todavía existe un fenómeno de picos decrecientes. Una tortura más del alma: ¿Cómo establecer un umbral más conservador? Si nos remontamos a abril de 2021, podemos ver que los datos históricos son de solo 13 o 17 años, y el umbral establecido de forma conservadora se puede establecer en 21 ...

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Comercie con criptomonedas en cualquier lugar y en cualquier momento
qrCode
Escanee para descargar la aplicación Gate.io
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)