모델 백테스트
4,000개 이상 주식에 대한 표본 외 예측으로 실제 예측 능력을 입증합니다
전략 성과
상위 20개 종목 선정 전략에서 시뮬레이션된 수익률, 기간마다 리밸런싱
누적 수익률 (자금 곡선)
전략별 기간 수익률
롱 vs 숏 포트폴리오 수익률
전략 드로다운
성과 통계
| 지표 | 가치 | 설명 |
|---|---|---|
| 총 예측 수 | 로드 중... | 테스트 기간 내 개별 주식 예측 수 |
| 고유 티커 | 로드 중... | 예측이 있는 서로 다른 종목 수 |
| Spearman IC (정보 계수) | 로드 중... | 예측 수익률과 실제 수익률 간 순위 상관관계 (정보 계수) |
| 평균 절대 오차 | 로드 중... | 평균 예측 오차 크기 |
| 방향 정확도 | 로드 중... | 올바른 방향(상승/하락)을 예측한 비율 |
| 상위 20 롱-숏 수익률 | 로드 중... | 상위 20 롱 및 하위 20 숏 예측의 기간별 누적 수익률 |
| 상위 20 롱-온리 수익률 | 로드 중... | 상위 20 숏 예측의 기간별 누적 수익률 |
| 테스트 기간 시작 | 로드 중... | 테스트 세트의 첫 예측 날짜 |
| 테스트 기간 종료 | 로드 중... | 테스트 세트의 마지막 예측 날짜 |
방법론
표본 외 테스트
이 백테스트는 모델이 학습 중 본 적 없는 데이터에 대한 예측을 표시합니다. 모델은 2022년 9월 이전 데이터로 학습되었으며, 이 예측은 2024년 1월 이후부터로—학습 데이터와 테스트 데이터 간 완전한 분리를 보장합니다.
개발 과정에서 데이터 누출을 방지하기 위해 적절한 엠바고 기간을 두고 과거 데이터를 학습, 검증, 테스트 세트로 분할했습니다. 검증 세트는 테스트 세트를 건드리지 않고 하이퍼파라미터를 조정하고 최적의 모델 구성을 선택하는 데 사용됩니다. 검증을 통해 최적의 파라미터가 결정되면 최종 프로덕션 모델은 사용 가능한 전체 데이터 기록으로 학습됩니다. 이를 통해 항상 최신 모델로 최고의 성능을 보장합니다.
예측 기간
1개월 예상 수익률과 3개월 예상 수익률 간 전환합니다. 1개월 예측은 향후 30일간의 주식 수익률을, 3개월 예측은 90일간의 수익률을 예측합니다. 둘 다 시장을 이기는 기회를 식별하는 모델의 능력을 보여줍니다.
차트 읽는 방법
각 점은 단일 예측을 나타냅니다. X축은 모델이 예측한 값을, Y축은 실제 결과를 보여줍니다. 녹색 회귀선은 예측과 결과 사이의 실제 관계를 보여주며, 양의 기울기는 예측력을 나타냅니다.
핵심 통계
Spearman IC(정보 계수)는 예측 수익률의 순위가 실제 수익률의 순위와 얼마나 일치하는지 측정합니다. 방향 정확도는 모델이 주식의 상승 또는 하락을 올바르게 예측하는 빈도를 보여줍니다. 값이 높을수록 더 나은 예측 성능을 나타냅니다.
이 전략 복제하기
위에 표시된 전략 성과는 저희 플랫폼을 사용하여 복제할 수 있습니다. 다음은 작동 방식입니다:
- 예측 기간 선택: 투자 기간에 따라 1개월 또는 3개월 예측을 선택하세요.
- 롱 포트폴리오 구성: 예상 수익률이 가장 높은 상위 20개 종목을 선택하세요. 이것들이 '매수' 포지션이며, 각각 포트폴리오의 5%를 차지합니다.
- 숏 포트폴리오 구성 (선택사항): 예상 수익률이 가장 낮은 하위 20개 종목을 선택하세요. 이것들이 롱-숏 전략의 '공매도' 포지션입니다.
- 정기적 리밸런싱: 1개월 예측의 경우 매월, 3개월 예측의 경우 분기별로 리밸런싱하세요. 이를 통해 포트폴리오가 항상 가장 유망한 종목을 보유하도록 합니다.
빠른 링크:
상위 예측 보기 (롱) — 최고의 매수 기회 찾기
하위 예측 보기 (숏) — 잠재적 공매도 후보 찾기
포트폴리오 최적화 도구 — 선택한 종목으로 분산화되고 위험 최적화된 포트폴리오 구성
양적 금융 이해하기: 입문서
머신러닝과 금융의 교차점은 현대 양적 연구에서 가장 지적으로 도전적인 영역 중 하나입니다. 아래에서 알고리즘 트레이딩 시스템의 이론적 기초에 대한 간략한 개요를 제공합니다.
금융 머신러닝
예측 문제
기존 ML 응용 프로그램과 달리, 금융 시장은 예측을 유난히 어렵게 만드는 몇 가지 고유한 특성을 보입니다:
- 낮은 신호 대 잡음 비율: 자산 수익률은 주로 노이즈를 포함하며, 예측 신호는 종종 분산의 5% 미만만 설명합니다. Spearman IC 5-10%는 실무에서 우수한 수준으로 간주됩니다.
- 비정상성: 시장 역학은 시간이 지남에 따라 변화합니다. 한 국면에서 유지된 관계가 다른 국면에서는 반전될 수 있어 적응형 모델과 신중한 검증이 필요합니다.
- 적대적 성격: 시장은 경쟁적입니다—수익성 있는 신호는 차익 기회가 사라질 때까지 자본을 끌어들입니다. 이러한 '알파 감소'는 모델이 지속적인 연구와 개선을 필요로 한다는 것을 의미합니다.
금융에서의 교차 검증
표준 k-폴드 교차 검증은 시간적 종속성으로 인해 시계열 데이터에는 적합하지 않습니다. 저희는 다음을 사용합니다:
- 정제된 교차 검증: 중복되는 예측 기간으로 인한 정보 누출을 방지하기 위해 학습-테스트 경계 근처의 샘플을 제거합니다.
- 엠바고 기간: 학습과 테스트 기간 사이에 일반적으로 예측 기간 길이와 동일한 버퍼 구간을 추가합니다.
- 조합적 정제 교차 검증: 시간적 무결성을 유지하면서 여러 학습/테스트 조합을 테스트하여 견고한 표본 외 추정치를 제공합니다.
피처 엔지니어링
원시 가격 데이터는 정상성을 만족하는 예측 피처로 변환해야 합니다. 일반적인 변환에는 수익률(산술적 및 로그), z-점수, 백분위수 순위, 기술적 지표가 포함됩니다. 피처 스케일링과 정규화 선택은 모델 성능에 큰 영향을 미칩니다.
금융 위험 관리
기본적 위험 측정치
전문적인 포트폴리오 관리는 철저한 위험 정량화가 필요합니다:
- 변동성 (σ): 수익률의 표준편차로, 일반적으로 일별 데이터는 √252를 곱하여 연간화합니다. 총 위험을 측정하지만 상승과 하락을 구분하지 않습니다.
- 최대 드로다운: 포트폴리오 가치의 최고점에서 최저점까지의 최대 하락폭입니다. 최악의 시나리오와 투자자 심리를 이해하는 데 필수적입니다—50% 드로다운은 회복에 100% 상승이 필요합니다.
- 위험가치 (VaR): 특정 신뢰 수준(예: 95% VaR)에서 주어진 시간 기간 동안 예상되는 최대 손실입니다. 널리 사용되지만 꼬리 위험을 포착하지 못한다는 비판을 받습니다.
- 조건부 VaR (기대 손실액): VaR를 초과하는 손실이 발생했을 때의 예상 손실입니다. 꼬리 이벤트의 심각성을 정량화하여 VaR의 한계를 해결합니다.
샤프 비율
(Rp - Rf) / σp로 정의되는 샤프 비율은 위험 조정 수익률을 측정합니다—변동성 단위당 초과 수익률입니다. 샤프 비율 1.0 이상은 일반적으로 좋은 것으로 간주되고, 2.0 이상은 우수합니다. 다만 주의하세요: 샤프 비율은 비유동성, 레버리지 또는 짧은 샘플 기간에 의해 인위적으로 부풀려질 수 있습니다.
체계적 위험 vs. 비체계적 위험
총 위험은 시장 위험(β × 시장 움직임)과 회사 특유 위험으로 분해됩니다. 자본자산가격결정모형(CAPM)에 따르면 비체계적 위험은 분산화할 수 있으므로 체계적 위험만 보상됩니다. 현대 팩터 모델은 이를 여러 위험 팩터(규모, 가치, 모멘텀, 품질)로 확장합니다.
포트폴리오 구성
현대 포트폴리오 이론
해리 마코위츠의 기념비적인 연구(1952)는 포트폴리오 위험이 단순히 개별 자산 위험의 가중 평균이 아니라—상관관계가 중요함을 확립했습니다. 불완전한 상관관계(ρ < 1)를 가진 두 자산은 두 자산 단독보다 낮은 위험의 포트폴리오를 생성합니다.
효율적 투자선
주어진 수익률 목표에 대해 최소 분산을 가진 포트폴리오가 존재합니다. 이러한 모든 포트폴리오의 집합이 효율적 투자선을 형성하며—합리적인 투자자는 이 투자선 위의 포트폴리오만 보유해야 합니다. 투자선 아래 지점은 차선적(동일 위험, 더 낮은 수익)이고, 위 지점은 달성 불가능합니다.
최적화 과제
평균-분산 최적화는 입력 추정치에 매우 민감한 것으로 알려져 있습니다:
- 추정 오차: 기대 수익률을 정확하게 추정하기 어렵습니다. 입력값의 작은 오차가 극적으로 다른 최적 포트폴리오를 초래할 수 있습니다.
- 집중 위험: 제약 없는 최적화는 종종 극단적인 포지션을 산출합니다. 실제 구현에서는 포지션 한도와 섹터 제약을 부과합니다.
- 정규화: 수축 추정량, 블랙-리터만, 강건한 최적화와 같은 기법이 포트폴리오 가중치를 안정화하는 데 도움이 됩니다.
동일 가중치 vs. 최적화
1/N(동일 가중치) 포트폴리오는 추정 오차로 인해 표본 외에서 최적화된 포트폴리오를 능가하는 경우가 많습니다. 우리 백테스트는 강건한 기준선으로 동일한 5% 가중치를 사용합니다. 향상된 포트폴리오의 경우, 우리 최적화기는 실제 성능을 개선하기 위해 제약과 정규화를 적용합니다.
롱-숏 주식 전략
시장 중립
달러 중립 롱-숏 포트폴리오(동일한 롱 및 숏 익스포저)는 순 시장 익스포저가 0입니다. 이는 시장 위험을 헤지하면서 종목 선택에서 '알파'를 분리합니다. 이 전략은 시장 방향에 관계없이 롱 포지션이 숏 포지션을 능가할 때 수익을 냅니다.
수익 원천
롱-숏 수익은 다음으로 분해됩니다:
- 롱 알파: 시장 대비 롱 포지션의 초과 성과.
- 숏 알파: 시장 대비 숏 포지션의 저조한 성과(숏이 하락할 때 수익).
- 숏 리베이트: 공매도 수익에서 발생하는 이자(실제로는 차입 비용으로 감소).
실용적 고려사항
실제 구현에는 거래 비용(수수료, 매수-매도 스프레드), 시장 충격(불리한 가격 이동), 공매도 제약(로케이트 요건, 차입 비용) 및 용량 한도가 포함됩니다. 이러한 마찰이 이론적 백테스트에서 실현된 수익을 감소시킵니다.
리밸런싱 빈도
더 자주 리밸런싱하면 알파를 더 빨리 포착하지만 더 높은 거래 비용이 발생합니다. 최적의 빈도는 신호 감쇠와 거래 비용 사이의 균형을 맞춥니다. 수익률 예측의 경우, 월별 또는 분기별 리밸런싱이 일반적으로 유리한 트레이드오프를 제공합니다.
팩터 투자
팩터란 무엇인가?
팩터는 특정 주식이 시간이 지남에 따라 다른 주식보다 우수한 성과를 보이는 이유를 설명하는 체계적인 수익원입니다. 개별 회사 분석에 기반한 종목 선정과 달리, 팩터 투자는 증권 그룹이 공유하는 광범위하고 지속적인 특성을 목표로 합니다. 학술 연구는 수많은 팩터를 식별했지만, 시장과 기간에 걸쳐 강건하다고 입증된 것은 소수에 불과합니다.
클래식 팩터
- 시장 (β): 전체 주식 시장에 대한 노출. CAPM의 원래 팩터로—베타가 높은 주식은 시장과 함께 더 많이 움직이고 역사적으로 더 높은 수익(더 높은 위험과 함께)을 얻습니다.
- 규모 (SMB): 소형주는 대형주를 능가하는 경향이 있습니다. 파마와 프렌치(1993)가 이 '소형 마이너스 대형' 프리미엄을 문서화했지만, 최근 수십 년간 약화되었습니다.
- 가치 (HML): 주가순자산비율이 낮은 주식은 시간이 지남에 따라 성장주를 능가합니다. 이 '고 마이너스 저' 팩터는 싼 자산을 사고 비싼 자산을 파는 것을 반영합니다.
- 모멘텀 (UMD): 지난 3-12개월 동안 좋은 성과를 보인 주식은 계속해서 우수한 성과를 보이는 경향이 있습니다. 제가데시와 티트만(1993)이 이 '상승 마이너스 하락' 효과를 시장 전반에서 문서화했습니다.
- 품질 (QMJ): 높은 수익성, 안정적인 수익, 낮은 레버리지를 가진 회사가 우수한 성과를 보입니다. Asness 등(2019)이 이 '품질 마이너스 정크' 팩터를 공식화했습니다.
- 저변동성: 역설적이게도 저위험 주식은 기본 CAPM 예측과 모순되게 고위험 주식보다 더 높은 위험 조정 수익을 제공하는 경우가 많습니다.
팩터 모델
다요인 모델은 수익을 체계적 구성 요소로 분해합니다:
- 파마-프렌치 3-팩터: 시장 + 규모 + 가치. 분산 포트폴리오 수익의 ~90%를 설명합니다.
- 카하트 4-팩터: 파마-프렌치 모델에 모멘텀을 추가합니다.
- 파마-프렌치 5-팩터: 수익성과 투자 팩터를 추가하지만, 모멘텀은 여전히 중요합니다.
팩터 타이밍 vs. 팩터 익스포저
정적 팩터 익스포저(항상 가치, 모멘텀 등으로 기울임)는 역사적으로 인내심 있는 투자자에게 보상을 제공했습니다. 팩터 타이밍—팩터 가중치를 동적으로 조정—은 훨씬 더 어렵습니다. 팩터는 회귀하기 전 몇 년 동안 저조한 성과를 보일 수 있고, 타이밍 신호는 악명 높게 신뢰할 수 없습니다. 대부분의 실무자는 전술적 할당보다 다각화된 일관된 팩터 익스포저를 권장합니다.
머신러닝과 팩터
우리 예측 모델은 피처를 통해 팩터 익스포저를 암묵적으로 포착합니다. 기본 데이터, 가격 모멘텀 및 시장 상황에서 패턴을 학습함으로써 모델은 우수한 성과를 보일 가능성이 있는 주식을 식별하며—데이터 기반 방식으로 여러 팩터를 효과적으로 결합합니다. 이 접근 방식은 전통적인 선형 모델이 놓치는 비선형 팩터 상호작용을 발견할 수 있습니다.
중요 면책조항
과거 성과는 미래 결과를 보장하지 않습니다. 여기에 표시된 백테스트 결과는 과거 데이터를 기반으로 하며 미래 성과를 나타내지 않을 수 있습니다. 주식 시장 투자에는 원금 손실 가능성을 포함한 위험이 수반됩니다. 표시된 예측은 정보 제공 목적으로만 제공되며 재정적 조언으로 간주되어서는 안 됩니다. 투자 결정을 내리기 전에 항상 자격을 갖춘 재정 상담사와 상담하세요.