본문 바로가기

금융공학

(6)
[데이터 전처리] Feature Engineering 출처 : AIT-2 " 투자데이터의 Features를 활용해 Alpha를 도출하자 " Feature Engineering 의 기본 개념 https://developers.google.com/machine-learning/crash-course/representation/feature-engineering 표현: 특성 추출 | 머신러닝 단기집중과정 | Google Developers 예상 시간: 9분 기존의 프로그래밍에서는 코드에 중점을 두었습니다. 머신러닝 프로젝트에서는 표현에 중점을 둡니다. 즉, 개발자는 특성을 추가하고 개선하여 모델을 다듬어 나갑니다. 원시 데 developers.google.com 구글 개발자 사이트에서 특성추출에 대한 대략적인 단계와 개념을 확인할 수 있다. 한 마디로, 머신러닝..
[ Coursera ] 자산 배분의 강력한 tool, Black-Litterman Model Black-Litterman Model From Coursera "Advanced Portfoilo Construction Analysis" https://www.coursera.org/learn/advanced-portfolio-construction-python/lecture/Vgyoc/black-litterman-analysis Black-Litterman Analysis - Robust estimates for expected returns | Coursera www.coursera.org 배경) 일반적인 Expected Return의 한계 기존 평균-분산 모형 (Mean-Variance Portfolio)은 최적의 자산 배분을 찾기 위해 경제학적, 그리고 투자론적으로도 아주 기초가 되는 자산 모..
[ Coursera ] Style and Factors 파이썬 코드 구현 1. Factor Analysis using the CAPM and Fama-French Factor models Berkshire Hathaway 사의 수익률 데이터를 이용해 팩터 분석을 진행한다. 진행방법 1. 일별 수익률 데이터를 월별 수익률 데이터로 바꾼다. (.resample 함수 활용) 2. Fama-French (fff) 모델의 월별 수익률 데이터 세트를 가져온다. 3. CAPM 모델을 설명모델로 사용하여 1990 ~ 2012년 5월을 시장에 기인하는 부분과 시장에 기인하지 않는 부분으로 분해(using stats.api for the linear regression ) CAPM : 𝑅𝑏𝑟𝑘𝑎,𝑡−𝑅𝑓,𝑡=𝛼+𝛽(𝑅𝑚𝑘𝑡,𝑡−𝑅𝑓,𝑡)+𝜖𝑡 (결과) 4. CAPM 벤치마크 해석 - CAPM ..
[Coursera] Robust estimates for the covariance matrix, 공분산 행렬 추정 Robust estimates for the covariance matrix, 공분산 행렬 추정 출처) Coursera Online Session : Advanced Portfolio Construction and Analysis with Python The curse of Dimension : 차원성의 저주(?) "추정해야 할 모수의 수는 성분 수를 증가시킬 수록 급격히 증가하는 경향이 있다." 만약 구성 성분이 N개일 때 N개의 기대 수익률을 추정해야한다. correlation parameter를 구하기 위해서는 n(n-1)/2 개의 파라미터를 구해야 한다. 또한 포트폴리오의 각 구성요소에 대해 각각 N개의 volatility(변동성) 을 추정해야 한다. 문제는 상관관계 파라미터를 도출하는 데에 있다..
[Coursera] Factor investing 의 기초, Factor란 무엇인가? 출처 : Coursera Online Courses 팩터 투자와 스마트 베타 기존의 투자방식은 active, passive 전략 중 선택하는 문제였다.. Passive 전략은 S&P500 이나 KOSPI200과 같은 안전 자산에 투자하는 방법이다. 그 외에도 지수보다 좋은 성과를 내기보다는 지수만큼만 전략을 내는 방법을 패시브 전략으로 생각하면 될 것이다. 반면, Active 전략은 지수보다 더 나은 실적을 만드는 데 집중한다. 액티브 전략은 비용이 많이 들고 일관성이 떨어지지만, 확실히 뛰어난 수익률을 기록해왔다. 액티브와 패시브 전략을 뛰어넘는 '세 번째 투자전략'은 'indexation 물가연동/인덱세이션'라고 불리는 데 액티브 투자로서 벌어들인 수익 중 일부를 지수(S&P 500)에 비례해 수익을..
주가 데이터에서 아웃라이어와 필터링 Source of Outliers : 이상치데이터 주의 : 금융공학교육과정 내용을 정리했기 때문에 현저히 금융데이터에 초점이 맞춰짐. 이상치데이터 처리 필요성과 발생이유 왜 고쳐야 할까? 이상치 데이터를 처리하지 않으면, 실제 결과와 완전 왜곡된 결과가 나올 수 있다. 왜 생길까? 사람의 실수 OR 컴퓨터 버그, 의도적으로 답변하지 않는 경우, 정말로 특이한 경우의 발생 등.. 때문에 생긴다. 사람 실수로 인해서도 이상치 데이터가 발생한다. 소위 finger error라고 불리는 사람이 만드는 에러는... 배후에는 엄청난 사건이 있었을 것이다. 증권사만 해도 이런 경우 몇 십억원, 몇 조원의 손해는 물론이고, finger error로 인해서 헷지펀드 하나 금방 망하고 은행이 망하는 경우도 있다고 한다. ..