-
Facebook Prophet을 이용해서 확진자 수를 예측해보고, Kalman Filter의 예상값과 비교해보겠습니다.
-
Kalman Filter 모델에는 세계 지역 별 확진자 수 시계열 데이터를 입력했습니다. 반면 Facebook Prophet은 국내 확진자 수 시계열 데이터만 입력했습니다.
-
Facebook Prophet이 예상한 국내 코로나19 확진자 수가 Kalman Filter 모델의 예상값보다 더 많습니다.
Kalman Filter로 예상한 향후 7일 코로나 19 확진자 추이 (3/1 데이터셋 기반)
날짜 |
국내 코로나19 예상 확진자 수 |
2020-03-02 | 4145 |
2020-03-03 | 4978 |
2020-03-04 | 5415 |
2020-03-05 | 6144 |
2020-03-06 | 6675 |
2020-03-07 | 7209 |
2020-03-08 | 7925 |
Facebook Prophet로 예상한 향후 7일 코로나 19 확진자 추이 (3/1 데이터셋 기반)
날짜 | 국내 코로나19 예상 확진자 수 |
2020-03-02 | 4419 |
2020-03-03 | 5087 |
2020-03-04 | 5755 |
2020-03-05 | 6423 |
2020-03-06 | 7091 |
2020-03-07 | 7759 |
2020-03-08 | 8427 |
Kalman Filter은 루돌프 칼만이 창시한 예측모델입니다. 1960년 아폴로 프로젝트 우주선 조작을 할 때 예측 모델로 만들어졌습니다. 이후에 컴퓨터 비전, 로봇 공학, 시계열 분석 등 다양한 분야에 적용되었습니다.
이전 포스트에서는 1) 날씨, 2) 세계 지역 별 인구, 3) 세계 지역 별 코로나19 확진자 수 데이터를 Kalman Filter에다가 대입해서 한국의 확진자수를 예측했습니다.
하지만 한계점이 발견됐습니다. 데이터셋 출처인 JHU(존스홉킨스대학)는 각 국가의 확진자 데이터를 실시간으로 업로드합니다. 이탈리아, 이란, 한국 데이터가 업로드 되는 시간대에 모델을 돌리면 Kalman Filter은 예상 확진자 수를 높입니다. 반면 중국, 일본 확진자 데이터가 업로드 되는 시간대에는 예상 확진자 수를 낮췄습니다.
"우리나라는 코로나19 검사 물량은 세계 1위이기 때문에, 확진자가 많이 보고된다. 또한 타 국가의 통계 자료는 데이터 수집 방식에서 신뢰도가 낮다. 오히려 다른 나라의 데이터가 예측을 부정확하게 만드는 것인가?"라는 의문이 들었습니다.
따라서 이태희 님이 작성해놓으신 Facebook Prophet 예측 모델을 이용해서 국내 확진자 추이만으로 확진자 수를 예측했습니다. Prophet은 Facebook 회사가 개발한 예측 모듈이며, 오픈소스 프로젝트입니다. Prophet은 미리 기입된 주기적인 이벤트(1년, 1개월, 1주, 매일) 데이터를 기반으로 예측을 합니다. 여기에다가 연휴 효과까지 감안을 합니다.
다만 Prophet을 썼을 때 선형 회귀 모델로 예측을 하면, 확진자들의 지수적인 증가를 감안하지 못합니다. 밑에 첨부한 도표의 파란색 선이 검은색 점의 기울기를 따라가지 못하는 것에서 이를 확인할 수 있습니다.
따라서 Facebook Prophet 모델에다가 change point를 반영해서 새로 모델링을 했습니다. 기존의 선형 회귀 모델보다 더 유연한 예측이 가능합니다.
#1 FB Prophet 예측 모델을 Google Colab에서 직접 실행해보세요
Google Colaboratory
colab.research.google.com
GitHub Repository: fbprophet 모델 조정 관련 컨트리뷰팅은 언제나 환영입니다!
kairess/corona-virus-prediction
Corona Virus 19 confirmed timeseries prediction using fbprophet - kairess/corona-virus-prediction
github.com
#2 Kalman Filter 예측 모델을 Google Colab에서 직접 실행해보세요
colab.research.google.com
GitHub Repository: Kalman Filter 관련 컨트리뷰팅은 언제나 환영입니다!
Rank23/COVID19
Using Kalman Filter to Predict Corona Virus Spread - Rank23/COVID19
github.com
'Project Based Learning > 코로나19 국내 확진자 수 예측' 카테고리의 다른 글
Kalman Filter을 이용한 대한민국의 코로나19 확진자 추이 예측 (3월 1일 작성) (0) | 2020.03.02 |
---|