catbook 코린이의 그림일기 코린이(Coding+어린이)의 고통받는 이야기

DSFT01, Section01, About Covid-19

» Study

Abstract

Covid-19 발생 이후 사회는 많은 변화가 생겼습니다. 그래서 Covid-19 시리즈를 진행하게 되었습니다.

그래프들로 인해 페이지 로딩이 길어질 수 있습니다. 최선을 다해 빨리 자라서 최적화를 할 수 있도록 하겠습니다.

  • 이번 첫 번째 시리즈에서는 궁금하지만 알 수 없었던 부분에 대해 Covid-19 데이터 분석의 시각화를 하여, 각각 나라별로 Covid-19 감염 확진자에 대한 변화를 비교합니다.
  • 다음 시리즈부터는 원인, 영향을 줄만한 대상과 상관관계를 측정합니다.

95525436-151de500-0a0f-11eb-9866-89e9a0701ae9


Solo Project 1. about Covid-19 [~20.10.11]

  • Covid-19 가 시작되고 어느덧 몇 개월, 낯설었던 마스크 쓰기와 사회적 거리두기는 점차 사회에 녹아들어 하나의 생존 방법이 되었습니다.
  • 각종 국내외 매체에서 한국의 대처에 대해 칭찬이 쏟아지자 하나의 궁금증이 생겼습니다.

    ”우리나라와 전 세계를 비교했을 때 어떤 차이가 있을까?”

해외 매체에 취한 필자는 주모를 부르며 시작합니다. e_5006689773_468461774701430d5ec3b47c1be79a5aaca1e551

Dataset

  • 현재 데이터 셋 자료에 있는 정보는 ‘국가, 확진/사망/퇴원 시기’입니다.

1) select dataset

  • 서울시에서 공개한 코로나19 발생동향 분석
    http://www.seoul.go.kr/coronaV/coronaStatus.do (COVID-19)

2) select dataset

  • WHO 에서 발표한 COVID19 자료
    https://github.com/laxmimerit/Covid-19-Preprocessed-Dataset/
  • CORD-19 research challenge
    https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge/tasks

EDA 및 사전 점검 진행

  • 한국 데이터 정리 day count day count == day count max()

  • 전세계 데이터 정리 load the dataset

이해를 위한 시각화

[The latest Covid-19 in Korea, South]

한국의 월별 확진자수에 대한 빈도수

알 수 없음

한국의 확진 일자별 선그래프

M t WarinMnaty


세계적으로 발생한 Covid-19

전세계를 기준으로 시각화를 했을 경우

시간 흐름에 따라 새로운 확진자가 국가 별로 발생되는데 걸린 과정

  • [New Cases and No.of Countries]
  • 점차 모든 국가로 퍼저나가는 그래프를 볼 수 있다.

시간 흐름으로 보는 전세계의 Covid-19 현황

  • [선그래프]
  • [선과 Treemap 그래프]
  • [Treemap 그래프]
  • [지도 그래프]
  • [Scatter Plot for Deaths vs Confirmed Cases]

Covid-19의 사망률은?

  • 자세히 보면 ‘확진 = 사망’ 이 아니라는 것을 알 수 있습니다.
  • 서로 다른 곡선의 모양인 ‘확진과 사망 그래프’
  • [시간 흐름에 따라 나라별 발생 횟수(Confirmed_Death_Static_Colormap)]
  • [bar]

<요약본>

100개의 케이스로 요약을 할 경우

  • [per 100 Cases]

수많은 국가 중에 어느 나라가 Top 15 일까?

  • [Top 15 Countries case Analysis]

국가별 비율은?

바그래프

  • [Confirmed]
  • [Deaths]
  • [Recovered]
  • [New Cases]

Tree Map

  • [Confirmed]
  • [Deaths]

[Confirmed Cases Country and Day wise]


각각 국가의 발생 시기적으로 비교했을 때

국가별로 코로나 시작 날짜는?

  • [first_last]

Covid-19 vs Other Similar Epidemics

  • [other_Each_Country]

Covid-19와 국가는 서로 상관 관계가 있을 까?

chi2_contingency를 통한 상관 관계 확인

  • Country 와 Confirmed from scipy  stats import chi2 contingency

  • Country 와 Deaths print(chi2_contingency(dep_fest-

  • Country 와 Recovered # N2 771 95

결론 :

상관관계가 있다고 나왔을 뿐, 포괄적인 의미에서 정치적이든, 유전적이든, 바이러스 환경이든 원인은 아직 알 수 없다.
다만 국가와 Covid-19 사이에 상관관계가 있는 만큼 다른 영향, 반응들이 있지 않은지 지속적인 관찰이 필요하다고 판단된다.

그래서 지속적으로 국가별 관계에 대해 글을 작성할 예정이다.


+)사설, 처음에는 다른 데이터넷으로 하려했는데… ㅠㅠㅠㅠ image