SlideShare a Scribd company logo
1 of 33
Download to read offline
[데이터, 셋] '코로나19 유동인구 민감도'에 따른
서울시 자치구별 소비패턴 비교 분석
2020.07
I. 분석 개요
II. 탐색적 분석 및 지표 정의
III. 심화 분석
IV. 결론
- 목 차 -
I. 분석 개요
1. 분석 목적
2. 사용 데이터
I. 분석 개요
I.1 분석 목적
• 데이터를 효과적으로 반영하는 지표는
복잡하고 방대한 데이터를 분석할 때
강력한 효과를 발휘함
• 본 분석에서는 간단한 수식만을 사용해
코로나 관련 데이터 시각화/분석에
활용 가능한 여러 지표들을 개발함
• 본 분석에서는 개발된 지표들을
지역별 소비패턴 비교 분석에 적용해
여러 인사이트를 도출해 냄
I. 분석 개요
I.2 사용 데이터
8자리 행정동 코드 데이터
(adstrd_master.csv)
• 각 행정동별 코드 및
소속 시군구 이름 정보 포함
코로나19 확진자 데이터
(Time.csv, TimeProvince.csv)
• 날짜별 전국, 서울시
신규 확진자 수 데이터 활용
서울시 유동인구 데이터
(fpopl.csv)
• 2020년 1~5월 유동인구 데이터를 추출해
자치구 단위로 재집계 후 활용
서울시 자치구별 소비지수 데이터
(index.csv)
• 자치구별 품목별 19~20년 1~5월
(10개월 간) 소비지수 데이터 활용
II. 탐색적 분석 및 지표 정의
1. 전국 코로나19 확진자 데이터
2. 서울시 유동인구 데이터
3. 서울시 자치구별 소비지수 데이터
II. 탐색적 분석 및 지표 정의
II.1 전국 코로나19 확진자 데이터
• 데이터를 통해 '포스트 코로나'를 분석하기 위해서는,
우선 분석 대상인 '포스트 코로나'의 기준을 명확하게 정의해야 함
• 본 분석에서는 신규 코로나19 확진자 수를 *주차별로 집계하여,
코로나19가 빠르게 확산되기 시작한 시점 이후를 '포스트 코로나'로 정의
(*주차 : 1년 기준으로 몇 번째 주간인지를 계산. 최대 52주차)
II. 탐색적 분석 및 지표 정의
II.1 전국 코로나19 확진자 데이터 - 전국 월별/주차별 신규 확진자 수
9주차 ▲
II. 탐색적 분석 및 지표 정의
II.1 전국 코로나19 확진자 데이터 - 서울시 월별/주차별 신규 확진자 수
9주차 ▲
II. 탐색적 분석 및 지표 정의
II.1 전국 코로나19 확진자 데이터 - 서울시 월별/주차별 신규 확진자 수
그래프를 통해, 2월에서 3월로 넘어가는 9주차에
코로나19가 급격하게 확산되기 시작했음을 알 수 있음.
따라서 2020년 9주차(2월 말) 이후 시기를
'포스트 코로나(Post-Corona)' 시기라고 보는 것이
합당하다고 판단함
II. 탐색적 분석 및 지표 정의
II.2 서울시 유동인구 데이터 – 서울시 전체 주차별 유동인구 추이
 서울시 전체의 주차별 유동인구는 2~3주차에 최대치를 기록함
 서울시 전체의 주차별 유동인구는 코로나 대확산이 일어나던 9~12주차에 급락함
 이는 날씨가 포근한 3월 경 유동인구가 증가하는 통상적 경향과 크게 다른 현상임
 결국 2020년 9-12주차의 유동인구 하락은 코로나19의 영향이라고 판단할 수 있음
II. 탐색적 분석 및 지표 정의
II.2 서울시 유동인구 데이터 – ‘코로나19 유동인구 민감도’ 지표 정의
 각 자치구별로 '2-3주차 유동인구'와 '9-12주차 유동인구' 사이의 감소 비율을 구하면
'감염병 확산에 따른 유동인구 민감도'를 구할 수 있음
 코로나19 유동인구 민감도 (코로나19 대확산 기간의 유동인구 감소율)
= (2020년 2-3주차 유동인구 - 2020년 9-12주차 유동인구) ÷ 2020년 2-3주차 유동인구
II. 탐색적 분석 및 지표 정의
II.2 서울시 유동인구 데이터 – 자치구별 코로나19 유동인구 민감도 비교
 자치구별로 계산한 코로나19 유동인구 민감도가 상당히 다양하게 나타남
 이는 자치구별로 코로나19 확산에 의한 유동인구 변화에 차이가 있음을 의미함
유동인구 민감지역 ▲ 유동인구 둔감지역 ▼
종로구, 중구, 용산구, 서초구
II. 탐색적 분석 및 지표 정의
II.2 서울시 유동인구 데이터 – 자치구별 코로나19 유동인구 민감도 비교
 유동인구 민감도는 서울을 가로지르는 4개 자치구에서 특별히 높게 나타남
• 보다 구체적인 비교를 위해
자치구별 유동인구 수를 확인함
• 자치구별 유동인구 변화 패턴이
서로 상이함을 확인할 수 있음
• 본 분석에서는 지역별로 상이한
코로나19 유동인구 민감도와
소비패턴을 함께 비교하고자 함
II. 탐색적 분석 및 지표 정의
II.2 서울시 유동인구 데이터 – 자치구별 코로나19 유동인구 민감도 비교
중구 코로나19 유동인구 민감도 0.258
관악구 코로나19 유동인구 민감도 0.144
성동구 코로나19 유동인구 민감도 0.02
II. 탐색적 분석 및 지표 정의
II.2 서울시 유동인구 데이터 – 코로나19 유동인구 민감도 기반 집단 분류
 이후 소비패턴 비교 분석을 위해, 25개 자치구를 유동인구 민감도 상/중/하위 집단으로 분류함
1) 코로나19 유동인구 민감지역(민감도 상위지역) : 유동인구 민감도 0.2 이상
(중구, 용산구, 종로구, 서초구, 구로구)
2) 코로나 19 유동인구 둔감지역(민감도 하위지역) : 유동인구 민감도 0.1 미만
(도봉구, 성북구, 강남구, 강북구, 성동구)
3) 기타지역(민감도 중위지역) : 위 두 집단을 제외한 나머지 15개 자치구 (0.1~0.2 사이)
민감지역 기타지역 둔감지역
0.231 ▲
0.127
0.073 ▼
II. 탐색적 분석 및 지표 정의
II.3 서울시 자치구별 소비지수 데이터 – 서울시 전체 소비지수 추이
 2020년 1-2월 소비지수에 비해, 포스트 코로나(Post-Corona)에 속하는 3-4월 소비지수가
급격히 하락함
 전년 동기의 소비지수 추이와 비교할 때, 코로나19로 인해 전체적인 소비심리가 얼어붙었다는
사실을 추정할 수 있음
1~5월 서울시 전체 소비지수 추이
II. 탐색적 분석 및 지표 정의
II.3 서울시 자치구별 소비지수 데이터 – ‘(포스트코로나) 소비지수 변화율’ 지표 정의
 각 자치구별, 품목별로 2020년 월별 소비지수를 2019년 소비지수로 나눠 보정해준 뒤,
1-2월과 3-5월 소비지수 각각의 평균치를 구한 다음, 다시 두 기간 사이의 변화율을 구하면,
자치구별, 품목별 포스트코로나 기간의 소비지수 변화율을 구할 수 있음
 포스트코로나 소비지수 변화율 (코로나19로 인한 품목별 소비지수 변화 정도)
= (3-5월 보정 소비지수 평균 - 1-2월 보정 소비지수 평균) ÷ 1-2월 보정 소비지수 평균
II. 탐색적 분석 및 지표 정의
II.3 서울시 자치구별 소비지수 데이터 – 서울시 전체 소비지수 변화율 하위 4개 품목
 서울시 전체의 품목별 포스트코로나 소비지수 변화율을 구한 결과,
소비지수 하락폭이 가장 큰 4개 품목은 바디/헤어용품, 뷰티소품, 화장품, 빵류로 확인됨
 외부활동이 줄면서 씻거나 화장품을 사용할 일이 줄어들어,
바디/헤어용품이나 화장품 등의 소비가 줄어들었다고 해석할 여지가 있음
 재택근무/자가격리 등으로 소위 ‘집밥족’이 늘어나면서,
빵류 등의 소비가 줄어들었다고 해석할 여지가 있음
II. 탐색적 분석 및 지표 정의
II.3 서울시 자치구별 소비지수 데이터 – 서울시 전체 소비지수 변화율 상위 4개 품목
 서울시 전체의 품목별 포스트코로나 소비지수 변화율을 구한 결과,
소비지수 하락폭이 작은 4개 품목은 담배, 유제품류, 빙과류, 주류로 확인됨
 특히 주류의 경우, 전체 16개 품목 중 유일하게 포스트코로나 소비지수가 상승함
 코로나19 확산 이후 '홈쿡+홈술족'의 증가로 편의점 주류 및 주류 전문점의 매출이 급상승해,
이와 같은 현상이 발생했을 수 있음
III. 심화 분석
1. 코로나19 유동인구 민감도
상/중/하위 집단별 비교분석
2. 상관분석
코로나19 유동인구 민감도 x 소비지수
III. 심화 분석
III.1 코로나19 유동인구 민감도 상/중/하위 집단별 비교분석
 앞서 정의한 ‘코로나19 유동인구 민감도’와 ‘포스트코로나 소비지수 변화율‘ 지표를 활용해,
지역별로 유동인구 및 소비지수의 변화 패턴을 비교 분석함
(코로나19 유동인구 민감도 상/중/하위 집단별로, 품목별 소비지수 변화율 비교)
 총 16개의 품목 중, 집단 간 소비지수 변화율 차이가 가장 큰 3가지 품목만 추출
III. 심화 분석
III.1 코로나19 유동인구 민감도 상/중/하위 집단별 비교분석 – 빙과류 품목
1. 빙과류 - 민감지역과 기타지역에서는 소비가 위축된 반면,
유동인구 민감도가 낮은 지역에서는 소비가 활발해짐
 코로나19로 인한 외부활동 영향을 덜 받은 지역일수록 외부활동이 상대적으로 활발하고,
기온까지 올라가면서 빙과류의 소비가 증가했다고 해석할 여지가 있음
민감지역 기타지역 둔감지역
III. 심화 분석
III.1 코로나19 유동인구 민감도 상/중/하위 집단별 비교분석 – 신선식품 품목
2. 신선식품 - 코로나19 유동인구 민감도가 낮은 지역일수록 소비가 위축됨
 서울시 전체 소비지수 추이에서 보았던 것처럼,
코로나19 확산 이후 외부활동이 줄어든 지역일수록 '홈쿡’ 또는 ‘집밥족'이 증가하였고
반대로 외부활동에 영향이 적은 지역일수록 직접 밥을 해먹는 빈도가 상대적으로 적어
소비지수 추이에 차이가 있다고 해석할 여지가 있음
민감지역 기타지역 둔감지역
III. 심화 분석
III.1 코로나19 유동인구 민감도 상/중/하위 집단별 비교분석 – 주류 품목
2. 주류 - 코로나19 유동인구 민감도가 높은 지역일수록 소비가 활발해짐
 서울시 전체 소비지수 추이에서 보았던 것처럼,
코로나19 확산 이후 외부활동이 줄어든 지역일수록 '홈술족'이 증가해
주류 소비가 증가했다고 해석할 여지가 있음
민감지역 기타지역 둔감지역
III. 심화 분석
III.2 상관분석 (코로나19 유동인구 민감도 x 소비지수)
 소지비수 데이터에는 자치구별 구분 외에도 성별, 연령별 구분 정보가 포함됨
 성-연령별 구분 정보를 함께 고려하면 더욱 세분화된 분석이 가능함
 각 자치구의 ‘품목별 성연령별 소비지수 변화율’과
‘코로나19 유동인구 민감도’ 간 상관계를 분석하여,
다양한 관점에서 소비지수와 유동인구 변화 패턴 사이의 상관관계를 한 눈에 살펴볼 수 있음
(유동인구와 소비지수 관련 변수 간 상관계수 비교 및 산점도 차트 분석)
변수 간 상관관계에 따른 상관계수 예시
III. 심화 분석
III.2 상관분석 (코로나19 유동인구 민감도 x 소비지수) – 주류 품목 산점도
 상관분석 결과, 자치구별 주류 품목의 소비지수 변화율이 다른 품목에 비해
유동인구 민감도와 높은 상관관계를 나타냄
 주류 품목의 소비지수 변화율과 유동인구 민감도는 대체로 양의 상관관계를 보임
 코로나19로 인해 외부활동이 줄어든 지역일수록, 주류 소비가 증가했다고 해석할 여지가 있음
30대 남녀 60대 남녀 전 연령 남성
III. 심화 분석
III.2 상관분석 (코로나19 유동인구 민감도 x 소비지수) – 주류 품목 소비지수 추이
 상관분석에서 확인된 내용을 좀 더 구체적으로 확인하기 위해,
자치구별 2020년 주류 품목의 소비지수 추이를 분석함.
 주류 소비가 지속적으로 증가 추세인 두 자치구(민감지역, 기타지역 소속)에 비해,
유동인구 민감도가 낮은 성동구의 경우 주류 소비지수가 감소하는 패턴을 보임
2020년 중구 주류 소비지수 추이 2020년 관악구 주류 소비지수 추이 2020년 성동구 주류 소비지수 추이
III. 심화 분석
III.2 상관분석 (코로나19 유동인구 민감도 x 소비지수) – 주류 품목 소비지수 변화율 지도
 앞서 코로나19 유동인구 민감도에서는 종로구, 중구, 용산구, 서초구 등이 높게 나타남
 이와 유사하게, 중구, 용산구, 서초구 등에서 주류 판매의 증가가 상대적으로 가파름
 이를 통해 코로나19 유동인구 민감도와 주류 소비지수 변화율의 연관성을 재차 확인할 수 있음
중구, 용산구, 서초구
IV. 결론
1. 분석내용 요약
2. 분석 의의
IV. 결론
IV.1 분석내용 요약
 본 분석에서는 코로나19 확산세가 급격히 증가한 2월 말을
'포스트 코로나' 시기의 기점으로 정의함
 본 분석에서는 유동인구 데이터를 활용해
'코로나19 유동인구 민감도' 지표를 개발함.
서울 한 가운데를 가로지르는 4개 자치구에서 특히
코로나19 대확산 시기 유동인구 감소가 가파른 것으로 나타남
 본 분석에서는 소비지수 데이터를 활용해
'포스트 코로나 시기의 소비지수 변화율' 지표를 개발함.
이를 통해 각 지역별로 특정 품목의 소비지수 변화 추이를
한 눈에 시각화함
 서울시 자치구별 '코로나19 민감지수'와 품목별 '소비지수 변화율'을
비교 분석한 결과, 코로나19로 인해 외부활동이 줄어든 지역일수록
신선식품과 주류의 소비가 증가했으며, 코로나19로 인한 외부활동
영향을 덜 받은 지역일수록 빙과류의 소비가 증가함
 여러 관점에서 분석해볼 때, 주류 품목의 소비지수 변화율이
코로나19 유동인구 민감도와 상관관계가 높은 것으로 파악됨
IV. 결론
IV.2 분석 의의
 많은 참가자들로부터 포스트 코로나 시기, 유동인구 민감도 등 새로운 지표들의
참신함을 긍정적으로 평가받음
 본 분석 이후 여러 상위권 분석 보고서에도 해당 내용이 참조 또는 응용됨
(코로나 시기 재정의 : https://dacon.io/competitions/official/235618/codeshare/1434)
(코로나 확산기 전후 분류 :
https://dacon.io/competitions/official/235618/codeshare/1430)
(주차별 코로나19 확진자 수를 통해 포스트 코로나 시기 정의 :
https://dacon.io/competitions/official/235618/codeshare/1419)
 본 분석 과정을 통해, 복잡하고 방대한 분석일수록 간결하게 데이터를 요약하고
분석 결과의 전달력을 높이는 효과적인 지표의 중요성이 크다는 사실을 다시금 깨달음
감사합니다

More Related Content

More from DACON AI 데이콘

K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 8위 수상작
생체 광학 데이터 분석 AI 경진대회 8위 수상작생체 광학 데이터 분석 AI 경진대회 8위 수상작
생체 광학 데이터 분석 AI 경진대회 8위 수상작DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 7위 수상작
생체 광학 데이터 분석 AI 경진대회 7위 수상작생체 광학 데이터 분석 AI 경진대회 7위 수상작
생체 광학 데이터 분석 AI 경진대회 7위 수상작DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 6위 수상작
생체 광학 데이터 분석 AI 경진대회 6위 수상작생체 광학 데이터 분석 AI 경진대회 6위 수상작
생체 광학 데이터 분석 AI 경진대회 6위 수상작DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 2위 수상작
생체 광학 데이터 분석 AI 경진대회 2위 수상작생체 광학 데이터 분석 AI 경진대회 2위 수상작
생체 광학 데이터 분석 AI 경진대회 2위 수상작DACON AI 데이콘
 

More from DACON AI 데이콘 (20)

K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
 
20200923
2020092320200923
20200923
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작
 
생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작
 
생체 광학 데이터 분석 AI 경진대회 8위 수상작
생체 광학 데이터 분석 AI 경진대회 8위 수상작생체 광학 데이터 분석 AI 경진대회 8위 수상작
생체 광학 데이터 분석 AI 경진대회 8위 수상작
 
생체 광학 데이터 분석 AI 경진대회 7위 수상작
생체 광학 데이터 분석 AI 경진대회 7위 수상작생체 광학 데이터 분석 AI 경진대회 7위 수상작
생체 광학 데이터 분석 AI 경진대회 7위 수상작
 
생체 광학 데이터 분석 AI 경진대회 6위 수상작
생체 광학 데이터 분석 AI 경진대회 6위 수상작생체 광학 데이터 분석 AI 경진대회 6위 수상작
생체 광학 데이터 분석 AI 경진대회 6위 수상작
 
생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작
 
생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작
 
생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작
 
생체 광학 데이터 분석 AI 경진대회 2위 수상작
생체 광학 데이터 분석 AI 경진대회 2위 수상작생체 광학 데이터 분석 AI 경진대회 2위 수상작
생체 광학 데이터 분석 AI 경진대회 2위 수상작
 

포스트 코로나 데이터 시각화 경진대회 - 장려상2

  • 1. [데이터, 셋] '코로나19 유동인구 민감도'에 따른 서울시 자치구별 소비패턴 비교 분석 2020.07
  • 2. I. 분석 개요 II. 탐색적 분석 및 지표 정의 III. 심화 분석 IV. 결론 - 목 차 -
  • 3. I. 분석 개요 1. 분석 목적 2. 사용 데이터
  • 4. I. 분석 개요 I.1 분석 목적 • 데이터를 효과적으로 반영하는 지표는 복잡하고 방대한 데이터를 분석할 때 강력한 효과를 발휘함 • 본 분석에서는 간단한 수식만을 사용해 코로나 관련 데이터 시각화/분석에 활용 가능한 여러 지표들을 개발함 • 본 분석에서는 개발된 지표들을 지역별 소비패턴 비교 분석에 적용해 여러 인사이트를 도출해 냄
  • 5. I. 분석 개요 I.2 사용 데이터 8자리 행정동 코드 데이터 (adstrd_master.csv) • 각 행정동별 코드 및 소속 시군구 이름 정보 포함 코로나19 확진자 데이터 (Time.csv, TimeProvince.csv) • 날짜별 전국, 서울시 신규 확진자 수 데이터 활용 서울시 유동인구 데이터 (fpopl.csv) • 2020년 1~5월 유동인구 데이터를 추출해 자치구 단위로 재집계 후 활용 서울시 자치구별 소비지수 데이터 (index.csv) • 자치구별 품목별 19~20년 1~5월 (10개월 간) 소비지수 데이터 활용
  • 6. II. 탐색적 분석 및 지표 정의 1. 전국 코로나19 확진자 데이터 2. 서울시 유동인구 데이터 3. 서울시 자치구별 소비지수 데이터
  • 7. II. 탐색적 분석 및 지표 정의 II.1 전국 코로나19 확진자 데이터 • 데이터를 통해 '포스트 코로나'를 분석하기 위해서는, 우선 분석 대상인 '포스트 코로나'의 기준을 명확하게 정의해야 함 • 본 분석에서는 신규 코로나19 확진자 수를 *주차별로 집계하여, 코로나19가 빠르게 확산되기 시작한 시점 이후를 '포스트 코로나'로 정의 (*주차 : 1년 기준으로 몇 번째 주간인지를 계산. 최대 52주차)
  • 8. II. 탐색적 분석 및 지표 정의 II.1 전국 코로나19 확진자 데이터 - 전국 월별/주차별 신규 확진자 수 9주차 ▲
  • 9. II. 탐색적 분석 및 지표 정의 II.1 전국 코로나19 확진자 데이터 - 서울시 월별/주차별 신규 확진자 수 9주차 ▲
  • 10. II. 탐색적 분석 및 지표 정의 II.1 전국 코로나19 확진자 데이터 - 서울시 월별/주차별 신규 확진자 수 그래프를 통해, 2월에서 3월로 넘어가는 9주차에 코로나19가 급격하게 확산되기 시작했음을 알 수 있음. 따라서 2020년 9주차(2월 말) 이후 시기를 '포스트 코로나(Post-Corona)' 시기라고 보는 것이 합당하다고 판단함
  • 11. II. 탐색적 분석 및 지표 정의 II.2 서울시 유동인구 데이터 – 서울시 전체 주차별 유동인구 추이  서울시 전체의 주차별 유동인구는 2~3주차에 최대치를 기록함  서울시 전체의 주차별 유동인구는 코로나 대확산이 일어나던 9~12주차에 급락함  이는 날씨가 포근한 3월 경 유동인구가 증가하는 통상적 경향과 크게 다른 현상임  결국 2020년 9-12주차의 유동인구 하락은 코로나19의 영향이라고 판단할 수 있음
  • 12. II. 탐색적 분석 및 지표 정의 II.2 서울시 유동인구 데이터 – ‘코로나19 유동인구 민감도’ 지표 정의  각 자치구별로 '2-3주차 유동인구'와 '9-12주차 유동인구' 사이의 감소 비율을 구하면 '감염병 확산에 따른 유동인구 민감도'를 구할 수 있음  코로나19 유동인구 민감도 (코로나19 대확산 기간의 유동인구 감소율) = (2020년 2-3주차 유동인구 - 2020년 9-12주차 유동인구) ÷ 2020년 2-3주차 유동인구
  • 13. II. 탐색적 분석 및 지표 정의 II.2 서울시 유동인구 데이터 – 자치구별 코로나19 유동인구 민감도 비교  자치구별로 계산한 코로나19 유동인구 민감도가 상당히 다양하게 나타남  이는 자치구별로 코로나19 확산에 의한 유동인구 변화에 차이가 있음을 의미함 유동인구 민감지역 ▲ 유동인구 둔감지역 ▼
  • 14. 종로구, 중구, 용산구, 서초구 II. 탐색적 분석 및 지표 정의 II.2 서울시 유동인구 데이터 – 자치구별 코로나19 유동인구 민감도 비교  유동인구 민감도는 서울을 가로지르는 4개 자치구에서 특별히 높게 나타남
  • 15. • 보다 구체적인 비교를 위해 자치구별 유동인구 수를 확인함 • 자치구별 유동인구 변화 패턴이 서로 상이함을 확인할 수 있음 • 본 분석에서는 지역별로 상이한 코로나19 유동인구 민감도와 소비패턴을 함께 비교하고자 함 II. 탐색적 분석 및 지표 정의 II.2 서울시 유동인구 데이터 – 자치구별 코로나19 유동인구 민감도 비교 중구 코로나19 유동인구 민감도 0.258 관악구 코로나19 유동인구 민감도 0.144 성동구 코로나19 유동인구 민감도 0.02
  • 16. II. 탐색적 분석 및 지표 정의 II.2 서울시 유동인구 데이터 – 코로나19 유동인구 민감도 기반 집단 분류  이후 소비패턴 비교 분석을 위해, 25개 자치구를 유동인구 민감도 상/중/하위 집단으로 분류함 1) 코로나19 유동인구 민감지역(민감도 상위지역) : 유동인구 민감도 0.2 이상 (중구, 용산구, 종로구, 서초구, 구로구) 2) 코로나 19 유동인구 둔감지역(민감도 하위지역) : 유동인구 민감도 0.1 미만 (도봉구, 성북구, 강남구, 강북구, 성동구) 3) 기타지역(민감도 중위지역) : 위 두 집단을 제외한 나머지 15개 자치구 (0.1~0.2 사이) 민감지역 기타지역 둔감지역 0.231 ▲ 0.127 0.073 ▼
  • 17. II. 탐색적 분석 및 지표 정의 II.3 서울시 자치구별 소비지수 데이터 – 서울시 전체 소비지수 추이  2020년 1-2월 소비지수에 비해, 포스트 코로나(Post-Corona)에 속하는 3-4월 소비지수가 급격히 하락함  전년 동기의 소비지수 추이와 비교할 때, 코로나19로 인해 전체적인 소비심리가 얼어붙었다는 사실을 추정할 수 있음 1~5월 서울시 전체 소비지수 추이
  • 18. II. 탐색적 분석 및 지표 정의 II.3 서울시 자치구별 소비지수 데이터 – ‘(포스트코로나) 소비지수 변화율’ 지표 정의  각 자치구별, 품목별로 2020년 월별 소비지수를 2019년 소비지수로 나눠 보정해준 뒤, 1-2월과 3-5월 소비지수 각각의 평균치를 구한 다음, 다시 두 기간 사이의 변화율을 구하면, 자치구별, 품목별 포스트코로나 기간의 소비지수 변화율을 구할 수 있음  포스트코로나 소비지수 변화율 (코로나19로 인한 품목별 소비지수 변화 정도) = (3-5월 보정 소비지수 평균 - 1-2월 보정 소비지수 평균) ÷ 1-2월 보정 소비지수 평균
  • 19. II. 탐색적 분석 및 지표 정의 II.3 서울시 자치구별 소비지수 데이터 – 서울시 전체 소비지수 변화율 하위 4개 품목  서울시 전체의 품목별 포스트코로나 소비지수 변화율을 구한 결과, 소비지수 하락폭이 가장 큰 4개 품목은 바디/헤어용품, 뷰티소품, 화장품, 빵류로 확인됨  외부활동이 줄면서 씻거나 화장품을 사용할 일이 줄어들어, 바디/헤어용품이나 화장품 등의 소비가 줄어들었다고 해석할 여지가 있음  재택근무/자가격리 등으로 소위 ‘집밥족’이 늘어나면서, 빵류 등의 소비가 줄어들었다고 해석할 여지가 있음
  • 20. II. 탐색적 분석 및 지표 정의 II.3 서울시 자치구별 소비지수 데이터 – 서울시 전체 소비지수 변화율 상위 4개 품목  서울시 전체의 품목별 포스트코로나 소비지수 변화율을 구한 결과, 소비지수 하락폭이 작은 4개 품목은 담배, 유제품류, 빙과류, 주류로 확인됨  특히 주류의 경우, 전체 16개 품목 중 유일하게 포스트코로나 소비지수가 상승함  코로나19 확산 이후 '홈쿡+홈술족'의 증가로 편의점 주류 및 주류 전문점의 매출이 급상승해, 이와 같은 현상이 발생했을 수 있음
  • 21. III. 심화 분석 1. 코로나19 유동인구 민감도 상/중/하위 집단별 비교분석 2. 상관분석 코로나19 유동인구 민감도 x 소비지수
  • 22. III. 심화 분석 III.1 코로나19 유동인구 민감도 상/중/하위 집단별 비교분석  앞서 정의한 ‘코로나19 유동인구 민감도’와 ‘포스트코로나 소비지수 변화율‘ 지표를 활용해, 지역별로 유동인구 및 소비지수의 변화 패턴을 비교 분석함 (코로나19 유동인구 민감도 상/중/하위 집단별로, 품목별 소비지수 변화율 비교)  총 16개의 품목 중, 집단 간 소비지수 변화율 차이가 가장 큰 3가지 품목만 추출
  • 23. III. 심화 분석 III.1 코로나19 유동인구 민감도 상/중/하위 집단별 비교분석 – 빙과류 품목 1. 빙과류 - 민감지역과 기타지역에서는 소비가 위축된 반면, 유동인구 민감도가 낮은 지역에서는 소비가 활발해짐  코로나19로 인한 외부활동 영향을 덜 받은 지역일수록 외부활동이 상대적으로 활발하고, 기온까지 올라가면서 빙과류의 소비가 증가했다고 해석할 여지가 있음 민감지역 기타지역 둔감지역
  • 24. III. 심화 분석 III.1 코로나19 유동인구 민감도 상/중/하위 집단별 비교분석 – 신선식품 품목 2. 신선식품 - 코로나19 유동인구 민감도가 낮은 지역일수록 소비가 위축됨  서울시 전체 소비지수 추이에서 보았던 것처럼, 코로나19 확산 이후 외부활동이 줄어든 지역일수록 '홈쿡’ 또는 ‘집밥족'이 증가하였고 반대로 외부활동에 영향이 적은 지역일수록 직접 밥을 해먹는 빈도가 상대적으로 적어 소비지수 추이에 차이가 있다고 해석할 여지가 있음 민감지역 기타지역 둔감지역
  • 25. III. 심화 분석 III.1 코로나19 유동인구 민감도 상/중/하위 집단별 비교분석 – 주류 품목 2. 주류 - 코로나19 유동인구 민감도가 높은 지역일수록 소비가 활발해짐  서울시 전체 소비지수 추이에서 보았던 것처럼, 코로나19 확산 이후 외부활동이 줄어든 지역일수록 '홈술족'이 증가해 주류 소비가 증가했다고 해석할 여지가 있음 민감지역 기타지역 둔감지역
  • 26. III. 심화 분석 III.2 상관분석 (코로나19 유동인구 민감도 x 소비지수)  소지비수 데이터에는 자치구별 구분 외에도 성별, 연령별 구분 정보가 포함됨  성-연령별 구분 정보를 함께 고려하면 더욱 세분화된 분석이 가능함  각 자치구의 ‘품목별 성연령별 소비지수 변화율’과 ‘코로나19 유동인구 민감도’ 간 상관계를 분석하여, 다양한 관점에서 소비지수와 유동인구 변화 패턴 사이의 상관관계를 한 눈에 살펴볼 수 있음 (유동인구와 소비지수 관련 변수 간 상관계수 비교 및 산점도 차트 분석) 변수 간 상관관계에 따른 상관계수 예시
  • 27. III. 심화 분석 III.2 상관분석 (코로나19 유동인구 민감도 x 소비지수) – 주류 품목 산점도  상관분석 결과, 자치구별 주류 품목의 소비지수 변화율이 다른 품목에 비해 유동인구 민감도와 높은 상관관계를 나타냄  주류 품목의 소비지수 변화율과 유동인구 민감도는 대체로 양의 상관관계를 보임  코로나19로 인해 외부활동이 줄어든 지역일수록, 주류 소비가 증가했다고 해석할 여지가 있음 30대 남녀 60대 남녀 전 연령 남성
  • 28. III. 심화 분석 III.2 상관분석 (코로나19 유동인구 민감도 x 소비지수) – 주류 품목 소비지수 추이  상관분석에서 확인된 내용을 좀 더 구체적으로 확인하기 위해, 자치구별 2020년 주류 품목의 소비지수 추이를 분석함.  주류 소비가 지속적으로 증가 추세인 두 자치구(민감지역, 기타지역 소속)에 비해, 유동인구 민감도가 낮은 성동구의 경우 주류 소비지수가 감소하는 패턴을 보임 2020년 중구 주류 소비지수 추이 2020년 관악구 주류 소비지수 추이 2020년 성동구 주류 소비지수 추이
  • 29. III. 심화 분석 III.2 상관분석 (코로나19 유동인구 민감도 x 소비지수) – 주류 품목 소비지수 변화율 지도  앞서 코로나19 유동인구 민감도에서는 종로구, 중구, 용산구, 서초구 등이 높게 나타남  이와 유사하게, 중구, 용산구, 서초구 등에서 주류 판매의 증가가 상대적으로 가파름  이를 통해 코로나19 유동인구 민감도와 주류 소비지수 변화율의 연관성을 재차 확인할 수 있음 중구, 용산구, 서초구
  • 30. IV. 결론 1. 분석내용 요약 2. 분석 의의
  • 31. IV. 결론 IV.1 분석내용 요약  본 분석에서는 코로나19 확산세가 급격히 증가한 2월 말을 '포스트 코로나' 시기의 기점으로 정의함  본 분석에서는 유동인구 데이터를 활용해 '코로나19 유동인구 민감도' 지표를 개발함. 서울 한 가운데를 가로지르는 4개 자치구에서 특히 코로나19 대확산 시기 유동인구 감소가 가파른 것으로 나타남  본 분석에서는 소비지수 데이터를 활용해 '포스트 코로나 시기의 소비지수 변화율' 지표를 개발함. 이를 통해 각 지역별로 특정 품목의 소비지수 변화 추이를 한 눈에 시각화함  서울시 자치구별 '코로나19 민감지수'와 품목별 '소비지수 변화율'을 비교 분석한 결과, 코로나19로 인해 외부활동이 줄어든 지역일수록 신선식품과 주류의 소비가 증가했으며, 코로나19로 인한 외부활동 영향을 덜 받은 지역일수록 빙과류의 소비가 증가함  여러 관점에서 분석해볼 때, 주류 품목의 소비지수 변화율이 코로나19 유동인구 민감도와 상관관계가 높은 것으로 파악됨
  • 32. IV. 결론 IV.2 분석 의의  많은 참가자들로부터 포스트 코로나 시기, 유동인구 민감도 등 새로운 지표들의 참신함을 긍정적으로 평가받음  본 분석 이후 여러 상위권 분석 보고서에도 해당 내용이 참조 또는 응용됨 (코로나 시기 재정의 : https://dacon.io/competitions/official/235618/codeshare/1434) (코로나 확산기 전후 분류 : https://dacon.io/competitions/official/235618/codeshare/1430) (주차별 코로나19 확진자 수를 통해 포스트 코로나 시기 정의 : https://dacon.io/competitions/official/235618/codeshare/1419)  본 분석 과정을 통해, 복잡하고 방대한 분석일수록 간결하게 데이터를 요약하고 분석 결과의 전달력을 높이는 효과적인 지표의 중요성이 크다는 사실을 다시금 깨달음