1. 빅데이터 시각으로 본 공공데이터 활용
-의료서비스 관점에서
(주)라이프시맨틱스
송승재
kernel@lifesemantics.kr
socialsemantics@gmail.com
2012년 9월 24일
1 PAGE
2. Content
• 데이터의 여러 분류 및 특징
• 공공데이터 배포 현황-공공데이터 배포 방법
• 의료도메인의 데이터-정형데이터와 비정형데이터
• 데이터 관점의 정책 동향
• 의료 관련 데이터 공개 현황-미국
• 공공데이터 기반의 새로운 시장-Health2.0
• 의료 관련 공공데이터 기반 응용서비스
• 의료 관련 데이터 공개 현황-한국
• 결언
2 PAGE
4. What is Open Data & Government Data?
“Open Data”
Material(Data) is open
if it can be freely used, reused
and redistributed by anyone.
“Government Data”
Data and Information produced
or commissioned by
government or government
controlled entities.
Reference: Open Knowledge Foundation, 2010
4 PAGE
5. What is Linked Data?
“Linked Data”
In computing, linked data
describes a method of
publishing structured data so
that it can be interlinked and
become more useful.
Reference: http://en.wikipedia.org/wiki/Linked_data,
Wikipedia, 2012.09.21 access
5 PAGE
6. So, what is different?
Open Data Government Data
about Communication about Source
Linked Data
about Format
Big Data
about Size
6 PAGE
7. 공공데이터 배포 현황
Data.gov Data.go.kr
2009년 5월 21일 2010년 12월 2일
172개 연방기관 참여(하위 기관 포함) 22개 기관 참여
1,852종 Tools(34개 기관) 648종 프로그램(22개 기관)
386,429종 GeoData(6개 기관) 77,152 개 데이터 (18개 기관, File 기준)
7,290종 Raw Data(55개 기관, set 기준)
Dataset: 47(2009년) -> 약 450,000(2012년) 데이터베이스, 컴포넌트
*417 RDF Datasets / 6,418,927,209 Triples(2012년) apps[soap, rest, rss/atom, widgets]
Raw data, apps[widgets, gadgets, tools, RSS],
GeoData
7 PAGE
8. 데이터 관점의 Mash-up을 위해,
구조화 모델 기반의 데이터를 배포.
즉, Structured Data를 배포하는 것이 매우 중요
8 PAGE
9. 의료도메인의 데이터
Source: http://health.chosun.com/counseling/lawview.jsp?menu=2&submenu=2&bbsid=61326,
조선일보, 2012.09.22 접근
9 PAGE
11. 의료도메인의 데이터(cont’)
의료도메인의 데이터 분포
Structured Data
Semi-Structured Data
Unstructured Data
11 PAGE
12. 의료도메인에서 Linked Data의 중요성
• Big 5 병원의 1일 평균 외래 방문자 수 = 7천~만 명
(아산병원, 세브란스병원, 삼성병원, 서울대병원, 가톨릭대병원)
– 생성되는 데이터의 크기만으로는 빅데이터가 아닐 수도 있음
• 의학지식의 복잡성 때문에 비정형 데이터의 분석이 매우 어려움
– 근본적인 문제의 해결을 위해 CCM, CEM, Archetype 등을 연구
• Linked Data는,
– 데이터의 복잡성 해결을 지원하고
– 데이터 가공이 쉬운 장점을 지님
12 PAGE
32. 결언
• 공공데이터의 배포 è 새로운 시장 발굴
• 정보화 수준이 높은 한국의 병원시스템 è 정책적 지원을 통해
보건의료(응용)서비스 분야에서 세계적 경쟁력 확보
• ‘Data.go.kr’이라는 공공데이터 배포를 위한 플랫폼
• 공공데이터의 공격적인 배포가 필요
• 배포된 데이터의 라이선스 정책 변경 필요
서울시 열린 데이터 광장의 라이선스 정책
저작자 표시-비영리-변경금지
32 PAGE
33. Life Semantics we care for you from cradle to grave
감사합니다.
33 PAGE : Life Semantics Copyrights 2012 LifeSemantics All right reserved.