1 배경: 코로나19 극복을 위해 쉽게 쓸 수 있고 신뢰할 수 있는 공공데이터가 일관적으로 제공되어야 한다

코로나19를 극복하기 위해 시민 개발자(이하 씨빅해커)들이 자발적으로 코로나19 관련 여러 서비스들을 만들었다.

빠띠의 데이터팀은 시민들이 공익활동을 벌이거나 사실을 확인하기 위해 활용가능한 데이터 목록을 정리하는 작업을 준비하면서, 코로나19와 관련한 데이터들이 알려지고 더 많이 활용되는 것이 유용하겠다는 판단을 내렸다. 이에 코로나19 관련 서비스를 만드는데 필요한 데이터가 무엇이 공개되었는지를 조사하던 도중, 애초에 예상한 것보다는 기계가 읽을 수 있는 형태로 공개된 데이터가 거의 없다는 점을 확인하였다. 이는 코로나19 상황이 급박하게 확산되는 초기 상황에서 정부가 사람들이 읽기 쉽고 이해하기 쉬운 정보 공개는 발빠르게 대응한 것에 대비되는 상황이었다.

이후 빠띠의 데이터팀 활동가들은 코로나19 관련 서비스를 개발 중인 개발자들에게 개별적으로 연락을 취해 현재 어떤 방식으로 데이터를 수급하고 있는지 확인하였다. 질문에 응한 팀들에 따르면, 대부분의 팀들이 자발적으로 모인 팀원들이 주기적으로 정부의 여러 사이트를 방문하여 확진자 통계나 동선 등의 데이터를 수작업으로 복사해서 데이터로 가공하는 작업을 하고 있으며, 일부 팀이 크롤러를 개발하여 데이터를 자동으로 변환하고 있으나 이마저도 코로나19가 급박하게 진행되는 상황 속에서 함께 정부 사이트의 구조나 데이터 공개 형식이 바뀌면 그때마다 크롤러를 개선해야 하는 상황이었다. 이에 정부가 기계가 읽을 수 있는 데이터를 공개하고 동시에 데이터의 형식을 일관적으로 유지하고, 제공 주기를 규칙적으로 유지하는 것이 필요하다는 결론에 도달할 수 있었다.

2 공익데이터 공동대응 제안과 구성, 공공데이터 제공 요청

2.1 2월 24일에 코로나19 서비스 개발자들에게 발송한 메일

직전 주에 데이터 공동 대응을 준비한 후 빠띠의 데이터팀 활동가들은 국내 주요 코로나19 관련 서비스를 개발 중인 개발자들에게 다음의 메일을 발송하였다.

OOO 개발자님들께

안녕하세요.
민주주의활동가조합 빠띠 황은미 활동가입니다.

코로나19 데이터를 비주얼화해 작업하신 OOO가 도움이 많이 되었습니다. 가히 코로나 시국이라고 말할 정도로 코로나19 확진환자가 급격히 증가하는 와중에 시민들을 위해 OOO를 작업하고 애써주셔서 감사합니다.

빠띠는 공공데이터와 시빅해킹에 대해 관심을 가지고 활동하고 있습니다. 코로나19 데이터(확진환자 상태, 감염경로)는 오픈소스로 공동 작업하여 누구나 곧바로 사용할 수 있도록 공개하고자 합니다.

OOO 개발자님을 비롯해 애써주시는 분들과 좀더 수월하게 코로나19 데이터에 관해 협업하는 방법으로, 내용과 형식을 맞추고 Open API로 제공하는 등 여러 방법이 있지 않을까를 고민합니다. 코로나19 공공데이터에 대해 공동 대응하기를 희망합니다. 그래서 데이터 소스와 작업방식, 협업의향에 대한 여쭈어보려 연락드립니다.

1. 데이터 소스
사이트와 피드를 확인하니 손수 다 작업하고 계시는 것 같습니다. 제보와 질본 공개자료 외에 공공 데이터를 따로 받으시는 게 있는지요? 아니라면 일일이 질병대책본부의 정보를 가공하셔서 진행하시는지 궁금합니다.

2. 작업방식
혹시 따로 데이터를 가공하고 계신다고 하시나요? 스프레드시트를 활용해서 작업중이신가 궁금합니다.

3. 협업의향
코로나 19 공공데이터에 관해서 공동대응하면서, 우리 함께 할 수 있는 방법을 찾아볼까요?
빠띠 활동가들은 코로나19 공공데이터 API 만들어볼까 하는데, 협업할 수 있기를 기대합니다. (참고 자료: 데이터퍼블릭)

편히 답변 부탁드립니다.
감사합니다

황은미 드림

2.2 2월24일~2월28일: 공공데이터 공개요청 제안서 작성

2.3 2월24일~2월28일: 제안서 전달과 사전 작업

2.4 2월 27일에 코로나19 서비스 개발자들에게 발송한 메일

OOO 개발자님께,

안녕하세요. 민주주의활동가조합 빠띠 황은미 활동가입니다.

기하급수적으로 코로나19 감염이 늘어나는 상황에 실시간으로 데이터 작업을 하시느라 고생이 많으십니다. 지난 메일을 통해 언급하였듯이, 빠띠는 코로나19 로데이터(raw data)를 데이터퍼블릭(datapublic.kr)에 모으는 와중에 여러분이 비슷하게 느끼는 문제와 어려움이 있을 것 같아 공동대응을 제안드린 바 있습니다.
코로나19 지역사회 감염이 확산되면서 신속하게 대응할 필요성이 있다고 판단해서, 2월 28일(금) 오후에 행정안전부로 공공데이터 요청할 계획입니다. 이번 요청에 있어 여러분이 작업하고 계신 사이트와 앱에 집중할 수 있도록, 필요로 하시는 데이터를 정부가 제공하도록 요청하려고 합니다.

현재 코로나19 공공데이터를 활용해 사이트와 앱을 만들고 시민들에게 제공하는 입장에서 "지금 필요한 데이터, 지금은 없지만 필요하거나 개선이 필요한 데이터, 또한 앞으로 상황이 심각해질 경우 선제적으로 준비되면 좋을 데이터"를 함께 요청하면 어떨까 싶습니다. 그래서 공동대응차원으로 정부에 전달 하기에 앞서, 코로나19 공공데이터를 다루고 있는 여러분들께 의견과 피드백을 듣고자 이렇게 메일을 보냅니다.

현재 공동대응을 함께 하고 있는 분들과 링크가 있는 구글 문서으로 작업을 하고 있습니다. 아래 링크를 따라 가셔서 한번 살펴보시고, 필요한 데이터셋이나 가감없는 의견과 피드백을 부탁드립니다.

코로나19 공공데이터 가이드라인
코로나19 공공데이터 셋 포맷

혹시 좀더 공동대응에 관한 이야기를 쌍방향으로 이야기를 나누고, 함께 구상하고 싶으시다면 텔레그램(☜초대 링크 클릭) 로 오시는 것도 환영합니다.

여러분의 노고에 감사하고, 공공데이터 공동대응이 여러분과 시민들에게 도움이 되길 기대합니다.

편히 연락주세요.

감사합니다.

황은미 드림

3 공적마스크 API와 앱 개발이 본격 시작되다

공동대응은 이후 공적마스크 개발 대화방에 합류하여 마스크 API 개발 과정에 참여하였고, 소셜미디어를 통해 마스크 API 개방 소식을 알리며 텔레그램에 개발자를 모으고 개발 핸드북을 만드는등 개발자들이 쉽게 개발에 참여할 수 있도록 역할하였다. 이후 과정은 공적마스크백서에 기록되어 있다.