데이터 이야기

데이터 큐레이터가 될 수 있었던 3가지 이유

inhovation 2020. 2. 10. 19:22

부제 : 나는 어떻게 데이터 큐레이터가 되었나?

 

사실 이번 제목에 '데이터 큐레이터' 대신에 '빅데이터 큐레이터'라고 할까 했었다. 내 명함에 박힌 이름이 '빅데이터 큐레이터'이기 때문이다. 그렇다고 내가 그렇게 '빅'한 데이터를 다루는 것은 아니라서 그냥 '데이터 큐레이터'라고 조금은 소극적으로 바꿨다. 여튼, 데이터 큐레이터든 빅데이터 큐레이터든 엄밀히 따지면 그 차이가 클 수 있겠지만, 사실 내가 일하는 공공의 영역에서는 빅데이터를 그렇게 엄밀하게 정의하지도 않는다. 예를 들어, 행정안전부에서 공공기관 빅데이터 문제해결 사례같은 것을 공모하면 정말 '빅'한 데이터가 아닌, 몇만 건 정도의 행정데이터를 분석하여 개선한 것들도 우수사례로 선정된 것도 있다. 어떻게보면 이런 건 빅데이터 분석이라기보다는 통계데이터에 더 가깝기도 한데 말이다.

 

빅데이터든 데이터든 썰은 이정도로만 풀기로 하고, 사실 나도 빅데이터를 엄격하게 전공하고 공부하고 그런 사람은 아니다. 어떻게 하다가 명함에까지 넣게 됐는데, 1년 전에는 '데이터 큐레이션'이란 것 자체도 너무 생소했다. 미술관 같은 곳에서 일하면서 작품을 소개해주는 사람들을 큐레이터라고 부른다는 것은 알았는데, 데이터 큐레이터라니. 어쩌다보니 우리 팀 과장님이 "너 데이터 큐레이터 해!ㅋㅋㅋ" 약간 이런 느낌으로 하게 됐는데, 그럼 나는 어쩌다가 명함에 '빅데이터 큐레이터'라고 파고 다니는 사람이 될 수 있었나 한 번 정리해 보았다.

 

[참고] 빅데이터 큐레이터에 대한 간략한 설명

 

빅데이터 큐레이터 (Big data curator) | 과학포털 사이언스올

빅데이터를 분석 및 활용하여 최적의 전략을 제시하는 사람을 말한다. 전문성과 통찰력으로 데이터를 분석하여 고객과 기업이 원하는 데이터를 신속히 제공하거나, 특정주제와 가장연관성이 높은 콘텐츠를 창출하여 공급한다. 빅데이터 큐레이터는 통계를 다룰 줄 알며 프로그래밍 능력도 있어야 한다.

www.scienceall.com

1. 운

첫 번째 이유는 진짜 운이다. 운이 좋았다. 일단 나한테 데이터 큐레이터를 하라고 한 과장님을 이렇게 만나게 된 것도 사실상 내가 이렇게 글을 쓰게될 수 있었던 이유 전부라고 볼 수도 있다. 사실 나는 회사에 입사할 때 통계 포지션으로 들어갔다. 그러다가 데이터에 대한 중요성을 회사가 (조금 늦게) 깨닫고 관련 부서도 만들고 내가 이쪽 업무를 하는 포지션으로 바뀌게 되었다. 그 과장님은 이런 쪽으로 잘 아시고 전략적으로도 뭔가 포지셔닝을 잘 하시는 분이었는데, '빅데이터 큐레이터'의 자격에 대해 아주 엄밀하게 놓고 심사하기 보다는 내가 그런 비슷한 일을 하고 있는 것은 맞으니까 대외적으로도 또 회사 안에서도 뭔가 전략적으로 보이기 위해서 '데이터 큐레이션'이라는 영역을 정리하고 계셨다. 그분은 기록관리를 하시는 분이었는데, 그래서 결국 '기록관리-데이터 아키텍처-데이터 큐레이션', 이 세 영역이 유기적으로 엮여서 함께 일해야 한다는 논리에 데이터 아키텍처 담당인력까지 +1 해서 부서 인력도 구성해갔다. 저기서 데이터 큐레이션을 담당하는 사람이 바로 나다. ㅋㅋㅋ

결국 정리하면, 진짜 운이 좋았다. 회사에서 이런 '데이터 큐레이션'을 생각해 낼 수 있는 과장님과 함께 일할 수 있었다는 것, 그리고 딱 맞게 회사에서 데이터 영역을 중요하게 생각해서 지지를 많이 해줬다는 것, 그리고 아래 서술하겠지만, 내가 이런 일을 하기에 그래도 완전 이상한 사람은 아니었다는 것 까지? ㅋㅋ 결국 거기 내가 딱 있었다는 것도 정말 어떻게 생각해보면 운이 좋아서 딱딱 다 맞아 떨어졌다.

 

'데이터' 업무를 해도 손으로 쓰면서 일을 한다. (Unsplash image)

2. 노력

사실 나는 회사에서 통계실적을 정리하는 사람으로 뽑혀서 계-속 이 일만 할 수도 있었다. 그런데 2년정도 지나니까 단순반복 업무가 조금은 따분하게 느껴졌다. 일이 싫어졌다는 것이 아니어서 내가 하고 있는 업무를 더 효율적으로 할 수 있는 방법은 없을까 고민하고 노력하고 개선하고 그랬다.

입사 전부터도 잘 한다고 생각했던 엑셀 실력은 더 늘어만 갔고, 이거로는 부족해서 파이썬(python)을 독학으로 배워나갔다. 사실 파이썬은 교수님께서 무작정 '파이썬으로 크롤링을 해 보라'는 말씀에 책을 사서 따라하고 그러면서 익숙해졌고, 박사과정 첫 학기 수업으로 파이썬을 들으면서 폭발적으로 실력이 늘어갔다. (그렇다고 파이썬을 아주 개발자 수준으로 한다는 건 아니고, 업무를 효율적으로 할 수 있는 프로그램들을 스스로 만들 줄 아는 수준?) 그리고 회사에서 라이선스만 있고 잘 사용하지 않고 있던 통계/데이터 프로그램인 스타타(Stata, 스테이러- 쏘는 스에티타ㅋ)도 독학으로 시작했다. 그러다 회사의 지원을 통해 스타타 주말강의도 몇 개 듣고 이수하고 하면서 회사 업무에도 엄청 사용했다. 그러다 보니 역시 실력이 폭발적으로 늘어나면서 대단한 것은 아니지만 스타타 관련 논문도 쓰고 그랬다.

대학생 때도 따지 않던 자격증을 따기 시작했는데, 중학생 때 워드프로세서 1급을 딴 이후로 처음으로 공부해서 사회조사분석사 2급, 빅데이터분석 준전문가 자격증을 독학으로 취득했다. 작년 말에는 사회조사분석사 1급까지 합격을 했다. 어쩌다보니 자격증 수집가가 되어버렸...ㅎㅎ 회사를 위한 것은 아니고 개인욕심으로 시작한 경영학 박사공부를 시작해서 학위과정 중에 있다는 것도 데이터 큐레이터로서 나쁘지 않은 조건이었다. 또 대단한 실적은 아니었지만, 고인물을 넘어 썪은물 수준으로 일 할 수 있었던 통계 포지션의 업무가 지루해서 새로운 일거리를 만들면서 대내외적으로 평가가 좋은 것도 한 몫 하지 않았을까 싶다.

결국 입사 후 '데이터 큐레이션' 포지션으로 넘어가는 그때까지, 만 4년을 조금 넘은 시점이었는데, 이때까지 위에서 나열한 내 노력의 결과들이 다 모여서 데이터 큐레이터가 될 수 있었던 것 같다. 

 

'데이터 큐레이션'을 하기 위해 혼자 컴퓨터 앞에서 코딩하고 표 그래프를 뽑는 일도 많다. (Unsplash image)

3. 업무 연관

'데이터 큐레이터'로 불리기까지 했던 업무들을 보면 연관이 좀 있다. 음, 좀은 아니고 아주 밀접하게.ㅋㅋㅋ 일단 통계 업무를 하면서 실적취합 정리 보고의 반복이지만 주요 업무 중 하나는 그 통계를 잘 만들어서 다른사람에게 제공하는 것이 있었다. 정형화된 통계가 아니라면 사용자의 니즈에 맞게 표나 그래프를 적절하게 기준에 따라 바꾸는 것들도 하게 되고, 아주 많은 자료들을 보면서 가끔은 분석을 요청하는 일도 늘어갔다. 그래서 조언 수준을 넘어 '데이터 컨설팅'이라는 업무영역도 새로 정립해 나가면서 회사 안에서 계속 통계 그 이상의 업무들을 맡게 되었다. 이렇게 통계업무를 하기 위해 회사에 들어왔지만, 앞에서 언급했던 이유들과 함께 계속해서 관련된 업무를 넓혀나가면서 데이터 큐레이션과 관련된 업무 연관성도 점점 높여갔던 것 같다.


사실 이렇게 정리할 생각은 딱히 없었는데, 작년에 외부 강의를 나가서, 또 올해 신입직원 교육을 하면서 쉬는시간에 몇몇 사람이 진지하게 물어본 내용이 이런 것 관련이었다. 강의 내용은 아니었고...ㅋ 질문의 공통요소를 뽑아보면, "나는 전공이 통계나 데이터가 아닌데 이런 일을 할 수 있을까요?"였다. 질문을 듣고 나는 한치의 망설임도 없이 대답했다. 당연히 할 수 있다고. 그리고 내 전공도 통계나 데이터가 아니라고. 그래도 이런 일을 할 수 있는 자리가 있어야 할 것이고, 당장 없다면 여러가지 방면으로 노력한다면 충분히 할 수 있는 일이 '데이터 큐레이터' 아닐까 싶다. 기술직이 아니라면 사실 전공은 크게 중요한 게 아니라고 본다. 데이터라는 것은 요즘 정말 너무 많은 곳에서 사용되고 있어서 전공 분야 불문, 데이터가 쓰이지 않는 곳이 없다. 결국 해당 분야에서의 경험과 데이터 관련 지식이 결합된다면 앞으로 막강한 무기가 되지 않을까... 하는 게 내 생각이다.

 

반응형