메뉴 건너뛰기

close

데이터 과학자, 분석가, 저널리스트가 갖춰야하는 기본기술을 5개 영역으로 나눠 정리한 오픈 콘텐츠
▲ 데이터 과학을 지탱하는 기본기 데이터 과학자, 분석가, 저널리스트가 갖춰야하는 기본기술을 5개 영역으로 나눠 정리한 오픈 콘텐츠
ⓒ 이광춘

관련사진보기

 
디지털 불평등 해소와 데이터 민주화를 기치로 내건 비영리법인 '한국 알(R) 사용자회'는 데이터 저널리스트에게도 희소식이 될 수 있는 데이터 사이언스 콘텐츠 2종을 인터넷에 공개했다. 

먼저 공개된 전자책은 "데이터 시각화"를 체계적으로 정리한 것이다. 시각화가 필요한 이유부터 데이터 시각화 기본 구성요소는 물론 거의 모든 데이터 시각화 시스템이 채택하고 있는 그래프 문법(Grammar of Graphics) 체계를 상세히 소개하고 있다. 또, 데이터 저널리스트를 위한 시각화 패턴과 실제 사례를 들어 코드는 물론 실제 데이터 그래프를 제작하는 데 필요한 데이터도 함께 GitHub 저장소에 공개하고 있다.

두 번째 전자책은 "데이터 과학을 지탱하는 기본기" 명칭으로 5월 14일 인터넷에 공개되었다. 21세기 석유로 불리는 데이터를 자원으로 다양한 경제적 가치를 추구하고자 하는 산업계 종사자뿐만 아니라 데이터 사이언스를 통해 과학기술을 한단계 높이는 데 진력하시는 이들에게도 큰 힘이 될 것으로 보인다.

특히 데이터 사이언스를 지탱하는 기본기에 해당되는 자동화 도구 유닉스 쉘, 시간여행 도구 Git, 공유와 협업 도구 GitHub, 프로그래밍 언어 R, 데이터 관리 도구 SQL, 작업흐름 자동화 도구 Make를 선정하여 개념뿐만 아니라 현재 가장 인기를 얻고 있는 도구를 실제 코드와 함께 소개하고 있다.

지난 4월 "설치형 오픈 통계 패키지 - Rcmdr"에 이어 "데이터 시각화"와 "데이터 과학을 지탱하는 기본기" 추가로 오픈 콘텐츠 2종을 공개한 한국 알 사용자회는 오픈 무료 콘텐츠가 "싼 게 비지떡"이라는 오해와 편견을 벗고 싶다고 견해도 함께 전했다.

과거 디지털 전환이 일어나기 전에 저렴한 상품이나 제품은 품질이 낮고 내구성이 떨어지는 것이 사실이었다. 디지털 전환이 급속히 진전되고 있는 지금은 오히려 무료 오픈 콘텐츠나 소프트웨어 질이 상용 콘텐츠보다 훨씬 더 좋은 경우도 있다. 

수십 년 동안 수많은 개발자분들과 기여자분들이 열정을 가지고 업그레이드 하고 조금씩 품질을 높여나가면서 관심을 갖고 살아남은 콘텐츠는 한두 명이 저작한 콘텐츠와 비교 자체가 불가능할 정도로 완성도와 깊이가 있기도 하다. 

한국 알 사용자회는 향후 커뮤니티 개발자분들과 함께 지속적으로 콘텐츠 품질향상을 노력함은 물론이고 통계 대중화와 디지털 불평등 해소를 위해 6월 공개될 "오픈 통계 패키지" 소프트웨어에 대한 전자책도 개발하여 공개할 예정이라고 밝혔다.

덧붙이는 글 | 한국 알 사용자회에서 공개한 오픈 콘텐츠는 시민 참여형으로 집단지성으로 함께 만들어나가고 있습니다. 참여를 원하는 분은 누구나 GitHub 저장소를 통해 기여와 협업이 가능합니다. "데이터 과학을 지탱하는 기본기- https://github.com/bit2r/book_analytics", "데이터 시각화 - https://github.com/bit2r/book_viz", "설치형 오픈통계 패키지 - https://github.com/bit2r/Rcmdr"


태그:#데이터 저널리즘, #오픈 콘텐츠, #데이터 시각화, #데이터 과학을 지탱하는 기본기, #한국 알 사용자회
댓글
이 기사가 마음에 드시나요? 좋은기사 원고료로 응원하세요
원고료로 응원하기

[챗GPT 데이터 사이언스] 데이터로 세상을 바라봅니다. 공공오픈 데이터를 분석하여 세상을 바라보는 새로운 시각을 제공하고자 합니다.




독자의견

연도별 콘텐츠 보기