데이터 과학자 및 분석가를 위한 7가지 데이터 경연 대회

데이터 시각화 경연 대회에서 데이터 과학, 데이터 시각화 등 광범위한 분야에 걸쳐 여러분의 기술을 직접 테스트해 보십시오.

데이터 경연 대회는 많은 기능을 합니다. 모범 사례를 배우고, 작업에 대한 피드백을 받고, 기술을 향상할 수 있는 훌륭한 기회입니다. 또한 문제에 대한 솔루션을 크우드소싱하여 다양한 아이디어를 얻는 방법이 되기도 합니다.

어떤 기능을 목표로 하든, 데이터 경연 대회는 다양한 데이터 관련 분야에 종사하는 최고의 인재들 사이에서 자신의 한계를 넘어서고 창의성을 키우는 기회입니다.

데이터 시각화에서 데이터 과학에 걸쳐 여러분이 도전해 볼 만한 다양한 데이터 경연 대회를 소개합니다.

Iron Viz

웹 사이트: tableau.com/ko-kr/iron-viz
주최: Tableau

매년 Tableau Public은 최고의 비주얼리제이션 대회인 Iron Viz의 준비 과정으로 여러 데이터 시각화 콘테스트를 주최합니다. 이 가상 ‘예선’ 콘테스트는 연중 개최되며, 각 예선마다 데이터 시각화 기술을 부각시킬 특정 주제가 주어집니다. 이 콘테스트의 각 우승자는 Tableau Conference 또는 Tableau Conference Europe에서 열리는 최종 결선에서 17,000명의 청중 앞에서 실시간으로 경쟁을 벌이게 됩니다. 최종 결선에서는 세 명의 콘테스트 우승자가 같은 데이터 집합을 사용하여 데이터 시각화를 생성하여 겨루게 됩니다.

Iron Viz 참가자는 비주얼리제이션의 전반적인 디자인, 비주얼리제이션 및 데이터가 스토리를 얼마나 잘 표현하는지, 데이터 및 결과에 대한 분석이 얼마나 심도 있는지 등 몇 가지 기준으로 심사를 받게 됩니다. 우승 여부를 떠나서, Iron Viz 콘테스트는 분석 업계에 진출하고 업계의 동료 및 전문가들로부터 피드백을 받을 수 있는 좋은 기회가 될 것입니다.

Kaggle Competitions

웹 사이트: kaggle.com/competitions
주최: Kaggle

Kaggle은 데이터 경연 대회 목록에서 빼놓을 수 없는 대회입니다. Kaggle은 데이터 과학 경연 대회에서 가장 잘 알려진 플랫폼 중 하나입니다. 이 사이트는 현재의 명성을 얻게 해준 기계 학습 경연으로 시작되었습니다. Kaggle 경연 대회에는 꾸준히 수천 명에 이르는 참가자들이 팀 또는 개인 자격으로 매력적인 상품을 놓고 경쟁을 벌입니다.

이 대회는 복잡한 문제를 제시하고, 참가자들이 그 문제를 해결할 최고의 알고리즘을 고안해내는 것을 특징으로 합니다. 상품은 지적인 만족감에서부터 '기념품', 금전적 보상에 이르기까지 다양합니다. 대부분의 금전적인 보상은 몇 만 달러 범위 내이지만 10만 달러를 넘는 상금도 있었습니다. 지금까지 최고의 단일 상금은 1백만 달러로, 부동산 회사인 Zillow의 주택 가격을 예측하는 'Zestimate' 벤치마크 모델을 뛰어넘는 1위 작품에 수여되었습니다. Kaggle은 여러 조직을 위한 경연 대회를 개최했을 뿐만 아니라, 과학을 통해 더 나은 사회를 만들고자 매년 Data Science Bowl 경연 대회도 개최하고 있습니다.

Kantar Information is Beautiful Awards

웹 사이트: informationisbeautifulawards.com
주최: Information is Beautiful과 Kantar

어떤 식으로든 데이터 시각화를 접해 보았다면, 시각적 디자인이 정보의 전송을 어떻게 증대시키는지 보여주는 David McCandless의 사이트, 'Information Is Beautiful'에 대해 들어봤을 것입니다. 이 사이트에서는 또한 가장 뛰어나고 창의적인 데이터 시각화에 대한 사람들의 관심을 끌기 위해 Information is Beautiful Awards를 수여하고 있습니다.

이 상은 매년, 데이터를 얼마나 잘 배열하는지, 주제에 맞게 얼마나 잘 정보를 강조하고 인사이트를 끌어내는지를 평가하여 데이터를 가장 탁월하게 예술적으로 변환시키는 사람에게 수여되고 있습니다. 이 콘테스트는 Information is Beautiful Awards 시상식으로 대미를 장식하는데, 전체 참가자 목록은 사이트에 소개되며, 수상자로 선정된 참가자들은 연말 시상식에 참석합니다. 2018년 시상식에서 선정된 참가자들은 자신의 비주얼리제이션이 식장의 쿠키에 새겨진 것을 보았습니다.

자신의 쿠키를 갖는 영광에서 수천 달러에 이르는 상금으로, 데이터 경연 대회는 최고의 인재들을 가려내고 있습니다. 쉬운 과제부터 시작하더라도, 데이터 경연 대회는 자신의 전문성의 수준에 상관없이 기술을 연마할 수 있는 좋은 방법입니다.

Driven Data Competitions

웹 사이트: drivendata.org/competitions
주최: Driven Data

Kaggle과 마찬가지로 Driven Data 역시 어려운 예측 문제에 대한 솔루션을 크라우드소싱할 목적으로 데이터 과학 경연 대회를 열고 있습니다. 이들은 통계 모델을 구축함으로써 예측을 돕고 이 세상의 외면할 수 없는 사회 문제를 해결하고자 노력하고 있습니다. 비록 그 규모는 Kaggle만큼 크지는 않지만 Driven Data는 우리 사회에 실질적인 영향을 미치는 문제들을 해결하는 데 주력함으로써 인간과 자연 모두를 이롭게 합니다. 그 중 특히 이목을 끄는 경연 대회로는 AARP Foundation이 후원하는 고령자의 신체적인 안전을 예측하기 위한 경연 대회와 동영상을 통해 물고기 크기를 측정하고 그 수를 세어서 지속 가능한 어업을 지원하기 위한 경연 대회(The Nature Conservancy and Gulf of Maine Research Institute가 후원)가 있습니다.

참가자들은 현재 데이터의 실제 값을 기준점로 삼아 비교함으로써, 문제 해결을 위해 데이터를 얼마나 잘 예측할 수 있는가에 입각하여 평가됩니다. 우승한 모델은 목표를 더 잘 개선할 목적으로 주최측 조직에 통합됩니다. 어떤 경연 대회는 자부심을 가질 권리를, 어떤 경연 대회는 금전적인 보상을 제공하지만, 모두 세상에 영향력을 발휘한다는 공통점이 있습니다.

CrowdANALYTIX Community

웹 사이트: crowdanalytix.com/community
주최: CrowdANALYTIX

CrowdANALYTIX도 역시 데이터 모델링 경연 대회를 여는데, 기계 학습, 인공 지능, 딥러닝, 자연어 처리를 주요 분야로 다룹니다. 이 경연 대회는 격식을 차리는 대회는 아니지만, 결코 보상이 적지는 않습니다. 여기에서 언급한 다른 경연 대회와 마찬가지로, 어떤 경연은 순수하게 학습을 목적으로 하고 어떤 경연에는 상금이 걸려 있습니다.

이 플랫폼은 두 가지 '계층'으로 구성되어 있는데, 하나는 봇이라는 컴퓨터 계층이고 다른 하나는 이러한 봇과 알고리즘을 구축하는 데이터 과학자들이라는 인간 계층입니다. 이 경연 대회의 데이터 경연작들은 다른 대회와 달리 일관적인 반복을 위해 일종의 진행 중인 작업으로 간주됩니다. 우승을 차지하는 알고리즘은 CrowdANALYTIX의 데이터베이스로 이동된 다음 세부 조정을 위해 모니터링됩니다. 이 알고리즘의 성능이 저하되기 시작하면 커뮤니티로 다시 반환되어 조정되거나 다시 구축됩니다.

Coda Lab Competitions

웹 사이트: competitions.codalab.org
주최: Coda Lab

Coda Lab은 전산 연구를 위한 오픈 소스 플랫폼입니다. 본 경연 대회는 공동 연구 및 코드 테스트를 위해 개최됩니다. 권위있는 상을 수여하지는 않지만, 함께 협력하여 보다 효율적이고 재생산 가능한 코드를 생성한다는 의의가 있습니다. Coda Lab은 데이터의 프로그래밍 및 코드 구축에 중점을 두고 있으며, 공동 프로젝트 및 과제 진행 경험을 쌓는 좋은 방법이 될 수 있습니다.

Topcoder Open

웹 사이트: tco19.topcoder.com
주최: Topcoder

Topcoder는 코드 테스팅과 연구를 함께 진행하는 공동의 노력이라는 점에서 Coda Lab과 유사합니다. 메인 사이트에 데이터 과학에서부터 코딩, 웹 디자인에 이르는 광범위한 도전 과제와 경연 대회를 제시하고 있습니다. 많은 경우에 상당한 상품을 제공하지만 어떤 경연은 순수하게 도전하는 데 의미를 둡니다.

가장 중요한 경연은 매년 열리는 '최고의 프로그래밍 및 디자인 토너먼트'라고 하는 Topcoder Open입니다. 알고리즘, 개발, UI 디자인, 품질 보증과 같은 다양한 경쟁 항목으로 구성되어 있습니다. 첫 경연은 온라인으로 열리며, 여기서 우승자들은 점수에 따라 추가적인 상품을 받고, 미국에서 열리는 TCO 결승전에 초대됩니다. TCO는 더 많은 사람들이 경연에 참가할 수 있도록 더 작은 규모의 지역 이벤트도 개최하고 있습니다. 이러한 이벤트의 기간은 1~2일에 불과하지만 더 많은 나라에 기회를 제공합니다.

먼저 Tableau Public에서 무료로 계정을 만들고 리소스 페이지에 게시되어 있는 데이터 집합 중 하나를 사용하여 직접 데이터 시각화를 만들어보십시오.

팁: 연습이 필요하시다면, Makeover Monday를 시도해 보십시오. 일요일마다 새로운 데이터 집합이 게시되며, 전 세계 사람들이 데이터 시각화를 만들어서 그 주 수요일에 웹 세미나를 통해 이에 대해 토론하는 곳입니다.