본 포스팅에서는 그동안 모아 왔던 무료 데이터셋 다운로드 사이트를 공유해보고자 합니다. 최근에 무료로 데이터셋을 다운로드할 수 있는 사이트가 많이 늘어나서 추가하였습니다.
데이터셋 무료 다운로드 사이트 목록
각 사이트의 성향과 목적에 따라 서로 다른 데이터셋을 제공하고 있습니다. 사이트를 국내와 해외로 분류하고, 간략히 소개하였습니다.
국내 데이터 셋 다운로드 사이트
국내의 데이터셋 다운로드 사이트 모음입니다.
추천 사이트
1. 공공데이터 포털
국내 대부분의 공공데이터에 접근할 수 있는 공공데이터 포털입니다. 자료의 양이 방대하여, 활용도가 무궁무진합니다.
2. K-ICT 빅데이터 센터
과기부와 한국지능정보사회진흥원에서 지원하는 K-ICT빅데이터센터 공식 홈페이지입니다. 각종 공공데이터와 민간데이터를 살펴볼 수 있습니다.
https://kbig.kr/portal/;jsessionid=937409988C7AE96A54CAEB5E47CD6EDE
3. 서울 열린데이터 광장
서울 시민을 위한 공공데이터 포털입니다. 서울시와 연계하여 실생활에 밀접한 데이터를 가져와서 사용할 수 있습니다.
https://data.seoul.go.kr/index.do
4. 데이터 스토어
각종 민간 데이터들을 무료 혹은 유료로 구매할 수 있는 데이터 잡화점입니다. 공공데이터로 부족한 부분을 무료 민간 데이터로 보완할 때 유용합니다.
5.AI허브
AI학습용 데이터를 분류하여 제공하는 사이트입니다. 음성/자연어, 비전, 헬스케어, 자율주행 등 유망한 분야에서 유용한 데이터셋들을 다운로드할 수 있습니다.
6. KT 통신 빅데이터 플랫폼
KT에서 제공하는 데이터 플랫폼입니다. 다양한 민간 데이터와 KT에서 제공하는 데이터를 활용할 수 있습니다.
https://www.bigdata-telecom.kr/invoke/SOKBP0000/?ver=3.0
7. 문화 빅데이터 플랫폼
문화에 관련된 다양한 데이터를 제공하는 플랫폼으로, 현재 1256여 개의 데이터를 제공하고 있습니다. 무료 공공데이터와 민간 데이터중에서도 유용한 데이터가 많습니다.
https://www.bigdata-culture.kr/bigdata/user/main.do
8. 국가통계포털
통계청에서 운영하는 국가통계포털입니다. 각종 통계자료를 열람 및 다운로드할 수 있습니다.
https://kosis.kr/index/index.do
9. 데이콘 (데이터 경진대회 플랫폼)
AI해커톤 플랫폼인 데이콘입니다. 각종 경진대회가 자주 열리고, 이전에 열렸던 대회의 데이터셋 및 분석 결과가 공유됩니다.
이외의 데이터 제공 사이트
서울 연구 데이터 서비스
서울특별시 빅데이터 캠퍼스
https://bigdata.seoul.go.kr/data/selectPageListDataSet.do?r_id=P210
금융통계정보시스템
https://fisis.fss.or.kr/fss/fsiview/indexw.html
KRF 정보 데이터 시스템
http://data.krx.co.kr/contents/MDC/MAIN/main/index.cmd
한국은행 경제통계시스템
국민건강보험 자료 공유 서비스
https://nhiss.nhis.or.kr/bd/ay/bdaya001iv.do
보건의료 빅데이터 개방 시스템
https://opendata.hira.or.kr/home.do#none
건강보험심사평가원
https://www.hira.or.kr/main.do
특허정보넷 키프리스
http://www.kipris.or.kr/khome/main.jsp
WISDOMAIN (선행조사 검색 도구)
https://www.wisdomain.com/Search/Workboard
WIPS ON (특허정보검색)
https://www.wipson.com/service/mai/main.wips
공동주택관리 정보시스템
마이크로데이터 통합서비스
https://mdis.kostat.go.kr/index.do
해외 데이터 셋 다운로드 사이트
해외의 데이터셋 다운로드 사이트 모음입니다.
1. 구글 데이터셋 서치
https://datasetsearch.research.google.com/
구글에서 제공하는 데이터셋 검색엔진입니다. 전 세계 사이트에서 검색 결과를 가져오기 때문에, 가장 최신의 데이터를 간편하게 검색할 수 있습니다.
2. 월드뱅크 오픈데이터
월드뱅크에서 제공하는 오픈 데이터셋입니다. 각 국가별, 대륙별 인구통계학적 자료들에 접근이 가능합니다.
4. 월드뱅크 데이터 카탈로그
공공 및 민간 데이터를 검색할 수 있습니다. 총 5063여 개의 데이터셋이 존재합니다.
https://datacatalog.worldbank.org/home
3. ProPublica Data Store
NGO뉴스 단체에서 운영하는 데이터 스토어입니다. 유무료 자료들에 접근 가능합니다. 국내보다는 해외에 관련된 자료가 많습니다.
https://www.propublica.org/datastore/
4. Data USA
미국에 관련된 여러 가지 데이터들을 다운로드하거나 간단히 시각화하여 살펴볼 수 있습니다.
5. 구글 AI 데이터셋
구글에서 제공하는 AI데이터셋입니다. 누구나 자유롭게 이용이 가능합니다.
https://ai.google/tools/#datasets
이외의 데이터 제공 사이트
캐글
KDnuggets
https://www.kdnuggets.com/datasets/index.html
DataScience Central
https://www.datasciencecentral.com/
UCI Machine Learning Repository
https://archive.ics.uci.edu/ml/index.php
Awesome Public Datasets
https://github.com/awesomedata/awesome-public-datasets
이렇게 무료 데이터셋 다운로드 사이트를 정리해보았습니다. 저도 개인 취업준비를 위해 데이터 분석을 위한 데이터셋을 찾아다녔었는데요, 이렇게 정리한 자료가 다른 분이 데이터를 활용한 프로젝트를 진행할 때에도 꼭 도움이 되셧으면 좋겠습니다.