머신러닝, 딥러닝, 데이터 분석 데이터셋 무료 사이트 모음

본 포스팅에서는 그동안 모아 왔던 무료 데이터셋 다운로드 사이트를 공유해보고자 합니다. 최근에 무료로 데이터셋을 다운로드할 수 있는 사이트가 많이 늘어나서 추가하였습니다.

 

데이터셋 무료 다운로드 사이트 목록

각 사이트의 성향과 목적에 따라 서로 다른 데이터셋을 제공하고 있습니다. 사이트를 국내와 해외로 분류하고, 간략히 소개하였습니다.

 

국내 데이터 셋 다운로드 사이트

국내의 데이터셋 다운로드 사이트 모음입니다.

 

추천 사이트

1. 공공데이터 포털

국내 대부분의 공공데이터에 접근할 수 있는 공공데이터 포털입니다. 자료의 양이 방대하여, 활용도가 무궁무진합니다.

https://www.data.go.kr/

 

2. K-ICT 빅데이터 센터

과기부와 한국지능정보사회진흥원에서 지원하는 K-ICT빅데이터센터 공식 홈페이지입니다. 각종 공공데이터와 민간데이터를 살펴볼 수 있습니다.

https://kbig.kr/portal/;jsessionid=937409988C7AE96A54CAEB5E47CD6EDE

 

3. 서울 열린데이터 광장

서울 시민을 위한 공공데이터 포털입니다. 서울시와 연계하여 실생활에 밀접한 데이터를 가져와서 사용할 수 있습니다.

https://data.seoul.go.kr/index.do

 

4. 데이터 스토어

각종 민간 데이터들을 무료 혹은 유료로 구매할 수 있는 데이터 잡화점입니다. 공공데이터로 부족한 부분을 무료 민간 데이터로 보완할 때 유용합니다.

https://www.datastore.or.kr/

 

5.AI허브

AI학습용 데이터를 분류하여 제공하는 사이트입니다. 음성/자연어, 비전, 헬스케어, 자율주행 등 유망한 분야에서 유용한 데이터셋들을 다운로드할 수 있습니다.

https://aihub.or.kr/

 

6. KT 통신 빅데이터 플랫폼

KT에서 제공하는 데이터 플랫폼입니다. 다양한 민간 데이터와 KT에서 제공하는 데이터를 활용할 수 있습니다.

https://www.bigdata-telecom.kr/invoke/SOKBP0000/?ver=3.0

 

7. 문화 빅데이터 플랫폼

문화에 관련된 다양한 데이터를 제공하는 플랫폼으로, 현재 1256여 개의 데이터를 제공하고 있습니다. 무료 공공데이터와 민간 데이터중에서도 유용한 데이터가 많습니다.

https://www.bigdata-culture.kr/bigdata/user/main.do

 

8. 국가통계포털

통계청에서 운영하는 국가통계포털입니다. 각종 통계자료를 열람 및 다운로드할 수 있습니다.

https://kosis.kr/index/index.do

 

9. 데이콘 (데이터 경진대회 플랫폼)

AI해커톤 플랫폼인 데이콘입니다. 각종 경진대회가 자주 열리고, 이전에 열렸던 대회의 데이터셋 및 분석 결과가 공유됩니다.

https://dacon.io/

 

 

이외의 데이터 제공 사이트

서울 연구 데이터 서비스

https://data.si.re.kr/

 

서울특별시 빅데이터 캠퍼스

https://bigdata.seoul.go.kr/data/selectPageListDataSet.do?r_id=P210

 

금융통계정보시스템

https://fisis.fss.or.kr/fss/fsiview/indexw.html

 

KRF 정보 데이터 시스템

http://data.krx.co.kr/contents/MDC/MAIN/main/index.cmd

 

한국은행 경제통계시스템

http://ecos.bok.or.kr/

 

국민건강보험 자료 공유 서비스

https://nhiss.nhis.or.kr/bd/ay/bdaya001iv.do

 

보건의료 빅데이터 개방 시스템

https://opendata.hira.or.kr/home.do#none

 

건강보험심사평가원

https://www.hira.or.kr/main.do

 

특허정보넷 키프리스

http://www.kipris.or.kr/khome/main.jsp

 

WISDOMAIN (선행조사 검색 도구)

https://www.wisdomain.com/Search/Workboard

 

WIPS ON (특허정보검색)

https://www.wipson.com/service/mai/main.wips

 

공동주택관리 정보시스템

http://www.k-apt.go.kr/

 

마이크로데이터 통합서비스

https://mdis.kostat.go.kr/index.do

 

 

 

 

 

해외 데이터 셋 다운로드 사이트

해외의 데이터셋 다운로드 사이트 모음입니다.

 

1. 구글 데이터셋 서치

https://datasetsearch.research.google.com/

구글에서 제공하는 데이터셋 검색엔진입니다. 전 세계 사이트에서 검색 결과를 가져오기 때문에, 가장 최신의 데이터를 간편하게 검색할 수 있습니다.

 

2. 월드뱅크 오픈데이터

월드뱅크에서 제공하는 오픈 데이터셋입니다. 각 국가별, 대륙별 인구통계학적 자료들에 접근이 가능합니다.

https://data.worldbank.org/

 

4. 월드뱅크 데이터 카탈로그

공공 및 민간 데이터를 검색할 수 있습니다. 총 5063여 개의 데이터셋이 존재합니다.

https://datacatalog.worldbank.org/home

 

3. ProPublica Data Store

NGO뉴스 단체에서 운영하는 데이터 스토어입니다. 유무료 자료들에 접근 가능합니다. 국내보다는 해외에 관련된 자료가 많습니다.

https://www.propublica.org/datastore/

 

4. Data USA

미국에 관련된 여러 가지 데이터들을 다운로드하거나 간단히 시각화하여 살펴볼 수 있습니다.

https://datausa.io/

 

5. 구글 AI 데이터셋

구글에서 제공하는 AI데이터셋입니다. 누구나 자유롭게 이용이 가능합니다.

https://ai.google/tools/#datasets

 

이외의 데이터 제공 사이트

캐글

https://www.kaggle.com/

 

KDnuggets

https://www.kdnuggets.com/datasets/index.html

 

DataScience Central

https://www.datasciencecentral.com/

 

UCI Machine Learning Repository

https://archive.ics.uci.edu/ml/index.php

 

Awesome Public Datasets

https://github.com/awesomedata/awesome-public-datasets

 

 

이렇게 무료 데이터셋 다운로드 사이트를 정리해보았습니다. 저도 개인 취업준비를 위해 데이터 분석을 위한 데이터셋을 찾아다녔었는데요, 이렇게 정리한 자료가 다른 분이 데이터를 활용한 프로젝트를 진행할 때에도 꼭 도움이 되셧으면 좋겠습니다.

 

프롬프트 엔지니어링 방법 / 예시 꿀팁 26가지

최근 프롬프트 엔지니어링 성능을 기하급수적으로 끌어올릴 수 있는 방법 26가지가 논문을 통해 발표되었습니다. 논문에서 주장하는 바에 따르면 소개하는 26가지 방법을 따르게 되면, 성능은 57

presentlife.tistory.com