본문 바로가기
Machine Learning/News

정부, 구글의 데이터셋 공개 및 검색 플렛폼

by Physicist 2022. 11. 12.


AI허브·통합 데이터지도…공짜 데이터 도구 많네
https://n.news.naver.com/article/015/0004771494?sid=105

https://www.aihub.or.kr/
국내에선 정부가 구축해 운영 중인 AI 인프라 통합 플랫폼 ‘AI허브’의 규모가 가장 크다. 작년엔 공개 데이터 수가 약 5억 건이었지만 1년 만에 규모가 두 배 이상으로 늘었다. 지난 7월 기준 한국어·영상 이미지·헬스케어 등 381종에 걸쳐 데이터 약 11억 건을 공개하고 있다.

https://www.bigdata-map.kr/
무슨 데이터를 어디서 얻어야 할지 감이 잡히지 않는다면 ‘통합데이터 지도’를 활용할 수 있다. AI허브를 비롯해 국내 16대 빅데이터 플랫폼 등에 퍼져 있는 데이터를 검색할 수 있는 플랫폼이다. 데이터셋 분석 사례도 공개해 특정 모델에 필요한 데이터를 제시한다.

https://datasetsearch.research.google.com/
글로벌 정보기술(IT)기업 구글도 ‘데이터셋 검색’을 지원한다. 사전에 공유된 데이터셋 중 약 2500만 개를 미리 분류해 간단한 키워드만으로도 검색할 수 있게 했다. 

https://www.kaggle.com/datasets
구글의 AI 경진대회 플랫폼 ‘캐글’도 데이터 검색 기능을 지원한다.