한국정보화진흥원에서 의욕적으로 백여개의
인공지능 학습용 데이터를 AI-hub site (https://aihub.or.kr/)에
오픈했습니다. 완전 공개는 올
6월 즈음인 것 같고 아무런 제한 없이 누구든 다운로드 가능합니다.
이 중에 헬스케어 분류 중에 건강관리를
위한 음식 이미지를 다운로드해보았습니다. 전체
크기는 700GB가 좀 넘습니다.
약 20여개의 zip 파일로 나누어져 있는데 1,167개 음식 종류의 음식 사진이 담거져 있다고 하는데 실제로 모두 풀어서 보면 500여 종 밖에 안됩니다. 음식 이름으로 된 디렉토리 별로 해당 jpg
파일이 들어 있습니다. 각
디렉토리에는 있는 파일의 개수는 다릅니다. 적게는 수백에서 수천까지
jpg 파일이 있습니다.
신경망으로 학습도 시킬 예정이라
적어도 2000개 이하는 제외했는데 그래도 358 종의 음식
사진이고 총 1,996,738장입니다.
가리비 디렉토리에 있는 사진의 height와 width를 살펴 보았습니다. 대부분 세로 사진이 많는데 크기가 일정하지
않고 가리비가 있는 것이 아니라 접시, 배경 등이 있어 학습 및 인식에 어려움을 줄 것으로 보입니다.
댓글 없음:
댓글 쓰기