2021년 8월 8일 일요일

AI hub에 있는 음식 사진

 

한국정보화진흥원에서 의욕적으로 백여개의 인공지능 학습용 데이터를 AI-hub site (https://aihub.or.kr/)에 오픈했습니다.  완전 공개는 올 6월 즈음인 것 같고 아무런 제한 없이 누구든 다운로드 가능합니다.

 

이 중에 헬스케어 분류 중에 건강관리를 위한 음식 이미지를 다운로드해보았습니다.  전체 크기는 700GB가 좀 넘습니다.

 


 

20여개의 zip 파일로 나누어져 있는데 1,167개 음식 종류의 음식 사진이 담거져 있다고 하는데 실제로 모두 풀어서 보면 500여 종 밖에 안됩니다.  음식 이름으로 된 디렉토리 별로 해당 jpg 파일이 들어 있습니다.  각 디렉토리에는 있는 파일의 개수는 다릅니다. 적게는 수백에서 수천까지 jpg 파일이 있습니다.  

 

신경망으로 학습도 시킬 예정이라 적어도 2000개 이하는 제외했는데 그래도 358 종의 음식 사진이고 총 1,996,738장입니다.



가리비 디렉토리에 있는 사진의 heightwidth를 살펴 보았습니다.  대부분 세로 사진이 많는데 크기가 일정하지 않고 가리비가 있는 것이 아니라 접시, 배경 등이 있어 학습 및 인식에 어려움을 줄 것으로 보입니다.





 

댓글 없음:

댓글 쓰기