[머신러닝] 이미지 데이터를 분석해보자(feat. RGB, 인코딩)
Sagment Anything 2를 사용해서 이미지를 분리하는데, 채널이 3개가 아니라며 에러가 떴었습니다.그 원인을 확인해보니 이미지의 채널이 4개였던 것. 그 사진은 이렇게 생겼습니다. (영화광고 아님🤣)저번 주에 파일럿이라는 영화를 보고 조정석이 너무 웃겨서 이 사진으로 세그멘트를 해줘야겠다고 판단.그런데 에러가 발생했습니다. 결론부터 말씀드리자면, 보통 이미지는 3개의 channel (R,G,B) 의 채널을 갖는데, 위의 사진은 (RGBA)였던 것이었습니다.그래서 이참에 RGB는 무엇이고, RGBA는 무엇인지, 인코딩 디코딩은 무엇이고, 도대체 데이터 구조가 어떻게 생겼는지 세세하게 관찰해보기로 결심하였습니다. 목차 1. 이미지 데이터의 형태2. RGB?, RGBA?3. 파이썬으로 RGB..
2024. 8. 20.