본문 바로가기

전체 글36

[머신러닝] 미세조정(Fine-tuning)을 하는 이유 & 방법 LLM과 파인튜닝: 실전 경험과 구현하기안녕하세요! 오늘은 제가 개인 프로젝트에서 경험한 LLM(Large Language Model)과 파인튜닝에 대한 이야기를 나누려고 합니다. 최근 폭발적으로 성장하는 AI 기술 중에서도 가장 뜨거운 분야인 만큼, 실제 적용 사례와 함께 자세히 살펴보도록 하겠습니다.💡 LLM이란?LLM은 수천억 개의 매개변수(주로 Billion 단위)를 가진 거대 언어 모델입니다. 이 모델들은 인터넷에 있는 방대한 텍스트 데이터로 학습되어 마치 인간의 언어를 이해하는 것처럼 보입니다.LLM의 실제 작동 원리흥미로운 점은, LLM이 우리가 생각하는 것처럼 실제로 언어를 '이해'하는 것은 아니라는 점입니다. 대신 self-attention이라는 핵심 기술을 사용해 주어진 문맥을 바탕으.. 2024. 11. 6.
[기획] 무언가를 만들 때, 직관적으로 만들 수도 있다.직관적인 생각대로 만들다보면 그 생각이 처음에는 정말 좋은 것이었는지도 모른다.그런데 그것이 계속해서 정말 좋은 것으로 유지되지는 않는다.좋은 생각이 들었다고 하더라도 그것을 어떻게 구현하는지는 계획과 체계적인 전략이 필요하다. 예를들어 한국의 학생들이 직업을 찾는 것이 어렵다고 한다. 그러면 그런 하는 일을 열거하기보다 어떤 직업에 어떤 가치가 있는지. 그 직업에서 무엇을 느끼고, 어떤 부분에서 성장해 나아갈 수 있는지가 중요하다. 어떤 보람을 느낄 수 있는지, 어떤 직업의 가치를 느낄 수 있는지, 어떤 것을 잘 해야하는지, 자신이 어떤 부분을 좋아하면 그것을 해야하는지 등을 고민해야하는데, 그런 것을 나타내주는 뭔가가 없다. 구인공고 사이트에는 그저 할일.. 2024. 9. 27.
[리눅스] WSL2에서 설치한 우분투 조회 및 삭제 안녕하세요. 이번에 24.04를 새로 하나 더 설치했는데, 조회해보니 기존에 설치되었던 22.04버전이 있어서 삭제를 해보려고 합니다. 먼저, Power Shell 을 엽니다.그리고 조회 명령어를 입력합니다.wsl --list --verbose# 결과 NAME STATE VERSION* Ubuntu-24.04 Running 2 Ubuntu-24.04-New Stopped 2 Ubuntu Stopped 2 이 명령어로 삭제할 경우, 하드에서도 완전히 삭제가 되니, 신중하게 삭제를 해주세요.wsl --unregister Ubuntu등록 취소 중입니다.작업을 완료했습니다. 다시.. 2024. 8. 24.
[리눅스] 쫄지말자! conda 가상환경 만들기 안녕하세요. 오늘은 가상환경만드는 방법을 포스팅 해보려고 합니다.CUDA GPU 가속 + 윈도우를 사용하다보면 결국에는 WSL을 사용하여 가속하지 않을 수가 없게되는데,파이썬으로 머신러닝을 하다보면 결국 버전문제와 마주하지 않을 수가 없습니다. 오늘은 리눅스에서 conda를 통해 가상환경을 만드는 방법을 정리해보려고 합니다.사실은 내가 쫄았었다고한다.. 가상환경 만들기# 가상환경 만들기 에 넣고싶은 이름을 넣어주세요. 예) myenv# 버전을 변경할 수 있습니다. (새로 설치함)conda create --name python=3.9 만든 가상환경 활성화하기# 만든 가상환경으로 설정합니다. 예) conda activate myenvconda activate # 비활성화 하는방법conda deactivat.. 2024. 8. 23.
[머신러닝] 이미지 데이터를 분석해보자(feat. RGB, 인코딩) Sagment Anything 2를 사용해서 이미지를 분리하는데, 채널이 3개가 아니라며 에러가 떴었습니다.그 원인을 확인해보니 이미지의 채널이 4개였던 것. 그 사진은 이렇게 생겼습니다. (영화광고 아님🤣)저번 주에 파일럿이라는 영화를 보고 조정석이 너무 웃겨서 이 사진으로 세그멘트를 해줘야겠다고 판단.그런데 에러가 발생했습니다.   결론부터 말씀드리자면, 보통 이미지는 3개의 channel (R,G,B) 의 채널을 갖는데, 위의 사진은 (RGBA)였던 것이었습니다.그래서 이참에 RGB는 무엇이고, RGBA는 무엇인지, 인코딩 디코딩은 무엇이고, 도대체 데이터 구조가 어떻게 생겼는지 세세하게 관찰해보기로 결심하였습니다.   목차 1. 이미지 데이터의 형태2. RGB?, RGBA?3. 파이썬으로 RGB.. 2024. 8. 20.
[배움기록] Segment-Anything-2 사용기 아이펠 수업 중 META에서 세그먼트 애니띵이라는 모델이 나왔다는 사실을 알게되어 튜토리얼을 보게 되었는데 너무 신기하고, 어마어마해서 돌려보기로했습니다. 정말 무엇이든지 다 segment 해버립니다. 예제에는 3가지 [ image predictor, video predictor, mask generator ] 예제가 있고, 사용방법은 간단합니다. https://github.com/facebookresearch/segment-anything-2 깃허브 주소에서 시키는대로 하면되는데 cpu로 이미지 한장 분리하는데 5분이 걸려서 결국 미루어왔던 WSL GPU 세팅을 하기로 마음먹고, 덕분에 주말을 사용해서 램16기가를 추가하고, 용량도 넉넉히 NVME SSD를 구입했습니다.. 😂 이녀석 덕분에 PC를 업.. 2024. 8. 20.