본문 바로가기

전체 글36

[캐글] 처음 시작하는 캐글 - 타이타닉(1) 이 글은 이유한님의 글을 참고하며 스스로 공부를 위해 더 자세하게 작성한 글 입니다.(출처: 캐글 코리아 홈페이지의 이유한 님의 글)학습을 위해 글을 작성하다보니 코드 하나에 깊게 파고드는 경우가 있을 것 같습니다. 참고해주시면 감사하겠습니다. 타이타닉 코드의 초반부인 탐색적 데이터 확인을 진행 하고 있습니다.갈길이 아직 멀지만, 차근 차근 한걸음씩! 타이타닉과 Kaggle을 알아가보겠습니다 :-) 1. 탐색적 데이터 확인 1.2 Target Label 확인가장 중한 생존에 대한 분포를 확인하고, binary classification 문제의 경우 이 분포에 따라 모델의 평가 방법이 달라질 수 있다고 합니다.이 부분은 불러온 데이터를 활용하여 matplotlib.pyplot 모듈(패키지)을 사용한 pie.. 2024. 5. 24.
[캐글] 처음 시작하는 캐글 - 타이타닉 (0) 머신러닝이 무엇인지 맛 보려고 타이타닉을 진행해보았습니다.'타이타닉'은 영화로 가장 잘 알려져 있는데, 영화로 여러번 보았는데 여기서 만났습니다.찾아보니 1912년 4월 10일 영국의 사우샘프턴을 떠나 미국의 뉴욕으로 향하던 첫 항해 중에 4월 15일 빙산과 충돌하여 침몰하였다. 타이타닉이 완전히 침몰한 시간은 새벽 2시 20분이다. 타이타닉의 침몰로 1,514명이 사망한 사고 라고 알려져 있습니다. (위키백과) 처음에는 한개씩 따라 치기 시작했는데, 처음이다 보니 그저 읽고 따라치고 이해하려고 애쓰다보니 조금씩 읽히기 시작했다. 처음에는 데이터가 어떤 것이 있는지 살펴보는 것 위주로 진행했고, 여러 신기한 명령어들이 많았습니다. csv파일을 이런 저런 방식으로 차트를 만들면서 데이터를 이해하는 부분이 .. 2024. 5. 21.
[파이썬] Lambda 람다, map, reduce 함수, 일급객체 함수 1. lamda 함수한 줄만으로 익명의 함수를 만들 수 있음!(lambda 매개변수 : 리턴값)(인수) 타이타닉 캐글을 해보면서 이렇게 데이터를 전처리 하는 부분이 있어서 가져와 보았습니다.df_train['Fare'] = df_train['Fare'].map(lambda i: np.log(i) if i > 0 else 0) 의미는 df_train 데이터 셋에서 'Fare' 열의 데이터를 lambda함수를 사용하여 log를 취하는데 i가 0보다 큰 경우에만 로그를 씌우고, 그렇지 않으면 0으로 처리하는 부분 입니다.  2. map 함수특별한 처리를 할 때 사용하는 함수map(적용시킬 함수, 적용할 값들)# 표현 방식map(함수, 리스트 or 튜플)  3. filter함수함수를 통과시킬 때 사용하는 .. 2024. 5. 21.
[파이썬] 코딩도장 이터레이터 문제 (39.6 - 39.7) 이터레이터가 감이 잡히지 않아, JUNG퍼실님께 코딩도장을 추천 받아 방문하였는데처음에는 아예 감도 잡히지 않았지만, 이론을 먼저 학습하고 이터레이터를 클래스로 구현해보면서 감을 잡기 좋았습니다!코딩도장 파이썬 100제도 시간날때마다 조금씩 풀었더니 레벨도 4로 올라가더군요. 39.6 연습문제: 배수 이터레이터 만들기 코드# class 정의class MultipleIterator: # 초기화 def __init__(self, stop, multiple): self.current = 0 # 현재 숫자 유지, 0부터 지정된 숫자 직전까지 반복 self.stop = stop # 반복을 끝낼 숫자 self.multiple = multiple # __iter_.. 2024. 5. 20.
[파이썬] 이터레이터, 제너레이터, 데코레이터 이터레이터, 제너레이터, 데코레이터 이름이 비슷해서 헷갈려 내가 보려고 정리하는 글 입니당. 특징 및 차이점  1. 이터레이터  2. 제너레이터  3. 데코레이터 사용법  1. 이터레이터  2. 제너레이터  3. 데코레이터 특징 및 차이점 이터레이터이터레이터는 여러번 사용 가능 반복 가능한 객체를 다루는 데 사용되는 개념'next()' 메서드를 사용하여 다음 요소로 이동  next() 메서드를 통해 모든 요소를 다 진행했을 때 StopIteration' 예외를 발생 이터레이터는 필요할 때만 메모리를 사용하여 메모리 효율에 좋은 장점제너레이터제너레이터는 이터레이터를 생성해주는 함수return 대신 yield 사용모든 함수를 한꺼번에 실행하는 것이 아닌 필요할 때만 실행하는 방식(느긋한 계산법, lazy .. 2024. 5. 20.
[파이썬] 리스트, 튜플, 집합, 딕셔너리 오늘도 리스트 투플 집합을 정리하면서 포스팅을 해보려고 합니다. 리스트, 튜플, 집합은 모두 파이썬에서 사용하는 자료형 입니다. 리스트 특징생김새는 이렇게 생겼습니다. (대괄호 [ ] 를 사용합니다.)list1 = [1, 2, 3]list2 = ['a', 'b', 'c']순서가 있습니다. 리스트 인덱싱 및 슬라이싱이 가능합니다.리스트끼리 수정이 가능합니다. (리스트 = 리스트 + 튜플은 불가능)+기호는 리스트를 합칩니다. ex) list1+list2*기호는 리스트를 반복합니다. ex) list*2del 키워드로 원소 삭제 가능 ex) del list2[1:3] 튜플생김새는 괄호() 기호를 사용하며, 생략도 가능합니다.tuple = 1, 2, 3tuple2 = (4, 5, 6)순서가 있습니다.튜플만 수정이.. 2024. 5. 16.