스파르타
-
2/2스파르타/TIP 2024. 2. 5. 09:10
과제를 해결해 나가면서 드는 의문이 생겼다. 우리가 성별인 컬럼 Sex에 대한 인코딩을 진행하려고 하는데 반복되는 코딩에 대해 함수로 만들어서 처리를 하려고 했다. y_train과 y_test 데이터에 들어있는 'y'라는 컬럼에 문자열을 받아 no면 0을 yes면 1을 반환하는 함수를 짜려고 하는데 if문을 통해서 간단히 만들수 있었다. 하지만 나의 생각은 함수안에 labelencoder를 써서 자동으로 인코딩을 만들고 싶어서 fit_transform을 썼는데 계속 오류가 나서 문제를 해결하지 못하였다.. :( fit_transform에는 1차원 배열이 와야했고 그래서 배열을 씌운 x값을 받으면 오류가 나고 그렇다고 시리즈 형태로 넣자니 또 다른 오류가 발생하는 문제... 그렇게 오늘은 오류와 함께 밤을..
-
2/1스파르타/TIL(Today I Learned) 2024. 2. 1. 20:29
어제 과제가 나오고 오늘은 머신 러닝 과제를 해결하기 위해서 시간을 썼다. 과제는 우리가 좋은 주피터 데이터 셋을 구했는데 구멍이 뚫렸있으며 구멍을 채우는 것을 목표로 진행되었다. 기본적으로 데이터를 불러오고 전처리할 데이터를 살피고 (info, describe( include='all')) 처리하였다. 이상치로 탐지한 데이터가 -8000 이 찍혀있었고, 다른 데이터에 비해 많이 멀고 이상하였다. 은행이라는 가상 주제에 -8000은 미친 마이너스 통장의 소유자가 아니면 존재하지 않을거 같았고 (주관적 생각) 객관적으로는 우리는 데이터 분석에 있어서 머신 러닝을 통해 해당 가설에 맞는 인사이트 도출을 목표로 한다. 이에 필요한 도구중 하나가 머신러닝의 기법들이고 인코딩,스케일링 등이 있는데 스케일링을 하는..
-
1/10 TIL스파르타/TIL(Today I Learned) 2024. 1. 10. 20:46
오늘은 저번에 내준 개인 과제 해설을 보았다. 튜터님이 푼 풀이는 나의 풀이보다 훨씬 간단하였다. 일단 문제의 조건을 내 상식 선에서 풀어서 틀린 문제도 있었다. (문제를 잘 읽어야한다....) 이메일 문제 조건을 상식선에서 말고 조건에 따지라는 튜터님의 함정이였다.. 오늘은 파이썬 코드카타를 했는데 나는 파이썬 머리가 없는지 생각이 단순해지는 기분이다... 오늘은 sorted와 join으로 정렬하는 문제를 푸는데 시간이 오래걸렸다. 반복문으로 비교해서 새로운 리스트에 넣으려 했지만 실패했다... 내일은 프로젝트 발제를 하는 날이라서 프로젝트 쪽으로 시간을 갈아야하겠지만 좋은 팀원과 잘 해냈으면 좋겠습니다!