스파르타/TIL(Today I Learned)
-
만우절 기념 TIL스파르타/TIL(Today I Learned) 2024. 4. 1. 10:22
오늘은 아침에 sql 문제를 푸는 도중에 새로운 걸 알아서 적어본다. 문제는 다음과 같다. Write a solution to find the patient_id, patient_name, and conditions of the patients who have Type I Diabetes. Type I Diabetes always starts with DIAB1 prefix : 솔루션을 작성하여 제1형 당뇨병 환자의 patient_id, patient_name 및 상태를 찾으십시오. 제1형 당뇨병은 항상 DIAB1 접두사로 시작합니다 여기 문제에서 보면 항상 DIAB1 이 접두사로 시작을 해야한다.라고 써있다.이는 만일 ACNE DIAB100 이렇게 되어있어도 두번째 단어의 접두사이기 때문에 출력이 되어..
-
24/3/8스파르타/TIL(Today I Learned) 2024. 3. 8. 21:17
프로젝트의 주어진 문제들을 팀원들과 같이 해결하고 대시보드를 만드는 작업을 하였다. 구글에 있는 멋진 대시보드들 중에 맘에 든 사진을 저번에 팀원이 저장하였고, 이를 참고해서 대시보드를 꾸미기 시작했다. 파이차트가 100%로 된게 많아서 아쉽지 않았지만 오히려 좋아...라는 기분으로 했다. 꽉차있어서 이뻐~ 그리고 동적으로 변하는 대시보드를 만들려고 이것 저것 시도했는데 실패해서 조금 아쉬웠다. 마케팅 대시보드는 잘 만들어봐야겠당~ 처음 도넛차트를 만들 때에는 열에 1 넣고 차원으로 안바꿔서 자꾸 안되다가 차원으로 바꾸고 이중축을 설정하니 잘 되었다. 만족스러웠다~ 오늘 마무리하고자 했던 데이터 정합성 대시보드는 잘 완성되었다. 팀원들과 위치나 색상을 조율해서 하니 재밌고 시간이 잘 갔다 울희팀 쵝오~
-
2/29 TIL스파르타/TIL(Today I Learned) 2024. 2. 29. 21:26
오랜만이다... 오늘은 프로젝트의 발제를 하여 데이터를 살펴보고 뜯어보았다. 1. pd.to_datetime(df['created_at'])를 하여 created_at이라는 object 타입 -> datetime으로 변경을 시도 2. 바로 실패 3. ValueError: time data "2024-01-14 02:35:15.743909+00:00" doesn't match format "%Y-%m-%d %H:%M:%S%z", at position 1351. You might want to try: - passing `format` if your strings have a consistent format; - passing `format='ISO8601'` if your strings are all IS..
-
1월 마지막 주 ~ 2월 첫째 주 WIL스파르타/TIL(Today I Learned) 2024. 2. 5. 09:15
이번주는 머신러닝이라는 것을 배웠다. 우리가 흔히 아는 선형모델의 머신러닝을 기초로 배웠고 x라는 값을 통해 가중치와 편향을 알면 y를 알 수 있는 기법이였다! 상당히 흥미로웠으며 이를 통한 예측값과 우리가 아는 실제값의 오차를 분석하여 얼만큼 정확한가 등등을 배울 수 있는 기회였다 이후로 배운 심화에서는 실상 우리가 쓰는 데이터는 선형적이지 않다라는 주제로 이상치도 많고 데이터가 많이 요상한 형태로 주어진다 이를 위해 우리는 log도 사용하고 의사결정나무, 랜덤 포레스트 같은 기법을 다루었다. 심화로 가면서 아 머신러닝이 정말 분야가 어렵구나...라고 느끼는 한 주였다. 이를 활용한다면 데이터를 활용하여 정말 많은 것을 할 수 있고 꽤나 인상적인 인사이트를 도출할 수 있을것 같았다.!
-
2/1스파르타/TIL(Today I Learned) 2024. 2. 1. 20:29
어제 과제가 나오고 오늘은 머신 러닝 과제를 해결하기 위해서 시간을 썼다. 과제는 우리가 좋은 주피터 데이터 셋을 구했는데 구멍이 뚫렸있으며 구멍을 채우는 것을 목표로 진행되었다. 기본적으로 데이터를 불러오고 전처리할 데이터를 살피고 (info, describe( include='all')) 처리하였다. 이상치로 탐지한 데이터가 -8000 이 찍혀있었고, 다른 데이터에 비해 많이 멀고 이상하였다. 은행이라는 가상 주제에 -8000은 미친 마이너스 통장의 소유자가 아니면 존재하지 않을거 같았고 (주관적 생각) 객관적으로는 우리는 데이터 분석에 있어서 머신 러닝을 통해 해당 가설에 맞는 인사이트 도출을 목표로 한다. 이에 필요한 도구중 하나가 머신러닝의 기법들이고 인코딩,스케일링 등이 있는데 스케일링을 하는..