Data Visualization 1 실습
·
🇰 Kakaotech Bootcamp/실습
실습에 사용한 데이터- https://www.kaggle.com/datasets/nikhil7280/weather-type-classification실습한 시각화 그래프- 막대그래프, 선그래프, 히스토그램, 파이차트, 산점도, 박스플롯 1. 계절별 데이터 개수 세기2. 수치형 열의 상관관계 히트맵3. 계절별 비와 눈 이벤트 횟수 막대 그래프4. 구름 덮개 상태별 평균 강수 확률 막대 그래프1. 데이터 개요- 특정 지역, 기온, 습도, 풍속, 강수 확률, 기압, 자외선 지수, 가시 거리 등 다양한 기상 변수 2. 주요 시각화 결과 및 분석2-1. 겨울 데이터 개수가 많음2-2. 수치형 열의 상관관계 히트맵- 기온(Temperature)과 습도(Humidity): 강한 음의 상관관계가 나타남. 이는 기온이 ..
텍스트 데이터를 클리닝하고 정규화
·
💥 Projects/개인실습
[텍스트 데이터 전처리 과정]* 텍스트 데이터 전처리 과정1. 데이터 정제(Cleaning)- 불필요한 문자 제거: HMTL, 태그, 특수 문자, 이모지 등 제거- 불용어 제거: 분석에 도움되지 않는 일반적인 단어들 제거 (the, is)- 철자 오류 교정2. 데이터 정규화(Normalization)- 토큰화(Tokenization): 텍스트를 문장 또는 단어 단위로 분할- 어간 추출(Stemming): 단어의 접미사나 어미를 제거하여 어간을 추출- 원형 복원(Lemmatization): 단어의 문법적 의미와 문맥을 고려하여 사전적 원형 찾아 변환3. 정형화(Structuring)- 백터화(Vectorization): 텍스트 데이터를 수치 데이터로 변환- Bag-of-Words(BoW): 각 단어의 발생..
데이터 분석 1 실습
·
🇰 Kakaotech Bootcamp/실습
1. 가설 설정- 귀무가설(H0): 두 그룹(diagnosis - M, B) 간의 특정 변수의 평균 차이는 없다.- 대립가설(H1): 두 그룹(diagnosis - M, B) 간의 특정 변수의 평균 차이는 있다. 2. 데이터 준비diagnosis 열을 기준으로 데이터를 두 그룹으로 나눈다. group_m = data[data['diagnosis'] == 'M'] # 악성group_b = data[data['diagnosis'] == 'B'] # 양성3. T-검정 수행4. A/B 테스트 설계- 각 변수에 대해 두 그룹의 평균을 비교하여 실험군과 대조군의 차이를 분석한다. - 이 과정을 통해 각 변수의 유의미한 차이를 평가할 수 있다. 5. 결과 시각화- T-검정 결과를 바탕으로 각 변수에 대한 T-통계량과..
python programming 2 종합 실습
·
🇰 Kakaotech Bootcamp/실습
# 파이썬 프로그래밍 II 종합 실습학습 목표: collections 모듈, comprehension, logging, 정규표현식, 멀티스레딩, 멀티프로세싱을 활용합니다. 1. Collections 모듈 활용EXAMPLE_SEQUENCE 값을 활용해보세요.1. Deque: Deque를 생성하고, 요소를 추가하고 제거하는 작업을 해보세요.2. Namedtuple: Namedtuple을 정의하고 인스턴스를 생성해보세요.3. Defaultdict: Defaultdict를 사용해보세요. 키가 없을 때 기본값을 설정하세요.4. Counter: Counter를 사용해 리스트에서 각 요소의 빈도를 세어보세요.from collections import deque, namedtuple, defaultdict, Count..
python programming 1 종합 실습
·
🇰 Kakaotech Bootcamp/실습
# 파이썬 프로그래밍 종합 실습학습 목표: 기본 문법 복습, 자료형, 함수, 클래스와 객체지향 프로그래밍, 제너레이터와 이터레이터, 파일 입출력, 예외 처리를 종합적으로 활용합니다.1. 파이썬 기본 문법 복습 및 자료형 문제:사용자로부터 이름, 나이, 이메일을 입력받아 딕셔너리에 저장하는 프로그램을 작성하세요.나이와 이메일의 형식을 검증하고, 잘못된 입력이 있으면 예외 처리를 하세요.def validate_age(age): try: age = int(age) # 14세 미만 예외 처리 if age 15: raise ValueError("The ID is too short or too long. Please write 5 or more and..
[Kakaotech Bootcamp] 지원 과정 및 후기
·
🇰 Kakaotech Bootcamp
[모집 일정]지원 일정: 5.23 (목) ~ 6.10 (월) 17시까지코딩테스트 대상자 발표: 6.14 (금) 개별 안내코딩테스트 일정: 6월 17일 (월) / 10:00 - 12:00 (풀스택) / 13:30 - 15:30 (인공지능) / 16:00 - 18:00 (클라우드)면접 및 인성평가 대상자 발표: 6.18 (화) 개별 안내면접 및 인성평가 일정: 풀스택 - 6.20 (목) / 인공지능 - 6.21 (금) / 클라우드 - 6.22 (토)합격자 발표: 6.24 (월) 개별 안내HRD-Net 수강 신청 일정: 6.25 (화) - 6.28 (금)교육 일정: 7.1 (월) - 12.27 (금) [선발 과정][1차 - 서류 / 3배수]- 지원서 문항이 5개가 있고, 하나는 선택으로 부트캠프 측에 하고 싶..