전체 글 48

250417_Data_6기 TIL 43일차

250417_Data_6기 TIL 43일차- 머신러닝 라이브세션 복습 ✅- 머신러닝 완강 ✅- 회귀 라이브세션 다시보면서 실습 ✅- 머신러닝 전체 복습 ✅- 코드카타 1문제 ✅ 머신러닝 #10📚 딥러닝과 머신러닝은 어떻게 다른가요?A1: 머신러닝은 사람의 개입으로 특징을 추출해 모델을 학습하는 전통적인 방법들을 포괄적으로 일컫습니다. 딥러닝은 신경망(특히 다층 구조)을 사용해 데이터를 스스로 표현(특징 추출)하며 학습하는 것이 핵심 차이점입니다. 머신러닝 전체 복습하기 1. 머신러닝이란?컴퓨터가 인간의 개입 없이(또는 최소한으로) 데이터를 학습하여 패턴을 찾아내고, 새로운 데이터에 대해 예측이나 분류를 수행하는 기술 머신러닝의 3대 요소데이터, 알고리즘, 컴퓨팅 파워 머신러닝, AI, 딥러닝의 관계..

카테고리 없음 2025.04.17

250416_Data_6기 TIL 42일차

250416_Data_6기 TIL 42일차 - 머신러닝 라이브세션 복습 x2 - 머신러닝 8, 9강 듣기 - 코드카타 1문제 머신러닝 #81. 차원 축소가 왜 필요할까?차원 축소의 필요성고차원 데이터란?데이터의 피처(변수)가 매우 많은 상태를 말합니다. 예컨대 이미지 데이터의 경우, 한 장의 이미지를 구성하는 픽셀 수만큼의 피처가 있을 수 있습니다.어떤 문제가 생길까?모델 학습 시 연산 복잡도가 급증하여 시간이 오래 걸림많은 피처들 중 일부는 실제로 중요한 정보를 주지 못하는 노이즈(잡음)일 수 있음차원이 너무 높아지면 데이터를 시각화하기가 어려워 패턴 파악이 힘듬차원 축소의 장점노이즈 제거로 모델 성능 및 일반화 능력을 개선할 수 있음2차원이나 3차원으로 축소하면 시각적으로 직관적인 분석을 할 수 ..

카테고리 없음 2025.04.16

250415_Data_6기 TIL 41일차

250415_Data_6기 TIL 41일차 - 머신러닝 라이브세션 복습 ✅- 머신러닝 7강 듣기 ✅- 머신 러닝 5강 다시 듣기 ✅- 아티클 스터디 정리 ✅- 코드카타 1문제 ✅ 머신러닝 #7 1. 비지도 학습 개요 비지도 학습이란?비지도 학습은 정답(레이블) 없이 데이터에서 패턴이나 구조를 찾는 머신러닝 기법을 의미함- 활용 영역데이터의 군집화(Clustering)차원 축소(Dimensionality Reduction)이상치 탐지(Anomaly Detection) 등지도학습과의 비교지도 학습 (Supervised Learning)입력 데이터에 대한 정답(레이블)을 알고 있는 상태에서 모델을 학습하여, 새로운 데이터가 들어 왔을 때 레이블을 예측.ex) 이미지 분류, 스팸 메일 분류비지도 학습 (Un..

카테고리 없음 2025.04.15

250414_Data_6기 TIL 40일차 - 통계 라이브세션, 파이썬 스탠다드 복습

250414_Data_6기 TIL 40일차 - 통계학 라이브세션 복습 ✅- 머신 러닝 복습 & 실습 ✅- 머신 러닝 4강 다시 듣기 ✅- 파이썬 스탠다드 라이브세션 복습 ✅- 코드카타 1문제 ✅ 통계학 라이브세션 #6 머신러닝의 종류 - 지도학습, 비지도 학습에 대해 이해 해보자. 1. 통계와 머신러닝머신러닝이란?정의 : 데이터를 기반으로 예측 모델을 학습시키는 알고리즘 기반의 접근법,목적 : 주어진 데이터를 통해 패턴을 학습하여 미래 데이터를 예측하거나 분류하는 것종류 : 지도학습(분류, 회귀), 비지도학습(클러스터링, 차원 축소), 강화학습통계적 가설검정과 머신러닝은 비슷한 듯 다르다.그렇다면 두가지 방법론을 꼭 하나만 사용해야 하는가? 그건 아니다.두 가지 방법론은 상호보완적이다.통계적 가설 검..

250411_Data_6기 TIL 39일차

250411_Data_6기 TIL 39일차 - 통계학 복습 ✅- 머신 러닝 복습 & 실습- QCC 복습 ✅- 코드카타 1문제 ✅벌써 금요일이다. 이번주는 강의를 엄청 많이 들었는데 정작 소화는 잘 안됐던 것 같다.. 그래서 오늘은 새로운걸 배우기보단 전체 복습하는 느낌으로 다시 훑어보고 기반을 단단히 다지는 시간을 가졌다.  통계학 복습  다음 중 기술통계에 해당하는 것은?→ 데이터의 중앙값을 계산하는 것. 기술통계는 데이터를 요약하고 설명하는데 중점을 두고, 추론통계는 표본 데이터를 사용하여 모집단에 대한 결론을 내리는 과정. 다음 중 인과관계(Causation)와 상관관계(Correlation)의 차이에 대한 설명으로 옳은 것은 무엇인가요?→ 인과관계는 두 변수 간의 원인과 결과를 나타내고, 상관관계..

카테고리 없음 2025.04.11

250410_Data_6기 TIL 38일차

250410_Data_6기 TIL 38일차 - 통계학 라이브 세션 복습 ✅- 머신 러닝 1-6강 듣기 ✅- 파이썬 스탠다드 세션 복습 ✅- QCC대비 SQL 공부하기 ✅- 코드카타 1문제 ✅- 아티클 스터디 정리 ✅  아티클 스터디 - 더 나은 대시보드 디자인을 위한 10개명: 10 rules for better dashboard design.  1. 대시보드의 목적을 정의하라대시보드는 정확한 목적을 이루기 위해 존재한다.Operational Dashboard사용자들에게 데이터 편차를 빠르고 정확하게 보여주고 현재 리소스와 상태를 알려주는 것이 Operational dashboard의 주요 임무Analytical Dashboard최우선 목표는 사용자들이 데이터를 더 쉽게 이해하고, 트렌드를 분석하며 의사..

카테고리 없음 2025.04.10

250409_Data_6기 TIL 37일차 - 통계 라이브 세션 #4

250409_Data_6기 TIL 37일차 - 통계학 라이브 세션 복습 ✅- 머신 러닝 3~5강 듣기 ✅- 파이썬 스탠다드 세션 복습 ✅- 코드카타 1문제 ✅ 통계 라이브 세션 #4  1. 회귀분석이란?회귀 분석 : 두 변수 이상 간의 관계를 모델링하고 예측하는 통계 기법. 독립변수(x)로 종속변수(y)를 예측하는 분석기법 ✅ 회귀 분석의 주요 목적예측(prediction) : 미래 값을 추정설명(explanation) : 변수 간 관계 파악모델링(modeling) : 수학적 모델 구축✅ 프로세스 1. 독립변수, 종속변수 설정- 독립변수와 종속변수를 정하고 가설을 설정합니다.ex)→ 독립변수: 게임시간 → 종속변수: 전기세 → 귀무가설: 게임시간은 전기세와 관련이 없을 것이다.→ 대립가설: 게임시간은 전..

250408_Data_6기 TIL 36일차 - 통계학 기초 6주차

250408_Data_6기 TIL 36일차 통계학 기초 6주차 ✅머신 러닝 2강 듣기 파이썬 라이브 세션 복습 ✅코드카타 1문제 ✅아티클 스터디 정리 ✅  통계학 기초 6주차가설검정의 주의점[수업 목표]가설검정의 다양한 주의점에 대해 이해한다이러한 주의점들을 참고하여 가설검정을 진행할 수 있다 1. 재현 가능성동일한 연구나 실험을 반복했을 때 일관된 결과가 나오는지에 대한 여부, 연구의 신뢰성을 높이는 중요한 요소이다.최근 p값에 대한 논쟁이 두드러지고 있다.p값을 사용하지 않는 것이 좋다?유의수준을 0.05에서 변경하는 것이 좋다?가설 검정의 원리상의 문제나 가설검정의 잘못된 사용이 낮은 재현성으로 이어진다는 문제 발생중요성결과가 재현되지 않는 다면 해당 가설의 신뢰도가 떨어진다.재현성 위기의 원인은?..

250407_Data_6기 TIL 35일차 - 통계학 기초 5주차

- 통계학 기초 5주차 ✅- 10분 판다스 ✅- QCC 복습 / 지난 주 복습 ✅- 통계학 라이브 세션 복습 ✅  통계학 기초 5주차  1. 피어슨 상관계수두 연속형 변수 간의 선형 관계를 측정하는 지표-1에서 1 사이의 값을 가진다.1은 완전한 양의 선형 관계-1은 오나전한 음의 선형 관계0은 선형 관계가 없음을 의미언제 사용할까?선형적인 관계가 예상 될 때비선형 관계에선 사용할 수 없음 2. 비모수 상관계수데이터가 정규분포를 따르지 않거나 변수들이 순서형 데이터일 때 사용하는 상관계수데이터의 분포에 대한 가정 없이 두 변수 간의 상관관계를 측정할 때 사용대표적으로 스피어만 상관계수와 켄달의 타우 상관계수가 있다.가. 스피어만 상관계수두 변수의 순위 간의 일관성을 측정켄달의 타우 상관계수보다 데이터 내..

250404_Data_6기 TIL 34일차 - 파이썬 스탠다드 #2

250404_Data_6기 TIL 34일차- 주간 전체 복습 ✅- 기초프로젝트 코드 분석 #5 ✅- QCC 복습 - 10분 판다스 ✅- 파이썬 스탠다드 세션 복습 ✅  파이썬 스탠다드 #2  1. Python의 Window Function윈도우 함수는 여러 행의 관계를 파악하기 위해 사용된다. 정의 : 행과 행 간의 관계를 정의하기 위해서 제공되는 함수역할 : 윈도우 함수를 사용해서 순위, 합계, 평균, 행 위치 등을 조작할 수 있다.종류 : 순위, 집계, 순서, 비율Python에서는 윈도우 펑션을 어떻게 구현할까?Shift, Rollin, Expanding 으로 구현 가능! SHIFTShift(메서드)정의 : 시계열 데이터 데이터나 인덱스를 원하는 기간 만큼 쉬프트 하는 메서드문법 : DataFrame..