전체 글 49

250404_Data_6기 TIL 34일차 - 파이썬 스탠다드 #2

250404_Data_6기 TIL 34일차- 주간 전체 복습 ✅- 기초프로젝트 코드 분석 #5 ✅- QCC 복습 - 10분 판다스 ✅- 파이썬 스탠다드 세션 복습 ✅  파이썬 스탠다드 #2  1. Python의 Window Function윈도우 함수는 여러 행의 관계를 파악하기 위해 사용된다. 정의 : 행과 행 간의 관계를 정의하기 위해서 제공되는 함수역할 : 윈도우 함수를 사용해서 순위, 합계, 평균, 행 위치 등을 조작할 수 있다.종류 : 순위, 집계, 순서, 비율Python에서는 윈도우 펑션을 어떻게 구현할까?Shift, Rollin, Expanding 으로 구현 가능! SHIFTShift(메서드)정의 : 시계열 데이터 데이터나 인덱스를 원하는 기간 만큼 쉬프트 하는 메서드문법 : DataFrame..

데이터 분석 입문 주차데이터 분석 입문 주차250403_Data_6기 TIL 33일차 - 통계학 기초, 통계 라이브세션, 파이썬 스탠다드 복습

b250403_Data_6기 TIL 33일차- 통계학 기초 강의 4주차 수강 ✅- 기초프로젝트 코드 분석 #4 ✅- 아티클 스터디 정리 ✅- 10분 판다스 ✅- 통계 라이브세션 복습 ✅- 파이썬 스탠다드 세션 복습 ✅  통계학 기초 4주차  회귀(Regression)1. 단순 선형 회귀하나의 독립 변수(X)와 하나의 종속 변수(Y) 간의 관계를 직선으로 모델링하는 방법.☑️ 회귀식Y = β0 + β1X, 여기서 β0는 절편, β1는 기울기☑️ 특징독립 변수의 변화에 따라 종속 변수가 어떻게 변화하는지 설명하고 예측데이터가 직선적 경향을 따를 때 사용한다.간단하고 해석이 용이하다.데이터가 선형적이지 않을 경우 적합하지 않다.언제 사용할까?☑️ 하나의 독립변수와 종속변수와의 관계를 분석 및 예측광고비(X)와..

기초 프로젝트 코드 분석 #4

원래 TIL에 오늘 워낙 많이 적어놔서 스크롤 압박이 심할 것 같아서 여기다가 따로 정리해야 될 것 같았다  기초 프로젝트 코드 분석 #4이 코드는 아동복(Baby/Children)을 구매한 고객들이 함께 구매한 다른 품목이 무엇인지 분석하고,해당 품목의 구매 비율(%) 을 계산하여 표로 나타내는 코드다.즉, 아동복을 구매하는 고객이 추가로 어떤 품목을 가장 많이 구매하는지를 알아보기 위한 분석이다.  1. 날짜 형식 변환 tran_df["t_dat"] = pd.to_datetime(tran_df["t_dat"]) 2. 거래 데이터와 상품 정보 병합 tran_merged = tran_df.merge(    art_df[['article_id', 'index_group_name']],     on='art..

데이터 분석 입문 주차250402_Data_6기 TIL 32일차 - 통계학 기초, 라이브세션 복습

250402_Data_6기 TIL 32일차- 통계학 기초 강의 3주차 수강 ✅- 기초프로젝트 코드 분석 #3 ✅- 코드카타 1문제 ✅- 10분 판다스 ✅- 라이브세션 복습 ✅   기초 프로젝트 코드 분석 #3 오늘 분석할 코드는 아동의류 교차구매 비율을 계산하고 교차 구매를 하지 않은 구매자와 교차구매자의 비율을 파이차트로 시각화하는 코드이다.이 코드의 사용목적은 아동의류 품목이 다른 카테고리의 품목과 얼마나 자주 팔리는지를 분석하기 위해 사용 되었다.# Baby/Children 교차구매 비율 계산# Baby/Children 구매한 고객 IDbaby_buyers = tran_df.merge( art_df[['article_id', 'index_group_name']], on='article_id',..

250401_Data_6기 TIL 31일차 - 통계학 기초 2주차, 기초 프로젝트 코드 분석, 아티클 스터디

250401_Data_6기 TIL 31일차통계학 기초 강의 2주차 수강 ✅기초프로젝트 코드 분석  ✅코드카타 1문제  ✅10분 판다스 ✅라이브 세션 수강  ✅아티클 스터디 정리 ✅오늘은 위에 일정대로 진행해보려한다.    기초 프로젝트 코드 분석 #2  먼저 전체코드는 이렇다.import pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns# 스타일 설정sns.set_style("whitegrid")plt.rcParams['axes.labelsize'] = 12plt.rcParams['xtick.labelsize'] = 10plt.rcParams['ytick.labelsize'] = 10# 날짜 처리 및 year-month 컬럼 생성tran_..

250331_Data_6기 TIL 30일차 - 통계학 기초 1주차, 기초 프로젝트 코드 분석

250331_Data_6기 TIL 30일차 오늘부터 데이터 분석 입문 주차가 시작되었다. 그래서 팀도 재편성 되었다. 으으 팀 바뀔때마다 이 어색한 공기는 도저히 적응이 안된다ㅋㅋ얼른 친해져야겠다~ 오늘은 못들었던 파이썬 종합반 5주차를 마무리하고 통계학 기초 1주차를 듣고 복습, 저번주에 못한 기초 프로젝트 코드 분석을 메인으로 할 예정이다.    통계학 기초 1주차  1. 데이터 분석에 있어 통계가 중요한 이유-> 데이터 기반의 의사결정을 내릴 수 있기 때문! ☑️ 데이터를 분석하고 이를 바탕으로 결정을 내릴 수 있다.데이터 분석에서 통계는 데이터를 이해하고 해석하는 데 중요한 역할을 한다.데이터를 요약하고 패턴을 발견할 수 있다.추론을 통해 결론을 도출하는 과정을 돕는다.즉, 데이터 기반의 의사결정..

250327_Data_6기 TIL 28일차 - 기초 프로젝트 발표 대본

250326_Data_6기 TIL 27일차 오늘은 팀원들과 프로젝트 발표용 ppt를 완성하고 몇번 수정하는 과정을 거쳤다.나는 영상 발표를 맡았어서 오늘은 ppt 내용 조정과 영상 촬영 대본 작성 및 촬영을 주로 하였다.특별히 적을 사항이 없어 ppt를 보며 어떻게 내용을 전달할 지 기록한 대본을 올려 둘려고 한다ㅋㅋ PPT 대본 1p. 안녕하세요 Print 21조 영상 발표를 진행하게 된 000이라고 합니다성장을 입히는 브랜드 : H&M 아동복을 통한 장기 고객확보 전략 발표를 시작하도록 하겠습니다. 2p. 발표 시작에 앞서 목차부터 말씀드리자면 크게 H&M 브랜드 분석, 데이터 분석 준비, 가설별 분석 및 검증이 되겠고 세부적으로는 아래에 명시된 순으로 안내해 드리겠습니다.3P. h&m에 대한 브랜드..

250326_Data_6기 TIL 27일차 - 기초 프로젝트 사고 과정 기록

250326_Data_6기 TIL 27일차 오늘은 전반적인 마무리 단계에 들어섰다. 전반적인 사고 과정을 기록해두면 좋을 것 같아서 오늘은 그 작업을 해보려 한다.  프로젝트 주제 : [커머스] H&M 고객/매출 데이터 분석  h&m 도메인 분석 "패스트 패션" 대표 브랜드 중 하나→ 트렌디한 옷을 빠르게 제작하고 저렴하게 판매하는 전략 🌱 지속 가능성 (Sustainability)H&M은 최근 몇 년간 지속 가능성에도 많은 투자를 하고 있다 :의류 리사이클 프로그램 운영 (매장 내 헌 옷 수거함)2040년까지 기후 중립 목표 선언  간략한 데이터 EDA 과정 진행 후 대주제 설정  대략적인 데이터 구조 파악과 간략한 분석을 진행하였다.   카테고리별 상품 구성 비율과 카테고리별 매출 비율을 분석했을 ..

250325_Data_6기 TIL 26일차 - 기초 프로젝트 분석

250325_Data_6기 TIL 26일차   어제 하다가 마치지 못했던 시즌성 가설 검증을 완료하고 분석 결과 해석과 인사이트 도출을 진행해보도록 하겠다. 시즌성 가설  2-5. 여름 시즌 옷들에 비해 가을 시즌 옷의 평균 단가가 높아 높은 매출 증감률을 보이는 것인가? 아동복과 전체 품목의 월별 평균 단가를 조사해본 결과 실제로 9월의 제품 평균 단가가 급격히 올라가는 것을 알 수 있었다!매출은 1월이 제일 높은데 9월의 단가가 제일 높은게 조금 찜찜하긴 했지만 그래도 9월을 잘 타겟팅한 것 같다. 왜냐하면 9월의 의류상품이 단가가 가장 높아 9월 매출 증진이 전체 매출에 가장 효율적으로 작용할 것 같으니까..ㅋㅋ

250324_Data_6기 TIL 25일차 - 기초 프로젝트 분석

250324_Data_6기 TIL 25일차  오늘은 설정해둔 가설을 토대로 가설 검증을 위한 분석을 진행하였다.그럼 다듬은 서론과 주제부터 다시 정리하고 가설과 진행한 분석에 대해 알아보자.  서론  H&M은 ‘지속 가능성(sustainability)’을 브랜드의 핵심 키워드로 설정하며, 친환경적이고 윤리적인 생산 과정을 강조하고 있다. H&M의 상품 구조를 살펴보면 여성의류가 가장 많은 비중을 차지하며, 그 다음으로는 아동의류(Baby/Children)의 비중이 크다. 그러나 H&M의 아동의류 품목은 상대적으로 매출이 낮아, 이러한 지속적인 투자의 이유에 대한 의문이 제기된다. 여기서 H&M이 강조하는 ‘지속 가능성’이 단순히 환경적 측면만이 아니라, 고객층의 지속 가능성을 포함하고 있다고 가정하였다...