본문 바로가기

분류 전체보기38

ADSP 벼락치기 - 2장 데이터 분석 기획 요약 다시 요약요약해보자흐름을 다시 머릿속에 잘 넣어보자이부분은 만점맞아야함 ㅠㅠㅠㅠ1. 데이터분석기획ㅇ 분석기획단계 -1. 프로젝트의 범위 설정-2. 프로젝트 정의 및 목표 수립-3. 분석단계에서 발생가능한 위험요소 식별(데이터정의 > 데이터 준비단계) ㅇ분석기획시 고려사항- 가용데이터(데이터가 확보되어야함, 유형에 대한 분석이 선행적으로 이뤄져야함)- 적절한 유즈케이스(기존에 잘구현되어있는 유사분석시나리오,솔루션 충분히 활용)- 장애요소들에 대한 사전계획 수립 ㅇ분석 유형 - 분석방법/분석대상 다 모를때 : discovery, 분석대상만 모를때 : insight, 분석방법만 모를때 : solution, 다 알때 : optimization ㅇ위험 대응 4요소 : 전이, 회피, 수용, 완화ㅇ분석프로젝트 영역별.. 2025. 8. 8.
분석 유형 주요 알고리즘 (ADsP 기준) 악 헷갈려!!!!!!!!!!!!!!특히 군집분석 너므너므 헷갈린다분석 유형 주요 알고리즘 (ADsP 기준)구분 알고리즘 내용 군집분석비지도ㅇ계층적 군집- 최장,최단,평균,와드연결법(오차제곱)ㅇ비계층적 군집- K-means(연속형변수,분산을 최소화함, 이상치민감,greedy -> 최적이라는 보장 없) ---> 이상값민감을 극복하기위해 PAM 사용(k-평균과 비슷한데, 중앙값이용)- DBSCAN(k필요없음,밀도차를 기준,이상치보완,임의의모양이있을때)- 혼합군집(EM, 이상치민감, e단게 : 기대치계산, m단계 : 최적화단계)- 퍼지군집(여러 군집에 속할 수 있음)-평가 방법: 실루엣계수* SOM : 신경망 모델, 고차원>저차원으로 변환하여 데이터구조를 시작적으로 이해할 수 있또록 도움입력층 뉴런은 경쟁층뉴런.. 2025. 8. 7.
ADsP 데이터분석파트 통계분석~회귀분석 정리 윽미치겠군1. 통계분석1-1. 사전작업- 전수조사/ 표본조사 -> 정규분포/ t분포-> 표본조사를하기위해선 표본을 어떻게 뽑는지 중요 : 단순랜덤, 계통추출, 집락추출(군집,다단계표본,지역표본), 층화추출(비례층화-> 표본을 척도를 기준으로 측정함 : 범주형자료(잘적척도) [명목(어느집단에 속하는지), 순서(서열)] / 수치형자료(양적척도[등간(간격이 의미가 있음. 날짜,온도), 비율(0을 기준으로 사칙연산이가능) ]- 왜도 : 분포의 비대칭정도. 양수 : 오른쪽 꼬리가 길다. 중앙값이 평균보다 크다 ㅇ추론과 가설검정 -귀무가설(h0) : 차이가없다.동일하다를 기본개념 -> 제1종오류(유의수준) h0이 옳은데 이걸 기각할 오류 : 위험, 줄여야함 ->제2종오류 h0이 틀렸는데 채택할 오류-대립가설.. 2025. 8. 7.
ADsP 기출문제(43회) 미어캣 풀면서 요약정리 43회 오답정리 1장 데이터이해1. 빅데이터의 등장으로 상관관계가 중요시해짐(인과관계x), 전수조사가 우선시됨(표본조사x)2. 비정형데이터 : 사진,영상,댓글 등(온도 : 숫자로 표현된 정형데이터)3. 데이터사이언티스트는 커뮤니케이션 능력이 분석력보다 더 중요함4. 개인정보사용자가 책임을 져야하는 방향으로 가고 있음 2장 데이터분석기획1. 분석기획 고려사항 : 가용 데이터 확보 가능성 파악, 적절한 활용방안, 유스케이스탐색, 성공실패사례참고, 장애요소에 대한 사전계획 수립(리스크비용 고려안함)2. 데이터준비단계 : 모든 유형의 데이터를 수용, 기업의 데이터는 포괄적으로 활용(전수 X), 수집된 데이터 정당성 검증, 개인정보보호준수3. 빅데이터분석방법론 : 단계, 태스크, 스텝(입력자료,처리및도구,출력자.. 2025. 8. 5.
adsp 벼락치기 - 아답터 유튜브 강의 요약(3. 데이터분석 일부) 아답터 강의 adsp 3. 데이터분석 내가 모르는부분헷갈리는부분 정리 1. 확률표본추출법- 집락추출법(군집추출법) = 군집 간은 동질하고, 군집 내에선 이질성이 있음(성격이 같은 a,b,c집단으로 나누고 a만뽑아서쓰는경우) - 층화추출법(비례) = 군집간은 이질적이고, 군집내에선 동질(1학년,2학년,3학년의 표본을 뽑는 경우) 2. 가설검정귀무가설(h0)으로 시작 -> p-value값을 봄- p-value : 이 가설 하에 이런 결과가 나올 확률! 이 p-vaule가 유의수준(significance level, α (알파), 보통 0.05)보다 큰지 작은지에 따라 귀무가설 기각여부를 정함!- 유의수준 : 귀무가설 기각할 기준값 = 즉 p-value가 기준값보다 작아야 귀무가설을 기각 할 수 있음(제1종.. 2025. 8. 4.
[ADsP] 헷갈리는 통계(표본추출법, 가설검정) 표본추출법📌 1️⃣ 단순무작위추출(Simple Random Sampling)방법: 모집단에서 표본을 무작위로 뽑음 (동일한 확률)예시: 1000명의 고객 중 무작위로 100명을 추첨📌 2️⃣ 체계적추출(Systematic Sampling)방법: 일정 간격으로 표본 추출예시: 고객 명단에서 10번째마다 한 명씩 선택📌 3️⃣ 층화추출(Stratified Sampling)방법: 모집단을 **동질적인 층(성별, 연령대 등)**으로 나눈 후, 각 층에서 무작위 추출예시: 남녀 비율을 반영하기 위해 남자 50명, 여자 50명씩 랜덤 추출📌 4️⃣ 군집추출(Cluster Sampling)방법: 모집단을 여러 **군집(자체적으로 모집단의 축소판)**으로 나누고, 일부 군집을 통째로 선택예시: 전국 학교 중 1.. 2025. 8. 4.
반응형