[ADsP] 자격증 시험 2주 회고
·
📜 Certs/ADsP
약 2주간 ADsP(Advanced Data Analytics Semi-Professional) 자격증 준비를 하며 배운 점과 느낀 점을 정리해보려 합니다.데이터 분석의 기초부터 활용까지 폭넓게 다루기 때문에, 공부를 통해 데이터 분석 전반에 대한 지식과 흥미를 쌓을 수 있었습니다.이번 회고에서는 공부 과정, 어려웠던 점, 그리고 성장과 느낀 점을 중심으로 정리하겠습니다.1. ADsP 자격증이란?ADsP는 데이터를 활용하여 문제를 정의하고, 분석을 통해 해결책을 제시할 수 있는 능력을 검증하는 자격증입니다.특히 데이터 분석 초급자들에게 적합하며, 데이터 분석에 관심 있는 직장인이나 학생들이 첫걸음으로 많이 도전하는 시험입니다.시험은 크게 세 가지 영역으로 구성됩니다:데이터 이해데이터 분석 기획데이터 분석..
ADsP 메모 - 데이터 분류 분석
·
📜 Certs/ADsP
분류 분석분류 분석은 데이터가 어떤 그룹에 속하는지 예측하는 기법으로, 지도 학습에 해당합니다. 인공 신경망, 의사결정나무, 회귀분석 등은 대부분 분류 분석에 포함됩니다.모형 평가 방법향상도 곡선: 분류 분석의 모형 평가 방법으로, 랜덤 모델과 비교하여 해당 모델의 성과가 얼마나 향상되었는지를 각 등급별로 파악합니다.로지스틱 회귀분석반응 변수가 범주형인 경우에 적용되는 회귀분석 모형입니다.exp(B)는 나머지 변수(x1...xk)가 주어질 때, xl이 한 단위 증가할 때마다 성공의 오즈가 몇 배 증가하는지를 나타내는 값입니다. 오즈 = p / (1 - p) = 확률 / (1 - 확률)성공할 확률이 실패할 확률의 몇 배인지를 나타냅니다.B > 0 이면 S자 모양, B 의사결정나무의사결정 문제를 시각화하여..
ADsP 메모 - 데이터 분석 및 모델링
·
📜 Certs/ADsP
데이터 분석 및 모델링 관련 메모분해시계열시계열에 영향을 주는 일반적인 요인을 분리해 분석하는 방법:경향(추세): 자료가 오르거나 내리는 추세.계절요인: 고정된 주기에 따라 자료가 변하는 경우.순환요인: 경제적이나 자연적인 이유 없이 알려지지 않은 주기를 갖고 변화.불규칙요인: 위 3가지로 설명할 수 없을 때 발생.다차원척도법 (MDS)객체 간 근접성을 시각화하는 통계 기법.개체들을 2차원 또는 3차원 공간 상에 점으로 표현하여 집단화를 시각적으로 나타냄.계량적 MDS: 비율척도, 구간척도 데이터 활용 (양적척도).비계량적 MDS: 순서척도 데이터를 활용 (순서척도).주성분분석 (PCA)여러 변수를 상관관계를 이용해 소수의 주성분으로 차원 축소.Scree plot: 그래프의 기울기가 완만해지는 지점에서 ..
ADsP 메모 - 상관분석과 회귀분석
·
📜 Certs/ADsP
이번 포스팅에서는 R을 사용한 상관분석과 회귀분석의 주요 개념을 정리해보겠습니다.1. 상관분석상관분석은 두 변수 간의 관계를 평가하는 중요한 통계 기법입니다. R에서 상관분석을 수행할 때, P-값이 0.05 이하인 경우 귀무가설을 기각하고 대립가설을 채택할 수 있습니다. 이는 두 변수 간에 통계적으로 유의미한 상관관계가 존재함을 의미합니다.상관계수상관계수는 두 변수 간의 선형 관계의 강도를 나타내며, +1과 -1 사이의 값을 가집니다. 0에 가까울수록 관계가 약하다는 것을 나타냅니다.2. 회귀분석회귀분석은 하나 또는 그 이상의 독립 변수가 종속 변수에 미치는 영향을 추정하는 통계법입니다. 독립변수는 X(원인)이고, 종속변수는 Y(결과)입니다. 회귀모형의 유의성P-값이 0.05보다 작으면 회귀식은 통계적으..
ADsP 메모 - 확률변수와 통계
·
📜 Certs/ADsP
ADSP(데이터 분석 전문 자격증) 준비를 위해 확률변수와 통계의 기초 개념을 정리해보았습니다.1. 확률변수의 종류이산형 확률변수이산형 확률변수는 0이 아닌 확률 값을 가지는 셀 수 있는 실수 값입니다. 대표적인 이산형 확률변수로는 다음과 같은 분포가 있습니다:베르누이 분포: 두 가지 결과(성공/실패) 중 하나를 나타냄이항 분포: 베르누이 시행의 반복 결과다항 분포: 여러 가지 결과를 가지는 시행포아송 분포: 특정 시간이나 공간에서의 사건 발생 횟수연속형 확률변수연속형 확률변수는 확률이 함수 형태로 주어지며, 무한히 많은 값을 가질 수 있습니다. 주요 연속형 분포는 다음과 같습니다:균일 분포: 모든 값이 동일한 확률로 발생정규 분포: 종 모양의 대칭적인 분포지수 분포: 사건 발생 간의 시간 간격t 분포:..