본문 바로가기

TIL46

본 캠프 46일차 TIL 오늘 배운 것모수의 추정모수의 추정은 모집단의 특성을 나타내는 모수를 표본 데이터를 이용해 추정하는 과정입니다. 모수에는 평균, 분산, 비율 등이 포함됩니다.점추정(Point Estimation): 모집단의 모수를 단일 값으로 추정하는 방법입니다. 예를 들어, 표본 평균은 모집단 평균의 점추정량이 됩니다.구간추정(Interval Estimation): 모집단의 모수를 특정 신뢰 수준 하에 하나의 구간으로 추정하는 방법입니다. 예를 들어, 모집단 평균의 구간추정은 특정 신뢰 수준에서 평균이 포함될 것으로 기대되는 값의 범위를 제공합니다.가설검정에서의 개념가설검정(Hypothesis Testing)은 모집단에 대한 주장이나 가설을 표본 데이터를 사용하여 검증하는 통계적 방법입니다.1. 귀무가설(Null Hy.. 2024. 8. 9.
본 캠프 45일차 TIL 데이터 마트의 이해데이터 마트(Data Mart)는 특정 부서나 업무 목적에 맞춘 데이터 웨어하우스의 하위 집합이다. 이를 통해 더 구체적이고 전문화된 데이터를 제공하여 사용자들이 쉽게 접근하고 분석할 수 있도록 돕는다. 데이터 마트는 대규모 데이터 웨어하우스의 일부로 운영되며, 특정 부서나 기능별 요구를 충족시키기 위해 설계된다.데이터 마트1. 정의와 목적정의데이터 마트는 특정 비즈니스 부서나 사용자 그룹이 필요로 하는 데이터만을 포함하는 소규모 데이터 웨어하우스이다.목적특정 부서의 요구 사항을 충족시키기 위해 데이터 분석 및 보고를 용이하게 하여 의사 결정 과정을 지원한다.2. 유형분석형 데이터 마트분석 및 보고를 위해 사용되는 데이터 마트로, 주로 경영진이나 분석가들이 사용한다.운영형 데이터 마트운.. 2024. 8. 7.
본 캠프 44일차 TIL 오늘 배운 것거버넌스 체계 개요 및 구성 요소거버넌스 체계 개요거버넌스 체계는 조직 내에서 데이터와 IT 자산을 관리하고 통제하는 프레임워크이다. 이는 데이터 품질, 데이터 보안, 데이터 활용, 데이터 정책 등을 포함하여 데이터를 효과적으로 관리하고 조직의 목표를 지원하는 데 초점을 맞춘다.구성 요소1. 정책 및 절차 (Policies and Procedures)데이터 관리 정책: 데이터 생성, 저장, 처리, 폐기 등의 관리 방침데이터 보안 정책: 데이터 접근, 암호화, 보안 위협 대응 방침데이터 품질 정책: 데이터의 정확성, 완전성, 일관성 유지 방침2. 데이터 소유권 및 책임 (Data Ownership and Stewardship)데이터 소유자: 특정 데이터 세트에 대한 책임과 권한을 가진 개인 또.. 2024. 8. 6.
본 캠프 43일차 TIL 피어슨 상관계수 (Pearson Correlation Coefficient)피어슨 상관계수는 두 변수 간의 선형 관계를 측정하는 통계량입니다. 이 값은 -1과 1 사이의 값을 가지며, 값의 크기에 따라 두 변수 간의 관계를 다음과 같이 해석할 수 있습니다:1: 완벽한 양의 선형 관계0: 선형 관계가 없음-1: 완벽한 음의 선형 관계피어슨 상관계수는 다음의 수식을 통해 계산됩니다:r = ∑(X − X̄)(Y − Ȳ) / √[ ∑(X − X̄)² ∑(Y − Ȳ)² ] 여기서 X와 Y는 두 변수, X̄와 Ȳ는 각각의 평균입니다.스피어만 순위 상관계수 (Spearman's Rank Correlation Coefficient)스피어만 순위 상관계수는 두 변수 간의 모노톤 관계(단조 관계)를 측정합니다. 이 상관계.. 2024. 8. 5.