Data Warehouse

κΈ°μ—…μ˜ μ˜μ‚¬ 결정을 μ§€μ›ν•˜κΈ° μœ„ν•œ 데이터λ₯Ό λͺ¨μ•„놓은 톡합적인 자료의 집합이닀.

μ΄λŠ” 주제 μ€‘μ‹¬μ μœΌλ‘œ λͺ¨μ•„λ†“μ•˜μœΌλ©° λ‹€μ–‘ν•œ 운영 μ‹œμŠ€ν…œμ—μ„œ μΆ”μΆœ 및 λ³€ν˜•κ³Όμ •μ΄ μΌμ–΄λ‚œ 읽기 μ „μš© 데이터 λ² μ΄μŠ€μ΄λ‹€.

νŠΉμ§•

주제 쀑심적 (Subject Oriented)

  • 각 쑰직의 μ£Όμš” 주제λ₯Ό μ€‘μ‹¬μœΌλ‘œ κ΄€λ ¨ 데이터λ₯Ό ꡬ성

톡합 ꡬ쑰 (Integrated)

  • 업무 κΈ°λŠ₯λ³„λ‘œ κ΄€λ¦¬λ˜λŠ” λ‹€μˆ˜μ˜ 운영 데이터λ₯Ό 전사적 κ΄€μ μ—μ„œ 쀑볡을 μ΅œμ†Œν™”ν•˜κ³ , λͺ¨λ“  업무에 κ³΅μœ ν•  수 μžˆλ„λ‘ 톡합
  • λ°μ΄ν„°μ˜ μ •ν•©μ„±κ³Ό 톡일성을 κ°–λŠ” 데이터 ꡬ쑰의 지원

μ‹œκ³„μ—΄ 데이터 (Time Variant)

  • λ°μ΄ν„°λŠ” 였랜 κΈ°κ°„ λ™μ•ˆ 보유되며 과거와 ν˜„μž¬μ˜ κ²½ν–₯ 뢄석이 κ°€λŠ₯ν•˜λ„λ‘ λͺ¨λ“  μˆœκ°„μ˜ 값을 μœ μ§€

λΉ„ νœ˜λ°œμ„± 데이터 (Non Volatile)

  • 초기 데이터 적재 μ΄ν›„μ—λŠ” λ°μ΄ν„°μ˜ 갱신은 λ°œμƒν•˜μ§€ μ•Šκ³  κ²€μƒ‰λ§Œ κ°€λŠ₯
  • 데이터 κ°±μ‹  이상에 λŒ€ν•œ κ³ λ €κ°€ ν•„μš”μ—†μœΌλ©°, μ •κ·œν™” 및 λ°˜μ •κ·œν™”μ— λŒ€ν•œ μœ΅ν†΅μ„±μ˜ 증가

λͺ¨λΈλ§ 기법

주둜 ETL νˆ΄μ„ μ΄μš©ν•˜μ—¬ κ΅¬μΆ•ν•˜κΈ°λ„ ν•˜λ©° λŒ€λΆ€λΆ„μ€ μŠ€νƒ€ μŠ€ν‚€λ§ˆ (Star Schema) ꡬ쑰둜 κ΅¬μ„±λœλ‹€.

μŠ€νƒ€ μŠ€ν‚€λ§ˆ (Star Schema)

λͺ¨λΈλ§μ˜ ꡬ쑰가 별 λͺ¨μ–‘이라 μŠ€νƒ€λΌλŠ” 이름이 λͺ…λͺ…됨

μŠ€νƒ€ μŠ€ν‚€λ§ˆ

  • 차원 (Dimension) : 수치λ₯Ό ν•œμ •μ§“κ²Œ ν•˜λŠ” μΌμ’…μ˜ ν‚€ μ—­ν™œμ„ ν•œλ‹€. (ν•„ν„°, μ •λ ¬ 등등이 ν¬ν•¨λœλ‹€)
  • 수치 (Measure) : μ‹€μ œλ‘œ μ˜λ―ΈμžˆλŠ” 값을 μ§€μΉ­ν•œλ‹€.
  • 팩트 ν…Œμ΄λΈ” (Fact Table) : Measure 정보λ₯Ό ν¬ν•¨ν•œ ν…Œμ΄λΈ”μ„ λ§ν•œλ‹€.

데이터 마트 (Data Mart)

이해관계가 λ™μΌν•œ μ‚¬μš©μž 집단에 νŠΉν™”λœ 데이터 λ‘œμ„œ λŒ€λΆ€λΆ„μ€ DW 둜 λΆ€ν„° λ³΅μ œλ˜μ§€λ§Œ μžμ²΄μˆ˜μ§‘ λ˜λŠ” κ²½μš°λ„ μžˆλ‹€. νŠΉμ • μ‚¬μš©μž 집단에 λŒ€ν•œ μ ‘κ·Όμ„±κ³Ό 가독성을 λ†’μ΄λŠ”λ° 초점 이 맞좰져 있으며 λ§Žμ€ 뢀뢄듀이 μš”μ•½λœ λ°μ΄ν„°λ‘œ 제곡 λœλ‹€.

메타 데이터 (Meta Data)

  • 데이타에 λŒ€ν•œ 데이타라고 ν•  수 μžˆλ‹€.
  • λ°μ΄ν„°μ˜ μœ„μΉ˜μ •λ³΄λΌλ˜μ§€ ν˜Ήμ€ λ°μ΄ν„°κ°„μ˜ 관계와 같은 λ°μ΄ν„°μ˜ λͺ…μ„Έλ₯Ό 가지고 μžˆλŠ” 정보이닀.

데이터 λ§ˆμ΄λ‹ (Data Mining)

  • λŒ€κ·œλͺ¨λ‘œ μ €μž₯된 데이터 μ•ˆμ—μ„œ νŠΉμ • κ·œμΉ™μ΄λ‚˜ νŒ¨ν„΄μ„ λ°œκ²¬ν•΄λ‚΄λŠ” 과정을 λ§ν•œλ‹€.
  • μΌλΆ€μ—μ„œλŠ” 데이터 λ””μŠ€μ»€λ²„λ¦¬λΌλŠ” μš©μ–΄λ‘œ μ„œμˆ ν•˜κΈ°λ„ ν•œλ‹€ (ex. MicroStrategy)