πŸ” 데이터 뢄석/02. Data Processing

[νƒœλΈ”λ‘œ 신병 ν›ˆλ ¨μ†Œ 20κΈ°] DAY10 Tableau Prep을 ν™œμš©ν•œ 데이터 μ „μ²˜λ¦¬

xod22 2023. 9. 8. 08:47
728x90

μ•ˆλ…•ν•˜μ„Έμš”:)

벌써 νƒœλΈ”λ‘œ 신병 ν›ˆλ ¨μ†Œ λ§ˆμ§€λ§‰ 리뷰λ₯Ό ν•˜κ²Œλ˜μ—ˆλ„€μš”!

μ˜€λŠ˜μ€ tableau prep을 μ΄μš©ν•˜μ—¬ 데이터λ₯Ό μ‰½κ²Œ joinν•˜κ³  μ „μ²˜λ¦¬ν•˜λŠ” 방법에 λŒ€ν•΄ μ†Œκ°œν•΄λ³΄λ €κ³  ν•©λ‹ˆλ‹€.

Tableau Prep은 Tableau Desktopκ³Ό λ³„λ„λ‘œ μ„€μΉ˜λ₯Ό ν•΄μ£Όμ…”μ•Όλ˜λŠ” 점! κΈ°μ–΅ν•΄μ£Όμ„Έμš”!


* μ˜μƒ


1️⃣ Tableau Prep Builder

뢄석해야할 데이터가 잘 μ •μ œλ˜μ–΄ μžˆλ‹€λ©΄ λ°”λ‘œ Tableau Desktop에 데이터λ₯Ό μ—°κ²°ν•΄μ„œ 뢄석을 ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

ν•˜μ§€λ§Œ, 데이터가 잘 μ •λ¦¬λ˜μ–΄ μžˆμ§€ μ•Šκ³  μ •μ œκ°€ ν•„μš”ν•˜λ‹€λ©΄ Tableau Prep Builder을 ν™œμš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

 

2️⃣ 데λͺ¨

Q. 데이터 μ„€λͺ…

가ꡬ, 사무기기, μ‚¬λ¬΄μš©ν’ˆμ„ νŒλ§€ν•˜λŠ” λ¦¬ν…ŒμΌ μ—…μ²΄μ˜ 2015λ…„λΆ€ν„° 2018λ…„κΉŒμ§€μ˜ 맀좜 데이터

 

Q. μž‘μ—… λ²”μœ„

   1. 4λ…„μΉ˜ 데이터 κ²°ν•© (Union)

   2. 지역별 κ΄€λ¦¬μž 데이터 κ²°ν•© (Join)

   3. λ°˜ν’ˆ 데이터 κ²°ν•© (Join)

 

  • 2015λ…„~18λ…„κΉŒμ§€ 4개의 μ—‘μ…€νŒŒμΌμ„ tableau prep에 λΆˆλŸ¬μ™€μ€λ‹ˆλ‹€.
    (drag&dropμœΌλ‘œλ„ μ‰½κ²Œ 뢈러올 수 있음)

 

  • 2015λ…„ 데이터 μœ„μ— 2016λ…„ 데이터λ₯Ό drag&drop (UNION κ²°ν•©)

 

  • μΆ”κ°€μ μœΌλ‘œ "지역별 κ΄€λ¦¬μž" νŒŒμΌλ„ μ—…λ‘œλ“œ ν›„ μœ λ‹ˆμ˜¨1에 JOIN()
    -> (문제) 쑰인에 μ œμ™Έλœ 행이 1,832
    -> (원인) μœ λ‹ˆμ˜¨1μ—λŠ” "μ„œμšΈκ²½κΈ°"λΌλŠ” 값이 μ‘΄μž¬ν•˜μ§€λ§Œ 지역별 κ΄€λ¦¬μž ν…Œμ΄λΈ”μ—λŠ” "μ„œμšΈκ²½κΈ°"κ°€ μ—†λ‹€λŠ” 것을 확인

 

  • 문제 해결을 μœ„ν•΄ "정리단계" μ‚½μž…

 

  • "μ§€μ—­" 컬럼 검색 ν›„ "μ„œμšΈκ²½κΈ°" 선택 ν›„ ν•„ν„°κ°’ 제거
    -> "μ„œμšΈκ²½κΈ°"λΌλŠ” 값은 "μ˜μ—… 싀적 2018λ…„" λ°μ΄ν„°μ—λ§Œ 포함이 λ˜μ–΄μžˆμ—ˆμŒ.
    -> κ³΅ν†΅λ˜μ§€ μ•Šμ€ 값듀이 λ“€μ–΄μ™€μžˆλ‹€λŠ” 의미

 

  • λ‹€μ‹œ "μ§€μ—­" 컬럼 검색 > "μˆ˜λ„κΆŒ", "μ„œμšΈκ²½κΈ°" 선택 >"μˆ˜λ„κΆŒ"을 κΈ°μ€€μœΌλ‘œ κ°’ κ·Έλ£Ήν™”

 

  • λ‹€μ‹œ 쑰인1으둜 λŒμ•„κ°€λ³΄λ©΄ μ•„κΉŒμ™€λŠ” λ‹€λ₯΄κ²Œ "μ„œμšΈκ²½κΈ°"값이 μ œμ™Έλ˜μ§€ μ•Šκ³  잘 쑰인이 된 것을 확인

 

  • λ°˜ν’ˆ 데이터 쑰인 
    -> (문제) λ°˜ν’ˆ λ°μ΄ν„°λŠ” μ‹€μ œλ‘œ λ°˜ν’ˆμ΄λœ μ£Όλ¬Έκ±΄μˆ˜μ— λŒ€ν•œ λ°μ΄ν„°λ§Œ 관리.
    -> λ”°λΌμ„œ 쑰인1κ³Ό λ°˜ν’ˆ 두 곳에 μžˆλŠ” λ°μ΄ν„°λ§Œ κ°€μ Έμ˜€λ©΄ λ°˜ν’ˆμ΄ μΌμ–΄λ‚˜μ§€ μ•Šμ€ 주문건은 μ‘°μΈμ—μ„œ μ œμ™Έλ¨

 

  • LEFT OUTER JOIN으둜 λ³€κ²½
    -> μ™Όμͺ½ μ„€μ •μ—μ„œ 쑰인 μœ ν˜•μ„ μ™Όμͺ½μœΌλ‘œ 선택해쀄 것.

 

  • 정리단계 클릭

  • 결합을 ν•˜λ©΄μ„œ λ°œμƒν•œ 좔가적인 정보듀을 제거

 

3️⃣ 좜λ ₯ν•˜κΈ°

λ§Œλ“€μ–΄μ§„ 데이터λ₯Ό 좜λ ₯ν•  수 μžˆλŠ” ν˜•νƒœλ‘œ λ§Œλ“€μ–΄μ•Όν•¨.

-> 파일 ν˜•νƒœ or μ„œλ²„λ‘œ κ²Œμ‹œ(λ‹€λ₯Έ μ‚¬μš©μžλ“€κ³Ό κ³΅μœ ν•΄μ„œ μ‚¬μš©ν•  수 μžˆλ„λ‘)


μ΄λ ‡κ²Œ λ“œλ””μ–΄ κ΅μœ‘μ„ λ‹€ λ§ˆμ³€μŠ΅λ‹ˆλ‹€!!!

ꡐ윑이 λλ‚˜λ©΄ μ΄λ ‡κ²Œ μˆ˜λ£Œμ¦λ„ μ „λ‹¬μ£Όμ‹œλ”λΌκ΅¬μš”~!

 

이둜써 BIνˆ΄μ— ν•œλ°œμ§ λ‹€κ°€κ°„ λŠλ‚Œ!

수료증

 

728x90