πŸ” 데이터 뢄석/03. Data Visualizaton

[Python] 쒅합병원 뢄포 뢄석 - μ‹œκ°ν™”

xod22 2022. 3. 25. 21:08
728x90

2022.03.24 - [데이터 뢄석/04. Data Analysis] - [Python] μ„œμšΈ 쒅합병원 뢄포 데이터 뢄석

 

[Python] μ„œμšΈ 쒅합병원 뢄포 데이터 뢄석

데이터 μ†Œμƒκ³΅μΈμ‹œμž₯μ§„ν₯곡단_상가(μƒκΆŒ)정보_μ˜λ£ŒκΈ°κ΄€_20190930 상가(μƒκΆŒ)정보 μ˜λ£ŒκΈ°κ΄€μ„ λ‚˜νƒ€λ‚΄λŠ” λ°μ΄ν„°μž…λ‹ˆλ‹€. μ˜λ£ŒκΈ°κ΄€μ˜ μƒν˜Έλͺ…, μ£Όμ†Œ, μƒκΆŒμ—…μ’… 쀑뢄λ₯˜λͺ…, μ†ŒλΆ„λ₯˜λͺ…을 ν•­λͺ©μœΌλ‘œ μ œκ³΅ν•©

xod22.tistory.com

μ €λ²ˆ ν¬μŠ€νŒ…μ—μ„œ μ„œμšΈ 쒅합병원은 κ³ λ₯΄κ²Œ λΆ„ν¬λ˜μ–΄ μžˆμ„κΉŒμ— λŒ€ν•΄ λΆ„μ„ν•΄λ³΄μ•˜μŠ΅λ‹ˆλ‹€!

이번 κΈ€μ—μ„œλŠ” μ›ν•˜λŠ” "μ‹œλ„λ³„" μ˜λ£ŒκΈ°κ΄€ 개수λ₯Ό μ‹œκ°ν™”ν•˜λŠ” 것에 λŒ€ν•΄ μ½”λ“œλ₯Ό 정리해보렀고 ν•©λ‹ˆλ‹Ή~_~

 

νŠΉμ •μ§€μ—­ 데이터 μΆ”μΆœ

 

1. νŒ¨ν‚€μ§€ μž„ν¬νŠΈ 및 데이터 뢈러였기

: λ°μ΄ν„°λŠ” μ €λ²ˆ κΈ€μ—μ„œ μ‚¬μš©ν•œ 데이터와 λ™μΌν•©λ‹ˆλ‹€.!

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

#κ·Έλž˜ν”„κ°€ λ…ΈνŠΈλΆ μ•ˆμ— 보이게 ν•˜κΈ° μœ„ν•΄
%matplotlib inline

#ν•œκΈ€ 폰트 μ„€μ •
#matplotlibμ—μ„œλŠ” ν•œκΈ€ν°νŠΈκ°€ κΉ¨μ§€κΈ° λ•Œλ¬Έμ—
plt.rc('font', family='Malgun Gothic')
#λ§ˆμ΄λ„ˆμŠ€ κΈ°ν˜Έκ°€ ν‘œμ‹œλ˜λ„λ‘ ν•΄μ€Œ
plt.rc('axes', unicode_minus=False)
df=pd.read_csv('μ†Œμƒκ³΅μΈμ‹œμž₯μ§„ν₯곡단_μƒκ°€μ—…μ†Œμ •λ³΄_μ˜λ£ŒκΈ°κ΄€_201909.csv', encoding='cp949')

 

 

2. κ°€μž₯ μ˜λ£ŒκΈ°κ΄€μ΄ λ§Žμ€ "μ‹œλ„λ³„" 데이터λ₯Ό μ‹œκ°ν™”ν•΄λ³΄κ² μŠ΅λ‹ˆλ‹€!

city=df["μ‹œλ„λͺ…"].value_counts()
city

=> 경기도가 κ°€μž₯ λ§Žμ€ μ˜λ£ŒκΈ°κ΄€μ΄ μžˆλŠ” 것을 확인!

 

 

3. 경기도 데이터 μΆ”μΆœ

: μ œμ£ΌνŠΉλ³„μžμΉ˜λ„ 데이터가 보고싢닀면 

df_jeju=df[df["μ‹œλ„λͺ…"]=="μ œμ£ΌνŠΉλ³„μžμΉ˜λ„"].copy

μ΄λ ‡κ²Œ "μ‹œλ„λͺ…"만 λ°”κΏ”μ„œ 데이터λ₯Ό ν•„ν„°λ§ν•˜μ—¬ λ³Ό 수 μžˆλ‹€!

df_kyonggi=df[df["μ‹œλ„λͺ…"]=="경기도"].copy()
df_kyonggi.head()

 

 

4. "μ‹œκ΅°κ΅¬λͺ…"μ‹œκ°ν™”

df_kyonggi["μ‹œκ΅°κ΅¬λͺ…"].value_counts().plot.bar(figsize=(20,4), rot=30)

#seaborn
plt.figure(figsize=(20,4))
sns.countplot(data=df_kyonggi, x="μ‹œκ΅°κ΅¬λͺ…")

 

 

5. "μ‹œκ΅°κ΅¬λͺ…" 경도와 μœ„λ„ ν‘œμ‹œ

 

~pandas의 plot.scatter~

df_kyonggi[["경도", "μœ„λ„", "μ‹œκ΅°κ΅¬λͺ…"]].plot.scatter(x="경도", y="μœ„λ„", figsize=(8,7), grid=True)

~seaborn의 scatterplot~
-> hue:μƒ‰μœΌλ‘œ ꡬ뢄할 수 있게 ν•΄μ€Œ

plt.figure(figsize=(9,8))
sns.scatterplot(data=df_kyonggi, x="경도", y="μœ„λ„", hue="μ‹œκ΅°κ΅¬λͺ…")

 

 

6. "μƒκΆŒμ—…μ’…μ€‘λΆ„λ₯˜λͺ…" κ²½λ„와 μœ„도 ν‘œμ‹œ

plt.figure(figsize=(9,8))
sns.scatterplot(data=df_kyonggi, x="경도", y="μœ„λ„", hue="μƒκΆŒμ—…μ’…μ€‘λΆ„λ₯˜λͺ…")

 

 

7. μ „κ΅­λ°μ΄ν„°λ‘œ "μ‹œκ΅°κ΅¬λͺ…" 경도와 μœ„λ„ ν‘œμ‹œ

#μ „κ΅­ 데이터(df)둜 ꡬ별 경도와 μœ„λ„λ₯Ό ν‘œμ‹œ
plt.figure(figsize=(16,12))
sns.scatterplot(data=df, x="경도", y="μœ„λ„", hue="μ‹œλ„λͺ…")

728x90