[Python] μμΈ μ’ ν©λ³μ λΆν¬ λ°μ΄ν° λΆμ
λ°μ΄ν° μμ곡μΈμμ₯μ§ν₯곡λ¨_μκ°(μκΆ)μ 보_μλ£κΈ°κ΄_20190930 μκ°(μκΆ)μ 보 μλ£κΈ°κ΄μ λνλ΄λ λ°μ΄ν°μ λλ€. μλ£κΈ°κ΄μ μνΈλͺ , μ£Όμ, μκΆμ μ’ μ€λΆλ₯λͺ , μλΆλ₯λͺ μ νλͺ©μΌλ‘ μ 곡ν©
xod22.tistory.com
μ λ² ν¬μ€ν μμ μμΈ μ’ ν©λ³μμ κ³ λ₯΄κ² λΆν¬λμ΄ μμκΉμ λν΄ λΆμν΄λ³΄μμ΅λλ€!
μ΄λ² κΈμμλ μνλ "μλλ³" μλ£κΈ°κ΄ κ°μλ₯Ό μκ°ννλ κ²μ λν΄ μ½λλ₯Ό μ 리ν΄λ³΄λ €κ³ ν©λλΉ~_~
νΉμ μ§μ λ°μ΄ν° μΆμΆ
1. ν¨ν€μ§ μν¬νΈ λ° λ°μ΄ν° λΆλ¬μ€κΈ°
: λ°μ΄ν°λ μ λ² κΈμμ μ¬μ©ν λ°μ΄ν°μ λμΌν©λλ€.!
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
#κ·Έλνκ° λ
ΈνΈλΆ μμ 보μ΄κ² νκΈ° μν΄
%matplotlib inline
#νκΈ ν°νΈ μ€μ
#matplotlibμμλ νκΈν°νΈκ° κΉ¨μ§κΈ° λλ¬Έμ
plt.rc('font', family='Malgun Gothic')
#λ§μ΄λμ€ κΈ°νΈκ° νμλλλ‘ ν΄μ€
plt.rc('axes', unicode_minus=False)
df=pd.read_csv('μμ곡μΈμμ₯μ§ν₯곡λ¨_μκ°μ
μμ 보_μλ£κΈ°κ΄_201909.csv', encoding='cp949')
2. κ°μ₯ μλ£κΈ°κ΄μ΄ λ§μ "μλλ³" λ°μ΄ν°λ₯Ό μκ°νν΄λ³΄κ² μ΅λλ€!
city=df["μλλͺ
"].value_counts()
city
=> κ²½κΈ°λκ° κ°μ₯ λ§μ μλ£κΈ°κ΄μ΄ μλ κ²μ νμΈ!
3. κ²½κΈ°λ λ°μ΄ν° μΆμΆ
: μ μ£ΌνΉλ³μμΉλ λ°μ΄ν°κ° λ³΄κ³ μΆλ€λ©΄
df_jeju=df[df["μλλͺ "]=="μ μ£ΌνΉλ³μμΉλ"].copy
μ΄λ κ² "μλλͺ "λ§ λ°κΏμ λ°μ΄ν°λ₯Ό νν°λ§νμ¬ λ³Ό μ μλ€!
df_kyonggi=df[df["μλλͺ
"]=="κ²½κΈ°λ"].copy()
df_kyonggi.head()
4. "μꡰꡬλͺ "μκ°ν
df_kyonggi["μꡰꡬλͺ
"].value_counts().plot.bar(figsize=(20,4), rot=30)
#seaborn
plt.figure(figsize=(20,4))
sns.countplot(data=df_kyonggi, x="μꡰꡬλͺ
")
5. "μꡰꡬλͺ " κ²½λμ μλ νμ
~pandasμ plot.scatter~
df_kyonggi[["κ²½λ", "μλ", "μꡰꡬλͺ
"]].plot.scatter(x="κ²½λ", y="μλ", figsize=(8,7), grid=True)
~seabornμ scatterplot~
-> hue:μμΌλ‘ ꡬλΆν μ μκ² ν΄μ€
plt.figure(figsize=(9,8))
sns.scatterplot(data=df_kyonggi, x="κ²½λ", y="μλ", hue="μꡰꡬλͺ
")
6. "μκΆμ μ’ μ€λΆλ₯λͺ " κ²½λμ μλ νμ
plt.figure(figsize=(9,8))
sns.scatterplot(data=df_kyonggi, x="κ²½λ", y="μλ", hue="μκΆμ
μ’
μ€λΆλ₯λͺ
")
7. μ κ΅λ°μ΄ν°λ‘ "μꡰꡬλͺ " κ²½λμ μλ νμ
#μ κ΅ λ°μ΄ν°(df)λ‘ κ΅¬λ³ κ²½λμ μλλ₯Ό νμ
plt.figure(figsize=(16,12))
sns.scatterplot(data=df, x="κ²½λ", y="μλ", hue="μλλͺ
")