*์์ ํ ์ 1 ์ ํ์ ์ ์ถํ ๋ ์ฃผ์์ ์ ์ค๊ฐ์ ํธ๋ ๊ณผ์ ์์ print๊ฐ ์์๋ค๋ฉด ๋ง์ง๋ง์ ์ ์ถ ์ ์๋ "#"์ ๋ถ์ฌ์ ์ฃผ์ ์ฒ๋ฆฌ๋ฅผ ํด์ฃผ์๊ณ ์ต์ข print๋ง ์ถ๋ ฅ๋๋๋ก ํด์ผํ๋ค๋ ๊ฒ..!
11๋ฒ ๋ฌธ์
๋ค์์ BostonHousing ๋ฐ์ดํฐ ์ธํธ์ด๋ค. crim ํญ๋ชฉ์ ์์์์ 10๋ฒ์งธ ๊ฐ(์ฆ, ์์ 10๋ฒ์งธ ๊ฐ ์ค์์ ๊ฐ์ฅ ์ ์ ๊ฐ)์ผ๋ก ์์ 10๊ฐ์ ๊ฐ์ ๋ณํํ๊ณ , age 80 ์ด์์ธ ๊ฐ์ ๋ํ์ฌ crim ํ๊ท ์ ๊ตฌํ์์ค.
11๋ฒ ํ์ด
1. ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐ
import pandas as pd
data=pd.read_csv("BostonHousing.csv")
2. info()
print(data.info())
=> 506๊ฐ์ ํ๊ณผ, 15๊ฐ์ ์ปฌ๋ผ์ผ๋ก ์ด๋ฃจ์ด์ง ๋ฐ์ดํฐ ํ๋ ์์ธ ๊ฒ์ ํ์ธํ์ต๋๋ค
3. 'CRIM'์ปฌ๋ผ->๋ด๋ฆผ์ฐจ์์ผ๋ก ์ ๋ ฌ(ํฐ ์ ๋ถํฐ)
data.sort_values('CRIM', ascending=False, inplace=True)
4. ์์ 10๊ฐ ๊ฐ ์ค ์ต์๊ฐ์ ์ ์ฅ
crim_min=data['CRIM'].head(10).min()
5. 'CRIM'์ปฌ๋ผ์ด ์ต์๊ฐ๋ณด๋ค ํฌ๋ฉด a1์ ์ ์ฅ/ ์ต์๊ฐ๋ณด๋ค ์์ผ๋ฉด a2์ ์ ์ฅ
a1=data[data['CRIM']>=crim_min]
a2=data[data['CRIM']<crim_min]
6. ์ต์๊ฐ๋ณด๋ค ํฐ ๊ฐ์ด ์ ์ฅ๋์ด์๋ a1๊ฐ์ ๋ค ์ต์๊ฐ์ผ๋ก ๋ณํํด์ค
#a1=a1.copy()
a1['CRIM']=crim_min
์ฌ๊ธฐ์ a1=a1.copy()๋ฅผ ์์จ์ฃผ๋ฉด ๊ฒฝ๊ณ ๋ฌธ?์ด ๋จ๋๋ผ๊ตฌ์..!
๊ทธ๋์ ์ ๋ ์จ์คฌ์ต๋๋น
print(a1)
์ ๋ณํ๋์ด์๋ ๊ฒ์ ํ์ธ!
7. ๋ฐ์ดํฐ ํ๋ ์ ํฉ์น๊ธฐ
train=pd.concat([a1,a2],axis=0)
pd.concat()์ ๋ ๋ฐ์ดํฐ ํ๋ ์์ ํฉ์ณ์ค๋๋ค.
=> axis=0์ ์์๋๋ก ๋ถ์ฌ๋ผ!๋ผ๋ ์๋ฏธ.. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ์ปฌ๋ผ ๊ฐ์๊ฐ ๋์ผํด์ผ๋ง ์ค๋ฅ์์ด ํฉ์ง๋๋ค..!
print(train)
=> 506๊ฐ์ ํ๊ณผ, 15๊ฐ์ ์ปฌ๋ผ์ผ๋ก ๋ค์ ์ ํฉ์ณ์ก์ฃต!
8. 'AGE' ์ปฌ๋ผ์ด 80 ์ด์์ธ row๋ง ์ ์ฅ
result=train[train['AGE']>=80]
9. AGE>=80์ด ํํฐ๋ง ๋ ์๋ก์ด ๋ฐ์ดํฐํ๋ ์์์ 'CRIM' ํ๊ท
result=result['CRIM'].mean()
10. ๊ฒฐ๊ณผ๊ฐ ์ ์ถ
print(result)
๋ฌธ์ ๋ง ๋ณด๊ณ ์ ๊ฐ ํ์ดํ๊ฑฐ๋ผ ๋ณต์กํ ์๋ ์์ง๋ง
๋ณต์กํ ํจ์๋ฅผ ์ฐ์ง ์์ผ๋ ค๊ณ ๊ทธ๋ฌ๋๊ฑฐ๋ผ ์ต์ํด์ง๋ฉด ๊ทธ๋ ๊ฒ ๋ณต์กํ๊ฒ ๋๊ปด์ง์์ง ์์๊บผ์์ฅ..!