๐Ÿ“š Study/๋น…๋ฐ์ดํ„ฐ ๋ถ„์„๊ธฐ์‚ฌ ์‹ค๊ธฐ

[๋น…๋ถ„๊ธฐ] 2021๋…„ ์‹ค๊ธฐ ๊ธฐ์ถœ ํ’€์ด-์ž‘์—…ํ˜• ์ œ 1์œ ํ˜•(11๋ฒˆ)

xod22 2022. 3. 22. 12:35
728x90

*์ž‘์—…ํ˜• ์ œ 1 ์œ ํ˜•์„ ์ œ์ถœํ•  ๋•Œ ์ฃผ์˜์ ์€ ์ค‘๊ฐ„์— ํ‘ธ๋Š” ๊ณผ์ •์—์„œ print๊ฐ€ ์žˆ์—ˆ๋‹ค๋ฉด ๋งˆ์ง€๋ง‰์— ์ œ์ถœ ์ „์—๋Š” "#"์„ ๋ถ™์—ฌ์„œ ์ฃผ์„ ์ฒ˜๋ฆฌ๋ฅผ ํ•ด์ฃผ์‹œ๊ณ  ์ตœ์ข… print๋งŒ ์ถœ๋ ฅ๋˜๋„๋ก ํ•ด์•ผํ•œ๋‹ค๋Š” ๊ฒƒ..!

 

11๋ฒˆ ๋ฌธ์ œ

BostonHousing.csv
0.03MB

๋‹ค์Œ์€ BostonHousing ๋ฐ์ดํ„ฐ ์„ธํŠธ์ด๋‹ค. crim ํ•ญ๋ชฉ์˜ ์ƒ์œ„์—์„œ 10๋ฒˆ์งธ ๊ฐ’(์ฆ‰, ์ƒ์œ„ 10๋ฒˆ์งธ ๊ฐ’ ์ค‘์—์„œ ๊ฐ€์žฅ ์ ์€ ๊ฐ’)์œผ๋กœ ์ƒ์œ„ 10๊ฐœ์˜ ๊ฐ’์„ ๋ณ€ํ™˜ํ•˜๊ณ , age 80 ์ด์ƒ์ธ ๊ฐ’์— ๋Œ€ํ•˜์—ฌ crim ํ‰๊ท ์„ ๊ตฌํ•˜์‹œ์˜ค.

 

 

11๋ฒˆ ํ’€์ด

 

1. ๋ฐ์ดํ„ฐ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ

import pandas as pd
data=pd.read_csv("BostonHousing.csv")

 

2. info()

print(data.info())

=> 506๊ฐœ์˜ ํ–‰๊ณผ, 15๊ฐœ์˜ ์ปฌ๋Ÿผ์œผ๋กœ ์ด๋ฃจ์–ด์ง„ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์ธ ๊ฒƒ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค

 

 

3. 'CRIM'์ปฌ๋Ÿผ->๋‚ด๋ฆผ์ฐจ์ˆœ์œผ๋กœ ์ •๋ ฌ(ํฐ ์ˆ˜ ๋ถ€ํ„ฐ)

data.sort_values('CRIM', ascending=False, inplace=True)

 

 

4. ์ƒ์œ„ 10๊ฐœ ๊ฐ’ ์ค‘ ์ตœ์†Ÿ๊ฐ’์„ ์ €์žฅ

crim_min=data['CRIM'].head(10).min()

 

 

5. 'CRIM'์ปฌ๋Ÿผ์ด ์ตœ์†Ÿ๊ฐ’๋ณด๋‹ค ํฌ๋ฉด a1์— ์ €์žฅ/ ์ตœ์†Ÿ๊ฐ’๋ณด๋‹ค ์ž‘์œผ๋ฉด a2์— ์ €์žฅ

a1=data[data['CRIM']>=crim_min]
a2=data[data['CRIM']<crim_min]

 

 

6. ์ตœ์†Ÿ๊ฐ’๋ณด๋‹ค ํฐ ๊ฐ’์ด ์ €์žฅ๋˜์–ด์žˆ๋Š” a1๊ฐ’์„ ๋‹ค ์ตœ์†Ÿ๊ฐ’์œผ๋กœ ๋ณ€ํ™˜ํ•ด์คŒ

#a1=a1.copy()
a1['CRIM']=crim_min

์—ฌ๊ธฐ์„œ a1=a1.copy()๋ฅผ ์•ˆ์จ์ฃผ๋ฉด ๊ฒฝ๊ณ ๋ฌธ?์ด ๋œจ๋”๋ผ๊ตฌ์š”..!

๊ทธ๋ž˜์„œ ์ €๋Š” ์จ์คฌ์Šต๋‹ˆ๋‹น

print(a1)

์ž˜ ๋ณ€ํ™˜๋˜์–ด์žˆ๋Š” ๊ฒƒ์„ ํ™•์ธ!

 

 

7. ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ํ•ฉ์น˜๊ธฐ

train=pd.concat([a1,a2],axis=0)

pd.concat()์€ ๋‘ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•ฉ์ณ์ค๋‹ˆ๋‹ค.

=> axis=0์€ ์œ„์•„๋ž˜๋กœ ๋ถ™์—ฌ๋ผ!๋ผ๋Š” ์˜๋ฏธ.. ๊ทธ๋ ‡๊ธฐ ๋•Œ๋ฌธ์— ์ปฌ๋Ÿผ ๊ฐœ์ˆ˜๊ฐ€ ๋™์ผํ•ด์•ผ๋งŒ ์˜ค๋ฅ˜์—†์ด ํ•ฉ์ง‘๋‹ˆ๋‹ค..!

print(train)

=> 506๊ฐœ์˜ ํ–‰๊ณผ, 15๊ฐœ์˜ ์ปฌ๋Ÿผ์œผ๋กœ ๋‹ค์‹œ ์ž˜ ํ•ฉ์ณ์กŒ์ฃต!

 

 

8. 'AGE' ์ปฌ๋Ÿผ์ด 80 ์ด์ƒ์ธ row๋งŒ ์ €์žฅ

result=train[train['AGE']>=80]

 

 

9. AGE>=80์ด ํ•„ํ„ฐ๋ง ๋œ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์—์„œ 'CRIM' ํ‰๊ท 

result=result['CRIM'].mean()

 

 

10. ๊ฒฐ๊ณผ๊ฐ’ ์ œ์ถœ

print(result)


๋ฌธ์ œ๋งŒ ๋ณด๊ณ  ์ œ๊ฐ€ ํ’€์ดํ•œ๊ฑฐ๋ผ ๋ณต์žกํ•  ์ˆ˜๋„ ์žˆ์ง€๋งŒ 

๋ณต์žกํ•œ ํ•จ์ˆ˜๋ฅผ ์“ฐ์ง€ ์•Š์œผ๋ ค๊ณ  ๊ทธ๋žฌ๋˜๊ฑฐ๋ผ ์ต์ˆ™ํ•ด์ง€๋ฉด ๊ทธ๋ ‡๊ฒŒ ๋ณต์žกํ•˜๊ฒŒ ๋А๊ปด์ง€์‹œ์ง„ ์•Š์„๊บผ์—์šฅ..!

 

728x90
๋Œ“๊ธ€์ˆ˜0