*pandas ํจํค์ง๋ฅผ ์ต์ํ๊ฒ ๋ค๋ฃฐ ์ค ์๋ค๋ฉด ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์์ ์ฝ๊ฒ ๋ถ์์ ์คํํ ์ ์๋ค!
*์ง์ ํ์ผ์ ๋ถ๋ฌ์์ ๋ค๋ค๋ณด๋ ๊ฒ์ด ์ค๋ ฅ์ด ๋ ์ ์๋ ๊ฐ์ฅ ๋น ๋ฅธ ๋ฐฉ๋ฒ์ด๋ค.
๊ทธ๋ผ ์์!
- ์ฐ์ ํ์ด์ฌ์์ pandas ํจํค์ง๋ฅผ ์ฌ์ฉํ๊ธฐ ์ ํญ์ ์ ์ธํด์ฃผ์ด์ผํ๋ค.
- as pd๋ pandas๋ฅผ pd๋ก ์จ์ฃผ๊ฒ ๋ค๋ ์๋ฏธ์ด๋ฏ๋ก ์ดํ์๋ pd๋ก ์จ์ฃผ์ด ํ๋ค์ค๋ฅผ ๊ธฐ๋ฅ๋ค์ ์ด์ฉํ๋ค.
import pandas as pd
- 1. ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐ
excelํ์ผ์ ๋ถ๋ฌ์ฌ ๋๋ ํ์ผ๋ช ์ .xlsx๋ฅผ csvํ์ผ์ ๋ถ๋ฌ์ฌ ๋๋ ํ์ผ๋ช ์ .csv๊น์ง ๋ถ์ฌ์ ๋ถ๋ฌ์์ผํ๋ค.
# pd.read_excel("ํ์ผ๋ช
.xlsx")
# pd.read_csv("ํ์ผ๋ช
.csv")
df=pd.read_excel("EX_GrapeData.xlsx")
print(df)
df=pd.read_csv('EX_GrapeData.csv')
print(df)
print๋ฅผ ํด์ ๋ฐ์ดํฐํ๋ ์์ ํ์ธํ๋ฉด ๋๋ต์ ์ธ ๋ฐ์ดํฐ์ ํ๊ณผ์ด์ ํ์ธํ ์ ์๋ค!
ํ๊ธ์ด ํฌํจ๋ ํ์ผ์ ๋ถ๋ฌ์ฌ ๋ ๊นจ์ง๋ ๊ฒฝ์ฐ,
ํ์ผ๋ช ๋ค์ , encoding='euc-kr'๋ก ์ธ์ฝ๋ฉ ์ต์ ์ ์ค์
df=pd.read_csv("EX_GrapeData.csv", encoding='euc-kr')
dfโ
- 2. ๋ฐ์ดํฐ ํ๋ ์ ํ์ธํ๊ธฐ
# ์์ 5๊ฐ ํ์ ๋ถ๋ฌ์ด, ()์์ ์๋ฌด๊ฒ๋ ์ง์ ํ์ง ์์ ์์๋ 5๊ฐ
df.head()
# ์๋์ 5๊ฐ ํ์ ๋ถ๋ฌ์ด
df.tail()
# 1๋ถํฐ 4๊น์ง ์ถ๋ ฅ
df[1:5]
# ์ฒ์๋ถํฐ 2๊น์ง ์ถ๋ ฅ
df[:3]
# 60์์ ๋๊น์ง ์ถ๋ ฅ
df[60:]
df.head()๋ ๋ฐ์ดํฐ์ ํํ๋ฅผ ๋์ถฉ ํ์ธํ๊ธฐ ์ํด ์ ๋ง ์์ฃผ ์ฌ์ฉํ๋ ์ฝ๋์ ๋๋ค!
- 3. ๋ฐ์ดํฐ ํ๋ ์ ํน์ ์ด ๋ถ๋ฌ์ค๊ธฐ
# ๋ฐฉ๋ฒ1
# 0๋ฒ, 2๋ฒ, 4๋ฒ์งธ ์ปฌ๋ผ๋ง ์ถ๋ ฅ
df[df.columns[[0,2,4]]]
# ๋ฐฉ๋ฒ2 : loc์ด์ฉ
# ํ์ ์ ๋ถ, ์ด์ 'size'~'price'๊น์ง ์ถ๋ ฅ
df.loc[:,'size':'price']
# ๋ฐฉ๋ฒ3 : iloc์ด์ฉ
# ํ๊ณผ ์ด์ ๋ชจ๋ ์ง์ ํด์ ๋ถ๋ฅผ ๋
# 1~7ํ, 0~2์ด
df.iloc[1:7, 0:2]
# ๋ฐฉ๋ฒ4
# ํ, ์ด์ ํน์ ๊ฐ์ ์ง์ ํด์ ์ถ๋ ฅํ ๋
df.at[5, 'price']
ํ ์ปฌ๋ผ์ ๋ถ๋ฌ์ฌ ๋ ์ ๋ ๋ฐ์ดํฐ์ ๋ช [['ํ์ด๋ฆ']] ์ด๋ ๊ฒ ๋ถ๋ฌ์ค๋ ๊ฒ์ด ๊ฐ์ฅ ํธ๋ฆฌํ๋ค.
df[['price']]
# df['price']๋ ๋ฐ์ดํฐ ํ๋ ์ ํํ๋ก ๋ถ๋ฌ์์ง๋ ๊ฒ์ด ์๋๊ธฐ ๋๋ฌธ์ ์ฃผ์!
๋ค์ ํฌ์คํ ์์ ํ๋ค์ค์ ํ์ฉ๋ฐฉ์์ ์ข ๋ ์์๋ด ์๋ค!
