물론 pandas에는 아주 익숙하지만 잊어버리거나 하는 경우를 대비하여 곁에 두고 자주 보는 것이 좋기때문에 블로그에 올려둡니다! 보통 cheetsheet은 한장으로 정리되어있는데 pandas는 두장으로 정리가 되어있네요! 자주자주 봐야겠습니다 ㅎㅎ
- loc : 인덱스 이름을 기준으로 추출(사람이 읽을 수 있는 label값으로 특정 값들을 골라오는 방법) - iloc : 데이터 프레임의 행이나 컬럼의 인덱스 값으로 접근하는 방법 loc 예시 df.loc[행 인덱싱 값, 열 인덱싱 값] 1. 데이터 불러오기 import pandas as pd customer_m=pd.read_csv("customer_master.csv") customer_m 2. 레이블 이름이 "0"인 행 추출 customer_m.loc[0] 레이블 이름이 "0"인 행을 추출한 것을 확인 3. 레이블 이름이 "1"인 행 추출 customer_m.loc[1] 레이블 이름이 "1"인 행을 추출한 것을 확인 4. 레이블 이름이 "customer_id"인 열 추출 customer_m.lo..
*작업형 제 1 유형을 제출할 때 주의점은 중간에 푸는 과정에서 print가 있었다면 마지막에 제출 전에는 "#"을 붙여서 주석 처리를 해주시고 최종 print만 출력되도록 해야한다는 것..! 11번 문제 다음은 BostonHousing 데이터 세트이다. crim 항목의 상위에서 10번째 값(즉, 상위 10번째 값 중에서 가장 적은 값)으로 상위 10개의 값을 변환하고, age 80 이상인 값에 대하여 crim 평균을 구하시오. 11번 풀이 1. 데이터 불러오기 import pandas as pd data=pd.read_csv("BostonHousing.csv") 2. info() print(data.info()) => 506개의 행과, 15개의 컬럼으로 이루어진 데이터 프레임인 것을 확인했습니다 3. ..
*pandas 패키지를 익숙하게 다룰 줄 안다면 데이터를 불러와서 쉽게 분석을 실행할 수 있다! *직접 파일을 불러와서 다뤄보는 것이 실력이 늘 수 있는 가장 빠른 방법이다. 그럼 시작! 우선 파이썬에서 pandas 패키지를 사용하기 전 항상 선언해주어야한다. as pd는 pandas를 pd로 써주겠다는 의미이므로 이후에는 pd로 써주어 판다스를 기능들을 이용한다. import pandas as pd 1. 데이터 불러오기 excel파일을 불러올 때는 파일명에 .xlsx를 csv파일을 불러올 때는 파일명에 .csv까지 붙여서 불러와야한다. # pd.read_excel("파일명.xlsx") # pd.read_csv("파일명.csv") df=pd.read_excel("EX_GrapeData.xlsx") pri..