본문 바로가기

Python/Pandas9

DataFrame 병합하기: concat, merge, join 안녕하세요. 모두의 케빈입니다. 오늘은 Data Frame을 병합하는 방법에 대해 알아보도록 하겠습니다. ■ Data Frame 병합 Pandas를 다루다 보면, 데이터 프레임을 합쳐야 하는 경우가 종종 생깁니다. Data Frame을 합치는 방법에는 크게 3가지가 있습니다. concat, merge, join이 그것인데요. 병합의 메커니즘이 조금씩 다르기 때문에 방법을 정확히 알고 상황에 맞게 사용하시면 됩니다. 자, 그러면 실습을 진행해볼까요? Data 준비: kaggle "exams.csv" 실습에 사용하는 Data는 Kaggle에서 학생들의 시험 성적에 관한 파일을 사용했습니다. 실습을 위해 일부의 데이터만 사용하고, 조금 가공해보도록 하겠습니다. import pandas as pd raw_dat.. 2022. 11. 9.
Data Frame의 행, 열 선택하기: iloc과 loc의 차이점 안녕하세요. 모두의 케빈입니다. 오늘은 Dafa Frame의 행, 열을 선택하는 방법 중 대표적인 loc과 iloc에 대해 알아보도록 하겠습니다. ■ iloc과 loc이란? 정의와 차이점 순서 기반 접근 vs 명시된 이름으로 접근 pandas 공식 페이지에 의하면, iloc은 정수 "위치" 기반 인덱싱이라고 나와있습니다. iloc은 integer location의 약자로, 행과 열의 위치, 즉 순서 정보로 data frame에 접근합니다. 반면 loc은 "레이블" 등으로 행과 열에 접근한다고 나와있습니다. 행과 열의 "이름"으로 접근한다고 접근한다고 생각하시면 편합니다. 위 테이블을 예시로 설명드리겠습니다. iloc은 순서 기반 인덱싱이라고 했습니다. 따라서 "두 번째 행, 세 번째 열의 정보를 가져와줘.. 2022. 11. 7.
Python 기초: DataFrame 만들기 안녕하세요. 모두의 케빈입니다. 오늘은 실제 현업에서도 굉장히 많이 사용되는 Pandas 중, DataFrame를 만드는 방법에 대해 알아보겠습니다. 첫 번째 방법: read_excel(csv) Excel 파일(또는 csv)를 Pandas로 불러오면, 자연스럽게 DataFrame 형태가 됩니다. 아마도 현업에서 가장 많이 사용하는 방법일 것 같습니다. # DataFrame 생성 df = pd.read_excel("employee_list.xlsx") df 사번을 index로 사용하고 싶다면, 아래와 같이 지정해주세요. df = pd.read_excel("employee_list.xlsx",index_col = "사번") df 두 번째 방법: dictionary 종종 코딩을 하다보면, 직접 DataFram.. 2022. 11. 3.