본문 바로가기

Python/Pandas9

데이터 프레임에 함수 적용: map, apply, applymap 완벽 정리 안녕하세요. 모두의 케빈입니다. 오늘은 map, apply, applymap의 정의와 각각의 차이점을 완벽하게 예제를 활용하여 설명해드리도록 하겠습니다. ■ 메서드 설명 [요약] map, apply 메서드의 차이는 거의 없고, apply를 주로 활용한다. 다만, map이 유용하게 쓰이는 경우가 있다. 먼저 map과 apply 메서드입니다. map은 Series에만 적용 가능하며, apply는 Series 또는 데이터 프레임의 행, 열에 적용 가능합니다. pandas 환경에서 대부분 apply 메서드를 활용하시는 게 편합니다. 단, map 메서드는 key 값으로 Series를 바로 mapping 할 때 굉장히 편하게 사용할 수 있습니다. [요약] apply와 applymap의 차이는 데이터 프레임 개별 값.. 2022. 11. 24.
데이터 프레임의 행렬곱: AI의 기본 안녕하세요. 모두의 케빈입니다. 오늘은 데이터 프레임으로 행렬곱을 실습해보도록 하겠습니다. ■ 벡터의 곱과 행렬의 곱 두 벡터의 내적을 Dot Product이라고 합니다. 2차원 평면벡터에서 두 벡터 a(a1, a2)와 b(b1, b2)의 내적(방향 표시는 타이핑 이슈로 생략)은 각 성분끼리 곱하고 더하여 정의합니다. (a1*b1 + a2*b2) 이와 유사한 연산으로 선형 대수학에서는 행렬의 곱셈이라는 개념이 있습니다. 행렬의 곱셈은 두 행렬의 크기가 맞는 경우에만 가능합니다. 여기서 크기란, 앞 행렬의 수와 뒤 행렬의 열의 수가 일치하는 것을 의미합니다. 상세한 개념 설명은 나무 위키에서 참고해주세요. 신경망 모델에서 행렬은 벡터의 집합으로 모델링 되고 파라미터의 거의 모든 연산은 행렬의 연산으로 귀결.. 2022. 11. 22.
[Python 기초] 데이터 프레임 중복값 제거: drop_duplicate 예제와 사용법 안녕하세요. 모두의 케빈입니다. 오늘은 데이터 프레임에서 중복된 값을 제거하는 drop_duplicate() 메소드에 대해 알아보겠습니다. 글쓴이의 경험: 언제 사용하는가? 파이썬을 현업에서 사용하면, 종종 엑셀의 VLOOKUP과 같은 기능이 필요한 경우가 있습니다. 다양한 방법이 있겠지만, 저 같은 경우에는 index 설정과 loc을 자주 활용합니다. import pandas as pd df1 = pd.DataFrame({"사번":[1111,2222,3333,4444], "이름":["홍길동","김철수","박영수","이영자"]}) df2 = pd.DataFrame({"사번":[1111,2222,2222,3333,4444], "집계대상":["집계대상","집계대상","집계대상","제외대상","제외대상"], .. 2022. 11. 21.