안녕하세요. Teus입니다. 일반적인 1d array를 사용해서 ndarray를 만드는 프로그래밍 언어들의 list, array와 다르게 Pnadas의 경우 1d Series, 2d DataFrame이라는 형태로 Data를 보다 편리하게 관리합니다. 덕분에 pivot이나 groupby 같은 SQL에서 특화된 동작도 편하게 사용이 가능합니다. 이번 포스팅은, Pandas DataFrame의 .groupby method의 동작 원리에 대해서 알아보겠습니다. 1. DataFrame.groupby groupby는 n개 이상의 col을 기준으로 group을 만들고, group마다 특정 function을 적용하는 method로, SQL의 select Aggregation_method(col) group by gro..
안녕하세요. Teus입니다. 이번 포스팅은 Encoding에 대해서 간단히 정리하고, Python에서 char를 다루는 방법과 Encoding에 대해서 다룹니다. 1. 문자열 Encoding 이제는 식상한 말 이지만, 컴퓨터는 모든 데이터를 0/1 이진 Data로 처리합니다. 그렇기 때문에 숫자 같은 경우 10진수->2진수 변환을 통해서 저장됩니다 (Ex. 숫자 22 -> 2진수 101100) 반면, char 같은경우 char -> 2진 변환을 하는 다양한 방법이 존재합니다. 이때 char -> 2진 변환은 Encoding이라고 하며, char에 대응되는 특정한 2진수로 coding한다는 것을 의미합니다. 대표적인 char Encoding 방법으로 ASCII Code와 Unicode(UTF-8.16.....
안녕하세요. Teus입니다. 이번 포스팅은, Pandas DataFrame의 .apply method에 대해서 파해쳐 봅니다. 1.DataFrame.apply Pandas의 경우, DataFrame이나 Series에 .apply method를 사용해서, 사용자 지정 함수를 Elementwise하게 적용하는 것이 가능합니다. import pandas as pd temp_df = pd.DataFrame({"a" : [i*1 for i in range(100)], "b" : [i*2 for i in range(100)], "c" : [i*3 for i in range(100)], "d" : [i*4 for i in range(100)], "e" : [i*5 for i in range(100)]}) #"a" c..
안녕하세요. Teus입니다.이번 포스팅에서는 Pandas Object의 inplace=True 동작에 대해서 다룹니다.inplace = True동작이 어떻게 동작하는지, 그리고 왜 사용을 지양하는지에 대해서 알아 볼겁니다.1. inplace = True ? Falseinplace는 Object의 불변성과 관련된 중요한 키워드 입니다.기본적으로 불변성 Data는 Data자신이 바뀌는일 없이Data에 변경이 생길경우 변경이 적용된 새로운 Data를 만들어 줍니다.아래 Series Object를 정렬시켜주는 sort_values()를 보시겠습니다.import pandas as pddt = pd.Series([1, 8, 6, 7, 9])print(dt.sort_values())#>>[1, 6, 7, 8, 9]p..
안녕하세요. Teus입니다. 지난 포스팅을 통해서 Pandas Series가 어떻게 Data를 저장하는지 확인 하였습니다. 이번 포스팅은 Pandas Series Data에 접근하기 용이하게 해주는 Pandas Index에 대해서 알아보겠습니다. 1. BlockManager 지난시간 Pandas Series는 내부에 _mgr라는 곳에 Data와 Index를 저장하고 이 Object를 통해서 Data를 접근, 통제한다고 했습니다. 그리고 이 Manager는 BlockManager Object였습니다. #https://github.com/pandas-dev/pandas/blob/e86ed377639948c64c429059127bcf5b359ab6be/pandas/core/internals/managers.p..
안녕하세요 Teus입니다. 이번 포스팅은 Pandas DataFrame을 이해하기 위한 Pandas Series 알아보기 시간 입니다. 1. Pandas Series Pandas Series는 Pandas의 자료구조 중 1dim의 Array형태의 Object입니다 다들 DataFrame이 익숙 하시겠지만, DataFrame을 이해하기 위해서는 Series를 먼저 이해할 필요가 있습니다. 그럼 Pandas Series Source Code가 어떤 형태로 되어있는지 보도록 하겠습니다. (초록색은 일반 Cls, 주황색은Mixin Cls입니다) Series가 NDFrame을 상속받고, 이 NDFrame이 PandasObject를 상속받는 구조 입니다. Series : drop_duplicates, reset_i..
- Total
- Today
- Yesterday
- Greedy알고리즘
- 컴퓨터그래픽스
- 이분탐색
- C++
- Python
- Search알고리즘
- hash
- Sort알고리즘
- 분할정복
- 알고리즘
- 프로그래머스
- stack
- 동적계획법
- 자료구조
- GDC
- git
- prime number
- SIMD
- AVX
- 완전탐색 알고리즘
- 사칙연산
- heap
- 병렬처리
- 코딩테스트
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |