at
단 하나의 값에만 접근할 수 있게 설계된 인덱서
loc
다량의 자료에 접근하기 위해 설계된 인덱서
팁
단 하나의 자료에 접근할 때는 at을 쓰는 것이 속도가 훨씬 빠르다. 패스트 인덱싱이라고도 한다.
예제
#### at 사용하기
def split_multicolumn(Series):
df = pd.DataFrame(False, columns = (Series.dropna().str.split(';').str[0].unique()), index = Series.index)
for idx, rep in Series.str.split(';').items():
if isinstance(rep, list):
for one in rep:
df.at[idx, one.strip()] = True
else :
pass
return df
split_multicolumn(survey_df['DevType'])
### 동작 시간 : 1.2초
#### loc 사용하기
def split_multicolumn(Series):
df = pd.DataFrame(False, columns = [Series.dropna().str.split(';').str[0].unique()], index = Series.index)
for idx, rep in Series.str.split(';').items():
if isinstance(rep, list):
for one in rep:
df.loc[idx, one.strip()] = True
else :
pass
return df
split_multicolumn(survey_df['DevType'])
### 동작 시간 : 14.5초
공식문서
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.at.html
'데이터 분석 및 시각화 > 파이썬' 카테고리의 다른 글
[Python]Pandas 특정 문자열 포함 행 찾고 대체하기(str.contains, where) (0) | 2023.01.30 |
---|---|
[Python] Pandas 시리즈 문자열 변경 메소드(replace) (1) | 2023.01.30 |
[Python] 기초정리(Pandas(Merge, 시계열 자료, Groupby)) (0) | 2023.01.20 |
[Python] 기초 정리(Pandas_DataFrame3) (0) | 2023.01.20 |
[Python] 기초 정리(Pandas_DataFrame2) (2) | 2023.01.19 |