반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- Biconnected_Component
- Algorithm
- sstream
- Articulation_Point
- Critical_Path_Analysis
- Pair
- 13305
- Heap
- sort
- 문법
- deletion
- function_template
- 예제
- qsort
- list
- 구현
- 총정리
- data_structure
- c++
- STL
- red-black tree
- class_template
- 5397
- connected_component
- 백준
- '0'
- 알고리즘
- template
- singly Linked List
- 자료구조
Archives
- Today
- Total
- Today
- Total
- 방명록
어제의 나보다 성장한 오늘의 나
[Data Frame] 많이 사용하는 함수 모음 ( DataFrame 생성 , Columns , head , tail , iloc , set_option 등 ) 본문
Python
[Data Frame] 많이 사용하는 함수 모음 ( DataFrame 생성 , Columns , head , tail , iloc , set_option 등 )
today_me 2024. 1. 27. 16:49반응형
오늘은 파이썬 데이터 분석 라이브러리인 Pandas의 "Data Frame" 에서 많이 사용되는 함수에 대해 알아보겠습니다.
0. Import
import pandas as pd
1. DataFrame 생성
1) Dictionary로 Data Frame 생성
d = {'col1': [1, 2], 'col2': [3, 4]}
df = pd.DataFrame(data=d)
2) Array로 Data Frame 생성
d = [['Hayoon', 165, 53], ['Orim', 182, 64], ['Minsu', 172, 82]]
people_info = pd.DataFrame(data=d, columns = ['name', 'cm', 'kg'])
3) numpy 의 array로 Data Frame 생성
df2 = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
columns=['a', 'b', 'c'])
2. columns
열의 이름 (헤더 정보) 가져 오기
df = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
// 열 헤더 출력
df.columns
Index(['A', 'B'], dtype='object')
3. head()
처음 ~ 지정된 값( 기본값: 5 )만큼의 갯수의 행을 보여 줌
df = pd.DataFrame({'A': [1, 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ]})
# 첫 5개의 행 출력
df.head()
A
0 1
1 2
2 3
3 4
4 5
# 첫 3개의 행 출력
df.head(3)
A
0 1
1 2
2 3
# 끝의 2개 제외한 모든 행 출력
df.head(-2)
A
0 1
1 2
2 3
3 4
4 5
5 6
6 7
7 8
4. tail()
끝부터 지정된 값( 기본값: 5 )만큼의 갯수의 행을 보여 줌
df = pd.DataFrame({'A': [1, 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ]})
# 마지막 5개의 행 출력
df.tail()
A
5 6
6 7
7 8
8 9
9 10
# 마지막 3개의 행 출력
df.tail(3)
A
7 8
8 9
9 10
# 첫 2개 제외 한 모든 행 출력
df.tail(-2)
A
2 3
3 4
4 5
5 6
6 7
7 8
8 9
9 10
5. iloc
Data Frame 자르기
[행 , 열]을 기준으로 자른다.
mydict = [{'a': 1, 'b': 2, 'c': 3, 'd': 4},
{'a': 100, 'b': 200, 'c': 300, 'd': 400},
{'a': 1000, 'b': 2000, 'c': 3000, 'd': 4000}]
df = pd.DataFrame(mydict)
df
a b c d
0 1 2 3 4
1 100 200 300 400
2 1000 2000 3000 4000
// 0 번째 행 뽑아 내기
>>> df.iloc[0]
a 1
b 2
c 3
d 4
Name: 0, dtype: int64
// 1 행(Row) , 2 열(Column) 뽑아 내기
df.iloc[1,2]
300
// 2행 ~ , 3열 ~ 뽑아내기
df.iloc[1: , 2:]
c d
1 300 400
2 3000 4000
// ~ 1행 , ~ 2열 뽑아내기
df.iloc[:1, :2]
a b
0 1 2
6. set_option
set_option로 pandas의 옵션을 변경할 수 있습니다.
저는 모든 행과 열을 볼 수 있게 하는데 주로 사용합니다.
df = pd.DataFrame({'x': range(30)})
# 중간 행이 .. 으로 짤려서 출력
df
x
0 0
1 1
2 2
3 3
4 4
.. ..
25 25
26 26
27 27
28 28
29 29
2) 모든 Row를 볼 수 있게 해줌
pd.set_option('display.max_rows',None)
df
# 모든 열 출력
2) 모든 열을 볼 수 있게 해줌
pd.set_option('display.max_columns', None)
df
# 모든 행 출력
Reference
https://pandas.pydata.org/docs/reference/frame.html
반응형
'Python' 카테고리의 다른 글
[Python] 가상 환경 설정 및 프로젝트 관리 관련 커맨드 (pyenv , poetry) (0) | 2024.03.06 |
---|
Comments