어제의 나보다 성장한 오늘의 나

[Data Frame] 많이 사용하는 함수 모음 ( DataFrame 생성 , Columns , head , tail , iloc , set_option 등 ) 본문

Python

[Data Frame] 많이 사용하는 함수 모음 ( DataFrame 생성 , Columns , head , tail , iloc , set_option 등 )

today_me 2024. 1. 27. 16:49
반응형

 

 

오늘은 파이썬 데이터 분석 라이브러리인 Pandas의 "Data Frame" 에서 많이 사용되는 함수에 대해 알아보겠습니다.

 


 

 

 

 

0. Import

 

import pandas as pd

 

 

 

 

 

1. DataFrame 생성

 

1) Dictionary로 Data Frame 생성

d = {'col1': [1, 2], 'col2': [3, 4]}
df = pd.DataFrame(data=d)

 

 

2) Array로 Data Frame 생성

d = [['Hayoon', 165, 53], ['Orim', 182, 64], ['Minsu', 172, 82]]
people_info = pd.DataFrame(data=d, columns = ['name', 'cm', 'kg'])

 

 

3) numpy 의 array로 Data Frame 생성

 df2 = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
                    columns=['a', 'b', 'c'])

 

 

 

 

 

2. columns

 

열의 이름 (헤더 정보) 가져 오기

df = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})

// 열 헤더 출력
df.columns
Index(['A', 'B'], dtype='object')

 

 

 

 

 

3. head()

 

처음 ~ 지정된 값( 기본값: 5 )만큼의 갯수의 행을 보여 줌

df = pd.DataFrame({'A': [1, 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ]})

# 첫 5개의 행 출력
df.head()

   A
0  1
1  2
2  3
3  4
4  5

# 첫 3개의 행 출력
df.head(3)

   A
0  1
1  2
2  3

# 끝의 2개 제외한 모든 행 출력
 df.head(-2)
   A
0  1
1  2
2  3
3  4
4  5
5  6
6  7
7  8

 

 

 

 

 

4. tail()

 

끝부터 지정된 값( 기본값: 5 )만큼의 갯수의 행을 보여 줌

df = pd.DataFrame({'A': [1, 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ]})

# 마지막 5개의 행 출력
df.tail()

	A
5   6
6   7
7   8
8   9
9  10

# 마지막 3개의 행 출력
df.tail(3)
    A
7   8
8   9
9  10

# 첫 2개 제외 한 모든 행 출력

df.tail(-2)
    A
2   3
3   4
4   5
5   6
6   7
7   8
8   9
9  10

 

 

 

 

 

5. iloc

 

Data Frame 자르기

[행 , 열]을 기준으로 자른다.

mydict = [{'a': 1, 'b': 2, 'c': 3, 'd': 4},
           {'a': 100, 'b': 200, 'c': 300, 'd': 400},
           {'a': 1000, 'b': 2000, 'c': 3000, 'd': 4000}]
df = pd.DataFrame(mydict)
df
      a     b     c     d
0     1     2     3     4
1   100   200   300   400
2  1000  2000  3000  4000



// 0 번째 행 뽑아 내기
>>> df.iloc[0]
a    1
b    2
c    3
d    4
Name: 0, dtype: int64

// 1 행(Row) , 2 열(Column) 뽑아 내기
df.iloc[1,2]
300

// 2행 ~ , 3열 ~ 뽑아내기

df.iloc[1: , 2:]
      c     d
1   300   400
2  3000  4000


// ~ 1행 , ~ 2열 뽑아내기

 df.iloc[:1, :2]
   a  b
0  1  2

 

 

 

 

6. set_option

 

set_option로 pandas의 옵션을 변경할 수 있습니다.

저는 모든 행과 열을 볼 수 있게 하는데 주로 사용합니다.

df = pd.DataFrame({'x': range(30)})

# 중간 행이 .. 으로 짤려서 출력
df
     x
0    0
1    1
2    2
3    3
4    4
..  ..
25  25
26  26
27  27
28  28
29  29

 

 

2) 모든 Row를 볼 수 있게 해줌

pd.set_option('display.max_rows',None)

df

# 모든 열 출력

 

 

2) 모든 열을 볼 수 있게 해줌

pd.set_option('display.max_columns', None)

df

# 모든 행 출력

 

 


 

Reference

 

https://pandas.pydata.org/docs/reference/frame.html

 

DataFrame — pandas 2.2.0 documentation

Warning DataFrame.attrs is considered experimental and may change without warning.

pandas.pydata.org

 

반응형
Comments