판다스 데이터프레임 만들기 | [Pandas 강의] 데이터프레임 생성하기 12171 좋은 평가 이 답변

당신은 주제를 찾고 있습니까 “판다스 데이터프레임 만들기 – [Pandas 강의] 데이터프레임 생성하기“? 다음 카테고리의 웹사이트 Chewathai27.com/you 에서 귀하의 모든 질문에 답변해 드립니다: https://chewathai27.com/you/blog. 바로 아래에서 답을 찾을 수 있습니다. 작성자 Minsuk Heo 허민석 이(가) 작성한 기사에는 조회수 16,840회 및 좋아요 138개 개의 좋아요가 있습니다.

판다스 데이터프레임 만들기 주제에 대한 동영상 보기

여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!

d여기에서 [Pandas 강의] 데이터프레임 생성하기 – 판다스 데이터프레임 만들기 주제에 대한 세부정보를 참조하세요

파이썬의 list와 dictionary 를 사용해서 팬더스의 데이터프레임을 생성하는 방법을 알아봅니다.
관련 주피터 노트북은 아래 링크에서 다운받아 실습하실 수 있어요.
https://github.com/minsuk-heo/pandas/blob/master/Pandas_Cheatsheet.ipynb

판다스 데이터프레임 만들기 주제에 대한 자세한 내용은 여기를 참조하세요.

[Python] 데이터프레임 만들기 :: pd.DataFrame() – Mizys

Import Pandas import pandas as pd Dataframe 생성 pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) 1.

+ 더 읽기

Source: mizykk.tistory.com

Date Published: 10/2/2022

View: 2997

Pandas-데이터 프레임 만들기

이전 포스트에서 판다스(Pandas)가 무엇인지 간단한 소개와 판다스의 대표적인 데이터 타입인 데이터 프레임(DataFrame)과 시리즈(Series)를 살펴 …

+ 여기에 표시

Source: gooopy.tistory.com

Date Published: 10/15/2022

View: 4068

[Pandas] 빈 데이터프레임 만들기 – 파이프마임

빈 데이터프레임 만드는 방법입니다. 기본적으로는 필수성분인 index와 column을 추가해주면 됩니다. import pandas as pd df = pd.

+ 여기에 자세히 보기

Source: seong6496.tistory.com

Date Published: 6/5/2021

View: 2970

Pandas – 데이터프레임 생성/병합/추출하기

Pandas에는 데이터프레임, 시리즈라는 자료구조가 추가되었습니다. 1. 데이터 프레임 생성. 데이터 프레임을 만드는 방법은 여러 가지가 있습니다. 일반적 …

+ 여기에 자세히 보기

Source: western-sky.tistory.com

Date Published: 5/30/2022

View: 526

Python – Pandas 튜토리얼 (데이터프레임 생성, 접근, 삭제, 수정)

Pandas (Python Data Analysis Library) 파이썬을 통해 데이터 분석을 할 때, Pandas를 빼놓고 이야기할 수 없다. 온전히 통계 분석을 위해 고안된 R …

+ 더 읽기

Source: 3months.tistory.com

Date Published: 3/23/2022

View: 5330

목록에서 Pandas 데이터 프레임 만들기 | Delft Stack

이 가이드에서는 목록을 사용하여 pandas 데이터 프레임을 만드는 방법을 보여줍니다.

+ 여기에 더 보기

Source: www.delftstack.com

Date Published: 7/19/2022

View: 7044

pandas #1. 데이터프레임 만들기 – velog

[pandas cheat sheet 주소] https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf. 1.1 열별로 만들기 ▥. pd.DataFrame( {“컬럼명1”:[데이터 입력], …

+ 여기에 표시

Source: velog.io

Date Published: 6/16/2021

View: 6207

[Python] 데이터프레임 만들기 (pandas 활용) – 우 주 신

오늘은 pandas를 활용하여 데이터프레임을 생성하는 방법을 보겠습니다. 데이터 분석을 한다면 R로 하는 경우가 많았는데, pandas가 등장한 뒤로 파이썬 …

+ 여기를 클릭

Source: ordo.tistory.com

Date Published: 7/5/2021

View: 5485

주제와 관련된 이미지 판다스 데이터프레임 만들기

주제와 관련된 더 많은 사진을 참조하십시오 [Pandas 강의] 데이터프레임 생성하기. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.

[Pandas 강의] 데이터프레임 생성하기
[Pandas 강의] 데이터프레임 생성하기

주제에 대한 기사 평가 판다스 데이터프레임 만들기

  • Author: Minsuk Heo 허민석
  • Views: 조회수 16,840회
  • Likes: 좋아요 138개
  • Date Published: 2018. 1. 6.
  • Video Url link: https://www.youtube.com/watch?v=f7rJEQy9yd0

[Python] 데이터프레임 만들기 :: pd.DataFrame()

[Python] 데이터프레임 만들기 :: pd.DataFrame()

Import Pandas

import pandas as pd

Dataframe 생성

pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

1.

student_card = pd.DataFrame({‘ID’:[20190103, 20190222, 20190531], ‘name’:[‘Kim’, ‘Lee’, ‘Jeong’], ‘class’:[‘H’, ‘W’, ‘S’]}) student_card

2.

student_card = pd.DataFrame([[20190103, ‘Kim’, ‘H’], [20190222, ‘Lee’, ‘W’], [20190531, ‘Jeong’, ‘S’]], columns = [‘ID’, ‘name’, ‘class’]) student_card

+ 인덱스 지정

student_card = pd.DataFrame({‘ID’:[20190103, 20190222, 20190531], ‘name’:[‘Kim’, ‘Lee’, ‘Jeong’], ‘class’:[‘H’, ‘W’, ‘S’]}, index = [‘a’, ‘b’, ‘c’]) #index 지정 student_card

+ 데이터 타입 지정

dtype 옵션으로 데이터 타입을 지정할 수 있다.

student_card = pd.DataFrame([[1, 2, 3], [4, 5, 6]], columns = [‘a’, ‘b’, ‘c’], dtype = float) #data type 지정 student_card

728×90

Pandas-데이터 프레임 만들기

728×90

반응형

이전 포스트에서 판다스(Pandas)가 무엇인지 간단한 소개와 판다스의 대표적인 데이터 타입인 데이터 프레임(DataFrame)과 시리즈(Series)를 살펴보았다.

이번 포스트는 판다스의 상징인 데이터 프레임을 만드는 방법에 대해 알아보도록 하겠다.

데이터 프레임 만들기

1. 판다스 가져오기

판다스를 사용하기 앞서 먼저 판다스를 설치하고 판다스를 사용하겠다고 선언해보자.

Python 모듈 설치는 크게 Anaconda를 사용하여 일반적으로 사용하는 Pandas를 포함한 각종 라이브러리를 한 번에 다운로드하는 방법이 있고, pip를 이용해서 다운로드하는 방법이 있다.

해당 방법을 서술하기엔 그 내용이 꽤 길고 헷갈리기 쉽기 때문에 Pandas를 비롯한 각종 라이브러리를 설치하는 방법이 적힌 이전 포스트로 가는 참조를 걸어놓겠다.

참고 1 – 라이브러리 설치 방법: “Python 필요한 모듈들을 설치해보자”

참고 2 – Anaconda 설치 방법: “Python 파이썬과 아나콘다”

참고 3 – 오프라인 환경에서 라이브러리 설치 방법: “Python 오프라인 환경에서 파이썬 패키지를 설치해보자”

위 방법대로 Pandas를 정상적으로 설치하였다는 전제하에 Pandas에 대해 학습해보도록 하겠다.

# Import module import pandas as pd

Python에서 #은 주석을 만드는 특수 문자로 코드(Syntax) 앞에 입력 시, 해당 행의 명령어들을 주석 처리한다.

import pandas as pd는 문자 그대로 “import(수입하다) pandas as(처럼) pd”로, pandas를 가지고 오는데 pd라는 문자로 가지고 온다는 의미이다.

Python은 특정 라이브러리 내 함수를 사용하려면 “라이브러리.함수()” 이런 식으로 코드를 짜게 되는데, pandas는 제법 긴 단어이므로 pd라는 간결한 단어로 라이브러리를 의미하겠다는 소리다.

일반적으로 pandas는 pd라 사용하니 pd로 쓰도록 하자.

2. 데이터 프레임 함수 설명

pandas에서 제공하는 DataFrame API에서 DataFrame이 가지고 있는 파라미터(Parameter)는 다음과 같다.

pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

data: list나 numpy에서 제공하는 array, dictionary 등을 받는다. 간단하게 생각해서 행렬이나 벡터를 Data로 사용할 수 있다고 생각하면 된다.

list나 numpy에서 제공하는 array, dictionary 등을 받는다. 간단하게 생각해서 행렬이나 벡터를 Data로 사용할 수 있다고 생각하면 된다. index: 이전 포스트에서 말했듯, pandas의 데이터 프레임이나 시리즈의 특징은 index를 갖는다는 것이다. 그리고 사용자가 원하는 index를 부여할 수 있다. 지정하지 않은 경우, 자동으로 range(0, len(data))에 해당하는 index가 생성된다.

이전 포스트에서 말했듯, pandas의 데이터 프레임이나 시리즈의 특징은 index를 갖는다는 것이다. 그리고 사용자가 원하는 index를 부여할 수 있다. 지정하지 않은 경우, 자동으로 range(0, len(data))에 해당하는 index가 생성된다. columns: 열, 즉 변수의 이름이다.

열, 즉 변수의 이름이다. dtype: DataFrame 안에 들어갈 데이터의 type을 결정한다. DataFrame의 장점은 변수 별로 다른 dtype이 들어갈 수 있는 것이므로, 특수한 경우가 아닌 이상 지정 안 한다.

DataFrame 안에 들어갈 데이터의 type을 결정한다. DataFrame의 장점은 변수 별로 다른 dtype이 들어갈 수 있는 것이므로, 특수한 경우가 아닌 이상 지정 안 한다. copy: DataFrame의 특징 중 하나인, Data의 종속성에 대한 부분인데, 이는 나중에 다루도록 하겠다. 크게 신경 쓰지 않아도 된다.

3. 행렬(2-d array)을 사용해서 데이터 프레임 만들기

2-d array는 2차원 배열을 의미하며, 우리에게 친숙한 행렬이 2-d array다.

머신러닝 라이브러리인 sklearn에서 제공하는 붓꽃 데이터를 이용해서 행렬을 보도록 하자.

import numpy as np from sklearn.datasets import load_iris

numpy는 선형 대수학에 특화된 라이브러리로 다른 포스팅에서 자세히 다룰 테니 일단 넘어가자(당장 쓰지 않더라도 Pandas를 쓸 때는 꼭 numpy도 import 해놓는 습관을 들여놓자. 나중에 아주 많이 쓰게 될 것이다.)

from sklearn.datasets import load_iris는 sklearn의 dataset이라는 모듈에서 load_iris라는 함수만 가져오겠다는 뜻이다. 특정 라이브러리에서 한, 두 개의 함수만 필요한 경우에 사용하는 방법이다.

>>> iris = load_iris() >>> iris {‘data’: array([[5.1, 3.5, 1.4, 0.2], [4.9, 3. , 1.4, 0.2], [4.7, 3.2, 1.3, 0.2], [4.6, 3.1, 1.5, 0.2], [5. , 3.6, 1.4, 0.2], [5.4, 3.9, 1.7, 0.4], … lustering system finds 3 classes in the data.

– Many, many more …’, ‘feature_names’: [‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’], ‘filename’: ‘C:\\Users\\gooop\\anaconda3\\lib\\site-packages\\sklearn\\datasets\\data\\iris.csv’}

해당 블로그에서 >>> 는 코드 실행을 의미하며, 앞에 >>>가 없는 것은 출력된 결과를 의미한다. 한 셀 안에 >>>가 없는 경우, 출력된 결과가 없기 때문에 >>>를 쓰지 않은 것이다.

load_iris()를 실행 시, dictionary가 출력된다. dictionary는 여러 종류의 데이터를 key:value로 담을 수 있는 사전이다.

dictionary를 key로 조회 시, 원하는 value만 볼 수 있다.

# iris data에 있는 key를 보자 >>> iris.keys() dict_keys([‘data’, ‘target’, ‘frame’, ‘target_names’, ‘DESCR’, ‘feature_names’, ‘filename’])

iris 데이터가 가지고 있는 key를 보면, data, target, frame 등 여러 key가 존재하는 것을 알 수 있다.

여기서 “data”는 iris data를 의미한다.

“feature_names”는 변수의 이름이다.

>>> iris[“data”] array([[5.1, 3.5, 1.4, 0.2], [4.9, 3. , 1.4, 0.2], [4.7, 3.2, 1.3, 0.2], [4.6, 3.1, 1.5, 0.2], [5. , 3.6, 1.4, 0.2], … [6.7, 3. , 5.2, 2.3], [6.3, 2.5, 5. , 1.9], [6.5, 3. , 5.2, 2. ], [6.2, 3.4, 5.4, 2.3], [5.9, 3. , 5.1, 1.8]])

데이터가 매우 크므로 중간을 생략하였다. 위 데이터 같이 행과 열로 2개의 차원(dimension)이 존재하는 데이터를 2차원 배열 2-d array라고 한다.

>>> iris[“feature_names”] [‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’]

칼럼 이름은 list로 출력되었다.

위 두 데이터를 사용해서 데이터 프레임을 생성해보자.

>>> iris_DF = pd.DataFrame(data=iris[“data”], columns=iris[“feature_names”])

DataFrame은 주피터 노트북 기준 한 번에 60개의 행이 조회되며, 아래에 있는 150 rows x 4 columns는 150개의 행과 4개의 열을 가진 데이터라는 것을 의미한다.

>>> iris_DF.values array([[5.1, 3.5, 1.4, 0.2], [4.9, 3. , 1.4, 0.2], [4.7, 3.2, 1.3, 0.2], [4.6, 3.1, 1.5, 0.2], [5. , 3.6, 1.4, 0.2], … [6.7, 3. , 5.2, 2.3], [6.3, 2.5, 5. , 1.9], [6.5, 3. , 5.2, 2. ], [6.2, 3.4, 5.4, 2.3], [5.9, 3. , 5.1, 1.8]])

DataFrame.values 함수를 사용하면, DataFrame을 2-d array로 돌릴 수 있다. 꽤 중요한 기능이니 꼭 숙지하도록 하자.

4. list를 사용해서 데이터 프레임 만들기

이번엔 list를 이용해서 데이터 프레임을 만들어보자.

list는 Python에서 대표적인 Data를 담는 그릇이다.

>>> name_list = [“박명수”, “유재석”, “노홍철”, “길”, “정준하”, “정형돈”, “하하”] >>> math_list = [65, 95, 70, 80, 100, 85, 60] >>> english_list = [75, 80, 85, 90, 65, 75, 100] >>> exam = pd.DataFrame({“name”:name_list, “math”:math_list, “english”:english_list}) >>> exam

데이터 프레임은 위 결과처럼 각 변수(열) 별로 다른 dtype이 들어갈 수 있다.

5. Dictionary를 사용해서 데이터 프레임 만들기

Dictionary는 모든 형태의 데이터를 Key:value의 형태로 담을 수 있는 데이터 타입이다.

Dictionary의 형태는 조금만 편집해서 바로 Json으로 사용할 수 있을 정도로 Json과 굉장히 유사하다.

Dictionary의 value들이 모두 list 또는 array이고, 그 길이가 동일하다면 , DataFrame으로 만들 수 있다.

(길이가 다르다면, 오류가 뜬다)

>>> Raw_dict = { >>> “name”:[“박명수”, “유재석”, “노홍철”, “길”, “정준하”, “정형돈”, “하하”], >>> “math”:[65, 95, 70, 80, 100, 85, 60], >>> “english”:[75, 80, 85, 90, 65, 75, 100], >>> “class”:[1, 2, 1, 2, 2, 2, 1] >>> } >>> Raw_dict {‘name’: [‘박명수’, ‘유재석’, ‘노홍철’, ‘길’, ‘정준하’, ‘정형돈’, ‘하하’], ‘math’: [65, 95, 70, 80, 100, 85, 60], ‘english’: [75, 80, 85, 90, 65, 75, 100], ‘class’: [1, 2, 1, 2, 2, 2, 1]}

DF = pd.DataFrame(Raw_dict) DF

Dictionary는 key와 value로 이루어져 있으므로, 별도의 컬럼 이름을 지정해주지 않아도 DataFrame으로 쉽게 전환이 가능하다.

반대로 DataFrame을 Dictionary로 변환하는 것 역시 굉장히 간단하다.

>>> DF.to_dict() {‘name’: {0: ‘박명수’, 1: ‘유재석’, 2: ‘노홍철’, 3: ‘길’, 4: ‘정준하’, 5: ‘정형돈’, 6: ‘하하’}, ‘math’: {0: 65, 1: 95, 2: 70, 3: 80, 4: 100, 5: 85, 6: 60}, ‘english’: {0: 75, 1: 80, 2: 85, 3: 90, 4: 65, 5: 75, 6: 100}, ‘class’: {0: 1, 1: 2, 2: 1, 3: 2, 4: 2, 5: 2, 6: 1}}

DataFrame.to_dict(): 해당 함수를 사용하면 DataFrame을 dictionary로 바로 전환할 수 있다.

지금까지 DataFrame을 만드는 방법에 대해 알아보았다. 다음 포스트에서는 데이터 프레임의 부위별 이름에 대해 알아보도록 하겠다.

728×90

반응형

[Pandas] 빈 데이터프레임 만들기

반응형

빈 데이터프레임 만드는 방법입니다.

기본적으로는 필수성분인 index와 column을 추가해주면 됩니다.

import pandas as pd df = pd.DataFrame(index=range(0,원하는갯수), columns = {‘column1′,’column2’,…})

index, column 없이 빈 데이터프레임 만든다면..

index와 column을 안 쓰고도 생성할 수 있습니다.

empty_df = pd.DataFrame()

index와 column이 없는 상태가 되면 다른 데이터프레임을 합칠때 주의를 기울여야 합니다.

간단하게 다른 데이터프레임과 합치려면 append나 concat을 이용하면 합칠 수 있습니다.

join, merge는 안 됩니다.

df = pd.DataFrame({‘col1’:[‘a’,’b’,’c’]}) empty_df = pd.DataFrame() empty_df = empty_df.append(df) # concat인 경우 pd.concat((empty_df,df),sort=False)

join을 쓰고 싶다면 index가 필히 있어야 합니다.

df = pd.DataFrame({‘col1’:[‘a’,’b’,’c’]}) empty_df = pd.DataFrame(index=df.index) empty_df.join(df)

merge는 left,right 설정을 해야하므로 index, column을 다 설정해주어야 합니다.

empty_df = pd.DataFrame(index=df.index,columns={‘col2′}) pd.merge(empty_df,df,left_on=’col2′,right_on=’col1′,how=’outer’)

merge는 how 에 따라 합치는 방식이 달라지니 참고하시길 바랍니다.

관련 포스팅

[Python/Pandas] – [Pandas] 데이터프레임 합치기(append,concat)

[Python/Pandas] – [Pandas]데이터프레임 합치기(join)

[Python/Pandas] – [Pandas] DataFrame 합치기(Merge)

Pandas – 데이터프레임 생성/병합/추출하기

Pandas

파이썬은 원래 데이터 분석에 특화된 언어가 아닙니다.

R로 분석하던 것을 파이썬으로 하고 싶은 개발자들이 만든 도구가 Numpy와 Pandas입니다.

데이터분석을 위한 파이썬의 기본 자료구조 딕셔너리, 리스트만으로는 부족했기 때문에,

Pandas에는 데이터프레임, 시리즈라는 자료구조가 추가되었습니다.

1. 데이터 프레임 생성

데이터 프레임을 만드는 방법은 여러 가지가 있습니다.

일반적으로 배열, 리스트, 딕셔너리로 만들 수 있습니다.

1.1. 배열로 생성하기

첫 번째는 배열(array)을 이용해서 만드는 방법입니다.

우선 배열 자료구조를 사용하기 위해 numpy를 불러오고, pandas도 import 합니다.

import pandas as pd import numpy as np

sample_array = np.arange(1,6) sample_array

array 생성 결과

생성된 배열로 데이터 프레임을 만들겠습니다.

sample_df = pd.DataFrame({ ‘col1’ : sample_array, ‘col2’ : sample_array*2, ‘col3’ : [“A”,”B”,”C”,”D”,”E”] }) print(sample_df)

배열로 생성한 DataFrame

1.2. 리스트로 생성하기

데이터프레임은 리스트로도 만들 수 있습니다.

df = pd.DataFrame([[80,90,100,70],[70,80,90,100]], index=[‘달리기’,’점프’], columns=[‘모모’,’츄츄’,’디디’,’루루’]) df

리스트로 생성한 DataFrame

1.3. 딕셔너리로 생성하기

이번엔 딕셔너리로 만들어 보겠습니다.

딕셔너리는 key와 그에 대응하는 value로 이루어진 자료구조입니다.

data = {‘score1’ : [91,94,97,100], ‘score2’ : [100, 97, 94, 91]} data

딕셔너리 생성

data = pd.DataFrame(data, index=[‘a’,’b’,’c’,’d’]) data

딕셔너리로 생성한 데이터프레임

2. 데이터프레임 병합

데이터 프레임을 합치는 방법은 4가지가 있습니다.

1. pd.concat()

2. df.append()

3. pd.merge()

4. df.join()

먼저 pd.concat 함수에 대해 먼저 알아보겠습니다.

2.1. pd.concat()

데이터 프레임을 두 개 생성하고, concat함수를 사용해 세로로 붙여보겠습니다.

df_1 = pd.DataFrame({ ‘모모’ : np.array([90,80,70]), ‘츄츄’ : np.array([70,80,90]) },index=[‘먹기’,’달리기’,’점프’]) df_2 = pd.DataFrame({ ‘모모’ : np.array([90,100,60]), ‘츄츄’ : np.array([80,90,95]) }, index=[‘그루밍’,’깨물기’,’냥냥펀치’])

df_1 생성 df_2 생성

# concat을 사용해 세로로 병합 pd.concat([df_1,df_2])

pd.concat() 결과

다음은 가로로 합쳐보겠습니다. 가로로 concatenate할 때는 주의해야합니다.

행과 열중에 보통 행연산에 대해서는 관대한 편이지만, 열에 관해서는 조심할 필요가 있습니다.

예를 들어 탑승객 데이터가 있다고 할 때, 행 1줄이 변경되는 것은 1명의 정보에 영향을 미칩니다.

하지만 열 하나가 삭제되거나 잘못 변경될 경우 모든 탑승객의 정보에 대해 영향을 미치기 때문입니다.

concat함수의 default 옵션이 세로(axis=0)로 되어있는 이유이기도 합니다.

그럼 이번엔 옵션을 추가해서 세로가 아닌 가로로 붙여보도록 하겠습니다.

pd.concat([result, df_result], axis=1)

pd.concat() axis=1 결과

이렇게 해줄수도 있지만, 소개한 두 번째 방법인 append함수를 이용해서 병합할 수도 있습니다.

2.2. df.append()

df_1.append(df_2)

df_1.append(df_2) 결과

2.3. pd.merge()

merge함수의 경우 Concat과 달리, 중복된 행은 자동으로 처리합니다.

반면 concat의 경우 병합시 그대로 합쳐진다는 점이 차이가 있습니다.

df_11 = pd.DataFrame({ ‘col1’ : np.array([90,80,70]), ‘col2’ : np.array([70,80,90]) }) df_22 = pd.DataFrame({ ‘col1’ : np.array([90,100,60]), ‘col2’ : np.array([70,90,95]) })

df_11 생성 df_22 생성

pd.concat([df_11, df_22])

concat 사용 시 index 중복

pd.merge(df_11, df_22, how=”outer”)

merge 사용 시 중복 제외

이번엔 on 파라미터를 사용해 Key를 기준으로 Merge 해보도록 하겠습니다.

# 데이터 프레임 생성 left = pd.DataFrame({ ‘Key’: [‘키1′,’키2′,’키3′,’키4’], ‘A’: [‘A0′,’A1′,’A2′,’A3’], ‘B’: [‘B0′,’B1′,’B2′,’B3’] }) right = pd.DataFrame({ ‘Key’: [‘키1′,’키2′,’키3′,’키4’], ‘C’: [‘C0′,’C1′,’C2′,’C3’], ‘D’: [‘D0′,’D1′,’D2′,’D3′] })

left 생성 right 생성

# Key를 중심으로 left, right 데이터프레임 병합 result = pd.merge(left, right, on=’Key’) result

Merge 결과 – Key 중심 병합

2.4. df.join()

Joint 방식에 대해서는 파라미터로 how를 사용해보도록 하겠습니다.

how에 left를 주느냐, right를 주느냐에 따라 병합 결과가 달라집니다.

왼쪽 프레임과 오른쪽 프레임 중 어디를 기준으로 하느냐의 차이입니다.

예시를 보겠습니다.

left = pd.DataFrame({ ‘A’:[‘A0′,’A1′,’A2’], ‘B’:[‘B0′,’B1′,’B2’] }, index=[‘K0′,’K1′,’K2’]) right = pd.DataFrame({ ‘C’:[‘C0′,’C2′,’C3’], ‘D’:[‘D0′,’D2′,’D3’] }, index=[‘K0′,’K2′,’K3′])

left 생성 right 생성

# 왼쪽(left) 데이터 프레임 기준으로 병합 result = left.join(right, how=’left’) result

left 조인 결과

# 오른쪽(right) 데이터 프레임 기준으로 병합 result = left.join(right, how=’right’) result

right 조인 결과

3. 데이터프레임 열 추출하기

이번엔 예시로 된 샘플 데이터 프레임을 생성한 뒤, 열에 해당하는 값들을 추출해 보겠습니다.

sample_df = pd.DataFrame({ ‘col1’ : np.array([1,2,3,4,5]), ‘col2’ : np.array([2,4,6,8,10]), ‘col3’ : np.array([“A”,”B”,”C”,”D”,”E”]) })

샘플 DataFrame 생성

열 이름을 지정해서 호출하려면 DataFrame.col_name 형식으로 점(.)을 사용합니다.

sample_df.col2

col2 컬럼 호출 – 점(.)

대괄호를 이용해서도 호출할 수 있습니다.

sample_df[“col2”]

col2 컬럼 호출 – 대괄호

여러 개의 컬럼을 호출하고 싶을 땐 대괄호를 한 번 더 사용합니다.

sample_df[[“col1″,”col2”]]

복수 개의 컬럼호출

4. loc함수와 iloc함수 사용하기

이번엔 loc과 iloc함수를 이용해 데이터를 더 디테일한 방법으로 추출해보겠습니다.

예시로 데이터 프레임을 하나 만들겠습니다.

df = pd.DataFrame( [[90,80,70, 40, 90, 50], [70,80,100, 90, 40, 70], [50, 100, 80, 30, 60, 100]], index=[‘모모’, ‘츄츄’, ‘티티’] ,columns=[‘먹기’,’달리기’,’점프’,’그루밍’,’깨물기’,’냥냥펀치’]) df

샘플 DataFrame

4.1. loc함수

위에서 생성한 샘플 데이터 프레임입니다.

샘플 데이터 프레임

우선 인덱스를 하나만 줄 경우, 해당 인덱스에 대한 행을 가져옵니다.

df.loc[‘모모’]

loc 결과 – 인덱스 1개

이번엔 리스트 형태로 인덱스를 2개 줘 보도록 하겠습니다.

df.loc[[‘모모’, ‘츄츄’]]

loc 결과 – 인덱스 2개

또한, loc 안에 조건식을 넣을 수도 있습니다.

해당 조건을 만족하는 데이터만 뽑아낼 수 있는 것이죠. 🙂

# 그루밍 능력이 50이 넘는 고양이만 추출 df.loc[df[‘그루밍’]> 50]

loc 안에 조건문 사용 결과

# 그루밍 능력이 50보다 작은 고양이만 추출 df.loc[df[‘그루밍’]<50] loc 안에 조건문 사용 결과 2 위에서는 그루밍 능력이 50 이상인 행의 모든 컬럼값을 추출했지만 특정 Column값만 추출하는 것도 가능합니다. # 그루밍 능력이 50보다 작은 고양이들의 '냥냥펀치' Column만 추출 df.loc[df['그루밍']< 50, '냥냥펀치'] loc 조건문 + Column명 사용 결과 4.2. iloc 함수 마지막으로 iloc 함수입니다. loc과 iloc의 가장 큰 차이는 label 기반 인덱싱이냐, integer 기반 인덱싱이냐입니다. 쉽게 말해 iloc 함수는 숫자를 기반으로 인덱싱을 합니다. iloc의 i도 integer-location의 줄임말입니다. 예를 들기 위해 위의 데이터프레임을 다시 사용하겠습니다. df = pd.DataFrame( [[90,80,70, 40, 90, 50], [70,80,100, 90, 40, 70], [50, 100, 80, 30, 60, 100]], index=['모모', '츄츄', '티티'] ,columns=['먹기','달리기','점프','그루밍','깨물기','냥냥펀치']) df 샘플 데이터 프레임 df iloc 함수를 이용해서 우선 열만 추출해 보겠습니다. # 0번째 column은 '먹기'입니다. df.iloc[:,0] iloc 컬럼 추출 여러 개 가져오는 것도 가능합니다. # 0번째, 1번째 column은 먹기, 달리기 입니다. df.iloc[:,[0,1]] iloc 컬럼 추출 2 loc과 동일하게 콜론(:)을 이용해서도 인덱싱이 가능합니다. # 1번째, 2번째, 3번째 컬럼 추출 : 달리기, 점프, 그루밍 df.iloc[:,1:4] iloc 컬럼 추출 3 같은 방식으로 행에 대해서도 추출할 수 있는데요. 똑같은 방식으로 진행해 보겠습니다. 우선 행 1개만 추출합니다. # 0번째 행은 '모모'입니다. df.iloc[0] iloc 행 추출 1 행 2개를 추출해 보겠습니다. # 0번째, 1번째 행은 '모모', '츄츄'입니다. df.iloc[[0,1],:] iloc 행 추출 2 같은 방식으로 콜론(:)을 사용해서 인덱싱 해 보겠습니다. # 1번째, 2번째 행은 '츄츄', '티티'입니다. df.iloc[1:3, :] iloc 행 추출 3 이상으로 Pandas로 데이터프레임을 생성하는 방법과 병합하는 방법, 그리고 loc, iloc 함수를 이용해 데이터를 추출하는 방법에 대해 알아보았습니다. 🙂

Python – Pandas 튜토리얼 (데이터프레임 생성, 접근, 삭제, 수정)

Pandas (Python Data Analysis Library)

파이썬을 통해 데이터 분석을 할 때, Pandas를 빼놓고 이야기할 수 없다. 온전히 통계 분석을 위해 고안된 R 과는 다르게 python은 일반적인 프로그래밍 언어(general purpose programming language) 이며, 데이터 분석을 하기 위해서는 여러가지 라이브러리를 사용할 수 밖에 없다. 이 패키지들 중 R의 dataframe 데이터 타입을 참고하여 만든 것이 바로 pandas dataframe이다. pandas는 dataframe을 주로 다루기 위한 라이브러리이며, dataframe을 자유롭게 가공하는 것은 데이터 과학자들에게 중요하다. 물론 pandas의 문법을 외우지 않고, 필요할 때마다 책이나 웹에서 찾아가면서 해도 좋지만 자주 사용하는 조작법을 외운다면 안 그래도 귀찮은 데이터 핸들링 작업을 빠르게 할 수 있다.

그래서 본 포스팅에서는 pandas dataframe을 다루는 법을 간단하게 정리해보고자 한다.

본 포스팅은 이 튜토리얼을 참고하였다.

Tabular Data type

Pandas Dataframe은 테이블 형식의 데이터 (tabular, rectangular grid 등으로 불림)를 다룰 때 사용한다. pandas dataframe의 3요소는 컬럼, 데이터(로우), 인덱스가 있다. 그리고 파이썬의 기본 데이터 타입으로 list, tuple, dictionary가 있다는 것도 다시 한 번 떠올리고 바로 튜토리얼을 해보자. 본 튜토리얼은 jupyter notebook, python3 환경에서 작성되었다.

1. Pandas Dataframe 만들기

pandas dataframe은 다양한 데이터 타입으로부터 만들 수 있다. ndarray, dictionary, dataframe, series, list의 예를 들고 있다.(IPython의 display 함수는 IPython 쉘 환경에서 pandas dataframe을 테이블 형식으로 표현해준다.)

# 1. Create Pandas Dataframe from IPython.display import display # Take a 2D array as input to your DataFrame my_2darray = np.array([[ 1 , 2 , 3 ], [ 4 , 5 , 6 ]]) display(pd.DataFrame(my_2darray)) # Take a dictionary as input to your DataFrame my_dict = { “a” : [ ‘1’ , ‘3’ ], “b” : [ ‘1’ , ‘2’ ], “c” : [ ‘2’ , ‘4’ ]} display(pd.DataFrame(my_dict)) # Take a DataFrame as input to your DataFrame my_df = pd.DataFrame(data = [ 4 , 5 , 6 , 7 ], index = range ( 0 , 4 ), columns = [ ‘A’ ]) display(pd.DataFrame(my_df)) # Take a Series as input to your DataFrame my_series = pd.Series({ “United Kingdom” : “London” , “India” : “New Delhi” , “United States” : “Washington” , “Belgium” : “Brussels” }) display(pd.DataFrame(my_series))

0 1 2 0 1 2 3 1 4 5 6

a b c 0 1 1 2 1 3 2 4

A 0 4 1 5 2 6 3 7

Belgium Brussels India New Delhi United Kingdom London United States Washington

Series의 경우 pandas에서 제공하는 데이터타입인데, index가 있는 1차원 배열이라고 생각하면 좋다. 문자, 논리형, 숫자 모든 데이터타입이 들어갈 수 있다. dataframe의 한 컬럼, 한 컬럼이 series이다.

Dataframe 간단하게 살펴보기

df.shape를 통해 dataframe의 row와 column 수를 알 수 있다. .index를 통해 index를 알 수 있으며, len을 통해 dataframe의 길이(row의 갯수)를 알 수 있다.

df = pd.DataFrame(np.array([[ 1 , 2 , 3 ], [ 4 , 5 , 6 ]])) # Use the `shape` property print (df.shape) # Or use the `len()` function with the `index` property print ( len (df.index))

(2, 3) 2

list (df.columns)

[0, 1, 2]

2. Dataframe에서 특정 컬럼이나 로우(인덱스) 선택하기

실무적으로 가장 많이 사용되는 부분중 하나는 바로 Dataframe에서 특정 컬럼이나 로우를 선택하여 그 값을 보는 것이다. pandas에서는 상당히 다양한 방법들이 있다. 대표적으로 iloc, loc, ix 등을 통해서 할 수 있다. 필자는 column을 조회할때 df[‘column’], row를 조회할 때는 df.ix[index]를 많이 사용한다. 가장 짧고 기억하기 쉽다.

우선 파이썬 기본 데이터 타입인 dictionary 데이터 타입을 통해 dataframe을 만든다.

df = pd.DataFrame({“A”:[1,4,7], “B”:[2,5,8], “C”:[3,6,9]})

# Use `iloc[]` to select a row display(df.iloc[ 0 ]) display(df.loc[ 0 ]) display(df.ix[ 0 ]) # Use `loc[]` to select a column display(df.loc[:, ‘A’ ]) display(df[ ‘A’ ]) # 특정 row, column을 선택하기 display(df.ix[ 0 ][ ‘A’ ]) display(df.loc[ 0 ][ ‘B’ ])

A 1 B 2 C 3 Name: 0, dtype: int64

A 1 B 2 C 3 Name: 0, dtype: int64

A 1 B 2 C 3 Name: 0, dtype: int64

0 1 1 4 2 7 Name: A, dtype: int64

0 1 1 4 2 7 Name: A, dtype: int64

1

2

3. Dataframe에 컬럼, 로우, 인덱스 추가하기

2에서는 Dataframe의 특정 컬럼, 로우에 접근하는 방법을 알아보았고, 이제 데이터를 추가하거나 수정, 삭제하는 실제 작업 방법을 알아보자.

인덱스 설정하기

pandas는 기본적으로 row에 인덱스를 0부터 차례대로 자연수를 부여한다. 이를 변경하는 방법은 set_index 함수를 이용하는 것이다. 아래의 df.set_index(‘A’)는 A 컬럼을 인덱스로 지정하는 것을 뜻한다. 그러면 3개의 row에 대하여 인덱스가 1,4,7이 부여된다.

# Print out your DataFrame `df` to check it out df = pd.DataFrame({ “A” :[ 1 , 4 , 7 ], “B” :[ 2 , 5 , 8 ], “C” :[ 3 , 6 , 9 ]}) display(df) # Set ‘C’ as the index of your DataFrame df = df.set_index( ‘A’ ) display(df)

A B C 0 1 2 3 1 4 5 6 2 7 8 9

B C A 1 2 3 4 5 6 7 8 9

인덱스 접근하기 (ix와 iloc의 차이점)

인덱스를 접근하는 방법에 여러가지가 있다. ix, loc, iloc 등을 쓸 수 있다. 필자는 ix를 주로 쓴다. ix와 iloc의 차이점은 iloc은 인덱스와 상관 없이 순서를 보고 row를 불러온다. 아래 코드에서 ix[7]은 index가 7인 로우를 불러오는 것이며, iloc[1]은 1번째 로우를 불러오는 것이다. (0번째 로우부터 시작) 근데 ix의 경우 주의할점은 index가 integer로만 이루어진 경우에는 index로 접근하지만, index에 문자가 껴있으면 순서로 접근한다는 점이다.

print (df.ix[ 7 ]) print (df.iloc[ 1 ])

B 8 C 9 Name: 7, dtype: int64 B 5 C 6 Name: 4, dtype: int64

예를 들어, 아래 코드를 보면, 인덱스를 문자와 숫자가 혼합된 형태로 주었다. 이 때 ix[2]로 로우를 부르면 인덱스가 아니라 순서로 로우를 불러오게된다.

df = pd.DataFrame(data = np.array([[ 1 , 2 , 3 ], [ 4 , 5 , 6 ], [ 7 , 8 , 9 ]]), index = [ 2 , ‘A’ , 4 ], columns = [ 48 , 49 , 50 ]) display(df) # Pass `2` to `loc` print (df.loc[ 2 ]) # Pass `2` to `iloc` print (df.iloc[ 2 ]) # Pass `2` to `ix` print (df.ix[ 2 ])

48 49 50 2 1 2 3 A 4 5 6 4 7 8 9

48 1 49 2 50 3 Name: 2, dtype: int64 48 7 49 8 50 9 Name: 4, dtype: int64 48 7 49 8 50 9 Name: 4, dtype: int64

로우 추가하기

ix의 경우 df.ix[2]를 입력하면 index=2인 곳의 row를 교체한다. 만약 index=2인 row가 없다면 position=2에 row를 추가하게 된다. loc을 사용하면 새로운 index=2인 row를 만들고, 그 곳에 row를 추가하게 된다.

df = pd.DataFrame(data = np.array([[ 1 , 2 , 3 ], [ 4 , 5 , 6 ], [ 7 , 8 , 9 ]]), index = [ 2.5 , 12.6 , 4.8 ], columns = [ 48 , 49 , 50 ]) display(df) # There’s no index labeled `2`, so you will change the index at position `2` df.ix[ 2 ] = [ 60 , 50 , 40 ] display(df) # This will make an index labeled `2` and add the new values df.loc[ 2 ] = [ 11 , 12 , 13 ] display(df)

Append를 이용해 로우 추가하기

때론 인덱스를 신경쓰지 않고 그냥 데이터의 가장 뒤에 row를 추가하고 싶을 수도 있다. 이 경우에는 append를 사용하면 좋다. 아래는 df 데이터프레임에 a를 추가하여 row를 추가하는 코드를 보여준다. row를 추가한 후에 reset index를 통해 index를 0부터 새롭게 지정한다. 이는 실제 작업할 때 많이 쓰는 테크닉이다.

df = pd.DataFrame(data = np.array([[ 1 , 2 , 3 ], [ 4 , 5 , 6 ], [ 7 , 8 , 9 ]]), columns = [ 48 , 49 , 50 ]) display(df) a = pd.DataFrame(data = [[ 1 , 2 , 3 ]], columns = [ 48 , 49 , 50 ]) display(a) df = df.append(a) df = df.reset_index(drop = True ) display(df)

48 49 50 0 1 2 3 1 4 5 6 2 7 8 9

48 49 50 0 1 2 3

48 49 50 0 1 2 3 1 4 5 6 2 7 8 9 3 1 2 3

컬럼 추가하기

컬럼을 추가하는 방법도 여러가지가 있다. 아래는 loc을 통해 추가하거나, df[‘column’]을 통해 추가하는 방법이다.

df = pd.DataFrame(data = np.array([[ 1 , 2 , 3 ], [ 4 , 5 , 6 ], [ 7 , 8 , 9 ]]), columns = [ ‘A’ , ‘B’ , ‘C’ ]) # Study the DataFrame `df` display(df) # Append a column to `df` df.loc[:, ‘D’ ] = pd.Series([ ‘5’ , ‘6’ , ‘7’ ], index = df.index) # Print out `df` again to see the changes display(df) df[ ‘E’ ] = pd.Series([ ‘5’ , ‘6’ , ‘7’ ], index = df.index) display(df)

A B C 0 1 2 3 1 4 5 6 2 7 8 9

A B C D 0 1 2 3 5 1 4 5 6 6 2 7 8 9 7

A B C D E 0 1 2 3 5 5 1 4 5 6 6 6 2 7 8 9 7 7

4. Dataframe의 인덱스, 컬럼, 데이터 삭제하기

인덱스 삭제

인덱스를 지워야할 경우는 그렇게 많지 않을 것이다. 주로 reset_index를 이용해서 index를 리셋하는 것을 많이 사용한다. 혹은 index의 이름을 삭제하고 싶다면 del df.index.name을 통해 인덱스의 이름을 삭제할 수 있다.

컬럼 삭제

drop 명령어를 통해 컬럼 전체를 삭제할 수 있다. axis=1은 컬럼을 뜻한다. axis=0인 경우, 로우를 삭제하며 이것이 디폴트이다. inplace의 경우 drop한 후의 데이터프레임으로 기존 데이터프레임을 대체하겠다는 뜻이다. 즉, 아래의 inplace=True는 df = df.drop(‘A’, axis=1)과 같다.

df = pd.DataFrame(data = np.array([[ 1 , 2 , 3 ], [ 4 , 5 , 6 ], [ 7 , 8 , 9 ]]), columns = [ ‘A’ , ‘B’ , ‘C’ ]) display(df) # Drop the column with label ‘A’ # drop axis의 경우 column이면 1, row이면 0이다. df.drop( ‘A’ , axis = 1 , inplace = True ) display(df)

A B C 0 1 2 3 1 4 5 6 2 7 8 9

B C 0 2 3 1 5 6 2 8 9

로우 삭제

– 중복 로우 삭제

drop_duplicate를 사용하면 특정 컬럼의 값이 중복된 로우를 제거할 수 있다. keep 키워드를 통해 중복된 것들 중 어떤 걸 킵할지 정할 수 있다.

df = pd.DataFrame(data = np.array([[ 1 , 2 , 3 ], [ 4 , 5 , 6 ], [ 7 , 8 , 9 ], [ 40 , 50 , 60 ], [ 23 , 35 , 37 ]]), index = [ 2.5 , 12.6 , 4.8 , 4.8 , 2.5 ], columns = [ 48 , 49 , 50 ]) display(df) df = df.reset_index() display(df) df = df.drop_duplicates(subset = ‘index’ , keep = ‘last’ ).set_index( ‘index’ ) display(df)

48 49 50 2.5 1 2 3 12.6 4 5 6 4.8 7 8 9 4.8 40 50 60 2.5 23 35 37

index 48 49 50 0 2.5 1 2 3 1 12.6 4 5 6 2 4.8 7 8 9 3 4.8 40 50 60 4 2.5 23 35 37

48 49 50 index 12.6 4 5 6 4.8 40 50 60 2.5 23 35 37

– 인덱스를 통한 로우 삭제

drop 명령어를 통해 특정 index를 가진 row를 삭제할 수 있다. df.index[1] 명령어는 1번 째 위치에 있는 index를 가져온다. 가져온 이 index를 drop에 인풋으로 넣어주면 해당 index를 가진 row를 삭제할 수 있다.

# Check out your DataFrame `df` df = pd.DataFrame(data = np.array([[ 1 , 2 , 3 ], [ 1 , 5 , 6 ], [ 7 , 8 , 9 ]]), columns = [ ‘A’ , ‘B’ , ‘C’ ]) display(df) # Drop the index at position 1 print (df.index[ 1 ]) print (df.drop(df.index[ 1 ])) print (df.drop( 0 ))

A B C 0 1 2 3 1 1 5 6 2 7 8 9

A B C 0 1 2 3 2 7 8 9 A B C 1 1 5 6 2 7 8 9

데이터 수정하기

특정 컬럼, 로우의 데이터를 수정하고 싶으면 ix 를 이용하면 편하다. 아래 코드는 인덱스=0, 컬럼=A의 데이터를 0으로 수정한다.

df = pd.DataFrame(data = np.array([[ 1 , 2 , 3 ], [ 1 , 5 , 6 ], [ 7 , 8 , 9 ]]), columns = [ ‘A’ , ‘B’ , ‘C’ ]) display(df) df.ix[ 0 ][ ‘A’ ] = 0 display(df)

A B C 0 1 2 3 1 1 5 6 2 7 8 9

A B C 0 0 2 3 1 1 5 6 2 7 8 9

목록에서 Pandas 데이터 프레임 만들기

Pandas를 사용하면 pd.DataFrame() 메서드를 사용하여 목록에서 Pandas DataFrame을 만들 수 있습니다. 단일 목록, 다중 목록 및 다차원 목록을 사용하여이를 달성 할 수 있습니다.

단일 목록을 사용하여 Pandas DataFrame 만들기

단일 목록에서 Dataframe을 생성하는 가장 기본적인 경우입니다. 목록을 pd.DataFrame() 에 전달하면 결과는 단일 열 Dataframe이됩니다.

예:

import pandas as pd import numpy as np lst = [“Jay”,”Raj”,”Jack”] df = pd.DataFrame(lst, columns = [‘Name’]) print(df)

출력:

Please enable JavaScript Doc Translator: 문서 번역기는 어떻게 사용합니까?

Name 0 Jay 1 Raj 2 Jack

여러 목록을 사용하여 Pandas DataFrame 만들기

둘 이상의 목록에서 Pandas DataFrame을 생성하려면 zip() 함수를 사용해야합니다. zip() 함수는 첫 번째 위치의 요소를 함께, 두 번째 위치에서 함께 쌍을 이루는 zip 유형의 객체를 반환합니다. 여기서 각 목록은 다른 열로 작동합니다.

예:

import pandas as pd import numpy as np lst1 = [“Jay”,”Raj”,”Jack”] lst2 = [12,15,14] df = pd.DataFrame(list(zip(lst1,lst2)), columns = [‘Name’,’Age’]) print(df)

출력:

Name Age 0 Jay 12 1 Raj 15 2 Jack 14

다차원 목록을 사용하여 Pandas DataFrame 만들기

다른 목록이 포함 된 목록을 다차원 목록이라고합니다. 이 경우 기본 목록 내에 중첩 된 각 목록은 데이터 프레임의 행 역할을합니다. 다음 예는 방법을 보여줍니다.

import pandas as pd import numpy as np lst = [[“Jay”,12,”BBA”],[“Jack”,15,”BSc”]] df = pd.DataFrame(lst, columns = [‘Name’,’Age’,’Course’]) print(df)

출력:

[Python] 데이터프레임 만들기 (pandas 활용)

안녕하세요. 우주신 입니다.

오랜만에 블로그 글을 남깁니다. 이것저것 바빠 활동을 잘하지 못 했네요.

앞으로 더 많은 포스팅 하겠습니다. 오늘은 pandas를 활용하여 데이터프레임을 생성하는 방법을 보겠습니다.

데이터 분석을 한다면 R로 하는 경우가 많았는데, pandas가 등장한 뒤로 파이썬에서도 쉽게 데이터를 다룰 수 있게 되어 많은 사랑을 받고 있어요!

먼저, pandas 모듈을 가져오고, DataFrame 기능을 간단히 df로 정의했습니다.

df(data= )의 데이터 입력 자리에 딕셔너리를 활용하여 df1 데이터프레임을 만들어봤습니다.

아주 깔끔하게 데이터프레임이 생성된 것을 확인할 수 있습니다.

자, 이제 열의 순서를 바꿔보겠습니다.

단순히, columns= 옵션을 활용하여 [] 리스트 안에 원하는 열의 순서대로 열 이름을 입력하면 됩니다.

행의 이름을 지정하지 않으면 default는 0부터 순서가 입력되지만 index= 기능을 활용하여 인덱스를 지정해줍니다.

numpy의 arange 함수를 활용하여 0부터 5까지 2행 3열의 형태로 데이터프레임을 만들었어요.

dtype=’int’: 데이터 형태를 int로 지정하라

copy=False: 입력 데이터를 복사할지 지정하라

아주 간단하고 가장 기본적인 함수들을 살펴봤습니다.

pandas Dataframe은 그 외 수많은 기능들을 제공하니 구글링을 통해 자세히 한번 살펴보시길 바랍니다.

수고하셨습니다~

키워드에 대한 정보 판다스 데이터프레임 만들기

다음은 Bing에서 판다스 데이터프레임 만들기 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.

이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!

사람들이 주제에 대해 자주 검색하는 키워드 [Pandas 강의] 데이터프레임 생성하기

  • 팬더스
  • 판다스
  • 펜더스
  • 데이터프레임
  • 데이터프레임 생성하기
  • 팬더스 데이터프레임
  • 판다스 데이터프레임
  • 데이터프레임 만들기
  • 리스트
  • 딕셔너리
[Pandas #강의] #데이터프레임 #생성하기


YouTube에서 판다스 데이터프레임 만들기 주제의 다른 동영상 보기

주제에 대한 기사를 시청해 주셔서 감사합니다 [Pandas 강의] 데이터프레임 생성하기 | 판다스 데이터프레임 만들기, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.

Leave a Comment