Top 32 파이썬 특정 열 추출 14847 People Liked This Answer

You are looking for information, articles, knowledge about the topic nail salons open on sunday near me 파이썬 특정 열 추출 on Google, you do not find the information you need! Here are the best content compiled and compiled by the https://chewathai27.com/to team, along with other related topics such as: 파이썬 특정 열 추출 Pandas 특정 열 추출, 파이썬 csv 열 추출, 파이썬 특정 행 추출, 파이썬 열 이름 추출, 판다스 행 추출, DataFrame 행 추출, Pandas 특정 조건 열 추출, Pandas 열 추출


pandas로 csv 파일에서 원하는 컬럼 추출하기 [미래 실험실 pYTHON]
pandas로 csv 파일에서 원하는 컬럼 추출하기 [미래 실험실 pYTHON]


[Pandas] 4. 필요한 열(Column) 추출하기

  • Article author: zephyrus1111.tistory.com
  • Reviews from users: 44346 ⭐ Ratings
  • Top rated: 4.7 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [Pandas] 4. 필요한 열(Column) 추출하기 안녕하세요~ 꽁냥이에요! 데이터의 크기가 클 경우에는 모든 데이터를 다루기보다 필요한 열(Column)을 추출하여 데이터의 크기를 줄인다면 더 빠르게 … …
  • Most searched keywords: Whether you are looking for [Pandas] 4. 필요한 열(Column) 추출하기 안녕하세요~ 꽁냥이에요! 데이터의 크기가 클 경우에는 모든 데이터를 다루기보다 필요한 열(Column)을 추출하여 데이터의 크기를 줄인다면 더 빠르게 … 안녕하세요~ 꽁냥이에요! 데이터의 크기가 클 경우에는 모든 데이터를 다루기보다 필요한 열(Column)을 추출하여 데이터의 크기를 줄인다면 더 빠르게 데이터 분석을 수행할 수 있을 거예요. 이번 포스팅에서는 데..
  • Table of Contents:

1 칼럼 이름을 사용하는 방법

2 iloc를 이용하여 원하는 칼럼 추출하기

3 drop을 이용하여 원하는 칼럼 추출하기

관련글

댓글2

전체 방문자

최근글

인기글

티스토리툴바

[Pandas] 4. 필요한 열(Column) 추출하기
[Pandas] 4. 필요한 열(Column) 추출하기

Read More

[Pandas] 파이썬 데이터프레임 특정 열 추출, 행 추출(1개, 여러 개)

  • Article author: jimmy-ai.tistory.com
  • Reviews from users: 23891 ⭐ Ratings
  • Top rated: 4.9 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [Pandas] 파이썬 데이터프레임 특정 열 추출, 행 추출(1개, 여러 개) 파이썬 판다스 원하는 열/행 가져오기 방법 간단 정리 파이썬 pandas 모듈을 이용하여 데이터프레임에서 원하는 1개의 열/행을 가져오는 방법과 여러 … …
  • Most searched keywords: Whether you are looking for [Pandas] 파이썬 데이터프레임 특정 열 추출, 행 추출(1개, 여러 개) 파이썬 판다스 원하는 열/행 가져오기 방법 간단 정리 파이썬 pandas 모듈을 이용하여 데이터프레임에서 원하는 1개의 열/행을 가져오는 방법과 여러 … 파이썬 판다스 원하는 열/행 가져오기 방법 간단 정리 파이썬 pandas 모듈을 이용하여 데이터프레임에서 원하는 1개의 열/행을 가져오는 방법과 여러 개의 column/row들을 동시에 추출하는 법에 대해서 간략하게..
  • Table of Contents:
[Pandas] 파이썬 데이터프레임 특정 열 추출 행 추출(1개 여러 개)

파이썬 판다스 원하는 열행 가져오기 방법 간단 정리

티스토리툴바

[Pandas] 파이썬 데이터프레임 특정 열 추출, 행 추출(1개, 여러 개)
[Pandas] 파이썬 데이터프레임 특정 열 추출, 행 추출(1개, 여러 개)

Read More

판다스(pandas) 실습 – 행과 열의 데이터 추출(loc, iloc)

  • Article author: velog.io
  • Reviews from users: 21096 ⭐ Ratings
  • Top rated: 3.8 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 판다스(pandas) 실습 – 행과 열의 데이터 추출(loc, iloc) 슬라이싱 구문, range 메서드데이터프레임에서 열 단위 데이터를 추출하려면. … 저는 파이썬 모르는 채로 pandas만 배웠어서 처음엔 인덱스가 뭔지, … …
  • Most searched keywords: Whether you are looking for 판다스(pandas) 실습 – 행과 열의 데이터 추출(loc, iloc) 슬라이싱 구문, range 메서드데이터프레임에서 열 단위 데이터를 추출하려면. … 저는 파이썬 모르는 채로 pandas만 배웠어서 처음엔 인덱스가 뭔지, … 목차1\. 열 단위 데이터 추출하기2\. 행 단위 데이터 추출하기3\. 인덱스와 행 번호 개념 알아보기4\. loc 속성으로 행 데이터 추출하기5\. iloc 속성으로 행 데이터 추출하기6\. 슬라이싱 구문, range 메서드데이터프레임에서 열 단위 데이터를 추출하려면
  • Table of Contents:

열 단위 데이터 추출하기

행 단위 데이터 추출하기

인덱스와 행 번호 개념 알아보기

loc 속성으로 행 데이터 추출하기

iloc 속성으로 행 데이터 추출하기

loc iloc 속성 사용 방법

판다스(pandas) 실습 - 행과 열의 데이터 추출(loc, iloc)
판다스(pandas) 실습 – 행과 열의 데이터 추출(loc, iloc)

Read More

Pandas – DataFrame에서 특정 행, 열 선택 : 네이버 블로그

  • Article author: blog.naver.com
  • Reviews from users: 39373 ⭐ Ratings
  • Top rated: 5.0 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about Pandas – DataFrame에서 특정 행, 열 선택 : 네이버 블로그 이번 글에서는 Python의 데이터 구조 중 하나인 DataFrame에서 특정 행 또는 열을 선택(추출)하는 방법에 대해 정리하고자 합니다. …
  • Most searched keywords: Whether you are looking for Pandas – DataFrame에서 특정 행, 열 선택 : 네이버 블로그 이번 글에서는 Python의 데이터 구조 중 하나인 DataFrame에서 특정 행 또는 열을 선택(추출)하는 방법에 대해 정리하고자 합니다.
  • Table of Contents:

블로그

악성코드가 포함되어 있는 파일입니다

작성자 이외의 방문자에게는 이용이 제한되었습니다

Pandas - DataFrame에서 특정 행, 열 선택 : 네이버 블로그
Pandas – DataFrame에서 특정 행, 열 선택 : 네이버 블로그

Read More

Pandas : 데이터 필터링하기 #2 (열 단위 데이터 추출)

  • Article author: sorting.tistory.com
  • Reviews from users: 25239 ⭐ Ratings
  • Top rated: 4.8 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about Pandas : 데이터 필터링하기 #2 (열 단위 데이터 추출) 데이터 프레임에서 특정 열만 골라 새로운 프레임으로 만들고 싶을 땐. 다음과 같이 대괄호를 사용하면 된다. 먼저 다음과 같은 데이터가 있다고 가정 … …
  • Most searched keywords: Whether you are looking for Pandas : 데이터 필터링하기 #2 (열 단위 데이터 추출) 데이터 프레임에서 특정 열만 골라 새로운 프레임으로 만들고 싶을 땐. 다음과 같이 대괄호를 사용하면 된다. 먼저 다음과 같은 데이터가 있다고 가정 … 데이터 프레임에서 특정 열만 골라 새로운 프레임으로 만들고 싶을 땐 다음과 같이 대괄호를 사용하면 된다. 먼저 다음과 같은 데이터가 있다고 가정한다. import pandas # 테스트 데이터 data = [(0, ‘a’, ‘서울’..Just trying
  • Table of Contents:
Pandas : 데이터 필터링하기 #2 (열 단위 데이터 추출)
Pandas : 데이터 필터링하기 #2 (열 단위 데이터 추출)

Read More

파이썬 Pandas, 특정 열 or 행 추출 인덱싱 (Python DataFrame loc)

  • Article author: muzukphysics.tistory.com
  • Reviews from users: 4682 ⭐ Ratings
  • Top rated: 4.2 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 파이썬 Pandas, 특정 열 or 행 추출 인덱싱 (Python DataFrame loc) 파이썬 Pandas, 특정 열 or 행 추출 인덱싱 (Python DataFrame loc). by 무적물리 2020. 8. 10. 최근 머신러닝 공부를 수행하면서 파이썬에서 데이터프레임을 다룰 일 … …
  • Most searched keywords: Whether you are looking for 파이썬 Pandas, 특정 열 or 행 추출 인덱싱 (Python DataFrame loc) 파이썬 Pandas, 특정 열 or 행 추출 인덱싱 (Python DataFrame loc). by 무적물리 2020. 8. 10. 최근 머신러닝 공부를 수행하면서 파이썬에서 데이터프레임을 다룰 일 … 최근 머신러닝 공부를 수행하면서 파이썬에서 데이터프레임을 다룰 일이 많이 생겼습니다. 해서, 자주 사용하는 것이 Pandas DataFrame입니다. 주로 판다스를 사용해서 특정 행이나 특정 열을 추출하는 방법이 많..
  • Table of Contents:

Pandas DataFrame 선언

특정 열 or 행 추출 방법

마치며

태그

관련글

댓글0

파이썬 Pandas, 특정 열 or 행 추출 인덱싱 (Python DataFrame loc)
파이썬 Pandas, 특정 열 or 행 추출 인덱싱 (Python DataFrame loc)

Read More

[python] 선택한 특정 열을 새 DataFrame에 복사본으로 추출 – 리뷰나라

  • Article author: daplus.net
  • Reviews from users: 18569 ⭐ Ratings
  • Top rated: 3.8 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [python] 선택한 특정 열을 새 DataFrame에 복사본으로 추출 – 리뷰나라 데이터 프레임에서 특정 열을 추출 하지만 R이 아닌 팬더의 경우 다음 코드는 작동하지 않으며 오류가 발생하며 판다 닉 방식이 아닙니다. import pandas as pd old = pd. …
  • Most searched keywords: Whether you are looking for [python] 선택한 특정 열을 새 DataFrame에 복사본으로 추출 – 리뷰나라 데이터 프레임에서 특정 열을 추출 하지만 R이 아닌 팬더의 경우 다음 코드는 작동하지 않으며 오류가 발생하며 판다 닉 방식이 아닙니다. import pandas as pd old = pd.
  • Table of Contents:

글 탐색

최신 글

카테고리

태그

[python] 선택한 특정 열을 새 DataFrame에 복사본으로 추출 - 리뷰나라
[python] 선택한 특정 열을 새 DataFrame에 복사본으로 추출 – 리뷰나라

Read More

[판다스, pandas] dataframe 특정 조건에 맞는 데이터 추출

  • Article author: computer-science-student.tistory.com
  • Reviews from users: 30053 ⭐ Ratings
  • Top rated: 4.9 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [판다스, pandas] dataframe 특정 조건에 맞는 데이터 추출 pandas dataframe에서 특정 조건에 맞는 데이터를 추출하는 방법에 대해 … [Python pandas] DataFrame, Series에서 조건에 맞는 값이 들어있는 행 … …
  • Most searched keywords: Whether you are looking for [판다스, pandas] dataframe 특정 조건에 맞는 데이터 추출 pandas dataframe에서 특정 조건에 맞는 데이터를 추출하는 방법에 대해 … [Python pandas] DataFrame, Series에서 조건에 맞는 값이 들어있는 행 … pandas dataframe 특정 조건에 맞는 데이터 추출 pandas dataframe에서 특정 조건에 맞는 데이터를 추출하는 방법에 대해 정리하고자 한다. 데이터가 아래와 같이 있다고 가정한다. import pandas as pd df = pd.D..
  • Table of Contents:

컴공생의 다이어리

[판다스 pandas] dataframe 특정 조건에 맞는 데이터 추출 본문

pandas dataframe 특정 조건에 맞는 데이터 추출

티스토리툴바

[판다스, pandas] dataframe 특정 조건에 맞는 데이터 추출
[판다스, pandas] dataframe 특정 조건에 맞는 데이터 추출

Read More

[python 파이썬, pandas 판다스] 데이터 특정 조건 추출

  • Article author: sunning-10.tistory.com
  • Reviews from users: 28010 ⭐ Ratings
  • Top rated: 4.8 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [python 파이썬, pandas 판다스] 데이터 특정 조건 추출 [python 파이썬, pandas 판다스] 데이터 특정 조건 추출. sunning 2022. 5. 11. 00:12. 320×100. DF = pd.DataFrame({‘name’ : [‘Minsoo’,’Minju’,’Yeomin’,’Hyeri’ … …
  • Most searched keywords: Whether you are looking for [python 파이썬, pandas 판다스] 데이터 특정 조건 추출 [python 파이썬, pandas 판다스] 데이터 특정 조건 추출. sunning 2022. 5. 11. 00:12. 320×100. DF = pd.DataFrame({‘name’ : [‘Minsoo’,’Minju’,’Yeomin’,’Hyeri’ … DF = pd.DataFrame({‘name’ : [‘Minsoo’,’Minju’,’Yeomin’,’Hyeri’,’Junghun’,’Sunny’,’Bummee’,’Luna’], ‘old’ : [33,25,19,25,32,36,23,36], ‘sex’ : [‘M’,’W’,’W’,’W’,’M’,’W’,’M’,’W’], ‘score1’: [91,50,69,9..
  • Table of Contents:

태그

‘빅데이터 분석기사[python]pandas와 기본 데이터 처리’ Related Articles

공지사항

최근 포스트

태그

검색

전체 방문자

[python 파이썬, pandas 판다스] 데이터 특정 조건 추출
[python 파이썬, pandas 판다스] 데이터 특정 조건 추출

Read More

[Pandas] 특정 조건을 만족하는 데이터 필터링

  • Article author: kimdingko-world.tistory.com
  • Reviews from users: 42699 ⭐ Ratings
  • Top rated: 4.5 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [Pandas] 특정 조건을 만족하는 데이터 필터링 Python/Pandas … 특정 값이 최대값을 가지는 행 추출¶ … 및 정렬 set_index()¶ set_index() 함수는 특정 열을 인덱스로 지정할 때 사용합니다. …
  • Most searched keywords: Whether you are looking for [Pandas] 특정 조건을 만족하는 데이터 필터링 Python/Pandas … 특정 값이 최대값을 가지는 행 추출¶ … 및 정렬 set_index()¶ set_index() 함수는 특정 열을 인덱스로 지정할 때 사용합니다. 특정 값이 최대값을 가지는 행 추출¶ In [2]: import pandas as pd import numpy as np import seaborn as sns df = sns.load_dataset(‘titanic’) df.head() Out[2]: survived pclass sex age sibsp parch fare..AI/RPA Developer
  • Table of Contents:
[Pandas] 특정 조건을 만족하는 데이터 필터링
[Pandas] 특정 조건을 만족하는 데이터 필터링

Read More


See more articles in the same category here: Top 721 tips update new.

[Pandas] 4. 필요한 열(Column) 추출하기

안녕하세요~ 꽁냥이에요!

데이터의 크기가 클 경우에는 모든 데이터를 다루기보다 필요한 열(Column)을 추출하여 데이터의 크기를 줄인다면 더 빠르게 데이터 분석을 수행할 수 있을 거예요.

이번 포스팅에서는 데이터프래임에서 원하는 칼럼을 추출하는 방법에 대해서 알아보겠습니다(상황에 따라 칼럼 또는 열이라는 단어를 사용할게요).

Pandas에서는 필요한 칼럼을 추출하는 방법을 여러 가지 제공하고 있어요. 여기서는 칼럼 이름을 사용하는 방법, iloc 함수를 이용하는 방법, drop 함수를 이용하는 방법 총 3가지를 알아보겠습니다.

1. 칼럼 이름을 사용하는 방법

2. iloc를 이용하여 원하는 칼럼 추출하기

3. drop을 이용하여 원하는 칼럼 추출하기

1. 칼럼 이름을 사용하는 방법

먼저 칼럼 이름을 이용하여 필요한 칼럼을 추출해보아요. 추출하는 방식은 다음과 같아요.

DataFrame [ [ ‘칼럼명1’, ‘칼럼명2’, . . . ] ]

즉, 추출하고자 하는 칼럼명을 리스트에 담아서 데이터프래임 인덱싱으로 넘겨주면 됩니다. 이게 무슨 말인지 당장 몰라도 괜찮아요. 아래 코드를 통해서 살펴볼꺼니까요.

이번 포스팅에서 사용할 데이터프래임을 다음과 같이 만들어 줍니다. 데이터 프래임에 대한 내용은 여기를 참고해주세요.

import pandas as pd ## 데이터 만들기 data = { ‘A’:[1,2,3,4,5], ‘B’:[‘a’,’b’,’c’,’d’,’e’], ‘C’:[‘apple’,’banana’,’grape’,’strawberry’,’peach’], ‘D’:[11,22,33,44,55] } df = pd.DataFrame(data) ## 데이터프래임 생성

위 코드를 실행하면 df의 칼럼은 ‘A’, ‘B’, ‘C’, ‘D’가 있다는 것을 알 수 있어요.

여기서 칼럼 ‘A’와 ‘B’를 추출하고자 한다면 아래 코드와 같이 해주면 됩니다.

df[[‘A’,’B’]]

위 코드를 실행하면 아래와 같이 칼럼 ‘A’와 ‘B’가 추출된 것을 알 수 있어요(여기서 칼럼명을 2중 각괄호로 둘러 싸여 있는 것을 주목하세요).

위와 같은 방식으로 원하는 칼럼을 추출할 수 있어요. 이 방식은 꽁냥이가 가장 많이 사용하는 방식이에요. 왜냐하면 어떤 칼럼을 추출했는지 코드상으로 이해하기가 쉽기 때문이에요.

만약 기존 데이터프래임을 원하는 칼럼이 추출된 데이터프래임으로 교체하고자 하는 경우에는 아래와 같이 해주세요.

df = df[[‘A’,’B’]]

반응형

2. iloc를 이용하여 원하는 칼럼 추출하기

데이터프래임에는 인덱싱을 위한 함수가 있는데요. 그중에서 iloc를 사용하여 칼럼을 추출해볼 거예요. 사용 방식은 아래와 같아요.

DataFrame.iloc [ : , [칼럼 인덱싱1, 칼럼 인덱싱2, . . . ] ]

여기서 ‘ : ‘은 모든 행을 가져오겠다는 것입니다. 그리고 칼럼 인덱싱이란 말은 0을 첫 번째로 하여 칼럼 이름이 몇 번째에 있는지를 나타내는 숫자입니다.

만약 칼럼 ‘A’와 칼럼 ‘C’를 추출하고자 한다면 아래와 같이 해주세요.

df.iloc[:,[0,2]]

여기서 숫자 0은 칼럼 ‘A’의 인덱스, 2는 칼럼 ‘C’의 인덱스입니다.위 코드를 실행하면 아래와 같이 칼럼 ‘A’와 ‘C’가 추출된 것을 알 수 있어요.

사실 이 방법은 잘 사용하지 않아요. 왜냐하면 칼럼을 인덱싱을 이용하여 추출하기 때문에 코드 상으로 어떤 칼럼을 추출했는지 알기가 어렵거든요.

3. drop을 이용하여 원하는 칼럼 추출하기

drop 함수는 사실 칼럼을 제거할 때 쓰는 방법인데요. 추출할 때도 쓸 수 있지요. 왜냐하면 원하고자 하는 칼럼 외 모든 칼럼을 제거하면 되기 때문이지요.

여기서도 칼럼 ‘A’ 와 ‘C’를 추출하려고 합니다. 그렇다면 나머지 칼럼 ‘B’, ‘C’는 필요가 없으므로 drop함수를 이용하여 제거해줍니다.

df.drop([‘B’,’D’], axis=1)

여기서 axis는 제거할 축을 결정하는 인자입니다. 0과 1 값을 가질 수 있으며 0이면 행을 제거, 1이면 열을 제거합니다. 우리는 칼럼을 제거해야 하므로 axis에 1을 넣었습니다.

위 코드를 실행하면 아래와 같이 칼럼 ‘A’와 ‘C’가 추출된 것을 알 수 있어요.

만약 추출하고자 하는 칼럼이 제거해야 할 칼럼보다 많은 경우에는 drop함수를 이용해서 추출해보세요.

이번 포스팅에서는 데이터프래임에서 원하는 칼럼을 추출하는 방법에 대해서 알아보았습니다. 궁금하신 점 있으면 댓글로 남겨주세요.

지금까지 꽁냥이의 글 읽어주셔서 감사합니다.

[Pandas] 파이썬 데이터프레임 특정 열 추출, 행 추출(1개, 여러 개)

반응형

파이썬 판다스 원하는 열/행 가져오기 방법 간단 정리

파이썬 pandas 모듈을 이용하여 데이터프레임에서 원하는 1개의 열/행을 가져오는 방법과

여러 개의 column/row들을 동시에 추출하는 법에 대해서 간략하게 정리해보겠습니다.

이해를 돕기 위하여, 아래의 데이터프레임이 df라는 변수에 저장된 상황을 가정하겠습니다.

import pandas as pd a = {‘A’ : [1, 2, 3, 4, 5], ‘B’ : [10, 20, 30, 40, 50], ‘C’ : [100, 200, 300, 400, 500]} df = pd.DataFrame(a, index = [‘가’, ‘나’, ‘다’, ‘라’, ‘마’]) df

열 1개 추출하기

대괄호 [] 1개로 해당 column의 이름을 지정해주시면 Series 형태로 열 추출이 됩니다.

df[‘A’]

반면, 대괄호 2개로 column 이름을 감싸주면 DataFrame 형태로 추출된 결과가 반환됩니다.

df[[‘A’]]

열 여러 개 동시에 추출하기

여러 개의 열을 동시에 선택하여 가져오고 싶은 경우에는

원하는 열 이름들의 순서를 적어 대괄호 2개로 감싸주시면 됩니다.

(이 경우에는 대괄호 1개로 묶을 시에는 KeyError 오류가 발생합니다.)

# df[‘A’, ‘C’] -> KeyError: (‘A’, ‘C’) 발생 df[[‘A’, ‘C’]]

반응형

행 1개 추출하기

원하는 인덱스의 이름을 열 추출의 경우처럼 대괄호로 묶되,

loc 함수를 사용해주시면 해당 행만을 선택하여 가져올 수 있습니다.

loc 뒤에 대괄호 1개로 해당 row의 이름을 감싸면 Series 형태로 행을 추출합니다.

df.loc[‘가’]

데이터프레임 형태로 가져오고 싶다면 열 추출과 마찬가지로 대괄호 2개로 감싸주시면 됩니다.

df.loc[[‘가’]]

행 여러 개 동시에 추출하기

열 여러 개 추출과 비슷한 방식으로 loc 뒤에 원하는 행들의 인덱스 목록을 대괄호 2개로

감싸주시면 여러 행 추출도 가능합니다. 역시 대괄호 1개로만 묶으면 오류가 발생합니다.

# df.loc[‘가’, ‘다’, ‘마’] -> IndexingError: Too many indexers 발생 df.loc[[‘가’, ‘다’, ‘마’]]

열과 행 이름을 모두 지정하여 추출하기

행 추출 방법에서 loc 함수의 두 번째 인자로 열 이름 목록을 리스트로 지정해주시면

column과 row 이름을 모두 지정하여 부분 데이터프레임을 가져올 수 있습니다.

df.loc[[‘가’, ‘다’, ‘마’], [‘A’, ‘C’]]

심화 : 조건 인덱싱, 위치 번호 기반 열/행 추출하기(loc, iloc 함수)

행 추출에서 사용된 loc 함수를 통하여 C열의 값이 250 이상인 행처럼 조건 인덱싱도 가능하며,

2~4번째 행 처럼 위치 기반 추출을 원하는 경우에는 iloc 함수를 사용하시면 가능합니다.

이에 대한 상세한 내용은 아래의 글을 참고해주세요.

이상으로 파이썬에서 column 및 row를 추출하는 방법에 대한 글을 마치겠습니다. 감사합니다.

반응형

Pandas – DataFrame에서 특정 행, 열 선택

Python Tutorial Pandas – DataFrame에서 특정 행, 열 선택 그림자 ・ URL 복사 본문 기타 기능 공유하기 신고하기 안녕하세요. ‘라이징n폴링’입니다. ​ 이번 글에서는 Python의 데이터 구조 중 하나인 DataFrame에서 특정 행 또는 열을 선택(추출)하는 방법에 대해 정리하고자 합니다. Pandas 데이터 처리 및 분석을 위한 Python 오픈 소스 라이브러리 데이터 구조 ‘Series’, ‘DataFrame’ 객체 제공 ​ DataFrame 행과 열로 구성된 2차원 데이터 구조 (Data Structure) RDB의 테이블 또는 엑셀(스프레드 시트)과 유사 DataFrame에서 열(column) 또는 행(row)을 선택하는 방법은 다음과 같습니다. 본 글에서는 아래 순서대로 각 방법을 예시를 통해 소개해 드리겠습니다. ​ 1. 컬럼명 또는 행의 index 사용하는 방법 ▶ DataFrame.loc[] 사용 2. 열 또는 행의 순서(위치) 사용하는 방법 ▶ DataFrame.iloc[] 사용 3. 열의 조건식 만족하는 행만 추출하는 방법 ​ 본 글에서는 예제 데이터로 ‘공공데이터포털’의 ‘건강검진정보(2017년)’를 사용하였습니다. 전체 데이터는 너무 커서, 앞의 50개 행만 사용하겠습니다. 공공데이터포털 – 건강검진정보 ​ 위 사이트에서 자료를 다운 받을 수 있지만, 편의를 위해 이곳에도 파일을 올려놓겠습니다. 🙂 첨부파일 sample_data_50 .xlsx 파일 다운로드 ​ 엑셀로 된 예시 데이터를 읽어오기 위해, pandas의 read_excel 메소드(method)를 사용합니다. 이 함수를 사용하면, 바로 DataFrame 형식으로 데이터를 가져올 수 있어 편합니다. 데이터를 읽어올 때, ‘가입자일련번호’를 index로 설정하였습니다. # read data path_file = r’\Python_Pandas’ # 파일이 들어 있는 폴더의 경로 지정 (변경해서 사용하세요!) fn = ‘sample_data_50.xlsx’ # 파일명 sn = ‘Sheet1’ # 시트명 idx_col = ‘가입자일련번호’ data = pd.read_excel(path_file + ‘\\’ + fn, sheet_name=sn, index_col=idx_col) print(data.columns) print(data.shape) ​ 어떤 데이터가 들어있는지 확인하기 위해, 컬럼명을 출력하였습니다. 50명에 대한 33개 검진 항목 결과가 기록된 자료군요. 저희는 33개를 다 볼 껀 아니라서, 아래 예시를 통해 필요한 열만 추려내는 걸로 시작하겠습니다. 🙂 ​ ​ DataFrame.loc 사용하기 내가 그의 “이름”을 불러 주었을 때… ​ ​ loc 이용해서 필요한 열 추출하기 ​ loc를 이용하면, 컬럼명을 명시하여 원하는 열을 선택할 수 있습니다. 앞서 가져온 데이터에서 앞으로 계속 사용하게 될 열만 선택하여 ‘df_sample’이라는 새로운 DataFrame으로 저장하겠습니다. ​ 방법은 [ ] 안의 앞에는 전체를 의미하는 ‘:’를, 뒷자리에는 선택할 열 이름으로 구성된 list를 넣어주면 됩니다. 이는 모든 행(:)의 선택한 열만 보겠다는 의미입니다. ​ 우리는 아래와 같이 6개 열을 선택해 보겠습니다. 🙂 df_sample = data.loc[:, [‘성별코드’, ‘신장(5Cm단위)’, ‘체중(5Kg 단위)’, ‘허리둘레’, ‘흡연상태’, ‘음주여부’]] # 다른 방법 # df_sample = data[[‘성별코드’, ‘신장(5Cm단위)’, ‘체중(5Kg 단위)’, ‘허리둘레’, ‘흡연상태’, ‘음주여부’]] df_sample.head(10) ​ 실행 결과는 다음과 같습니다. 위에서 지정한 열만 선택된 것을 확인할 수 있습니다. df_sample ​ ​ loc 이용해서 필요한 행 선택하기 ​ 이번에는 ‘df_sample’에서 index(=가입자 일련번호)가 1, 5, 10, 20인 사람의 건강검진정보만 추출해서 ‘df_sample_2’로 저장해보겠습니다. 열 선택할 때와 동일한 방법이지만, 이번에는 [ ] 안의 행 자리에 선택할 행의 index list를 넣어주고, 열 자리에는 ‘:’을 입력합니다. df_sample_2 = df_sample.loc[[1, 5, 10, 20], :] # index가 1, 5, 10, 20 df_sample_2.head() ​ ‘df_sample_2’를 출력해보면, 가입자일련번호가 1, 5, 10, 20인 행만 선택되어 있습니다. df_sample_2 index가 숫자로 되어 있어서 좀 그런데.. 우리가 입력한 숫자는 ‘행 순서’가 아니라 ‘index명’이라는 걸 유념하셔야 합니다. 🙂 ​ ​ loc 이용해서 필요한 열과 행 동시에 선택하기 ​ 별 다른 거 없고~ 열 선택하는 방법과 행 선택하는 방법을 같이 사용하면 끝입니다. 🙂 df_sample_3 = df_sample.loc[[1, 5, 10, 20], [‘성별코드’, ‘신장(5Cm단위)’, ‘체중(5Kg 단위)’, ‘허리둘레’]] df_sample_3.head() ​ 실행 결과입니다. 가입자일련번호가 1, 5, 10, 20인 사람들의 성별, 신장, 체중, 허리둘레 자료만 추출된 것을 볼 수 있습니다. df_sample_3 ​ ​ DataFrame.loc 사용하기 기준! 뒤로 번호! 0, 1, 2, …. ​ ​ iloc 이용해서 필요한 열 추출하기 ​ 이번에는, 앞에서 ‘df_sample’를 만든 것과 동일한 작업을 iloc를 사용해서 진행하겠습니다. ​ iloc는 위치(순서)를 이용해서 열을 지정하므로, 각 열의 순서를 먼저 확인해야 합니다. ‘성별코드’는 2번째 컬럼이므로 1, ‘신장’은 5번째 컬럼이므로 4… 이런 식으로 지정하면 우리가 선택해야 할 열의 순서(위치)는 [1, 4, 5, 6, 24, 25]가 됩니다. df_sample_4 = data.iloc[:, [1, 4, 5, 6, 24, 25]] df_sample_4.head(10) ​ 실행 결과를 보면 ‘df_sample_4’가 ‘df_sample’과 동일함을 알 수 있습니다. df_sample_4 ​ 연속된 열을 선택할 경우, ‘:’을 사용하면 됩니다. 각 열의 위치를 담고 있는 list가 아니라, 필요한 열의 처음과 끝 위치를 지정해주는 것이지요. 아래는 첫번째부터 다섯번째 열을 선택하는 코드입니다. df_sample_5 = data.iloc[:, 0:5] df_sample_5.head(10) ​ 실행 결과는 다음과 같습니다. df_sample_5 ​ ​ iloc 이용해서 필요한 행 추출하기 ​ [ ] 안에 선택할 행의 순서가 담긴 list를 넣어줍니다. (참 쉽죠?) df_sample_6 = df_sample.iloc[[1, 5, 10, 20], :] # 행 순서가 1, 5, 10, 20번째인 행 df_sample_6.head(10) ​ ‘df_sample_6’는 아래 그림과 같습니다. [ ] 안의 행 자리에 들어간 list는 ‘df_sample_6’과 ‘df_sample_2’가 동일하지만, 그 결과는 서로 다르다는 걸 알 수 있습니다. df_sample_6 ​ ‘df_sample_2’의 경우, loc를 사용해서 index(가입자일련번호)가 1, 5, 10, 20인 행을 추출한 것이고, ‘df_sample_6’은 iloc를 사용해서 행의 순서가 2번째, 6번째, 11번째 및 21번째인 행을 추출한 것이기 때문입니다. ​ 연속된 열을 선택하는 방식과 동일하게 연속된 행도 선택 가능합니다. df_sample_7 = df_sample.iloc[4:10, :] df_sample_7.head(10) ​ 실행 결과는 다음과 같습니다. df_sample_7 ​ ​ iloc 이용해서 필요한 열과 행 선택하기 ​ 연속된 행과 열을 선택할 경우에는 다음과 같이 사용하면 됩니다. df_sample_8 = df_sample.iloc[-6:-1, 1:3] df_sample_8.head() ​ 실행 결과는 다음과 같습니다. df_sample_8 ​ 행과 열을 list로 지정해서 사용할 수도 있습니다. df_sample_9 = df_sample.iloc[[0, 10, 20, 30, 40], [1, 3]] df_sample_9.head() ​ 실행 결과는 다음과 같습니다. df_sample_9 ​ ​ 컬럼 조건문으로 행 추출하기 True or False ​ ​ ‘df_sample’에서 ‘성별코드’ 열의 값이 ‘1’인 행만 추출해 보겠습니다. 방법은 앞에서 글로 표현한 조건을 [ ]안에 넣어주면 됩니다. 파이썬은 굉장히 직관적인 언어라, 조건문을 작성할 때 편리합니다. df_sample_10 = df_sample[df_sample[‘성별코드’] == 1] df_sample_10.head(10) ​ 실행 결과을 보면, [ ]안의 조건을 만족하는 행, 즉 ‘성별코드’가 ‘1’이 True인 행만 선택된 것을 확인할 수 있습니다. df_sample_10 ​ 경우에 따라 위의 예제와 달리, 조건문에서 선택해야 할 값이 다수일 때가 있습니다. 이럴 땐 당황하지 말고 Series 객체의 ‘isin()’ 메소드를 사용하면 됩니다. 🙂 ​ 예시를 들어보겠습니다. 이번에는 ‘신장(5cm단위)’ 열의 값이 165, 170, 175인 행만 따로 뽑아서 ‘df_sample_11’로 저장하겠습니다. df_sample_11 = df_sample[df_sample[‘신장(5Cm단위)’].isin([165, 170, 175])] df_sample_11.head(10) ​ 아래 그림에서는 상위 10개 행만 출력했지만, 예시를 따라해보시면 전체에서도 ‘신장(5cm단위)’ 열의 값이 165, 170, 175만 선택되었음을 알 수 있습니다. df_sample_11 ​ 이번에는 조건문이 여러 개인 경우입니다. 앞의 두 예시는 조건문이 하나였지만, 여러 개의 조건문이 동시에 사용되는 케이스도 매우 흔한 편입니다. ​ 이 경우에도 방법은 간단합니다. 그냥 본인이 원하는 결과가 나오도록 조건문을 비트 연산자(Bitwise operator)로 연결하면 됩니다. ​ 아래 예시는 신장이 170(이상)~180(미만) 사이인 사람만 추출하는 코드입니다. df_sample_12 = df_sample[(df_sample[‘신장(5Cm단위)’] >= 170) & (df_sample[‘신장(5Cm단위)’] < 180)] df_sample_12 ​ 결과는 위에서 설정한 조건문 구성에 따라, 신장이 170과 175로만 구성되었습니다. df_sample_12 ​ 조건문이 너무 복잡하거나 길어지면 아래 방식으로도 설정할 수 있습니다. condition_1 = (df_sample['신장(5Cm단위)'] >= 170) & (df_sample[‘신장(5Cm단위)’] < 180) condition_2 = (df_sample['체중(5Kg 단위)'] >= 65) & (df_sample[‘체중(5Kg 단위)’] < 80) df_sample_13 = df_sample[condition_1 & condition_2] df_sample_13 ​ 실행 결과는 다음과 같습니다. df_sample_13 ​ ​ 분석 예시 1과 2만 있다 ​ ​ '분석 예시'라고 했지만.. 그리 복잡하고 깊이 있는 건 아닙니다. ㅎㅎㅎ 그냥 '성별코드'가 1과 2로 되어 있어서, 어떤 숫자가 남자이고, 여자인지 확인해볼려고 합니다. ​ 우선, 결과 그래프를 출력하기 위해, 그래프 생성 관련 라이브러리 하나를 import 합니다. import matplotlib.pyplot as plt ​ 앞서, 성별코드가 1인 데이터는 'df_sample_10'으로 생성했기 때문에, 이번에는 성별코드가 2인 데이터만 추출해서 'df_sample_14'로 저장하겠습니다. df_sample_14 = df_sample[df_sample['성별코드'] == 2] print(df_sample_10.shape) print(df_sample_14.shape) ​ 두 DataFrame의 크기를 비교해보니 24:26정도 되는군요. ​ 다음은 히스토그램을 그리기 위해, 신장 간격마다의 빈도수를 계산합니다. 'value_counts()' 함수를 사용하면 Series 내부 각 값들의 빈도수를 얻을 수 있습니다. count_10 = df_sample_10['신장(5Cm단위)'].value_counts() count_14 = df_sample_14['신장(5Cm단위)'].value_counts() print(count_10) ​ 성별 코드 1의 경우, 160부터 175까지 각 발생 빈도수는 다음과 같습니다. ​ 결과를 시각적으로 확인하기 위해, 수평 막대 그래프를 사용하였습니다. 이 때 두 그룹의 분포를 한번에 확인할 수 있도록 좌측에는 성별 코드가 1인 그룹, 우측에는 성별 코드가 2인 그룹의 분포를 한번에 그렸습니다. fig, ax = plt.subplots(ncols=2, sharey=True) ax[0].barh(count_10.index.tolist(), count_10.tolist(), align='center', color='gray', height=3.5) ax[0].set(title='one') ax[1].barh(count_14.index.tolist(), count_14.tolist(), align='center', color='gray', height=3.5) ax[1].set(title='two') ax[0].invert_xaxis() plt.show() ​ 흠... 결과 그래프를 보니, 성별코드 '1'이 남성인 것 같네요. :) 조금 더 응용해보면, 남자와 여자의 흡연 비율, 음주 비율 등도 비교할 수 있겠군요.. :) ​ ​ ​ 저와 같이 파이썬 언어를 공부하는 분들께 도움이 되기 바랍니다. 감사합니다. :) ​ ​ 인쇄

So you have finished reading the 파이썬 특정 열 추출 topic article, if you find this article useful, please share it. Thank you very much. See more: Pandas 특정 열 추출, 파이썬 csv 열 추출, 파이썬 특정 행 추출, 파이썬 열 이름 추출, 판다스 행 추출, DataFrame 행 추출, Pandas 특정 조건 열 추출, Pandas 열 추출

Leave a Comment