Top 30 빅 데이터 분석 프로젝트 주제 The 94 Top Answers

You are looking for information, articles, knowledge about the topic nail salons open on sunday near me 빅 데이터 분석 프로젝트 주제 on Google, you do not find the information you need! Here are the best content compiled and compiled by the Chewathai27.com/to team, along with other related topics such as: 빅 데이터 분석 프로젝트 주제 빅데이터 프로젝트 예제, 데이터 분석 주제 예시, 공공데이터 분석 주제, 빅데이터 프로젝트 아이디어, 파이썬 데이터분석 주제, 공공데이터 분석 프로젝트, 파이썬 데이터분석 프로젝트, r 데이터분석 주제


[위비즈x빅데이터공모전] 한국기업데이터 시각화 공모전 대상 수상작 : Risk Finder
[위비즈x빅데이터공모전] 한국기업데이터 시각화 공모전 대상 수상작 : Risk Finder


[Brightics 서포터즈] 나홀로 분석 프로젝트 (1) 분석 주제 선정 (+ 계획서 작성)

  • Article author: soa-park.tistory.com
  • Reviews from users: 19766 ⭐ Ratings
  • Top rated: 3.1 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [Brightics 서포터즈] 나홀로 분석 프로젝트 (1) 분석 주제 선정 (+ 계획서 작성) 원래 저는 마케팅에서 데이터 분석을 사용하는 방법에 대해 포스팅하고 싶었잖아요? 그럼 이번을 기회로,. 마케팅 가설이나 주장에 대해서 힘을 실어줄 수 … …
  • Most searched keywords: Whether you are looking for [Brightics 서포터즈] 나홀로 분석 프로젝트 (1) 분석 주제 선정 (+ 계획서 작성) 원래 저는 마케팅에서 데이터 분석을 사용하는 방법에 대해 포스팅하고 싶었잖아요? 그럼 이번을 기회로,. 마케팅 가설이나 주장에 대해서 힘을 실어줄 수 … 안녕하세요, Soa입니다! ٩( ᐛ )و 이제 개강도 했고.. (공부하기싫어병) 홍보 ucc 제작 때문에 분석 포스팅이 조금 없었습니다.. 아직 홍보 ucc 제작은 끝나지 않았지만..! 운영국에서 메일이 왔습니당……..
  • Table of Contents:

태그

‘Data Analysis ‘◡’✿삼성SDS Brightics AI & Studio’ Related Articles

티스토리툴바

[Brightics 서포터즈] 나홀로 분석 프로젝트 (1) 분석 주제 선정 (+ 계획서 작성)
[Brightics 서포터즈] 나홀로 분석 프로젝트 (1) 분석 주제 선정 (+ 계획서 작성)

Read More

미니프로젝트(2) 범죄 빅데이터 분석

  • Article author: velog.io
  • Reviews from users: 34563 ⭐ Ratings
  • Top rated: 4.2 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 미니프로젝트(2) 범죄 빅데이터 분석 부산시 5대 범죄 및 시카고 범죄현황 빅데이터 분석. 구분, 내용. 기획배경, 부산시의 범죄발생율과 각 구별 cctv 설치 현황에 대하여 어떤 연결점이 있지 … …
  • Most searched keywords: Whether you are looking for 미니프로젝트(2) 범죄 빅데이터 분석 부산시 5대 범죄 및 시카고 범죄현황 빅데이터 분석. 구분, 내용. 기획배경, 부산시의 범죄발생율과 각 구별 cctv 설치 현황에 대하여 어떤 연결점이 있지 … 두번째 미니프로젝트 보고서입니다.
  • Table of Contents:

SW 빅데이터 실무과정 2021-0628~1206

부산시 5대 범죄 및 시카고 범죄현황 빅데이터 분석

미니프로젝트(2) 범죄 빅데이터 분석
미니프로젝트(2) 범죄 빅데이터 분석

Read More

빅 데이터 분석 프로젝트 주제

  • Article author: hyukstory.oopy.io
  • Reviews from users: 8550 ⭐ Ratings
  • Top rated: 4.8 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 빅 데이터 분석 프로젝트 주제 빅데이터 분석 및 시각화 project. 참여자 : 김수연, 이혁수, 김경주. @8/28/2020 → 9/13/2020. 주제 : 공공데이터 활용한 뉴노멀 시대 맞춤 야외 데이트 지역 추천. …
  • Most searched keywords: Whether you are looking for 빅 데이터 분석 프로젝트 주제 빅데이터 분석 및 시각화 project. 참여자 : 김수연, 이혁수, 김경주. @8/28/2020 → 9/13/2020. 주제 : 공공데이터 활용한 뉴노멀 시대 맞춤 야외 데이트 지역 추천.
  • Table of Contents:
빅 데이터 분석 프로젝트 주제
빅 데이터 분석 프로젝트 주제

Read More

프로젝트 주제 선정 – Seung Yeop | Software Engineer

  • Article author: seungyeop.me
  • Reviews from users: 9492 ⭐ Ratings
  • Top rated: 4.5 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 프로젝트 주제 선정 – Seung Yeop | Software Engineer 금융 관련 빅데이터 분석 Project 아이디어. (1) 빅데이터분석을 활용한 환율예측 알림서비스. 목적: 1달이상의 장기적인 환율추이를 예측하여 고객이 … …
  • Most searched keywords: Whether you are looking for 프로젝트 주제 선정 – Seung Yeop | Software Engineer 금융 관련 빅데이터 분석 Project 아이디어. (1) 빅데이터분석을 활용한 환율예측 알림서비스. 목적: 1달이상의 장기적인 환율추이를 예측하여 고객이 …
  • Table of Contents:

답글 남기기 응답 취소

최신 글

Categories

Tags

Statistics

Contact

프로젝트 주제 선정 – Seung Yeop |  Software Engineer
프로젝트 주제 선정 – Seung Yeop | Software Engineer

Read More

데알못이 데이터 분석 프로젝트를 하기 위해 리서치한 내용 총집합

  • Article author: thewayaboutme.tistory.com
  • Reviews from users: 11497 ⭐ Ratings
  • Top rated: 3.5 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 데알못이 데이터 분석 프로젝트를 하기 위해 리서치한 내용 총집합 데이터 이해. 정형/비정형, 데베, 빅데이터, 데이터사이언티스트 역량, 개인정보 비식별 기술 이렇게만 보면 될 듯. 2. 분석 기획, 분석 방법론, … …
  • Most searched keywords: Whether you are looking for 데알못이 데이터 분석 프로젝트를 하기 위해 리서치한 내용 총집합 데이터 이해. 정형/비정형, 데베, 빅데이터, 데이터사이언티스트 역량, 개인정보 비식별 기술 이렇게만 보면 될 듯. 2. 분석 기획, 분석 방법론, … 1. 데이터 이해 정형/비정형, 데베, 빅데이터, 데이터사이언티스트 역량, 개인정보 비식별 기술 이렇게만 보면 될 듯 2. 분석 기획, 분석 방법론, 분석과제 발굴 방법론, 마스터 플랜형 분석(장기전을 의미함) 1)..
  • Table of Contents:

drmeteor 공부 일지

데알못이 데이터 분석 프로젝트를 하기 위해 리서치한 내용 총집합 본문

데알못이 데이터 분석 프로젝트를 하기 위해 리서치한 내용 총집합
데알못이 데이터 분석 프로젝트를 하기 위해 리서치한 내용 총집합

Read More

[2021 빅데이터 아카데미 우수 프로젝트 사례(분석)] 머신러닝, 딥러닝 방법을 활용한 중고차 시세예측 – DATA ON-AIR

  • Article author: dataonair.or.kr
  • Reviews from users: 35036 ⭐ Ratings
  • Top rated: 3.8 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [2021 빅데이터 아카데미 우수 프로젝트 사례(분석)] 머신러닝, 딥러닝 방법을 활용한 중고차 시세예측 – DATA ON-AIR [2021 빅데이터 아카데미 우수 프로젝트 사례(분석)] 머신러닝, 딥러닝 방법을 활용한 중고차 시세예측 … …
  • Most searched keywords: Whether you are looking for [2021 빅데이터 아카데미 우수 프로젝트 사례(분석)] 머신러닝, 딥러닝 방법을 활용한 중고차 시세예측 – DATA ON-AIR [2021 빅데이터 아카데미 우수 프로젝트 사례(분석)] 머신러닝, 딥러닝 방법을 활용한 중고차 시세예측 …
  • Table of Contents:
[2021 빅데이터 아카데미 우수 프로젝트 사례(분석)] 머신러닝, 딥러닝 방법을 활용한 중고차 시세예측 – DATA ON-AIR
[2021 빅데이터 아카데미 우수 프로젝트 사례(분석)] 머신러닝, 딥러닝 방법을 활용한 중고차 시세예측 – DATA ON-AIR

Read More

[빅데이터] 텀 프로젝트(8) – 텀 프로젝트 최종 – Hyeon’s DevLog

  • Article author: hyeonjiwon.github.io
  • Reviews from users: 30651 ⭐ Ratings
  • Top rated: 3.5 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [빅데이터] 텀 프로젝트(8) – 텀 프로젝트 최종 – Hyeon’s DevLog 해당 프로젝트의 주제는 2011년부터 2018년까지 국내에서 발생한 … 하여 해상에서 발생한 선박 관련 사고에 대하여 분석하는 것입니다. …
  • Most searched keywords: Whether you are looking for [빅데이터] 텀 프로젝트(8) – 텀 프로젝트 최종 – Hyeon’s DevLog 해당 프로젝트의 주제는 2011년부터 2018년까지 국내에서 발생한 … 하여 해상에서 발생한 선박 관련 사고에 대하여 분석하는 것입니다. 해상 조난 사고 데이터 분석 최종
  • Table of Contents:

Skip links

Intro

TermProject 주제 선정

사건 데이터 생성

해양 사고 데이터 조사

해양 사고 데이터 응용 구축

해양 사고 데이터 응용 모니터링

[LeetCode] Binary Search

[Spring Boot] AOP

[Spring Boot] H2 데이터베이스 설치 2

[Spring Boot] H2 데이터베이스 설치 1

[빅데이터] 텀 프로젝트(8) - 텀 프로젝트 최종 - Hyeon’s DevLog
[빅데이터] 텀 프로젝트(8) – 텀 프로젝트 최종 – Hyeon’s DevLog

Read More

[빅데이터 개인 프로젝트] 밀레니얼 세대 소연구 by 텍스톰 UCINET

  • Article author: slowslow.tistory.com
  • Reviews from users: 25910 ⭐ Ratings
  • Top rated: 4.3 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [빅데이터 개인 프로젝트] 밀레니얼 세대 소연구 by 텍스톰 UCINET 주제 선정, 로직, 데이터 수집, 데이터 정제, 데이터 분석, 인사이트 도출, 발표 준비까지 약 2달 동안 준비했습니다. 크게 네 가지 단계로 관찰 > 빅 … …
  • Most searched keywords: Whether you are looking for [빅데이터 개인 프로젝트] 밀레니얼 세대 소연구 by 텍스톰 UCINET 주제 선정, 로직, 데이터 수집, 데이터 정제, 데이터 분석, 인사이트 도출, 발표 준비까지 약 2달 동안 준비했습니다. 크게 네 가지 단계로 관찰 > 빅 … 개인적으로 학교 수업시간에 진행한 빅데이터 및 스몰데이터 프로젝트입니다. 텍스 톰 Textom 및 UCINET을 주로 사용하였고 모든 주제와 로직은 자체적으로 구성했습니다. 해당 포스팅은 개인적으로 진행한 프로..
  • Table of Contents:

태그

관련글

댓글0

공지사항

최근글

인기글

최근댓글

태그

전체 방문자

티스토리툴바

[빅데이터 개인 프로젝트] 밀레니얼 세대 소연구 by 텍스톰 UCINET
[빅데이터 개인 프로젝트] 밀레니얼 세대 소연구 by 텍스톰 UCINET

Read More


See more articles in the same category here: Top 673 tips update new.

[Brightics 서포터즈] 나홀로 분석 프로젝트 (1) 분석 주제 선정 (+ 계획서 작성)

안녕하세요, Soa입니다!

٩( ᐛ )و

이제 개강도 했고.. (공부하기싫어병)

홍보 ucc 제작 때문에 분석 포스팅이 조금 없었습니다..

아직 홍보 ucc 제작은 끝나지 않았지만..!

운영국에서 메일이 왔습니당…….^^!

(우는거 아님)

무려 10주간, 개인 분석 프로젝트를 A부터 Z까지 진행해야 한다는 사실…!

그래서 고민했습니다..

사실 분석 프로젝트를 진행했던 경험이 없기 때문에,

어떻게 10주간의 분석 프로젝트를 해야하나 막막했어요…

그러면서 든 생각이

원래 저는 마케팅에서 데이터 분석을 사용하는 방법에 대해 포스팅하고 싶었잖아요?

그럼 이번을 기회로,

마케팅 가설이나 주장에 대해서 힘을 실어줄 수 있게끔 하는

데이터 분석을 진행해봐야겠다고 생각했습니다!

반응형

나홀로 분석 프로젝트 (1) 분석 주제 선정

개인 분석 프로젝트에 대한 큰 방향을 잡았습니다!

그래서 제가 정한 프로젝트 명은…

“나도 이제 디지털 마케터!”

물론 디지털 마케터가 실제로 하는 일에 대해서는

실무를 해보지 않았기 때문에 정답이 아닐 수 있습니다!

실제로 데이터 분석이 어떻게 사용되는지에 대해서 찾아보다가

다음 글을 발견했습니다.

https://platum.kr/archives/133978

데이터 분석을 통해서 마케팅 가설, 주장에 대해서

설득력을 높일 수 있다는 것이죠!

단순히 데이터 분석 뿐만 아니라

데이터 분석을 토대로, 그 데이터 안에서 인사이트를 도출해내는 것!

이번 개인 분석 프로젝트에서

물론 데이터 분석에 대해서 열심히 공부하겠지만,

마케팅에서 데이터 분석이 이렇게 쓰일 수 있구나 하는

그 과정에 대해서 자세히 포스팅하고자 합니다!

[프로젝트 목적]

위에서 언급했던 것처럼

데이터 분석을 마케팅에 어떻게 쓸 수 있는지에 대해서

공부하고 그 과정을 자세히 이야기하고자 하는데요.

목적을 간단하게 정리하자면 다음과 같습니다.

마케팅 가설을 설정한 후, 데이터 분석으로 가설을 검증해보는 과정을 실습해본다.

누구나 볼 수 있는 채널에서 소비자 데이터를 수집하여 데이터의 추이를 보며 가설을 주장에 설득력을 높여주고, 가설을 보완하는 방법을 배울 수 있다.

마케팅 가설을 설정하고, 그 가설을 데이터 분석을 통해 검증하려고 합니다!

간단하게 예를 들자면, 포스트 코로나 시대에서 온라인 쇼핑몰이 성장할 것이니 쇼핑몰을 만들어야 한다!

(조금 허접한 가설이지만..)

이런 식으로 마케팅 가설이나 주장을 설정하고

이에 대해 뒷받침할만한 근거로 분석한 데이터를 제시하는거죠!

예를 들어, 년도별 온라인 쇼핑몰 성장 추이 데이터 등이 있을 것 같습니다.

그래서 이러한 이유로 디지털 마케터가 되었다고 생각하고,

가상의 시나리오(내가 만약 ~라면)와 가설 등을 설정해서

그에 맞게끔 데이터 분석을 진행하고

분석 결과를 시각화하고, 나름 제안서? 분석 리포트를 작성해보고자 합니다!

[프로젝트 개요]

그래서 프로젝트는 간단하게 다음과 같이 진행될 예정입니다.

1. 설득력 있는 마케터 : 데이터 분석, 가설 검증이 필요한 이유

2. 분석 시나리오 설정 : ‘내가 만약 삼성SDS 마케팅 담당자라면?’

3. 제안을 위한 근거 만들기, 데이터 분석

4. 데이터 분석 결과 시각화

5. 결과 분석 및 인사이트 도출

여기서 2번의 분석 시나리오 설정에 대해서

조금 이야기해보겠습니다..!

가능한 시나리오가 여러 가지 있고, 정말 많이 고민해보았습니다..

사실 어느 기업에 소속된 마케터라면,

해당 기업에서 수집한 판매 데이터, 구매 전환 데이터 등과 같은

소비자 데이터가 있기 때문에 그와 관련된 가설을 세울 수 있겠지만

제가 수집할 수 있는 데이터에는 한계가 있기 때문에

많은 가설들을 포기했습니다.. ㅠ_ㅠ

그래서 공개되어 있는 데이터들 중에서 얻을 수 있는

소비자 데이터를 생각해보니,

네이버 데이터랩, 구글 트렌드 등과 같은

많은 사용자들이 이용하는 채널에서 제공하는 소비자 데이터가 있더라구요!

그런데 어떤 기업에 소속되어 있는 마케터라는 설정은 포기한거 아닌가요?

할 수도 있겠지만!

제가 설정한 시나리오는

‘내가 만약 삼성SDS 마케팅 담당자라면?’

이겁니다!

내가 만약 삼성SDS 마케팅 담당자라면!

Brightics 서포터즈를 모집해서, Brightics를 홍보하자는 전략에 대해서

어떠한 근거를 통해서 이야기하고,

그 근거를 어떤 데이터를 어떻게 분석해서 제안했을까?

라는 생각을 했습니다!

물론 진짜 담당자님께서는.. 저보다 높은 퀄리티의 제안서(?)를 작성하셨겠지만..

일단 한번 제안서(라고 부르는건지 모르겠지만) 작성 과정을

실습해보고자 합니다!

자세하게 어떤 데이터를 사용해서 어떻게 할건지에 대해서는

나중에 포스팅할 때 자세하게 이야기할 예정입니다..!

궁금하셔도 참아주세요!

٩( ᐛ )و

그럼 다음 포스팅에서는

좀 더 자세한 내용으로 만나요~!

안녕!

٩( ᐛ )و

* Brightics 서포터즈 활동의 일환으로 작성된 포스팅입니다. *

반응형

데알못이 데이터 분석 프로젝트를 하기 위해 리서치한 내용 총집합

1. 데이터 이해

정형/비정형, 데베, 빅데이터, 데이터사이언티스트 역량, 개인정보 비식별 기술 이렇게만 보면 될 듯

2. 분석 기획, 분석 방법론, 분석과제 발굴 방법론, 마스터 플랜형 분석(장기전을 의미함)

1) 분석 방법론

CRISP-DM 분석 방법론을 비롯한 몇몇 방법론 적혀있음. CRISP-DM 분석 방법론은 이미 정리해둔 내용이 있고, 학교 수업 및 교과서에도 나오는 방법론이니 간단하게 내용을 정리하고 간다.

[CRISP-DM]

https://medium.com/@thecodingcookie/cross-industry-process-for-data-mining-286c407132d0

(1) 비즈니스 이해

해결할 문제 파악/이해 –>문제 정의, 해결책 정의

적절한 해결책 공식이 나올 때까지 이 과정을 반복 한다.

해결책 설계 작업에서 분류/회귀분석, 확률 추정 등의 모델을 이용해 우리가 해결할 수 있는 더 작은 문제로 분할 하는 구조화 작업을 수행하기도 한다.

여기서 사용 시나리오 에 대해 신중히 생각한다 (결정 분석적 사고)

– 우리가 하려는 일이 정확히 무엇?

– 정확히 어떻게 할 것인가?

– 사용 시나리오 중 어느 부분이 데이터 마이닝 모델을 이루는가?

…를 따지며 사용 시나리오에 대해 생각해보는 동안 실제 목적에 부합하도록 시나리오를 수정할 필요를 느끼며, 여기서 문제 접근을 도와주는 개념적 도구를 사용하기도 하는데, 예를 들어 기댓값 관점에서 비즈니스 문제를 구조화하면 체계적으로 처리할 문제를 데이터 마이닝 작업으로 분할할 수 있다.

(2) 데이터 이해

문제에 정확히 부합하는 데이터가 있는 경우는 거의 없으므로 여러 데이터의 장단점을 파악하고 비교하는 것이 중요하다.

(3) 데이터 준비

분석 기술에서 요구하는 특정 조건을 만족해야 한다. 간혹 가져온 데이터는 분석 기술에서 원하는 형식과 일치하지 않기 때문에 변환해야 하는 경우가 있다. 데이터 형태 조작, 변환.

일반적으로 데이터를 테이블 형태로 변환하고 빠진 값은 유추해서 채우며, 적절한 형으로 변환한다. 수치 데이터를 비교하려면 졍규화, 변환 시 표준 규칙 이용.

일반적으로 마이닝 프로세스 앞 단계에서 후반부에 사용될 변수를 정의 하느라 많은 시간을 보내는데, 이 단계에서 인간의 창의성, 상식, 비즈니스에 대한 이해가 매우 중요하다. 데이터 마이닝 해결책의 품질은 분석가가 얼마나 문제를 구조화하고 변수를 정의하는지에 따라 차이가 난다.

(4) 모델링

마이닝을 데이터에 적용하는 초기 단계다. 모델링 결과로 데이터에서 드러난 규칙에 의해 모델의 종류나 패턴 이 만들어진다.

(5) 평가

마이닝 결과를 엄격히 평가하고 다음 단계로 넘어가도 되는지 모델의 신뢰성을 확인 하는 단계. 어떤 데이터셋이든 자세히 살펴보면 패턴을 알아낼 순 있지만, 신중히 평가해보면 패턴의 오류 를 찾아낼 수 있다. 이 단계에선 모델과 데이터에서 추출한 패턴이 진정한 규칙성을 갖고 있는지, 단지 특정 예제 데이터에서만 볼 수 있는 특이한 성질은 아닌지를 확인해야 한다.

+ 원래 비즈니스 목적에 부합하는지 확인

2) 분석과제 발굴 방법론: 상향식, 하향식

말은 간단하지만 구체적인 내용은 읽어볼 가치가 있어보임. 마스터 플랜은 지금 하려는게 아닐 것 같으니 패스.

3. 분석 기법 종류

시각화, 공간 분석, 탐색적 자료 분석, 통계분석, 데이터 마이닝 이건 다 읽어보기

위 1번~3번에 해당하는 내용은 wikidocs에 정리된 아래 사이트에서 읽어볼 항목을 정리한 것이다. 따라서 본 내용은 아래 링크에 있다. 예쁘고 이해하기 쉽게 된 포스트가 아니고 큰 그림을 보기 좋은 간명한 자료다.

https://wikidocs.net/book/3558

분석 기법 및 분석 방법론에 대한 내용은 장미라 님의 블로그의 아래 글을 추가로 공부하는 것도 좋다.

<대표적인 데이터 분석 테크닉 30가지 (1/2)>

대표적인 데이터 분석 테크닉 30가지 (1/2)

<데이터 분석의 유형 6가지 – 목적에 따라 달라지는 분석 방법>

데이터 분석의 유형 6가지 – 목적에 따라 달라지는 분석 방법

특히 필자가 관심 있어 하는 네트워크 분석 기법에 대한 포스트는 아래 링크 내용이 좋다. NC 소프트 게임 데이터 분석 블로그의 포스트다.

<네트워크 분석기법을 활용한 게임 데이터 분석 #1, #2>

https://danbi-ncsoft.github.io/works/2018/11/12/network_analysis-1.html

https://danbi-ncsoft.github.io/works/2018/11/12/network_analysis-2.html

그 외 본인이 관심 가거나 필요한 분석 기법이 있으면 포스트가 됐건 서적이 됐건 자료를 더 찾아서 공부하면 좋을 것 같다.

4. 관련 오픈소스(대중적으로 널리 알려진 + 많이 쓰는 초유명 라이브러리 제외)

이걸 정리하자면 뭐 끝도 없을 것이다. 여기서 내용을 기재한 기준은 이 데이터 분석 캡스톤 디자인을 시작하게 된 시점 이후에 발견한 것이자 필자에게 생소한 라이브러리다.

– data-driven document: d3.js

https://d3js.org/

5. 변성윤 쏘카 데이터사이언티스트님 깃허브 자료

워낙 유명하신 분.

https://github.com/Team-Neighborhood/I-want-to-study-Data-Science

위 링크에서 각종 data, 관련 블로그 자료가 도움이 된다.

또 유명하신 다른 분은 하조은 님. 캐글에서 활발히 활동하시는 분이라고 한다. 아래는 깃허브 링크. 데이터 분석 프로젝트로 참고할 수 있는 자료가 많다. 책을 쓰신 적이 있거나 강의라도 찍으신 적이 있는 건가…?

https://github.com/corazzon

⭐️6. 데이터 분석 포트폴리오!

사실 데이터 분석 포트폴리오를 봐야 데이터 관련 토이/사이드 프로젝트는 어떻게 진행하는지 이해하기가 좋다.

[사이트]

Flowing data 사이트

https://flowingdata.com/

안수빈 님이 운영하시는 페이스북 페이지 A.I. LookBook에서 발견한 사이트. 본인의 롤모델 사이트라고 하셨다. 짧은 글로 인사이트를 제시하는 형태의 글들이라 구체적인 코드를 알 수 있는 건 아니다.

[예시- 읽어본 것]

도움이 많이 됐던 프로젝트 순으로 나열

– 온라인 뉴스 댓글은 정말 사람들의 목소리일까? – PART2 (파트 1은 18년도에 있었던 것 같다): 아이디어 전개 과정이 기가 막히다.

https://www.pycon.kr/program/talk-detail?id=39

– 국힙 래퍼 네트워크 분석: 온통 네트워크 분석 기법. 내가 지금 하고 싶은 것과 가장 유사함

– Quantify myself – self 사생활침해

바로 위 국힙 플젝을 했던 사람이 한 파이콘 발표다. 역시 여기도 네트워크 분석이 들어가지만, 그보단 좀더 다양한 방법이 포함되어 있다.

https://archive.pycon.kr/2018/program/25

– 법률 네트워크 분석: 30년간의 변화: 독보적인 도메인에 수준 있는 분석.

https://archive.pycon.kr/2018/program/21

동일 발표자가 2019 파이콘에서 발푤한 자료는 아래 링크.

https://www.pycon.kr/program/talk-detail?id=75

– 파이썬을 활용한 나의 브런치 구독자 분석: 여기도 네트워크 분석 들어감. 딱 가벼운 주제의 토이 플젝으로 볼수 있음.

https://drive.google.com/file/d/0BzXf4sedgwRbV0w4dUFVVExKVGp0elBMbU9CZEhoWXJWWmpZ/view

[예시- 안읽어본 것]

– 파이썬으로 학생 들여다보기

https://archive.pycon.kr/2018/program/32

– 파이썬으로 암을 찾아보자: 데이터로 만드는 의학 이야기

https://archive.pycon.kr/2018/program/84

– Topic Modeling & Word Embedding 그리고 화장품

https://archive.pycon.kr/2018/program/5

– 일반적인 케이스까지 포함한 파이썬을 이용한 의료 물리학 모델링 및 분석의 이해

https://archive.pycon.kr/2018/program/52

– 드론 및 인공위성 영상을 이용한 태양광발전소 입지분석

https://archive.pycon.kr/2018/program/6

– 행복한 연애를 위해 필요한 3가지 조건: 회귀 분석 밭이다.

행복한 연애를 위해 필요한 3가지 조건

– <데이터야 놀자> 2019 발표 세션 자료

– 공공 데이터 포털의 공공 데이터 활용 사례: 너무 자료가 많다.

https://www.data.go.kr/useCase/exam/index.do

[블록체인 주제 대비]

– Parsing Ethereum Database: 지윤님~! 아래 데브 그라운드 사이트로 가면 발표 영상도 찾을 수 있을 듯

https://drive.google.com/file/d/1nozsiF5SWq4m7Js5R_I3wDLQTWV8WcjJ/view

– Elasticsearch와 Python을 이용하여 맨땅에서 데이터 분석하기: 정말 가벼운 주제의 블록체인 데이터 분석 주제

https://drive.google.com/file/d/1QShZENskb1c5PwxcqklnxdtbtrFXze8A/view

[기타]

– financipe: 설대 산공 분의 리스펙 토이 플젝. 데이터 분석 유명 기법 다 들어간 금융 데이터 플젝. 옛날부터 리스펙하는 플젝

http://www.financipe.com/index

[세션 링크 모음]

*파이콘 2019 발표 세션

https://www.pycon.kr/program/talks

* 데브 그라운드 데이터 과학/AI 2019 <- DSTS 처럼 지금 당장 나한테 도움되는 주제는 없었음. http://52.78.123.153/home_elementor/# * Data Science is a Team Sports 발표 세션 자료: 데이터 사이언스 팀 문화에 대한 세션이었기 때문에 유용한 자료 없음 아래는 <비즈니스와 데이터 과학> 읽으면서 메모한 비가공 데이터. 후에 본문으로 포함시킬 것

[기타 데이터 과학 작업 기법]

1) 동시 발생과 연관성의 발견(페이스북 좋아요 분석, 거래 데이터, 장바구니 분석 등)

어떤 목적 없이 그저 데이터를 탐색하고자 할 떈 연관성 마이닝이 더 적절한 방법=자율 데이터 마이닝

반면 구체적인 타겟 변수를 알아내려면 감독 문제를 정의하여 감독 데이터 마이닝 즉 감독 세분화 기법을 이용.

페이스북 좋아요는 모든 데이터끼리 서로 무슨 방법인지 하튼 해봐서 연관성을 분석한다. 연관도 점수 기준이 있어서 그 기준을 넘은 것들만 쫙 보여준다. 연관성을 마이닝하는 목적 중 하나가 우리가 잘 모르는 데이터를 탐색하기 위한 것이다.

예를 들어, 회사 고객의 거래 데이터를 탐색하고 강력한 동시 발생 사건들을 조사하면 고객들이 가진 취향 간의 관계를 전체적으로 살펴볼 수 있다. 이걸 염두에 두고 ‘좋아요’ 동시 발생 분석 시, 많은 사람들이 각각 어떤 것을 좋아한다는 사실(이런 관계가 엄청나게 많이 있을 것이다)은 고객들의 다양한 취향과 연관되어 폭넓게 보여줄 것이다.

연관 데이터 마이닝은 당연히 자율 기법이다.

2) 프로파일링: 전형적인 행동의 발견

개인, 단체, 전체 인구의 전형적 행동 특성을 찾아낸다.

ex)

– 이 고객 세그먼트의 전형적 신용카드 사용량은?

– 신용 사기 탐지: 정상적 행위의 특성을 프로파일링하고, 정상적 행동에서 상당히 벗어나는 사례 찾음. 특히 이전에 본 사기 사건과 비슷한 방식의 사례 찾음

이 때 카드 사용량을 프로파일링해서 사기를 찾아내려면 주중/주말의 평균 사용량, 해외 사용량, 판매자와 구입 상품 종류, 의심되는 판매자로부터의 청구 등 복잡한 설명이 요구된다. 행동은 전체 인구, 소규모 그룹, 개인 차원에서 설명할 수 있다.

[주제 예시]

– 카드 사기 탐지

– 스팸 문자 찾아내기

– 미국 의료보험 사기 사건: 사기 탐지 문제랑 다르다. 비즈니스 문제와 데이터 간 관계를 생각해보면 전혀 다른 문제다. 사기꾼이 청구 시스템의 정당한 제공자이거나 사용자고, 올바른 금액이 정확히 얼마가 되어야 하는지 계산해줄 객관적인 별도의 기관이 존재하지 않는다. 청구 데이터에 사기인지 판단할 수 있는 타겟 변수가 없을 뿐만 아니라, 신용카드에서 사용하는 감독 학습 방법을 사용할 수도 없다. 이런 문제는 프로파일링, 군집화, 비정상 행위 탐지, 동시 발생 그룹화와 같은 자율 학습 방법을 사용해야 한다.

[빅데이터 개인 프로젝트] 밀레니얼 세대 소연구 by 텍스톰 UCINET

개인적으로 학교 수업시간에 진행한 빅데이터 및 스몰데이터 프로젝트입니다.

텍스 톰 Textom 및 UCINET을 주로 사용하였고 모든 주제와 로직은 자체적으로 구성했습니다.

해당 포스팅은 개인적으로 진행한 프로젝트에 대한 소개이자 아카이빙의 목적이며, 관련 내용에 대한 무단 배포 재가공 등을 모두 금합니다.

프로젝트의 메인 theme이 “밀레니얼 세대”와 “패션”이었습니다. 저는 건축 공부를 병행하면서, 공간에 대한 사람들의 인식에 관심이 많았기 때문에 밀레니얼 세대가 공간을 일종의 패션으로 소비하고 있다는 것을 유튜브와 인스타그램 등 SNS를 통해 관찰했고, 다음의 주제를 선정했습니다.

주제 선정, 로직, 데이터 수집, 데이터 정제, 데이터 분석, 인사이트 도출, 발표 준비까지 약 2달 동안 준비했습니다.

크게 네 가지 단계로 관찰 > 빅데이터 분석 > 스몰데이터 분석 > 결과 도출의 흐름으로 발표를 구성했습니다.

관찰

먼저 “패션”과 관련된 “밀레니얼 세대”의 특징을 발견하기 위한 관찰 단계입니다.

밀레니얼 세대를 효과적으로 관찰하기 위해서는 그들의 주요 활동공간에 침투해야 한다고 생각해, 온라인 공간 속 모습을 관찰했습니다.

다양한 SNS 중 오늘의 집, 유튜브, 인스타그램을 통해 밀레니얼 세대들은 ‘랜선 집들이’와 같은 키워드로 자신의 공간을 공개하는 것에 익숙하다는 것을 관찰했습니다.

또한, 뉴스 등 2차 자료 조사를 통해 밀레니얼 세대는 개인 정보에 대해 타 세대보다 민감하며, 자신의 삶이 침해받지 않기를 원한다는 것을 관찰했습니다. 이 내용은 택배를 집 주소가 아닌 무인 택배함으로 주문하거나, 택배기사 직접 대면을 피하기 위해 ‘문 앞에 두고 가주세요’를 남긴다거나, 온라인 거래 시 ‘안심번호 활용’등의 사례가 있었습니다.

이러한 두 가지 모습을 통해서 밀레니얼 세대는 내 삶의 공간과 공개라는 측면에서 이중성을 보인다는 점을 알게 되었습니다.

이중성이 발생하는 이유가 무엇인지 탐구하는 것을 주제로 설정하였습니다.

기성세대는 내 삶의 공간을 Private 하고 지켜야 하는 공간으로 인식하는 편으로 알려져 있습니다. 때문에 외국에선 유행하는 홈파티 같은 문화도 잘 없죠.

하지만 밀레니얼 세대는 어떨까요?

앞서 발견되었던 유튜브, 인스타그램 속 모습들을 통해 기성세대에 비해 Private 한 공간으로 여기는 성향이 덜하다는 것을 알 수 있습니다.

빅데이터 분석

그 원인을 찾기 위해 먼저 빅데이터 분석을 진행했습니다.

분석 설계단계에서 연구 주제를 “내 삶의 공간에 대한 이중성을 보이는 밀레니얼 세대”로 설정하였습니다.

수집도구로 TEXTOM을 사용했으며, 다음과 구글 유튜브 등 관련 모습을 찾을 수 있을 것으로 예상되는 채널들을 중심으로 수집을 진행했습니다.

* 분석 당시 TEXTOM이 네이버의 수집의 오류가 발생해 네이버 관련 채널은 수집하지 못하였고, 인스타그램 또한 수집하지 못한 점이 한계였습니다.

2019-11-19부터 1년의 기간을 설정해, 중심 키워드로 “랜선 집들이”를 선택했고 총 4,172건의 데이터를 수집했습니다.

분석 결과

키워드 빈도 분석 결과 중심 키워드인 랜선 집들이를 비롯한 인테리어, 공개, 집, 영상, 소개 등 집 공개 방식이나 관련 키워드들이 높은 빈도와 중요성을 갖는 것을 알 수 있었습니다.

상위 30위 단어 워드 클라우드를 통해 다음과 같이 랜선 집들이- 인테리어- 집들이- 집- 공개 등의 키워드가 중심을 이룸을 알 수 있었습니다.

네트워크 분석

위의 분석 결과를 바탕으로 UCINET을 활용해 Network 분석을 진행했습니다.

개략적으로, 우측 하단의 높은 빈도와 연결성을 가지는 단어들이 나타나는 것을 확인할 수 있었습니다.

군집분석

이를 그룹핑하는 CONCOR 분석을 진행했습니다. 유의미한 해석을 위해 4개의 군집으로 분석했습니다.

4개의 군집을 다음과 같이 분석했습니다.

먼저, 붉은 집단은 랜선 집들이, 인테리어, 집들이, 오늘의 집 등 랜선 집들이 랜선 집들이와 관련된 소재, 방법 등의 단어가 나타나 랜선 집들이를 보여주는 전반적인 단어의 집합으로 볼 수 있었고,

푸른 집단은, 랜선 집들이 전쟁 -홈스타 워즈-홈스타 워즈라는 예능 프로그램과 관련된 키워들이키워들이 나타나 있었습니다. 때문에 예능으로 소비되는 온라인 집 공개 집 공개로 명명했습니다.

노란색 집단은 편 스토랑 프로그램에서 연예인 한다감 씨 합류 당시 집 공개를 했던 사례로 인한 키워드가 나타나 있었습니다. 때문에 연예인의 집 공개 사례로 명명했습니다.

마지막으로 초록색 집단은,, 공개, 유튜브 영상 등의 단어가 주를 이루는 것을 통해, 온라인 집 공개의 방법 – 영상으로 명명했습니다.

4가지 집단을 다시 간략하게 정리하면, 내용 유사도와유사도와 네트워크 간 연결관계를 통해 파랑 노랑 / 빨강 초록 두 개의 집단으로 나눌 수 있었으며 각각 방송과 연예인들의 랜선 집들이 사례 증가와 영상으로 진행되는 랜선 집들이 문화로 나눌 수 있었습니다.

스몰 데이터 분석

빅데이터 분석에서 스몰데이터 분석을 진행했습니다.

유튜브, 오늘의 집 등 관련 채널에 랜선 집들이 관련 온라인 포스팅 경험이 있는 밀레니얼 세대 2인을 인터뷰 대상으로 설정했으며

카카오톡 zoom 등 비대면 매체로 명당 20분 내외의 질의응답을 진행했습니다.

질문 구성

하나. 온라인 집 공개를 하는 이유와 사용 매체는 무엇인가?

-> 온라인 집 공개를 하는 동기와 방법에 대해 확인하고자

둘. 온라인 집 공개 시 개인정보 공개에 대해 우려한 적은 없는가?

-> 밀레니얼 세대의 두 번째 특징인 개인정보 노출에 민감한 특성에 대해 확인하고자

셋. 자신에게 집, 내 삶의 공간이란 무엇인가?

-> 집에 대해 느끼는 태도를 조사하고자

분석 결과

온라인 집 공개를 하는 이유와 매체에 대해 물은 질문에 대해서

응답자 A, B 모두 SNS에 내삶의 공간을 공개하는 것에 대한 저항이 적음을 알 수 있었고 내 냄새가 많이 나는 공간으로 꾸미고 싶다 라는 응답을 통해 내가 사는 공간 속에 나 자신이 반영되기를 원함을 알 수 있었습니다.

온라인 집 공개 시 개인정보 공개에 대해 우려한 적은 없냐는 질문에 대해서

A, B, 재밌는 게 더 많다는 응답을 통해 개인정보 공개에 대한 우려는 있으나 통제가 가능하다고 믿으며 얻는 것이 더 많고 중요하다고 여김을 알 수 있었습니다.

자신에게 집, 내 삶의 공간이란 어떤 의미를 갖는지에 대해서

내 삶의 공간이란 내 삶의 배경을 의미하기도 하고 패션의 일부와 자기표현의 수단으로 인식된다는 것과 유튜브 인스타그램인스타그램 등 SNS에 공유하는 것은 일종의 기록에 불과하지 않는다는 것을 알 수 있었습니다.

* 이 부분에서 추가적으로 밀레니얼 세대들의 SNS에 대한 태도를 알 수 있었습니다. 모두에게 공개된 온라인이라는 점보다는 자신의 삶의 영역 중 하나라고 느끼는 경향이 강한 것으로 생각됩니다.

결과 도출

빅데이터와 스몰데이터 분석을 통해 다음과 같은 결과를 도출했습니다.

먼저 밀레니얼 세대가 SNS를 통한 일상 공개에 익숙하다는 점과 자기표현의 욕구가 강하고 내 삶의 공간에 노출에 대한 저항이 낮다는 특징이 랜선 집들이라는 하나의 표현방식으로 나타났습니다.

이는 표현하고자 하는 욕구는 물론, SNS의 성장과 미디어를 통한 자극으로 인해 SNS 업로드로 이어져 일종의 주류문화로 형성되었을 것으로 예상됩니다.

또한, SNS 문화를 통해 랜선 집들이 문화가 주류로 자리 잡게 되자 매스미디어로 역전파 되었고 빅데이터 분석에서 보았던 랜선 집들이 전쟁- 홈스타 워즈 홈스타 워즈, 편 스토랑 등 예능 방송을 통한 연예인들의 집 공개 사례가 증가했습니다.

결과적으로 다시 외부 환경 및 자극으로 이어져 positive feedback을 형성해 지속적인 문화로 자리 잡은 것을 알 수 있었습니다.

결론적으로 관찰을 통해 알아보고자 했던 내 삶의 공간에 대한 밀레니얼 세대의 이중성은

하나. 자신의 삶의 공간을 일종의 패션, 자기 표출의 수단으로 여긴다

둘. 자신의 삶의 영역이 침해받지 않기 위해 SHOWING은, 정보는 제공하지 않는 것으로 나타난다

따라서, 기존 기성세대에게 private place로 여겨졌던 내 삶의 공간이 밀레니얼 세대에게는 보여주고 싶지만 알려주고 싶진 않은 공간,

“showing but not informing”한 의미를 가짐을 연구를 통해 알 수 있었습니다.

프로젝트를 통해서 TEXTOM, UCINET 등 새로운 프로그램을 배웠을 뿐 아니라 빅데이터와 스몰데이터 등 어떻게 데이터를 수집하고 처리하고 의미를 도출하는지 기초적인 흐름을 습득할 수 있었습니다.

뿐 아니라, 프로젝트 전 단계에 밀레니얼 세대에 대한 특성을 공부하면서 우리 세대만이 가지고 있는 특성과 타 세대와의 차이점에 대해서 고민할 수 있는 시간이었습니다.

평소 관심 있었던 주제에 대해서 연구하는 과정을 통해서, 문제를 해결하는 과정 혹은 호기심을 유의미하고 생산적으로 해결해가는 새로운 방법을 습득했다고 생각합니다.

So you have finished reading the 빅 데이터 분석 프로젝트 주제 topic article, if you find this article useful, please share it. Thank you very much. See more: 빅데이터 프로젝트 예제, 데이터 분석 주제 예시, 공공데이터 분석 주제, 빅데이터 프로젝트 아이디어, 파이썬 데이터분석 주제, 공공데이터 분석 프로젝트, 파이썬 데이터분석 프로젝트, r 데이터분석 주제

Leave a Comment