본문 바로가기

Python/Others

ChatGPT로 누구나 쉽게 데이터 시각화를 할 수 있다?!:Noteable Plugin

반응형

ChatGPT로 누구나 쉽게 데이터 시각화를 할 수 있다?!:Noteable Plugin

ChatGPT의 플러그인을 탐방하던 도중 재미있는 플러그인을 발견했다.
Noteable이라는 플러그인인데 설명은 이렇다.
Noteable Plugin
Python, SQL, Markdown의 Notebook 파일을 생성해 준다고 한다.
ipynb 파일을 생성해 준다는 것인데, 처음에는 단순하게 명령하면 Python 코딩을 해주는 줄 알았다.
아 물론 결국 Python 코드를 생성해 주는 것이 맞긴 하지만 기대 이상으로 어마 무시한 플러그인이다.
그럼 간단하게 알아보는 시간을 가져보자.
ChatGPT 플러그인 사용법
Noteable 가입
우선 Noteable을 가입해야한다.
필자는 ChatGPT 가입을 할 때 구글 계정을 사용했는데, Noteable도 우선 동일하게 구글 계정으로 가입했더니 바로 플러그인 사용이 가능했다.
Noteable Project 생성
가입 후에 개인 Space로 접속이 되는데, Project를 생성해서 진행해보자.
Noteable Project의 URL을 ChatGPT에게 주기
우선 필자는 TEST PROJECT를 생성하고 TEST.xlsx라는 파일을 업로드했다.
Create 옆에 Upload 버튼을 통해 파일을 업로드할 수 있다.
TEST.xlsx는 필자가 근무하고 있는 회사에서 진행한 어느 설문 조사의 응답 데이터인데 이걸로 한번 테스트해 보자.

작업을 진행할 프로젝트의 브라우저 상의 URL을 복사해서 ChatGPT에게 주면 된다.
그럼 바로 ChatGPT에게 요청해서 받아낸 결과를 확인해보자.
Question
https://app.noteable.io/p/.../TEST-PROJECT 이 프로젝트에 test.ipynb 파일을 생성하고 Hello world!를 print하는 코드를 작성해줘
Answer
이렇게 ChatGPT가 ipynb 파일을 생성해서 Python 코드를 작성해준다.
아래는 Noteable에 생성된 ipynb 파일이다.
잘 작동되는 것은 확인했고, 이미 URL을 넘긴 상태이니 한번 다른 걸 시도해 보자.
심플한 데이터로 한번 데이터 시각화 작업도 잘 해낼지 테스트해보았다.
아 영어로 하면 분명 더 잘하긴 하겠지만, 한글도 잘 이해하는지 확인해 보고자 한글로만 진행했다.
Question

1. TEST.xlsx을 불러오고

2. SQ4 변수는 성별이고, 1은 Male, 2는 Female이야.

3. SQ5 변수는 나이인데, 이걸 5세 단위로 구분된 범주형 변수를 생성하고

4. '성별 by 범주화된 나이'로 된 원형 차트를 출력해줘.

5. 그리고 '성별 by 범주화된 나이'의 크로스 테이블을 출력해 줘

Answer
Noteable에 저장되는 결과
matplotlib를 사용해서 요청한 대로 차트도 뽑아주고 크로스 테이블도 출력해 주었다.
정말 놀랍다... 결과도 정확하게 잘 해줬다.
예전에 matplotlib 공부할 때 생각하면 정말 저 명령어들을 언제 공부하고 언제 외우나... 싶었던 기억이 있는데...
이젠 ChatGPT에게 프롬프트만 잘 전달하면 된다...
심지어 생각보다 답변 속도도 빠른 편이었다.
그럼 한번 다른 것들도 시켜보자.
우선 나이 데이터의 최솟값이 15가 아닌 18이라서 이 부분을 수정해달라고 해보고 크로스 테이블도 행과 열을 서로 바꿔달라고 해보자.
Question
나이의 최소값은 15가 아닌 18이어서 15-19는 18-19로 수정해주고, 크로스 테이블은 행과 열을 바꿔줘
Answer
원형 차트의 색상도 마음에 안 드니 바꿔달라고 해보자.
Question
원형 차트의 컬러가 마음에 안 들어 초록색 컬러 팔레트 계열로 변경해 줄 수 있어?
Answer
요청한 대로 척척 다 잘 해주는 우리의 GPT...
그렇다면 마지막으로 워드 클라우드(wordcloud)도 도전해 보자.
워드 클라우드의 경우 Noteable Project에 wordcloud module이 설치되어 있어야 실행이 가능하다.
그래서 아래 이미지처럼 wordcloud를 설치하면 된다.
Question
decLang 변수가 english인 데이터 중에 Feedback 변수에서 공백인 데이터는 제외한 데이터로 워드클라우드를 생성해줘.
Answer
공백 데이터라고 하면 nan인 데이터를 제외해 줄까 싶어서 저렇게 해보았는데... 음 nan이라고 했어야 했나 싶다.
일단 출력해 준 코드를 실행하면 아래처럼 나왔다.
nan까지 문자열로 변경해서 워드 클라우드에 넣어버렸다.
아무튼! 우선 워드 클라우드를 출력하는 것 까지도 잘 해내는 것 같다.
정말 마지막으로 nan도 제외해달라고 해보자.
Question
워드 클라우드가 생성되었지만 nan이 포함되어 있어. nan이 있는 데이터를 제외하고 다시 출력해줘
Answer
깔끔하게 일 처리해 주는 우리의 GPT
예전에 내 개인 AWS에서 주피터 노트북으로 워드 클라우드를 만드는 걸 해보려 했던 적이 있었는데, 그때 무슨 문제였는진 기억나지 않지만 엄청 고생했던 기억이 있다...
심지어 회사 업무 때문이 아닌 그냥 공부하려고 했던 건데... 일을 사서 했다 아주...

아무튼 놀라운 점은 이제 ChatGPT에게 데이터를 줘서 분석도 시킬 수 있다는 것이다.
주 업무가 데이터 분석은 아니지만 데이터를 다룰 일은 좀 많아서 실제 업무에서도 활용도가 있을지 한번 연구해 봐야겠다.

참고로 Noteable은 엑셀 파일로만 할 수 있는 것이 아니다.
아래 이미지처럼 데이터 베이스를 연결시킬 수도 있다.
직접 연결해서 해볼 순 없지만 데이터를 다루는 분들에겐 정말 좋은 플러그인이라고 생각한다.
Noteable로 Python 코드를 함께 확인할 수 있으니 겸사겸사 Python 공부도 할 수 있고 좋은 것 같다.
또 어떤 플러그인이 있고 개발될지 앞으로가 너무 기대된다.
커피 한 잔으로
저를 응원해주세요!
반응형

loading