austin-distel-rxpThOwuVgE-unsplash.jpg

AI연구회

경남ICT협회 AI 연구 모임

Chat GPT Code Interpreter 사용 법과 사용 예

GPT-4 Python 코드 해석기를 사용한 신속한 매핑: 초보자 가이드

GPT-4를 사용하여 인구 통계 지도를 만드는 방법

존 로웬 박사

데이터 분석에서 가장 어려운 일 중 하나는 원시 숫자를 의미 있는 스토리로 변환하는 것입니다. 다행히도 이 작업 흐름에 빠르고 효율적인 지원을 제공할 수 있는 몇 가지 훌륭한 도구가 있습니다.

"블록의 새로운 어린이" 중 하나는 GPT-4 코드 해석기 입니다.

이 문서에서는 코드 해석기를 활용하여 인구통계 지도를 만들고 표시하는 데 필요한 모든 단계를 안내합니다. 우리의 도구? 인구통계 데이터가 포함된 CSV 파일과 GPT-4 코드 해석기와 일치하는 지리적 경계가 포함된 GeoJSON 파일.

그것에 갇히자!

코드 해석기 활성화

가장 먼저 해야 할 일은 설정에서 코드 해석기를 활성화하는 것입니다.

ChatGPT 프롬프트 창의 왼쪽 하단에 있는 프로필 사진과 이름 옆에 점 3개 아이콘(…)이 있습니다. 클릭하세요.

먼저 "…" 아이콘을 클릭하여 설정을 표시한 다음 설정 및 베타를 표시합니다.

다음으로 “설정 및 베타”를 클릭하세요. 다음과 유사한 창이 표시됩니다.

GPT-4로 코드 해석기 활성화

"베타 기능"을 클릭한 다음 "코드 해석기"를 클릭하고 ON으로 전환했는지 확인하세요. 기본적으로는 꺼져 있습니다.

그런 다음 "새 채팅"을 클릭할 때 먼저 "GPT-4"를 선택했는지 확인하세요.

코드 해석기 선택(베타)

그런 다음 "코드 해석기(베타)"를 선택했는지 확인하세요.

이제 갈 준비가 되었습니다!

채팅 창에 새로운 것이 보일 것입니다. 파일을 추가할 수 있는 작은 '+' 아이콘이 있습니다.

어떤 파일을 로드하나요? 다음에는 데이터 세트를 살펴보겠습니다.

데이터 세트

이 연습에서는 UN 경제사회부 웹사이트( 여기) 에서 새로 업데이트된 데이터세트를 사용합니다 .

“확률적 예측”을 클릭한 다음 “인구 백분율”을 클릭하세요. 파일은 여러 워크시트가 포함된 xlsx 파일로 다운로드됩니다. “Median” 워크시트를 선택하고 불필요한 설명의 처음 16개 행을 삭제한 다음 xlsx 파일을 CSV 파일로 변환했습니다.

XLSX 파일 - "중앙값" 워크시트를 선택하고 처음 16개 행을 삭제한 다음 CSV 파일로 내보냅니다.

이름을 "pp_median_by_age.csv"로 지정했습니다.

이 특정 데이터세트에는 지금(2023년)부터 세기말(2100년)까지 모든 국가의 인구 증가 예측이 포함되어 있습니다.

모든 데이터 분석 작업의 첫 번째 단계는 데이터를 로드하고 처리하는 것입니다. 여기서는 코드 해석기에 이 작업을 수행하도록 요청하는 방법을 보여 드리겠습니다.

코드 해석기를 사용하여 '+' 아이콘을 클릭하고 사용할 파일을 로드합니다.

데이터세트가 로드되어 Code Interpreter에 들어갈 준비가 되었습니다.

그런 다음 코드 해석기에 데이터를 준비하라는 메시지를 표시할 수 있습니다 .

geoJSON 파일

다음으로 GeoJSON 파일을 업로드해야 합니다( 여기 에서 다운로드 ).

이 파일이 왜 필요한가요? 이 파일에는 전 세계 모든 국가의 경계가 포함되어 있습니다.

그리고 이 특정 geoJGON 파일(countries.geoJSON)에는 3자리 ISO 코드가 포함되어 있습니다. CSV 파일에는 3자리 ISO 코드가 포함된 필드도 있습니다. 따라서 이 두 파일을 함께 사용하면 Python은 각 데이터 포인트를 지도에 표시되는 국가와 연결할 수 있습니다.

그리고 ChatGPT 창에 이 파일을 업로드하고 코드 해석기에 이 파일을 사용하라는 메시지를 표시할 수 있습니다.

모든 것을 종합하여 지도 만들기

이제 모든 조각이 있으므로 코드 해석기에 모든 조각을 합치도록 요청할 수 있습니다.

먼저 CSV 파일을 Code Interpreter에 업로드하고 이 파일로 무엇을 하려는지 알려드리겠습니다.

코드 해석기에 지도 생성을 위한 설정을 요청 - 두 번째 파일을 제공할 것임을 알립니다.

다음 프롬프트에서 두 번째 파일을 제공할 것임을 코드 해석기에게 알려서 파일만 업로드할 수 있는 문제를 해결했습니다. 그리고 응답하여 파일이 올 것이라는 것을 이해하고 있음을 나에게 알려줍니다.

그래서 파일을 제공하면 코드 해석기가 "해당 작업"을 시작합니다.

두 번째 파일 업로드(countries.geojson)

그리고 이로부터 Code Interpreter는 바로 지도 생성에 들어갑니다.

결과 지도는 다음과 같습니다.

코드 해석기의 최종 결과 — OpenAI 채팅 창에 바로 표시됩니다.

"65세 이상" 인구 비율이 크게 증가한 국가에는 더 어두운 음영이 지정되고, 증가(또는 감소)가 적게 증가한 국가에는 더 밝은 음영이 지정됩니다.

우리는 전 세계적으로 일어날 것으로 예상되는 인구통계학적 변화를 즉시 목격합니다. 심각한 인구 고령화를 겪을 것으로 예상되는 국가가 두드러져 패턴과 추세를 빠르게 파악할 수 있습니다.

생성된 Python 코드:

# 2025년과 2050년 및 "65+" 연령 그룹에 대한 CSV 데이터를 필터링합니다.
 data_2025 = country_data[(country_data[ 'Year' ] == 2025 )][[ 'Region, subregion, country or Area *' , '65 +' ]] 
data_2050 = country_data[(country_data[ '연도' ] == 2050 )][[ '지역, 하위 지역, 국가 또는 지역 *' , '65+' ]] 

# 두 데이터프레임 모두에 대해 위치에 대한 인덱스 설정
 data_2025.set_index ( "지역, 소지역, 국가 또는 지역 *" , inplace= True ) 
data_2050.set_index( "지역, 소지역, 국가 또는 지역 *" ,제자리= 참) 

# "65+" 인구의 백분율 변화를 계산합니다
 data_2025[ "65+change" ] = data_2050[ '65+' ] - data_2025[ '65+' ] 

# GeoDataFrame을 변경 데이터와
 병합 merged = geo_data .set_index( 'ADMIN' ).join(data_2025[ "65+change" ]) 

# '65+change'가 NaN인 행을 삭제합니다.
 merged = merged.dropna(subset=[ '65+change' ]) 

# 그래프를 그립니다. map
 fig, ax = plt.subplots( 1 , 1 , figsize=( 15 , 10 )) 이 
병합되었습니다.줄거리(열= '65+ 변화' , ax=ax, 범례=True , cmap= 'coolwarm' , legend_kwds={ 'label' : "2025년부터 2050년까지 65세 이상 인구 비율 변화" , 'orientation' : "horizontal" }) 
plt.title( '65세 이상 인구 비율 변화 (2025 - 2050)' , 글꼴 크기= 15 ) 
plt.show()

코드를 좀 더 자세히 살펴보면, 각각 2025년과 2050년으로 필터링하여 생성됩니다 data_2025. 두 데이터 프레임은 쉽게 병합할 수 있도록 국가 이름별로 색인화됩니다.data_2050country_data

2025년부터 2050년 사이의 "65+" 인구 비율의 변화가 계산되어 의 "65+ 변화" 열에 추가됩니다 data_2025.

geo_data그런 다음 이 데이터 프레임 은 국가 이름을 결합 인덱스로 사용하여 (국가의 지리적 경계가 있는 GeoJSON 파일)과 병합되어 merged. "65+ 변경" 데이터가 없는 항목은 모두 merged제거됩니다.

merged마지막으로 '65+ 변화'를 반영한 ​​각 국가의 색상을 사용하여 등치도가 생성됩니다 .

그리고 그게 전부입니다!

요약하자면…

이 사례 연구에서는 CSV 파일과 GeoJSON 파일에서 인구통계 지도를 만드는 과정을 살펴보았습니다.

작업의 복잡성에도 불구하고 올바른 파일, 명확한 프롬프트 및 모듈식 접근 방식을 통해 원시 데이터를 매우 멋진 지도로 변환할 수 있었습니다. 그리고 이것은 단지 기본 지도일 뿐입니다. 확실히 우리는 색상, 모양, 느낌을 변경하기 위해 추가 프롬프트를 사용하여 "흥미롭게" 할 수 있습니다.

이 프로세스는 데이터 시각화의 힘과 Code Interpreter와 같은 AI 보조자가 프로세스를 단순화할 수 있는 방법을 강조합니다.

한 번 시도해 보세요. 특히 어떤 종류의 이야기가 나올 수 있는지 확인하기 위해 테스트용 데이터 세트를 사용하는 경우 더욱 그렇습니다.

 

(상기 내용은 존 로웬 박사의 블로그에서 가져와 번역한 내용입니다)

기업 홍보를 위한 확실한 방법
협회 홈페이지에 회사정보를 보강해 보세요.