Skip to content

Latest commit

 

History

History
206 lines (150 loc) · 12.4 KB

README.ko.md

File metadata and controls

206 lines (150 loc) · 12.4 KB

PyGWalker 0.3 is released! Check out the changelog for more details. You can now active duckdb mode for larger datasets with extremely fast speed.

PyGWalker: 시각화와 함께 탐색적 데이터 분석을 위한 Python 라이브러리

PyPI version binder PyPI downloads conda-forge

discord invitation link Twitter Follow Join Kanaries on Slack

PyGWalker는 판다스 데이터프레임 (및 폴라 데이터프레임)을 Tableau 스타일의 사용자 인터페이스로 변환하여 Jupyter Notebook 데이터 분석 및 데이터 시각화 워크플로우를 간소화할 수 있습니다.

PyGWalker (즐겁게 발음하는 "Pig Walker"와 같이 발음됩니다)는 "Python binding of Graphic Walker"의 약자로 이름이 지어졌습니다. 이는 Graphic Walker와 Jupyter Notebook (또는 다른 Jupyter 기반 노트북)를 통합하여 Tableau의 대체 오픈 소스 유형을 제공합니다. 이를 사용하면 데이터 과학자들은 간단한 드래그 앤 드롭 작업으로 데이터를 분석하고 패턴을 시각화할 수 있습니다.

Test를 위해 Google Colab, Kaggle Code 또는 Graphic Walker Online Demo를 방문하여 테스트해보세요!

R을 사용하는 것을 선호하신다면 GWalkR을 확인해보세요!

시작하기

Kaggle에서 실행 Colab에서 실행
Kaggle Code Google Colab

pygwalker 설정하기

pygwalker를 사용하기 전에 pip 또는 conda를 사용하여 패키지를 설치해야 합니다.

pip

pip install pygwalker

참고

초기 시험을 위해 pip install pygwalker --upgrade로 설치하여 최신 릴리스와 버그 수정을 최신 상태로 유지하거나 pip install pygwalker --upgrade --pre로 최신 기능과 버그 수정을 얻을 수 있습니다.

Conda-forge

conda install -c conda-forge pygwalker

또는

mamba install -c conda-forge pygwalker

더 많은 도움말을 보려면 conda-forge feedstock을 참조하세요.

Jupyter Notebook에서 pygwalker 사용하기

빠른 시작

pygwalker 및 판다스를 Jupyter Notebook에 가져와 시작하세요.

import pandas as pd
import pygwalker as pyg

기존 워크플로우를 변경하지 않고 pygwalker를 사용할 수 있습니다. 예를 들어 다음과 같이 데이터프레임을 로드하고 Graphic Walker를 호출할 수 있습니다.

df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(df)

더 나은 방법

df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(
    df,
    spec="./chart_meta_0.json",    # 이 json 파일은 차트 상태를 저장하며, 차트를 완료할 때 수동으로 저장 버튼을 클릭해야 합니다. 'autosave'는 미래에 지원될 예정입니다.
    kernel_computation=True,          # `kernel_computation=True`로 설정하면 pygwalker가 계산 엔진으로 duckdb를 사용하며, 더 큰 데이터셋(<=100GB)을 탐색할 수 있습니다.
)

오프라인 예제

온라인 예제


이제 Tableau와 유사한 사용자 인터페이스를 사용하여 변수를 드래그 앤 드롭하여 데이터를 분석하고 시각화할 수 있습니다.

Graphic Walker로 수행할 수 있는 멋진 작업:

  • 다른 차트 유형으로 마크 유형을 변경하여 다른 차트를 만들 수 있습니다. 예를 들어, 라인

차트: graphic walker line chart

  • 다른 측정값을 비교하려면 행/열에 하나 이상의 측정값을 추가하여 concat 뷰를 생성할 수 있습니다. graphic walker area chart

  • 차원의 값으로 나누어진 여러 하위 뷰를 만들려면 행 또는 열에 차원을 추가하여 패싯 뷰를 만들 수 있습니다. 규칙은 Tableau와 유사합니다. graphic walker scatter chart

  • 테이블에서 데이터 프레임을 볼 수 있으며 분석 유형 및 의미 유형을 구성할 수 있습니다. page-data-view-light

  • 데이터 탐색 결과를 로컬 파일에 저장할 수 있습니다.

자세한 지침은 Graphic Walker GitHub 페이지를 방문하세요.

테스트된 환경

  • Jupyter Notebook
  • Google Colab
  • Kaggle Code
  • Jupyter Lab (작업 중: 아직 일부 작은 CSS 문제가 있음)
  • Jupyter Lite
  • Databricks Notebook (버전 0.1.4a0부터)
  • Visual Studio Code용 Jupyter 확장 (버전 0.1.4a0부터)
  • Hex Projects (버전 0.1.4a0부터)
  • IPython 커널과 호환되는 대부분의 웹 응용 프로그램 (버전 0.1.4a0부터)
  • Streamlit (버전 0.1.4.9부터), pyg.walk(df, env='Streamlit')을 사용하여 활성화됨
  • DataCamp Workspace (버전 0.1.4a0부터)
  • ...더 많은 환경에 대한 이슈를 제기하십시오.

구성 및 개인 정보 보호 정책(pygwalker >= 0.3.10)

$ pygwalker config --help

usage: pygwalker config [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list]

Modify configuration file. (default: /Users/douding/Library/Application Support/pygwalker/config.json) 
Available configurations:

- privacy  ['offline', 'update-only', 'events'] (default: events).
    "offline": fully offline, no data is send or api is requested
    "update-only": only check whether this is a new version of pygwalker to update
    "events": share which events about which feature is used in pygwalker, it only contains events data about which feature you arrive for product optimization. No DATA YOU ANALYSIS IS SEND.
    
- kanaries_token  ['your kanaries token'] (default: empty string).
    your kanaries token, you can get it from https://kanaries.net.
    refer: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries.
    by kanaries token, you can use kanaries service in pygwalker, such as share chart, share config.
    

options:
  -h, --help            show this help message and exit
  --set [key=value ...]
                        Set configuration. e.g. "pygwalker config --set privacy=update-only"
  --reset [key ...]     Reset user configuration and use default values instead. e.g. "pygwalker config --reset privacy"
  --reset-all           Reset all user configuration and use default values instead. e.g. "pygwalker config --reset-all"
  --list                List current used configuration.

자세한 내용은 참조하세요: How to set your privacy configuration?

라이선스

Apache License 2.0

자원

RATH GitHub를 확인하세요!

Reddit HackerNews Twitter Facebook LinkedIn