Python(2)
-
[BigData] Pandas 기본
Series Pandas에서 제공하는 1차원 배열과 같은 자료구조이다. 파이썬의 딕셔너리나 리스트로 만들 수 있다. import pandas as pd d = {'a': 1, 'b': 2, 'c': 3, 'd': 4} s = pd.Series(data=d, index=['a', 'b', 'c']) print(s) # a 1 # b 2 # c 3 # dtype: int64 # 데이터를 딕셔너리로 쓰면서 인덱스가 맞지 않으면 NaN으로 입력된다. d = {'a': 1, 'b': 2, 'c': 3, 'd': 4} s = pd.Series(data=d, index=['x', 'y', 'z']) print(s) # x NaN # y NaN # z NaN # dtype: float64 # 인덱스를 따로 지정하지 않..
2023.03.14 -
[BigData] Numpy 기본
Numpy 행렬이나 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원하는 파이썬 라이브러리이다. 파이썬 리스트 vs 넘파이 어레이 1. 선언 조건 파이썬 리스트 모든 타입을 가질 수 있다. 2차원 이상 배열 구조에서 내부 배열의 원소 개수가 달라도 된다. 넘파이 어레이 숫자형 또는 문자열만 가질 수 있으며 숫자형과 문자열이 섞이면 모두 문자열로 전환 2차원 이상 배열 구조에서 내부 배열의 원소 개수가 같아야 한다. # 파이썬 리스트 a = [1, 2, 3, 'four', 'five'] # 1, 2, 3은 number, four five는 string b = [[1], [2, 3], ['four', 'five']] # 파이썬 리스트는 원소 개수가 달라도 됨 # 넘파이 어레이 import numpy as n..
2023.03.13