전체 글
-
[NumPy_4] 기존 데이터에서 배열 만들기 / 배열 연산NAN/Python 2021. 6. 30. 22:37
배열 쌓기, 배열 쪼개기 기본 형태 np.vstack(tuple) : 두 배열을 세로로 쌓아 하나의 배열을 만든다. np.hstack(tuple) : 두 배열을 가로로 쌓아 하나의 배열을 만든다. np.vstack(arr1, arr2)의 형태로 array가 튜플 타입으로 들어간다. 첫 번째 축을 제외하고 모두 같은 모양이어야 하고, 1차원 배열은 길이가 같아야 한다. arr1 = np.array([[1, 1],[2, 2]]) arr2 = np.array([[3, 3],[4, 4]]) arr_vstack = np.vstack((arr1, arr2)) print(arr_vstack) [[1 1] [2 2] [3 3] [4 4]] arr_hstack = np.hstack((arr1, arr2)) print(a..
-
[NumPy_3] 배열의 차원 확장NAN/Python 2021. 6. 30. 20:38
배열의 차원 확장 numpy 이를 통해 배열을 다루다 보면 종종 1차원 배열을 다차원으로 확장해야 하는 경우가 생기는데 이때 사용할 수 있는 함수를 알아보자 import numpy as np arr = np.array([1, 2, 3, 4, 5, 6]) print(arr.shape) print(arr) (6,) [1 2 3 4 5 6] 1부터 6까지의 요소를 갖는 array 이를 만들고 모양을 확인하니 (6, ) 형태가 출력되었는데, 이를 다차원 배열로 바꾸기 위해서는 numpy.newaxis 라는 기능이 필요하다. newaxis는 지정된 위치에서 축을 하나 추가함으로써 차원을 확장하는 역할을 한다. arr2 = arr[np.newaxis, :] print(arr2.shape) print(arr2) (1..
-
[ NumPy_2] 차원 크기 모양 / 다차원 인덱싱 슬라이싱NAN/Python 2021. 6. 29. 21:33
배열의 차원, 크기, 모양 앞서 소개했듯이 NumPy 이는 차원을 다루는 라이브러리이다. 차원이라는 말이 조금 낯설게 느껴지기도 하고 n차원이라는 표현에 머리가 어지러워지지만 간단하게 생각하면, 1차원은 직선 그래프, 2차원은 x와 y로 구성된 평면 그래프이고 3차원은 그 평면 그래프에 선을 하나 더 데어 박스 형태를 갖게끔 한다고 이미지화 시키면 보다 이해가 편하다. import numpy as np arr = np.array([[[0,1,2,3,4], [5,6,7,8,9]], [[10,11,12,13,14], [15,16,17,18,19]], [[20,21,22,23,24], [25,26,27,28,29]], [[30,31,32,33,34], [35,36,37,38,39]]]) print(arr) [..
-
[NumPy_1] 소개 / 배열 만들기 / 원소 다루기NAN/Python 2021. 6. 29. 14:00
소개 이제까지 파이썬 기초 문법에 대해 공부했다면, 데이터를 효과적으로 다룰 수 있는 라이브러리에 대해 공부해보자 파이썬을 효율적인 언어로 부상시킨 요인은 객체 지향적인 문법으로 인한 낮은 진입 장벽과 데이터를 효율적으로 사용할 수 있게 만든 라이브러리의 역할이 컸는데 그 라이브러리가 'NumPy'이다. 파이썬은 c언어에 비해 느린 속도로 인해 사용이 많지 않았으나 NumPy가 c언어를 기반으로 만들어져 아쉬웠던 속도가 빨라져 자연스럽게 많은 사용자의 선호를 얻게 되었다. NumPy 이는 ndarray 객체를 통해 1차원이 아닌 n차열 배열이 사용 가능한데, 언뜻 보기에 파이썬의 list와 비슷하지만, 동적 할당인 list와 다르게 정적 할당이라는 점에서 가장 큰 차이를 갖는다. (튜플과 비슷한 성질을 ..
-
-
빅 데이터 커리큘럼NAN/빅 데이터 분석 2021. 6. 28. 12:29
빅데이터 분석 - 커리큘럼 1). SQL과 데이터 베이스. SQLite, SQLiteStudio, Query, SQL 함수, 데이터 베이스와 테이블, Python과의 연동. 2). 확률. 이산확률, 연속확률, 결합확률, 상관계수, 베이즈 통계법. 확률변수와 확률분포, 확률적 기댓값. 3). 확률 모델링. 나이브 베이즈, 랭귀지 모델, 은닉 마코프 모델. 4). 시각화를 통한 분석. 시각화의 원리, Seaborn 라이브러리. 5). 통계분석. 기술통계와 추론통계, 중심극한정리, 통계적 추정의 원리. 가설검정과 활용, 수치형 자료와 명목형 자료의 가설검정, ANOVA 분석. 6). 통계분석 활용. 선형회귀의 원리, 진단, 평가 및 최적화. 로지스틱회귀의 원리, 진단, 평가 및 최적화. 7). 실전문제 풀이 ..
-
Anaconda3 설치NAN/Anaconda3 setup 2021. 6. 25. 14:17
쿠다 파일 c드라이브 파일 nvdia gpu computing toolkit cuda c11.3으로 파일 복사 아나콘다 아나콘다 환경 셋팅 아나콘타 어플리케이션 바꾸려면 환경 설정을 통해 바꾼다 기본 (base)로 설정되어있는걸 개인 설정에 맞게 바꿔 작업한다. md project_dl cd project_dl conda create -n tfgpu_py37 python=3.7 active tfgpu_py37 conda create -n tfgpu_py37 python=3.7 conda install -c nvidia cudnn conda install -n tfgpu_py37 ipython notebook jupyter conda install -n tfgpu_py37 numpy scipy matplo..
-
[Python] 모듈NAN/Python 2021. 6. 24. 19:25
'모듈'이란 변수, 함수, 클래스 등등 특정 성질을 가진 요소의 모음이다. math 모듈에는 수학과 관련된 여러 변수와 함수들이 저장되어있고, 프로그래밍 언어에는 이런 기능들을 필요할 때 언제든 가져와 사용할 수 있다. 모듈 전체를 가져올 수도 있고, 사용하고자 하는 식만을 불러오기도 한다. import '모듈명' 모듈을 가져오는 첫번째 방법으로 import가 있는데, import math의 형태로 불러오며 이후부터는 math 모듈을 사용할 수 있다. form '모듈명' import '사용하고자 하는 식' 두 번째 방법은 사용하고자 하는 식만을 불러와 사용한다. import math math.sin(1) 0.84147... from math import sin sin(1) 0.84147... math ..