반응형
# 난수 발생 및 카운팅, 통계 함수 사용
- count(데이터의 개수)
- mean, average(평균)
- variance(분산)
- standard deviation(표준편차)
- max, min, median, quartile
- np.random.rand : 0부터 사이의 균일한 값을 리턴하는 분포
- np.random.randn : 정규분포
- np.random.randint : 정수의 난수를 리턴한다.
#np. mean() - 평균
#np. var() - 분산
#np. std() - 표본 표준편차
#np. percentile(value, %) - 분산
#np. random() - 난수 발생
- random 서브 패키지에 난수를 발생시키는 함수 제공
- np.random.seed(0)
rand를 쓸 경우 난수를 발생시키고 seed(0)을 같이 넣어주면 난수가 고정된다.
#np. random.shuffle() - 데이터를 섞어준다.
데이터를 섞어준다.
#np. random.choice() - 데이터 샘플링
- choice(배열, size = 샘플링 숫자, replace = T, p = 각 데이터가 선택될 확률 )
이렇게 숫자 별 가중치를 줄 수 있다.
#np. random.randn() -표준 정규 분포 확률에서 실수 표본
#np. random.randint() - 분포가 균일한 정수의 난수 값을 리턴하는 함수
- np.random.randint(low, high=None, size = None): 분포가 균일한 정수의 난수값을 리턴하는 함수이다.
#np. unique() - 유니크한 값만 추출한다.
유니크한 값만 추출한다.
#np. bincount() - 데이터에 대한 카운트를 한다.
반응형
'Base > Python' 카테고리의 다른 글
[Python] Pandas 사용법 - series 에 대한 추가 , 수정, 삭제, 연산, 결측치 (0) | 2020.10.14 |
---|---|
[Python] Pandas의 이론과 기초적인 사용법 (0) | 2020.10.14 |
[Python] Numpy를 통한 정렬하기 (0) | 2020.10.13 |
[Python] Numpy 를 통한 최대값, 최소값 , 통계함수 사용하기 (0) | 2020.10.13 |
[Python] Numpy를 통한 배열 연산 (0) | 2020.10.12 |