Base/Python

[Python] Numpy를 통한 난수생성, 카운팅, 통계함수 사용법

반응형

# 난수 발생 및 카운팅, 통계 함수 사용


 

- count(데이터의 개수)

- mean, average(평균)

- variance(분산)

- standard deviation(표준편차)

- max, min, median, quartile

- np.random.rand : 0부터 사이의 균일한 값을 리턴하는 분포

- np.random.randn : 정규분포

- np.random.randint : 정수의 난수를 리턴한다.

 

#np. mean() - 평균

 

#np. var() - 분산 

 

 

#np. std() - 표본 표준편차

 

 

#np. percentile(value, %) - 분산 

 

 

#np. random() - 난수 발생 

- random 서브 패키지에 난수를 발생시키는 함수 제공

- np.random.seed(0)

rand를 쓸 경우 난수를 발생시키고 seed(0)을 같이 넣어주면 난수가 고정된다.

 

#np. random.shuffle() - 데이터를 섞어준다.

데이터를 섞어준다.

 

 

#np. random.choice() - 데이터 샘플링

- choice(배열, size = 샘플링 숫자, replace = T, p = 각 데이터가 선택될 확률 )

 

 

이렇게 숫자 별 가중치를 줄 수 있다.

 

#np. random.randn() -표준 정규 분포 확률에서 실수 표본 

 

 

#np. random.randint() - 분포가 균일한 정수의 난수 값을 리턴하는 함수

- np.random.randint(low, high=None, size = None): 분포가 균일한 정수의 난수값을 리턴하는 함수이다.

 

 

 

 

 

 

#np. unique() - 유니크한 값만 추출한다.

유니크한 값만 추출한다.

 

 

#np. bincount() - 데이터에 대한 카운트를 한다.

 

반응형