돌공공돌

20-04-19 (데이터 과학) 본문

2022-1

20-04-19 (데이터 과학)

오로시 2022. 4. 20. 00:15

aggregate ( 데이터 프레임 받아서, 메트릭스로 출력)

aggregate(var1~var2 , data , FUN = )

"data" dataframe의 var1 vector 를 FUN을 이용해서 계산하여 , var2 로 그룹화 한다.

응용)

aggregate(c(var1,var2) ~ var3 , data , FUN= )

aggregate(var1 , var2+var3 , data , FUN = )

 

order / sort  (벡터로 받아  벡터로 츨력)

order ( x , decreasing = T/F)

ascending is default.

sorting 하여, 그 값들의 indext 값 출력

 

sort( x , decreasing = T/F)

sorting 한 값 출력

 

Random Sampling

set.seed(x)

sample(x, number , replace = T/F)

replace = T --> 복원추출 F --> 비복원 추출

 

DataFrame Manipulation (데이터프레임 조작)

split

subset

정리는 나중에 더 하는 걸로 하자

한 번 다 쭉 훑어봤다. 많이 배웠다. 안다고 착각하지 말자. 

정말 안보고 다 할수 있는 수준까지 올려야 한다.

나에게는 선형대수학이 더 급하다.

 

'2022-1' 카테고리의 다른 글

22-04-20  (0) 2022.04.20
22-04-20(선형대수학)  (0) 2022.04.20
22-04-18  (0) 2022.04.18
22-04-18 (통계학)  (0) 2022.04.18
22-04-18 ( 데이터구조)  (0) 2022.04.18
Comments