로그인 회원가입 고객센터
레포트자기소개서방송통신서식공모전취업정보
campusplus
세일즈코너배너
자료등록배너

2023년 2학기 방송통신대 베이즈데이터분석 기말과제물)밀도함수를 고려하자. 여기서 상수 이다. 다음의 질문에 답하시오. (a) 일 때, 상수 를 확률변수 의 기댓값으로 표현하시오


카테고리 : 레포트 > 자연과학계열
파일이름 :베이즈데이터분석.zip
문서분량 : 15 page 등록인 : sunnyfanta
문서뷰어 : 압축유틸프로그램 등록/수정일 : 23.11.06 / 23.11.06
구매평가 : 다운로드수 : 6
판매가격 : 20,000

미리보기

같은분야 연관자료
베이즈데이터분석 2024년 2학기 방송통신대 중간과제물)현재 대한민국에서 코로나19 바이러스 보균자는 전체 인구의 5%... 8 pages 15000
보고서설명
교재를 중심으로 다양한 문헌을 참고하여 정성을 다해 작성하였습니다.
(베이즈데이터분석.Rmd, 베이즈데이터분석.html, 베이즈데이터분석.pdf 첨부)

리포트 작성에 참고하시어 좋은 성적 받으세요.^^

행복하세요~
본문일부/목차
목차

1. (10점) 밀도함수 를 고려하자. 여기서 상수 이다. 다음의 질문에 답하시오.

(a) 일 때, 상수 를 확률변수 의 기댓값으로 표현하시오.
(b) 상수 를 (a)에서 표현한 식을 이용해서 몬테 카를로 방법으로 구하시오. 이 때, 몬테 카를로 표본의 개수는 를 이용하시오. 계산은 R을 이용하시오.
(c) (b)에서 구한 상수 값을 이용하여 밀도함수 의 그림을 R로 그리시오.

2. (20점) 다음은 1994년과 2014년 군에 입대하는 10명의 병사들의 몸무게를 잰 결과이다.
1994년: 65.9, 55.9, 43.8, 57.7, 68.8, 23.1, 85.4, 62.8, 65.2, 49.9 (kg)
2014년: 68.3, 85.7, 73.8, 83.2, 58.9, 7.27, 70.5, 58.7, 74.1, 75 (kg)

1994년 군에 입대한 병사들의 몸무게를 , 2014년 군에 입대한 병사들의 몸무게를 라 하고, 다음의 모형을 상정하자.

2014년 병사들의 몸무게의 평균과 1994년 병사들의 몸무게의 차이 에 대해 추론을 하고자 한다. 다음의 질문에 답하시오.

(a) 위 모형의 사후표본을 추출하기 위한 스탠과 R 코드를 작성하고 사후표본을 구하시오. 번인 5000개를 포함하여 총 15,000개의 사후표본을 추출하시오.
(b) 모수들의 시계열 그림, 자기상관계수 그림을 그리고 마르코프 체인이 수렴했는지 판단하시오. 수렴하지 않았다고 판단되면 수렴했다고 판단할 때까지 사후표본의 크기를 늘리시오.
(c) 의 사후표본의 히스토그램을 그리시오.
(d) 의 사후평균, 사후표준편차, 95% 신용구간을 구하시오.

3. (20점) 다음은 R의 mtcars 데이터의 일부분이다. 두변수 mpg(마일/갤론)과 hp(마력)을 각각 x1와 x2로 나타내었다.

두 변수 사이의 상관계수 에 대해 추론하고자 다음의 모형을 고려하자.

모수들의 사전분포는 다음과 같다고 하자.

다음의 질문에 답하시오.

(a) 위 모형의 사후표본을 추출하기 위한 스탠과 R 코드를 작성하고 사후표본을 구하시오. 번인 5000개를 포함하여 총 15,000개의 사후표본을 추출하시오.
(b) 모수들의 시계열 그림, 자기상관계수 그림을 그리고 마르코프 체인이 수렴했는지 판단하시오. 수렴하지 않았다고 판단하면 수렴했다고 판단할 때까지 사후표본의 크기를 늘리시오.
(c) 의 사후표본의 히스토그램을 그리시오.
(d) 의 사후평균, 사후표준편차, 95% 신용구간을 구하시오.

4. 참고문헌


본문일부

베이지안 추론의 핵심은 관측값이 주어졌을 때 모수 θ의 사후분포를 구하는 것이다. 그러나 모형이 복잡하거나 모수의 수가 많으면 θ를 수리적으로 구할 수 없다. 따라서 사후분포의 사후평균, 사후분산, 특정 사건에 대한 사후확률 등을 근사적으로 계산할 필요가 있다. 이때 사후분포의 특성을 근사적으로 구하기 위해 마르코프 체인 몬테칼로(Markov Chain Monte Carlo, MCMC) 기법이 많이 사용된다. MCMC 기법은 마르코프체인을 이용하여 사후분포로부터 표본을 생성하고 이 사후표본을 사용하여 사후추론을 수행하는 방법이다. 깁스 추출법, 메트로폴리스-헤이스팅스 알고리듬, 해밀턴 몬테 카를로 등이 대표적인 MCMC 기법이다.

단순한 모델의 경우 R의 기본적인 함수(lm, glm 등)를 사용하여 매개변수를 추정할 수 있고, 복잡한 모델의 경우에도 기존 R 패키지를 사용하면 문제를 해결할 수 있는 경우도 있다. 그러나 패키지와 함수별로 사용 방법이 달라서 이를 충분히 인지해야 하고, 패지지와 함수 중에서 적절한 모델을 찾는 노력도 중요하다. 특히 적절한 모델 지원이 되지 않는 경우에는 분석 자체를 진행할 수 없게 된다. 이처럼 R 패키지가 모델 확장성이 낮다는 단점에 대응하기 위해 등장한 것이 Stan, WinBUGS, JAGS 등의 확률적 프로그래밍 언어라고 할 수 있다.

Stan은 앤드류 겔만, 밥 카펜터, 대니얼 리 등이 2012년부터 깃허브에서 개발하고 있는 확률적 프로그래밍언어이다. WinBUGS나 JAGS처럼 사후분포에서 표본을 추출한다. R인터페이스인 rstan과 함께 python과 matlab 인터페이스도 공개되어 있다. Stan은 추정 계산 알고리즘으로 해밀토니안 몬테칼로(HMC)의 한 버전인 NUTS(No-U-Turn Sampler)를 사용한다.


참고문헌

이재용·이기재(2022), 베이즈 데이터 분석, 한국방송통신대학교출판문화원.
마쓰우라 겐타(2019), 데이터 분석을 위한 베이지안 통계 모델링 with Stan & R, 길벗.
존 크러슈케(2018), R, JAGS, Stan을 이용한 베이지안 데이터 분석 바이블 2판, 제이펍.
Stan User’s Guide(https://mc-stan.org/docs/stan-users-guide/index.html)
연관검색어
방송통신대베이즈데이터분석

구매평가

구매평가 기록이 없습니다
보상규정 및 환불정책
· 해피레포트는 다운로드 받은 파일에 문제가 있을 경우(손상된 파일/설명과 다른자료/중복자료 등) 1주일이내 환불요청 시
환불(재충전) 해드립니다.  (단, 단순 변심 및 실수로 인한 환불은 되지 않습니다.)
· 파일이 열리지 않거나 브라우저 오류로 인해 다운이 되지 않으면 고객센터로 문의바랍니다.
· 다운로드 받은 파일은 참고자료로 이용하셔야 하며,자료의 활용에 대한 모든 책임은 다운로드 받은 회원님에게 있습니다.

저작권안내

보고서 내용중의 의견 및 입장은 당사와 무관하며, 그 내용의 진위여부도 당사는 보증하지 않습니다.
보고서의 저작권 및 모든 법적 책임은 등록인에게 있으며, 무단전재 및 재배포를 금합니다.
저작권 문제 발생시 원저작권자의 입장에서 해결해드리고 있습니다. 저작권침해신고 바로가기

 

⼮üڷٷΰ ⸻ڷٷΰ thinkuniv ķ۽÷