분류 전체보기 241

수학스터디[확률통계]확률변수

Gambler's Ruin(도박꾼의 파산): A와 B 두 명의 도박꾼이 매 라운드 $1씩 걸고 도박을 한다. 이긴 사람은 상대방의 $1을 가져가고, 둘 중 한 명이 가지고 온 돈이 바닥날 때까지 이 과정을 반복한다 그렇다면 , 이 게임은 영원히 진행될까 ? 아닐까? 문제풀이 전략: 첫 단계에서 조건을 세운다 정의: p의 확률로 A가 1달러를 더 얻고, q의 확률로 1달러를 잃는다. 0, N은 흡수상태(absorbing state)라 하여, 게임 종료를 나타낸다. P(i) : A가 i달러로 게임을 이길 확률 이 문제의 경우에는 특정 수를 정하고 생각하기 보다는 일반적인 경우를 찾는것이 더 쉽다. P(i) = p * p(i+1) + q * P(i-1) guessing을 통한 풀이 더보기 Pi=xi라 추측을 ..

ML/확률론 2020.08.07

수학스터디[확률통계] [독립][조건부확률][전확률][몬티홀][심슨의 역설]

독립 정의: P(A∩B)=P(A)P(B)이 성립할 때, 사건 A와 B는 독립이다. ※ disjoint(서로소) != independence(독립) A와 B가 서로소인 경우는 A가 발생하면 B는 발생할 수 없다. 반면에 A와 B가 독립이라면 A의 발생은 B 발생에 어떠한 영향도 끼치지 않는다. 조건부 확률 새로운 정보를 얻었을 때, 기존의 ‘믿음/불확실성(uncertainty)’을 어떻게 업데이트할 지 대한 문제다. 직관적인 이해를 돕기 위해 '조약돌 세계'를 생각해보자. 독립과 조건부 확률을 통해 3가지 공리를 끌어낼 수 있다. 1. 조건부 확률의 정의에 P(B) 혹은 P(A)를 곱해주면 된다. 2. Chain Rule을 적용하면 아래처럼 증명할 수 있다. 3. 1번의 P(A∩B) = P(A|B)P(B)..

ML/확률론 2020.08.01

Git 브랜치 기초

모든 버전 관리 시스템은 브랜치를 지원한다. 개발을 하다 보면 코드를 여러 개로 복사해야 하는 일이 자주 생긴다. 코드를 통째로 복사하고 나서 원래 코드와는 상관없이 독립적으로 개발을 진행할 수 있는데, 이렇게 독립적으로 개발하는 것이 브랜치다. Git은 브랜치를 만들어 작업하고 나중에 Merge 하는 방법을 권장한다. 브랜치란 무엇인가 Git은 데이터를 Change Set이나 변경사항(Diff)으로 기록하지 않고 일련의 스냅샷으로 기록한다는 것을 알것이다. 커밋하면 Git은 현 Staging Area에 있는 데이터의 스냅샷에 대한 포인터, 저자나 커밋 메시지 같은 메타데이터, 이전 커밋에 대한 포인터 등을 포함하는 커밋 개체(커밋 Object)를 저장한다. 이전 커밋 포인트가 있어서 현재 커밋이 무엇을..

ML/Git 2020.07.27

Git의 기초 (2) 리모트 저장소

리모트 저장소 리모트 저장소를 관리할 줄 알아야 다른 사람과 함께 일할 수 있다. 리모트 저장소는 인터넷이나 네트워크 어딘가에 있는 저장소를 말한다. 저장소는 여러 개가 있을 수 있는데 어떤 저장소는 읽고 쓰기 모두 할 수 있고 어떤 저장소는 읽기만 가능할 수 있다. 협업한다는 것은 리모트 저장소를 관리하면서 데이터를 거기에 Push/Pull 하는 것이다. 리모트 저장소를 관리한다는 것은 저장소를 추가, 삭제하는 것뿐만 아니라 브랜치를 관리하고 추적할지 말지등을 관리하는 것을 말한다. 리모트 저장소 확인하기 git remote 명령으로 현재 프로젝트에 등록된 리모트 저장소를 확인할 수 있다. 이 명령은 리모트 저장소의 단축 이름을 보여준다. 저장소를 Clone하면 origin이라는 리모트 저장소가 자동으..

ML/Git 2020.07.27

Git의 기초

Git의 기초 저장소를 만들고 설정하는 방법 파일을 추적하거나(Track) 추적을 그만두는 방법 변경 내용을 Stage 하고 커밋하는 방법 파일이나 파일 패턴을 무시하도록 Git을 설정하는 방법 실수를 쉽고 빠르게 만회하는 방법 프로젝트 히스토리를 조회하고 커밋을 비교하는 방법 리모트 저장소에 Push하고 Pull 하는 방법을 살펴보자 Git 저장소 만들기 Git 저장소를 만드는 방법은 두 가지다. 기존 프로젝트나 디렉토리를 Git 저장소로 만드는 방법 다른 서버에 있는 저장소를 Clone 하는 방법 기존 디렉토리를 Git 저장소로 만들기 기존 프로젝트를 Git으로 관리하고 싶을 때, 프로젝트의 디렉토리로 이동한다. 운영체제에 따라서 명령코드가 다르다. Linux: $ cd /home/user/your_..

ML/Git 2020.07.26

Git 시작하기

버전 관리란? 버전 관리는 파일 변화를 시간에 따라 기록했다가 나중에 특정 시점의 버전을 다시 꺼내올 수 있는 시스템이다. VCS(Version Control System)을 사용하면 각 파일을 이전 상태로 되돌리거나 프로젝트를 통째로 이전 상태로 되돌릴 수 있고,시간에 따라 수정내용을 비교해 볼 수 있고,누가 문제를 일을켰는지도 추적할 수 있고,누가 언제 만들어낸 이슈인지도 알 수 있다.VCS를 사용하면 파일을 잃어버리거나 잘못 고쳤을 때도 쉽게 복구할 수 있다. 로컬 버전 관리 가장 많이 쓰는 VCS 도구 중에 RCS(Revision Control Systerm) 기본적으로 Patch Set(파일에서 변경되는 부분)을 관리한다. 이 Patch Set은 특별한 형식의 파일로 저장한다. 그리고 일련의 P..

ML/Git 2020.07.26

수학 스터디 [확률과 통계] [확률의 naive definition][표본추출][birthday problem] [포함배제 원리]

수학팀:김정민 박형준 최웅준 구예인 확률의 naïve 한 정의 각각이 일어날 가능성이 모두 같다고 한다면 특정 사건에 대한 확률을 구할 때 단순히 몇 번 발생하는지 세서 전체로 나누면 되는것 ==>naive definition 만족 시켜야할 조건 - 모든 사건이 발생할 확률은 같다 - 유한한 표본공간 셈 원리(Counting Principle) 곱의 법칙: 발생 가능한 경우의 수가 n1,n2,...,nr 가지인 1,2,...r 번의 시행에서 발생 가능한 모든 경우의 수는 n1 x n2 x...x nr 이다. 이항계수(Binomial Coefficient): Non-naïve definition of probability Birthday Problem k가 몇 명 이상이어야 같은 생일을 가진 사람들이 있을..

ML/확률론 2020.07.24

수학 스터디 활동 계획

확률론은 기본적으로 수학, 사회학, 경제학, 공학 모두에서 사용하는 수학의 한 분야입니다. 때문에 자연계는 물론 인문사회계의 학생에게도 가장 중요한 수학과목의 하나로 여겨집니다. 우리 사회의 여러 문제를 수학적으로 모델링해서 해결 할 수 있습니다. 특히 많은 기계학습 알고리즘, 딥러닝을 이해하고 사용하기 위해서 '확률'에 대한 이해는 필수적입니다. 기계가 결정하는 모든 것은 확률에 기반하고 최적화 알고리즘와 소프트맥스 등 비롯한 많은 부분에서 확률론이 사용됩니다. 하버드 대학에서 제공하는 본 강좌는 조건부 확률, 공분산과 상관계수, 마르코프 체인 등 확률 기초를 배울 수 있습니다. 선형대수는 기본적으로 과학과 공학 모두에서 사용하는 수학의 한 분야입니다. 선형대수학 없이 머신러닝을 시작할 수 있지만, 튼..

ML/확률론 2020.07.17