전체 글 (33) 썸네일형 리스트형 [30분 SQL] 1강 데이터베이스와 DBMS 우리가 일상에서 다루는 데이터는 정말 다양합니다. 컴퓨터 안에 기록된 모든 파일, 사진, 문서, 심지어는 메모까지 전부 다 데이터입니다. 그런데 이렇게 방대한 데이터를 그냥 마구잡이로 쌓아두면, 나중에 필요한 정보를 찾기가 쉽지 않을것이다마치 책이 아무렇게나 쌓여 있는 도서관에서 원하는 책을 찾으려는 것과 같습니다.그래서 필요한 것이 바로 데이터베이스(Database)입니다. 데이터베이스는 특정 데이터를 쉽게 찾아 활용할 수 있도록 체계적으로 정리한 데이터의 집합을 말합니다. 책의 주제, 저자, 출판 연도별로 분류된 도서관을 상상하면 이해가 쉽습니다.DB와 DBMS그렇다면 데이터베이스(DB)와 DBMS(Database Management System)는 어떻게 다를까요?간단히 말해, DB는 ‘정리된 데이.. Stata를 활용한 LCL 1. Introduction“사람들은 왜 특정 교통수단을 선택할까?”“어떤 병원을 선호할까?”“새로 나온 약을 얼마나 사용할까?” 이런 질문들에 답하기 위해 경제학자들과 정책 입안자들은 조건부 로짓 모형(conditional logit model)을 많이 써왔다. 이 모형은 사람들이 어떤 ‘속성(attribute)’을 기준으로 선택을 하는지 분석해준다.하지만 문제는 있다. 사람마다 중요하게 생각하는 기준이 다 다르다는 것.그래서 등장한 게 바로 잠재 클래스 조건부 로짓 모형(Latent Class Conditional Logit, LCL)이다.이 모델은 ‘사람들이 모두 같지 않다’는 현실을 반영해서, 비슷한 선택 기준을 가진 사람들을 숨겨진 그룹(클래스)으로 나눈 다음 각각 분석하는 방식이다. 2. 잠.. 1000억부자 유병재와 무일푼 차은우로 이해하는 이산선택'실험' 사람들은 내가 가장 만족할 선택을 한다 아주 기본적인 가정이다. 정부, 병원, 제약회사도 같은 가정을 한다 “사람들은 왜 어떤 병원을 택하지?”“어떤 약을 선호하지?”“신약이 출시되면 얼마나 쓸까?” 그걸 데이터로 예측하는 게 바로 오늘 다룰 핵심 개념,바로 이산선택실험(Discrete Choice Experiment, DCE)이다. 흔히하는 밸런스 게임도 이산선택 실험의 한 예시라고 볼수 있다 속성(attribute)들을 저울질하고,그걸 바탕으로 효용(utility)을 계산해서‘나한테 더 나은 쪽’을 택하는것 밸런스 게임 그 자체이다. 물론 이걸로 DCE(이산선택실험의 준말, 앞으로 이렇게 이야기 할거다)를 정확하게 설명하기엔 무리기 있기에 Lancsar & Louviere (2008)의 논문「.. 점심메뉴선택으로 이해하는 Logit 모델 1. 로짓 모델의 유도https://nevermind22.tistory.com/39 카리나와 이재용으로 이해하는 이산 선택모형의 특성 (Properties of Discrete Choice Models)0. Intro우리 주변엔 수많은 선택이 있다.버스를 탈지 지하철을 탈지, 어떤 브랜드의 커피를 살지, 혹은 점심으로 돈까스를 먹을지 국밥을 먹을지.이런 ‘선택’들을 수학적으로 모델링하고 예측nevermind22.tistory.com 앞선 글을 통해 기본적인 이산 선택 모형을 알수 있었고 ε의 분포에 따라 그 계산 방법이 달라진다는 것 또한 배워보았다 오늘은 이야기 했듯이 그 가장 대표적인 예시인 로짓 모델을 유도해보고 이를 활용한 소비자 효용애 대해 심도있게 접근해 보자 들어가기전 기호의 의미 복습 x.. 카리나와 이재용으로 이해하는 이산 선택모형의 특성 (Properties of Discrete Choice Models) 0. Intro우리 주변엔 수많은 선택이 있다.버스를 탈지 지하철을 탈지, 어떤 브랜드의 커피를 살지, 혹은 점심으로 돈까스를 먹을지 국밥을 먹을지.이런 ‘선택’들을 수학적으로 모델링하고 예측하는 게 바로 이산 선택 모형이다. ‘선택’이 일어나는 메커니즘을 이해하고, 그걸 예측 가능한 수학적 구조로 바꾸는 과정에 대해 앞으로 배워볼것이다 -> 우리의 마음속에서 일어나는 과정을 수학적 수식으로 바꾼다는 아이디어는 꽤 놀랍다1. 선택 집합 (choice set) 이산 선택 모형의 출발점은 간단하다:"사람이 무엇을 선택할 수 있는가?"사람이든, 가구든, 회사든 어떤 결정 주체가 있을 때,그들이 선택할 수 있는 옵션들의 집합을 선택집합(choice set)이라고 부른다.예를 들어 커피를 사러 간다면 ‘아메리카노.. MLE는 신이에요 0. Intro데이터를 분석한다는 건 결국 모수(파라미터)를 추정하는 일이다.모집단의 평균, 분산, 성공확률 같은 값들은 직접 관찰할 수 없기 때문에,우리는 표본을 통해 그 값들을 '추정'해야만 한다.이런 추정을 숫자 하나로 표현하면 그걸 점추정(point estimation)이라고 불렀다https://nevermind22.tistory.com/32 그런데...그 점은 대체 어떻게, 어떤 기준으로 골라야 가장 "그럴듯"할까?이 질문에 답하는 고전적이면서도 '강력한' 방법이 바로 최대우도추정법(MLE, Maximum Likelihood Estimation)이다.1. MLE 의 아이디어 최대우도추정법의 아이디어는 단순하다.“현재 내가 관측한 데이터가, 특정 파라미터 하에서 발생했을 가능성이 가장 높은 값이 .. 회귀분석의 가정 https://nevermind22.tistory.com/36 SLR, 단순선형회귀 이해하기https://nevermind22.tistory.com/35 회귀분석 시작 전 꼭 알아야 할 개념과 흐름TV 광고를 많이 하면 정말 매출이 오를까?지금 매출 데이터를 보면, 다음 달에는 얼마나 팔릴까?이런 질문들은 모두 하나의nevermind22.tistory.com앞서 SLR, 단순선형회귀를 살펴보았다. 이제 MLR, 다중선형회귀를 배워야 하지만https://nevermind22.tistory.com/35 회귀분석 시작 전 꼭 알아야 할 개념과 흐름TV 광고를 많이 하면 정말 매출이 오를까?지금 매출 데이터를 보면, 다음 달에는 얼마나 팔릴까?이런 질문들은 모두 하나의 공통된 갈증에서 시작된다.지금의 현상을 더.. SLR, 단순선형회귀 이해하기 https://nevermind22.tistory.com/35 회귀분석 시작 전 꼭 알아야 할 개념과 흐름TV 광고를 많이 하면 정말 매출이 오를까?지금 매출 데이터를 보면, 다음 달에는 얼마나 팔릴까?이런 질문들은 모두 하나의 공통된 갈증에서 시작된다.지금의 현상을 더 잘 이해하고, 앞으로를nevermind22.tistory.com앞서 적은 글에서 모델의 종류는 크게 2가지 가 있다고 했다 단순 선형 회귀와 다중 선형 회귀 다중을 이해하기 위해선 단순의 구조를 확실히 알아야 한다. 따라서 이번 시간엔 단순 선형 회귀를 이해하기 위한 선행지식을 알고 SLR 을 이해해보는 시간을 가져보고자 한다 2. SLR(Simple Linear Regression) 의 이해 2.1 Cor(공분산)과 Cov(상관계수) .. 이전 1 2 3 4 5 다음