EMERGENCY!

빨간 버튼 꾹. 반드시 미션은 전부 마쳐야한다. 지난 기수에 3주차 미션 슬슬 안되더니 4주차 미션이 전부 무너졌다..

hadoop user는 root로 하면 안된다! hadoop이라는 사용자를 만들던 해서 바꿔야 함.

우리의 팀플 주제가 구체적이지 않다? 사례를 보자.

데이터 가치: 구체적이어야 높다. 강남역 8번출구 10000개 > 전국 10000개

사용자 이동하는 데이터인 풋데이터를 어디에 쓸건데? 변화하는 상권에는 필요하지만 안정된 상권은 이미 증명이 된건데 필요가 없지.

기업 정보 제공 사이트? 세상의 모든 정보를 모아서 새로운 정보를 조합해서 팔자! 하지만 웹 크롤링을 한다면?

토스의 고객은 ‘급여소득이 없는, 소액 송금을 자주 하는 대학생’ 이라는 context → 직장인이 되어서도 쓰던게 편하니 원래 쓰던 은행사로 전환을 할 이유가 없다.

그 다음, 버튼 하나로 신용정보를 확인할 수 있는 서비스를 만들었다.

1명의 유저를 데리고 오는 비용: Customer Acquisition Cost → Lift time Value

18개월 기준으로 CAC 5천원, 18개월동안 서비스 유지비 Operation Cost 2천원, LTV가 5천원이라면 유저 1명당 2천원이 손해인 구조.

목적이 실시간 모니터링이냐, 월별 통계 조사냐, 사후 조사냐에 따라 데이터 수집 주기가 전부 다르니, 잘 고민하고 설정하자.

좋은 비즈니스 문제 vs 좋은 데이터 엔지니어링 문제?

빅 데이터를 이용해야 하고, 데이터로부터 인사이트를 받아야 한다.

빅 데이터 프로세싱으로 귀결이 되어야 한다.