어떤 생각을 가지고 프로젝트를 시작했고
어떤 방법이 프로젝트 주제에 맞겠다 판단했는지
왜 이렇게 했어?
라는 점을 계속해서 상기시키며 작성해보려 한다.
오늘은 데이콘에서 주최한
제 6회 대구 빅데이터 분석 경진대회에 대해 리뷰를 하려한다.
대략 7월말부터 2달간 진행했다.
6회에서는 분야별로 산업 에너지 등등 나눠져있었고
우리팀은 맨처음 에너지 부문에 도전했었다.
그러나 산업부문이 생각보다 인원이 미달이였는지 추가모집을 하였고 수상을 위해
산업분야에 추가로 분석계획서를 작성하여 분야를 바꿔 참가했다.

데이터를 분석한다는건 수집된 데이터를 가지고 인사이트를 도출하는 것이다.
우리는 대구 내에 이는 국가산업단지를 키워드로 산업단지 내 인프라 활성을 위해서
버스정류장/아파트/편의점의 입지를 최적화하여 인프라를 활성화 시켜보자 라는게 목적이였다.
문제 정의 : 산업단지 내 인프라 활성화는 산업 발전과 지역 경제 성장에 직결되는데 현재 산단 내 미분양 입주율이나 청년 고용률을 해석했을때 부족한 실정이였다. 따라서 우리는 산단 내 인프라 활성화를 통해 취업률 문제를 해소하고 지역 경제 발전을 도모해보자 이것이 프로젝트의 문제 정의였다.
위의 3가지를 선정한 이유는
인프라 활성화라는 명목에서 필요한 요소는 교통환경, 주거생활, 편의시설로 판단했기 때문이다.
교통환경은 인프라를 구축하는데 있어 중요한 문제 중 하나인데
근로자들이 산단으로 출퇴근하는 비율이 외부에서 들어오는 비중이 높았기 떄문에
버스 정류장 위치를 개선하여 노선을 신설하는 정책을 생각했다.
(지금 생각해보니 왜 교통환경 중에서 버스정류장, 자가용, 자전거 등에서 버스정류장을 선택하게 된 이유가 명확하지 않았던거같다.)
주거생활 역시 인프라를 구축하는데 있어서 가장 직결되는 문제 중 하나로 생각할 수 있는데
활성화에 필요하겠다 생각한 계기는 산단 내에 주거시설이 부족하여 청년들이나 근로자들이 외부에서 출퇴근한다는 뉴스 기사를 접했었다.
오피스텔이나 빌라 아파트 중 아파트를 선택한 이유는
데이터 확보를 위해 네이버 지도에서 크롤링을 진행했었는데
빌라의 경우 한정된 지역에 밀집되어있었고
오피스텔은 지도에서 찾을 수 없었다. 그 결과 아파트로 선택하게 되었다.
편의시설은 가장 생각이 많았던 요소이다.
초기의 생각은 상권 최적화였는데 상권이라는 정의부터 필요했고 카페나 음식점, 편의점 등에서 편의점을 선택한 이유는
편의점은 버스정류장이나 주거시설에 영향을 카페나 음식점에 비해 높은 영향을 받는다 생각했고
세가지의 요소가 인프라 활성화에 높은 시너지를 낸다고 판단했다.
분석 방법 : 입지 선정이라는 키워드에서 가장 많이 분석되는 기법은 MCLP 기법이였다.
한국어로는 최대커버링 모델로 제한된 시설물 수로 수요를 최대한 커버할 수 있는 위치를 선정하기 위한 모델링 방법이다.
이 분석방법을 선택하게 된 계기는 공공 자원의 한정된 예산과 효율성을 높이는데 적합하다고 판단했다.
이후 분석에 필요한 수요량을 계산하기 위해 다음과 같이 설정했다.
- 버스정류장 : 승하차 인원, 인구밀도, 주변 편의시설 데이터를 결합해 수요량(r_score)을 계산하고, 이를 기반으로 버스정류장의 입지 선정에 반영하였음.

- 아파트: 주변 지역의 주택가격을 분석하여 적정한 가격대의 주거단지를 조성할 수 있는 입지를 선정하고, 주변 공공시설(편의점, 병원 등)과의 접근성도 함께 고려하여 수요량을 반영하였음.

- 편의점 : 공시지가와 반경 내 버스정류장 개수, 인구밀도, 주거시설 접근성의 입지를 선정하여 수요량을 반영하였다.

가중치는 상관관계를 통해 설정하였고



다음과 같은 입지를 선정할 수 있었다.
아직 최종 결과는 나오지않은 상태라 올려도 괜찮을지 모르겠지만
어차피 아무도 안보니까 상관없다