빅데이터는 이제 우리 생활에서 떼려야 뗄 수 없는 것이 되어버렸습니다. 일상생활 속의 문제를 해결하거나 불편한 점을 개선해주는 역할을 하면서, 빅데이터는 점점 더 우리의 일상과 긴밀한 관계를 유지해 가고 있습니다. 하지만 빅데이터가 모든 문제를 해결해 줄 수는 없습니다. 우리의 생활에서 사소하게 일어나는 문제에 대해서는 특히 더 그렇습니다.

그래서 주변 생활 속에서 발생하고 쌓이는 데이터, 즉 ‘생활 데이터’가 필요하게 되는 것입니다. 생활 데이터는 데이터가 주는 본질적인 의미보다 기술과 장비에 치중하게 되는 요즘의 ‘빅데이터 세태’에 반하여 나온 개념입니다. 우리 주변에서 발견할 수 있는 아주 작은 데이터라도 그것을 활용하고 이해하는 과정이 중요하다는 것을 강조하는 것이지요. 관련 전문가가 아니더라도, 또는 많은 양의 정보를 수집하는데 시간과 비용을 들이지 않아도, 내 주변에서 항상 존재하고 있는 생활 데이터를 통해서 우리는 주도적으로 문제 상황에 맞설 수 있습니다.


생활 데이터가 된 당뇨병력 기록 차트, 사진 출처



생활 데이터의 활용 사례


1. 통계로 튀기는 치킨

  2015년 통계청에서 주최한 통계 활용 수기 공모에서 최우수상을 차지한 ‘통계로 튀기는 치킨’은 치킨집을 하는 아버지를 돕기 위해 매일 매일의 닭고기 수요를 예측하는 모델을 만들어 활용했던 대학생 허성일 님의 이야기입니다.





약 6개월의 관찰 끝에 계절, 날씨, 이벤트 등의 주요 변수를 얻고, 2013년 8월 판매 예상량과 실제 판매량을 데이터화 시킨 ‘가중치 닭고기 소모량 통계’를 만들었습니다. 또한, 효율적 판매를 위해 고객들의 치킨 구매 패턴을 분석하였습니다. 기호에 따라 일정한 구매 패턴을 보인다는 것을 알게 되었으며, 이는 전체 매출의 15%를 차지한다는 결과를 얻어냈습니다.


어쩌면 무시하고 넘어갈 수도 있었을 영업 데이터와 단순한 변수로 의미 있는 결과를 도출하고 치킨집에 새로운 활기를 줄 방안을 마련할 수 있었습니다.



2. 당뇨병 관리


자기 주변의 데이터 활용 사례와 방법에 대해 공유하고 실습으로 데이터 분석 능력을 키우는 목적의 모임인 ‘생활데이터 그룹’에서 소개한 서영부 님의 사례입니다.

서영부 님의 장모님께서는 당뇨병 진단을 받으시고 새로운 식이요법을 적용하고 매일 혈당을 측정하는 일에 적응하는 데 많은 어려움을 겪고 계셨습니다. 공복 시 혈당은 120 이하, 식후 혈당은 160 이하를 유지한다는 목표를 세우고 아침 공복 1번, 식후 3번의 빈도로 측정을 시작하셨지만 이를 꾸준히 기록하는 것을 힘들어하셨습니다.



서영부 님께서 공유해주신 장모님의 혈당 기록표



이에 서영부 님은 장모님께 혈당관리를 위한 데이터 사용법을 가르쳐드렸습니다. 종이에 입력하시던 혈당 데이터를 엑셀에 옮겨 추이를 보여드리고, 추가로 데이터를 넣으시면 그래프가 그려지도록 만들어 드린 것입니다. 또한, 혈당 관리를 위해서는 어느 기준점 이하로 그래프가 내려가야 한다는 점을 이해시켜 드렸습니다.



서영부 님께서 공유해주신 장모님의 혈당 기록표 엑셀 버전


이를 통해 장모님께서는 측정하는 숫자와 목표 간의 관례를 이해하실 수 있었습니다. 더불어 서영부 님은 장모님께서 혈당관리에 필수적인 운동량을 채우실 수 있도록 미 밴드도 드렸습니다. 운동량의 기준을 설정하여 운동량을 수치를 통해 관리하실 수 있게 한 것입니다. 이렇게 간단한 도구를 사용하여 생활 속의 데이터를 시각적으로 이해하고 측정할 수 있습니다.



3. 터미널 롯데리아, 동네 맥도날드, 강남 버거킹?




 한 트위터 이용자의 말에서 착안하여, 전국의 롯데리아, 버거킹, 맥도날드, KFC 매장 수와 지역의 발전 수준과의 상관관계를 파악한 사례도 있습니다. 위의 방정식을 ‘버거지수’라고 하고, 2015년 1월 26일 각각의 홈페이지에서 얻은 매장 정보를 토대로 다음과 같은 결과가 만들어졌습니다.





강남과 서초에는 롯데리아보다 버거킹, 맥도날드, KFC가 훨씬 많으며, 다른 지역에서도 주로 ‘시내’권인 중구 지역이 버거지수가 높은 것으로 나타났습니다.

추가로 브랜드별 매장 분포도 파악하였습니다. 이를 통해 롯데리아 매장이 전국적으로 고르게 분포하는 것을 확인하였는데요. 이에 따라 인구밀도에 상관없이 롯데리아 매장 숫자가 고정적인 비율이라면, 버거지수와 인구밀도에도 상관관계가 있을 것이라고 가설을 확장하였습니다.


인구밀도와 버거지수와의 상관관계



시군구 경계로 지역을 단순화했고 유동 인구나 인구 구조의 등의 특징을 충분히 고려하지 못하였지만, ‘이렇지 않을까?’라고 생각했던 것을 생활 속에서 얻어 낼 수 있는 데이터로 증명하려고 한 좋은 사례가 될 수 있습니다.



생활 데이터의 실천


아직 어떤 생활 데이터를 활용하여 어떻게 분석해야 하는지 감이 잡히지 않는다면, 어디서부터 시작해야 할까요?



1. 문제에서 시작하기

생활 데이터로 직접 풀어보고 싶은 문제가 주변에 있다면, 문제를 정의해 보세요. 이를 통해 자신의 고민을 구체화하여 데이터 분석과 수집 방향을 설정할 수 있습니다.

내가 최근에, 혹은 지속적으로 가장 관심을 두는 문제는 무엇일까? 그 문제에 관련된 현상을 어떻게 데이터화할 수 있을 것인가? 관련된 데이터가 이미 어딘가에 존재하는가? 아니라면 어떻게 수집할 수 있을까? 그 데이터를 분석하기 위한 최고의 방법은 무엇일까? 이런 질문에 대한 답을 생각하는 과정에서 문제의 세부사항 및 필요한 생활 데이터의 모습을 구체화할 수 있습니다.



2. 데이터에서 시작하기

생활데이터 그룹의 김영웅 님은 정보 공개 청구로 얻은 지하철 인구 유입 데이터를 살펴보다가, 크리스마스이브에 잠실역 승하차 인원이 급증하는 것을 발견하였습니다. 이 데이터를 통해 휴일에 유동인구가 줄어드는 장소를 찾으면 붐비지 않는 곳에서 데이트할 수 있겠다는 생각을 하게 되고, 이는 슬로우 데이트라는 데이터 분석 프로젝트가 되었습니다.


김영웅님이 만든 기념일별 데이트지도



이처럼 최근에는 여러 분야에서 다양한 데이터가 공개되고 있습니다. 데이터 공유에 따른 투명성의 확보 및 열린 혁신에 대한 인식이 높아졌기 때문입니다. 더불어 스마트폰과 웨어러블 기기의 진화로 개인의 일상을 기록하는 라이프로깅(Life-logging)이 활발해 짐에 따라 데이터에 대한 접근성도 높아졌습니다. 이를 활용하여 생활 데이터의 분석을 시작해 볼 수 있습니다.


3. 도구에서 시작하기

데이터에 대한 관심만큼이나 데이터를 다루는 도구 및 기법도 넘쳐 나고 있습니다. 기초부터 공부하여야 쓸 수 있는 도구들도 많고, 분석에 필요한 언어도 많습니다. 또 어떤 데이터인지에 따라 여러 가지 분석 기법을 병행해야 하는 예도 있습니다. 따라서 자신이 활용할 수 있는 도구가 어떤 것이 있는지 파악하는 것도 중요합니다.

데이터양이 방대하고 분석이 일회성으로 끝나지 않는 데이터에는 고급 도구와 기법이 필요합니다. 하지만 기본적으로는 엑셀도 좋은 도구가 될 수 있습니다. 다른 프로그래밍 기반의 도구와는 달리, 시각적으로 데이터를 입력할 수 있고, 셀 단위의 분석을 통해 패턴을 찾기에 유용하기 때문입니다.



4. 기존의 분석에서 시작하기


다른 사람의 분석 결과를 살펴보는 것도 좋은 시작이 될 수 있습니다. 데이터 수집 및 분석, 그리고 결과의 전달 방식에 이르기까지 어떤 기법과 도구를 사용했는지 꼼꼼하게 살펴보면서 부족한 점을 채우고 자신의 방식으로 발전시킬 수 있습니다.

데이터 저널리즘을 접할 수 있는 FiveThirtyEigth는 이 사이트의 상당수의 기사에 사용된 데이터를 GitHub페이지에서 제공하고 있습니다. 자기 주변의 문제를 직접 데이터로 해결하는 생활 데이터를 실천하는 개인들의 커뮤니티인 Quantified Self의 다양한 발표 자료도 유용하게 활용할 수 있습니다.



맺는 말


  생활 데이터는 상대적으로 적은 데이터와 단순한 문제들로 이루어져 있어 모든 사람들이 접근하기 쉽고, 자신의 삶과 연관되어 흥미롭게 결과를 도출해 낼 수 있습니다. 또한 분석하는 사람이 주도적으로 자신 데이터를 활용하여 문제 상황에 접근할 수 있다는 점이 큰 장점입니다.


하지만 모든 데이터가 그러하듯이, 생활 데이터라고 자신의 주변에서 일어나고 있는 문제를 모두 해결해 줄 수는 없습니다. 오히려 데이터를 어떻게 다룰 것이며, 그것으로부터 도출된 것을 어떻게 활용할 지가 더 중요합니다. - ‘데이터를 잘 써먹을 수 있는 구체적인 방법’ 보러 가기

내 주변의 문제를 데이터로 해결하기 위해 필요한 것은 무엇인가? 스스로에게 물어보고 답을 찾을 때 생활 데이터의 시대를 맞이하였다고 할 수 있을 것입니다.



(생활 데이터의 특성 상 개인 정보를 활용하여 분석한 사례가 많습니다. 때문에 민감한 정보는 본 글에 담지 못하였으나, '생활 데이터 분석', '일상 데이터 분석' 등으로 검색하시면 더 다양한 사례를 확인하실 수 있습니다.)


참고: Jin Young Kim의 브런치, 통계청, 슬로우뉴스



by 수달 발자국



Posted by slowalk




들어가며
지난 글 “디자이너를 위한 엑셀 활용법”에 이어 엑셀을 실무에 사용할 수 있는 몇 가지 팁을 소개하고자 합니다. 지난 글과 함께 읽어도 좋지만 이어지는 내용은 아니니 편하게 읽어 주시기 바랍니다.

활용1. ‘0’으로 시작하는 텍스트 입력하기
셀에 입력한 단어, 숫자의 맨 앞자리가 이유 없이 사라지는 경우가 있습니다. 대표적인 경우가 등호(=)와 0(숫자 ‘영’)을 입력하는 경우입니다. 등호(=)는 함수나 계산 식을 입력할 때 사용하므로 그 뒤에 어떤 단어를 붙이면 등호가 사라지거나 입력이 되지 않고 오류를 표시합니다. 또한, 0을 맨 앞자리에 입력할 때 엑셀은 맨 앞자리의 0을 무시하기 때문에 ‘010’으로 시작하는 휴대전화 번호를 입력해도 ‘10...’으로만 표시됩니다.

이런 경우에는 셀의 맨 앞에 작은따옴표(‘)를 입력하고 이어서 단어, 숫자를 입력하면 됩니다. 작은따옴표로 시작하는 모든 내용은 셀의 형식 중 텍스트로 인식하여 무시하거나 계산하지 않습니다. 하지만 이렇게 입력된 숫자를 엑셀에서는 텍스트로 인식하므로 사칙연산은 되지 않습니다.



활용2. 단축키로 쉽게 복사하기
Ctrl+C, V로 셀을 복사하여 붙여넣을 수 있습니다. 그런데 이렇게 복사해야할 셀이 많다면 어떨까요? 일일이 복사해서 붙여넣기를 하기보다는 복사 단축키를 사용해 보세요.

복사하고자 하는 셀을 맨 위에 두고 아래의 빈 셀들을 선택합니다. 그리고 Ctrl + D를 누르면 드래그해서 복사한 것처럼 연속 복사가 됩니다. 여러 개의 셀을 선택하지 않은 경우에는 바로 위의 셀이 복사됩니다. 또한, Ctrl + R을 누르면 현재 위치 바로 왼쪽 셀의 값을 복사합니다. Ctrl + D와 R을 이용하면 넓은 영역의 셀도 한꺼번에 복사할 수 있습니다.




활용3. 중복 값 제거하기

데이터 안에 중복 값이 있는 경우가 많습니다. 중복 값을 제거하거나 따로 표시해주려면 어떻게 해야 할까요? 엑셀 2013에 있는 ‘중복된 항목 제거’를 이용하거나 ‘조건부 서식’에서 중복 값을 강조해줄 수 있습니다.





활용4. 똑똑한 자동 채우기
셀의 오른쪽 아래 끝에 마우스를 위치시키면 마우스 포인터가 화살표로 변합니다. 이때 아래로 쭉 드래그하면 단어나 수식이 복사됩니다. 1, 2, 3과 같은 연속된 수가 있다면 복사된 셀을 수만큼 연속된 수가 자동으로 입력되기도 하는 매우 편리한 기능입니다. 2, 4, 6처럼 2의 배수를 입력하면 똑똑한 자동 채우기는 알아서 2의 배수로 채워 줍니다. 1, 2 등 정수뿐 아니라 요일(월, 화, 수 …), 월(Jan, Feb, Mar …), 심지어 12간지(자, 축, 인, 묘…)도 가능합니다.

이런 편리한 자동 채우기를 더욱 똑똑하게 만들어 봅시다. 엑셀의 [옵션], ‘고급’ 탭으로 들어가 [사용자 지정 목록 편집]을 누릅니다. 이미 입력되어 사용할 수 있는 자동 목록들이 나타납니다. 여기서 [추가]를 눌러 ‘새 목록’을 만들 수 있습니다. 여기에 새로운 목록을 채워 넣을 수 있습니다. 목록의 구분은 줄 바꿈(엔터)로 합니다.




마치며
지난 글(http://slowalk.com/2303)에 이어 디자인 작업에 엑셀을 활용할 수 있는 방법을 알아보았습니다. 어려운 수식으로만 연상되는 엑셀은 데이터 가공과 편집에 능한 아주 편리한 도구입니다. 잘만 활용하면 업무 능률을 크게 높일 수 있는 똑똑한 도구입니다. 포토샵, 일러스트레이터와 같은 그래픽 도구에서 벗어나 자기만의 능률 향상 도구를 찾아보고 만들어 보는 것은 어떨까요? 평소 귀찮아했던 작업의 문제를 찾고 해결하는 도구를 만드는 과정, 그 자체가 훌륭한 디자인일 테니까요.

by 북극곰 발자국


Posted by slowalk



 한동안 분야를 막론하고 '데이터' 혹은 '빅데이터'의 열풍이 몰아친 적이 있었습니다. 그 열기는 한 김 식었고 그 뒤에 감추어져 있던 거품이 모습을 드러내기도 하였지만, 데이터는 여전히 어떤 '가치'를 창출하는 데 있어 중요한 수단으로 여겨지고 있습니다. 치열한 경쟁 속에서 살아남기 위해서 데이터의 사용은 더욱 필요할 것이며, 기술의 발전은 그러한 적용을 수월하게 만들 것입니다. 


 과연 데이터 시대에서 우리는 가치 있는 데이터를 잘 사용하고 있을까요? 많은 데이터를 가지고 있는 것 또는 그러한 데이터를 사용하는 행위 자체에 어떤 의미를 부여하며, 데이터 사용의 본질을 잊고 있는 것은 아닐지 고민해 보아야 합니다. 효율적인 의사 결정을 지원하는 정보라는 관점에서 데이터를 잘 활용하기 위해서는 어떻게 해야 하는지 그 방법을 소개해보려고 합니다.    


 먼저 짚고 넘어가야 할 점은 데이터를 다루는 세 단계, (1) 데이터의 수집(Collection), (2) 가공(Refinement), (3) 전달 (Delivery) 입니다. 





데이터에 대한 세간의 관심은 어떻게 하면 많은 양의 데이터를 저장하고 빨리 꺼내 볼 수 있는가에 치중되어 있습니다. 하지만 이것은 가장 기초적인 첫 단계일 뿐입니다. 의사 결정자들이 원하는 '대답'의 형태를 갖추려면 여러 가지 가공과 통계학을 이용한 모델들을 만들어야 합니다. 그리고 세 번째 단계로 '의사 결정자들이 이해하기 쉬운 형태의 대답'을 이용자들이 '선호하는 채널을 통해 쉽게' 볼 수 있게 해 주어야 비로소 "데이터를 제대로 사용하기 시작했다"라고 말할 수 있는 것입니다.

 


'어떤 대답을 원하는 가' 목적을 명확히

 데이터를 다루는 단계를 이해했다면 이제 데이터 분석을 통해 어떤 대답을 원하는 것인지, 데이터를 활용하고자 하는 목적이 무엇인지를 생각해 보아야 합니다. 마케팅 분야를 예로 들어보겠습니다. 효율적인 마케팅이 목적이라면 어느 정도의 반응률이 나오면 성공이라 할 수 있는지, 어느 정도의 비용 절감이 목표인지도 현실성 있게 정의하고 일을 시작해야 합니다. 


마케팅을 주 목적으로 하는 데이터라고 해서 다 비슷한 것도 아닙니다. 수익 모델, 판매 방식, 판매자와 구매자가 선호하는 채널 등에 따라 데이터의 구조 자체가 완전히 달라질 수 있기 때문입니다. 따라서 데이터 수집에 앞서 데이터를 활용하려고 하는 목적이 무엇인지에 대해 정리하는 과정이 필요합니다.



데이터 전략에 대한 단계적 접근 방법



출처: 팝톡(POP&TALK) 블로그



 데이터를 통해서 어떤 대답을 이끌어 낼 것인지를 명확하게 하였다면, 데이터를 활용하는 전략을 구체화하는 것이 필요합니다. 단계적 전략이 필요한 이유는 (1) 그 과정이 복잡하므로 단계로 나누어야 그 공정의 관리가 수월해지며, (2) 각 단계마다 다른 종류의 전문성과 기술이 필요하기 때문입니다. 계속해서 마케팅의 예를 들어 데이터 전략을 구체화하는 주요 단계들에 대해 살펴보도록 하겠습니다.


1. 질문의 공식화 Formulate Questions) : 위에서 말한 목적을 명확하게 하는 단계입니다.


2. 데이터 재고 조사 (Data Inventory) : 어떤 조직이든 생각한 것보다 많은 데이터를 보유하고 있고 어떤 유용한 데이터는 쉽게 눈에 띄는 곳에 있지 않은 경우가 있습니다. 갖가지 정보를 전부 고려하여 데이터를 취합하여야 합니다.


3데이터 수정과 정형화 (Data Hygiene and Standardization) : 데이터의 조각들은 조사되고 추려져야 하며 때로는 고쳐지기도 해야 합니다. 데이터를 관리하는 부서에 따라 비슷한 정보도 다른 형태로 존재하는 경우가 많으니 사용 시에 고민을 덜려면 미리 정형화하여야 합니다.


4. 고객의 정의 (Customer Definition) : 한 조직 내에도 고객에 대한 정의가 여럿 있을 수 있으니 모든 ID 시스템, 고객 번호, 등록번호, 이메일 등이 고려되고 통합되어야 합니다.


5. 데이터의 통합 (Data Consolidation) : 일관된 고객 ID 시스템이 구축되면 일관되게 정리되어 있지 않은 데이터들이 새 ID를 중심으로 통합되어야 합니다. 이것은 모든 단계에서 가장 중요한 과정이기도 합니다. 비즈니스, 데이터, 그리고 분석에 관한 지식이 고루 필요한 작업이며 앞으로의 분석과 리포팅의 초석이 되는 변수들이 창출되는 단계이기도 합니다. 게다가 기업이 속한 산업의 특수성과 사업 모델에 따라 변수들의 형태가 천차만별로 달라지기 때문에 고도의 전문성과 경험을 요합니다.


6. 분석 프로젝트 (Analytical Projects) : 새로운 고객 중심의 플랫폼이 구성되면 그것을 토대로 한 시험 프로젝트를 처음부터 끝까지 실행해보는 것이 중요합니다. 처음부터 모든 걸림돌과 애로 사항들을 다 찾아낼 수 없으므로 반복적 테스트가 중요합니다.


7. 정보의 적용 (Applying the Knowledge) : 실제적인 마케팅 캠페인에 적용하고 전제 데이터베이스로 이용 범위를 확장합니다. 


8. 결과의 분석 (Result Analysis) : 결과를 도출하는 것을 넘어서, 모든 마케팅과 캠페인에 대한 결과를 재 입력하여 새로운 정보를 적용시켜야 합니다. 


이 단계들은 물론 간추려진 과정이며, 경우에 따라서 달라질 수 있습니다. 각 단계들은 데이터 분석의 주 목적을 공유하되 독립된 프로젝트들로 기획, 관리되어야 하며, 어떤 단계들은 동시에 진행될 수도 있습니다. 



데이터를 잘 가공하는 방법

 위의 데이터 전략 단계에서 시사하는 바 중의 하나는 데이터를 정리하는 과정을 통해 초석을 세우는 것이 중요하다는 것입니다.  그렇다면 어떠한 방법으로 데이터를 '잘' 정리할 수 있을까요?


첫 번째 방법은 '범주화'하는 것입니다.

 요즘 수집되고 있는 많은 데이터는 가공되지 않은, 정형화 되지 않은, 구분되어 있지 않은, 수정되지 않은 '자유형 데이터'들인 경우가 많습니다. 이러한 데이터들을 숫자로 표현하여 컴퓨터가 계산할 수 있도록 만들어 주는 것이 중요합니다. 그러기 위해서는 우선 '카테고리와 태그'를 잘 분류해야 합니다. 


실제로 인터넷 음악 서비스들이 마치 따로 고용된 DJ처럼 서로 잘 연결된 노래들을 자동으로 연속해서 틀어주는 것의 배후에는 잘 구성된 공식, 즉 알고리즘이 수백만 개의 노래들 간의 연관 점수를 계산하고 있습니다. 그러한 점수 계산의 시작 점은 각 노래마다 붙어있는 카테고리나 태그입니다. 노래나 음악의 장르, 가수, 연주자, 작곡가, 편곡자, 주요 악기 구분, 오리지널/리메이크 구분 등이 그 예가 될 수 있습니다. 


두 번째 방법은 '빈 곳을 메우는' 것입니다.





아무리 열심히 데이터를 모아도 어떤 이가 특정 상품을 구매한 적이 없다며 그 특정 상품을 중심으로 만든 변수는 비어있는 채로 남아 있을 수밖에 없습니다. 이처럼 비어 있는 데이터(Missing Data)는 도처에 널려있습니다. 그리고 데이터가 없는 데에도 많은 이유가 있습니다. 그렇다면 비어있는 데이터를 어떻게 다뤄야 할까요? 빈 곳으로 놔둘 것인가, 아니면 그곳에 무언가를 채워 넣을 것인가, 채워야 한다면 그렇다면 어떤 방법을 사용할 것인가. 이러한 질문에 대한 대답은 '경우에 따라 다르다'라는 것이며, 중요한 것은 정보의 부재에도 중요한 의미를 찾아낼 수 있다는 것입니다. 


 거래 기록에 있어서 계산이 가능한 데이터들은 거래 기록이 없을 때 자연적으로 비어있게 됩니다. 이것을 빈 곳으로 두어야 하지 0으로 표현해서는 안 됩니다. 간단한 '가구당 자녀 수'라는 정보를 수집하는데 자녀가 없다면 그것은 빈 곳으로 놔두는 것보다 0을 사용하는 것이 훨씬 바람직합니다. 


또는 통계적 모델을 통해 추정된 값으로 비어있는 곳을 메우는 방법도 있습니다. 예를 들어 가구당 연 수입을 다른 변수들을 이용하여 추정한다고 할 때에 아주 높은 액수(예: 5억 원 이상의 단위)나 특정 액수(예: 8천 6백 5십만 원)를 정확히 추정하는 것은 가능하지도 않고 바람직하지도 않습니다. 추정치로 값을 메우는 경우에는 대부분 '8천만 원 ~ 9천만 원`등의 '범위'로 주어지게 됩니다.



인간적인 요소를 제대로 이해해야

 데이터는 컴퓨터 출현 이전에도 존재해 왔습니다. 다만 데이터를 분석하는 도구가 변해왔을 뿐입니다. 지금 우리는 문자의 발명 이래로 집적된 모든 정보의 양보다 수백만 배 많은 데이터를 매일 실시간으로 수집하고 있습니다. 모든 사람의 행동은 물론이고 기계의 활동까지도 전부 기록되고 있으니 말입니다. 단지 몇 번의 클릭으로 통계적 모델을 만드는 도구가 일상화되고 있으며, 훗날에는 단지 컴퓨터에게 사업 목적을 명시하는 것만으로도 분석 임무를 수행할 수 있게 하는 것이 가능해질지도 모릅니다. 


 하지만 인간에 대한 이해와 고유의 감성적인 영역은 기술이 변해도 바뀌지 않는 유일한 것입니다. 인문학이 중요하게 여겨지고 있는 이유와 일맥상통한다고 볼 수 있습니다. 맹목적으로 기술에 의존하여 데이터를 가공하는 행위에 치중된 것이 아니라, 수많은 데이터를 어떻게 바라볼 것이며, 어떻게 활용해야 할 지를 의사 결정하는 것이 데이터를 잘 써먹을 수 있는 가장 중요한 방법이 아닐까 생각합니다.   



더 알고 싶다면

 데이터 분석과 활용에 대해 더 깊고 자세한 내용을 알고 싶으시다면 '데이터를 잘 써먹을 수 있는 구체적인 방법들'이라는 데이터 전략, 빅데이터 애널리틱스 전문가의 특별 연재를 참고하시기 바랍니다. 위에 소개된 내용 이외에도 데이터를 분석하는데 있어서 필요한 데이터베이스 모델링, 예측, 아웃소싱 등 전문적인 내용을 담고 있습니다.



출처: ITDaily, Forbes


by 수달 발자국


Posted by slowalk

리브랜딩이란 단순히 로고를 예쁘고 새롭게 만드는 것에서 끝나는 것이 아닙니다. 브랜드의 새로운 비전과 철학에 맞지 않는 옷을 입은 로고는 오래 갈 수 없습니다. 새롭게 태어난 브랜드의 말과 행동부터 모든 걸 새롭게 재설계해야 지속할 수 있습니다. 브랜드의 맞춤옷을 위해 걸음걸이와 습관을 살펴본 것이 데이터 분석이었다면, 이제 본격적인 설계와 구현에 들어가는 과정입니다.


> 먼저 읽기 : ed:m, 당신의 이름을 함께 만들다 (1) 





edm이 ed:m이 되다 – 유학은 ‘경험’이 핵심 키워드다


슬로워크: 기존 유학 시장을 분석해 보니 ‘상업적, 돈’과 같은 부정적 이미지가 있었어요. 유학의 동기가 ‘스펙’만이 아니라는 것도 확인했고요. 이제는 유학을 자신이 원하는 경험과 배움을 찾기 위해 가는 과정으로 봐야 한다는 것이죠. 교육(education)은 하나로 정의할 수 없으며, 다양한 모든 경험이 교육이 될 수 있다는 것을 새로운 CI에 녹여내야 했습니다.


ed:m은 교육(ed)에서 경험(m)으로의 확장을 의미(:)합니다. 그리고 [ed:m]은 [education is m_]을 함축적으로 표현합니다. ed:m이 유학을 통한 다양한 경험을 꿈꾸는 이들을 위해 mom(엄마)이 될 수도, mentor(멘토)나 mate(친구)가 될 수도 있는 것이죠. ed:m 브랜드가 소비자의 모든 경험으로 채워질 수 있도록 콘텐츠와 채널 전략, 이에 대한 가이드라인을 세웠습니다.




ed:m 브랜드 핵심 콘셉트


다각적 데이터 분석과 핵심 키워드 추출을 통해 ed:m이 앞으로 해야 할 행동과 말을 정립한 것인데요. 말이란 어떤 내용의 콘텐츠를 어떤 채널을 통해서 어떤 톤앤매너로 해야 하는지에 대한 가이드이고, 행동이란 어떤 프로모션으로 어떻게 다가가야 하는지 접점과 방식을 정해드린 것입니다. 커뮤니케이션 매뉴얼을 통해 채널 활용 전략, 콘텐츠 활용 전략부터 프로모션 방안과 블로그 글쓰기 가이드라인까지 브랜드가 해야 할 모든 것을 담아드렸습니다. 단순히 기업의 CI를 교체 하는 것이 아닌, 브랜드의 커뮤니케이션 방식에 대한 종합적인 컨설팅인 것이죠.



ed:m 콘텐츠, 채널 활동


ed:m : ‘경험’이라는 핵심 키워드를 잘 도출하신 것 같아요. 외국어를 배우고, 유학을 가는 것의 본질이 경험이죠. 단기에 영어를 배우는 데는 분명 한계가 있어요. 절차와 철학이 필요하고, ed:m은 그 절차와 과정을 돕는 곳입니다.

리브랜딩 과정을 통해 ed:m의 핵심 가치와 철학이 구성원들에게 내면화되고, 브랜드에도 녹아 들게 되었어요. 슬로워크와 함께 ed:m 구성원들을 인터뷰하고, 워크샵도 같이 하는 과정에서 브랜드가 왜 중요하고 앞으로 어떻게 해야 하는지 ed:m 스스로 알아가게 되었습니다. 결과물 달랑 하나만 주어지는 게 아니라, 리브랜딩 과정을 함께 겪으면서 ed:m 스스로 학습되고, 알아가고, 경험 하고 배우게 되어서 만족스럽습니다.

예전에는 로고를 만들 때 ed:m의 아이덴티티와 철학이 정말 녹아 있을까에 대한 의문이 있었어요. 지금은 ed:m이 무슨 의미인지 누구에게나 정확히 이야기할 수 있습니다. 이건 정말 큰 의미죠. 향후 오랫 동안 ed:m이 가져가야 할 아이덴티티이고, ed:m의 얼굴이잖아요. 모든 구성원이 시간을 내서 함께 성장했던 과정이 참 좋았습니다.



ed:m 리브랜딩 그 이후 – 함께 성장한 프로젝트였습니다

ed:m : 리브랜딩 결과물을 내부 구성원들에게 바로 알리지 않았어요. 모든 구성원이 모이는 송년 회에서 깜짝 발표를 했죠. 그때 드레스코드가 ‘dot(점)’였어요. 드레스코드가 왜 ‘dot’일까 궁금해 하는 분들이 많았는데, ed:m의 :을 암시한 것이었죠. edm이 ed:m으로 변화한 과정에 대해 브랜딩 총괄을 맡은 슬로워크의 문광진 실장님이 오셔서 프리젠테이션을 하셨어요. 그간의 작업 과정이 담긴 동영상까지 만들어 보여주셨죠. 전 직원에게 공개하는 그 과정이 리브랜딩의 클라이막스 같은 느낌이더군요.



슬로워크: 리브랜딩 작업 이후에 ed:m이 전사적으로 CI를 다 교체하고, 지점마다 간판도 다 바꾸고, 브랜드 패키지 제품도 만드시는 것 보면서 기분이 좋았어요. 리브랜딩이 끝났어도 슬로워크 내부에서는 ed:m에 대한 아이디어를 계속 공유하고 있습니다. 디자인 검색을 하거나 아이디어가 떠오를 때, ed:m에 적용하면 좋을 것을 이야기하는 거죠. 슬로워크가 리브랜딩 결과에 책임을 져 야 하잖아요. 이후에도 어떤 작업이 지속되어야 브랜드가 잘 살아남을 수 있을지 고민하는 거죠. 좋은 아이디어가 있으면 ed:m에 계속 제안하려고 합니다.



ed:m 브랜드 어플리케이션



ed:m : 리브랜딩 작업 이후에도 여러 프로젝트를 슬로워크와 함께 하고 있어요. ed:m의 홈페이지 리뉴얼도 슬로워크에서 하시는데, 프로젝트 담당자인 임마로 이사님도 슬로워크다운 장점을 잘 살려서 작업을 진행하고 계세요. 슬로워크 디자이너들의 시각적 직관에 데이터 분석의 시너지가 더해지는 듯해요. 리브랜딩 작업이 로고 교체에서 끝난 게 아니라, 리브랜딩에서 설계한 콘텐츠와 프로모션의 방향성과 가이드라인이 홈페이지까지 연속성 있게 이어지고 있습니다.



ed:m 웹사이트(edmedu.com)


슬로워크는 한 마디로 진정성 있는 결과물을 낼 수 있는 업체입니다. 저희도 여러 외부 업체와 이런저런 프로젝트를 진행해봤지만, 진정성 있는 결과물을 만드는 건 참 어렵더군요. 만족스러운 결과물을 내기 위해서는 서로에 대한 관심과 진심이 필요하죠. 파트너 관계로 서로 존중하고 과정을 함께 만들어 가야 하고요. 슬로워크는 배려와 소통을 통한 디자인에 최적화된 곳이라고 생각해요.




ed:m 리브랜딩은 기존 브랜드 컨설팅과 디자인 작업의 통합을 고민한 프로젝트였습니다. 파트너와 함께 확신을 갖고 실험하며 데이터를 분석해 만족스럽게 작업을 마무리할 수 있었죠. 슬로워크는 데이터 분석 및 브랜드 전략 수립부터 브랜드 패키지 디자인까지 총괄한다는 점에서 일반적인 리브랜딩 작업과 차별화한 결과물을 낼 수 있었습니다.

의뢰한 것 이상으로 받은 것 같아 고맙다는 ed:m. 함께 하는 과정에서 성장하고 자극 받았다는 슬로워크. 리브랜딩 작업에서 서로가 경험한 것들이 새로운 성장의 밑거름이 될 것입니다.



리브랜딩 프로젝트 

프로젝트 관리 – 슬로워크 디자인기획실 문광진 / ed:m유학센터 최원혁  

브랜드 콘셉트 – 슬로워크 디자인기획실

데이터 분석 – 슬로워크 디자인기획실 박영현, 뭐든지팀 임호열 / 스태커 황인성 

아이덴티티 디자인 – 슬로워크 디자인기획실 박영현, 곽지은

어플리케이션 디자인 – 슬로워크 디자인기획실 박영현, 곽지은 

프로모션 전략 – 슬로워크 디자인기획실 박영현, 뭐든지팀 임호열 


웹사이트 리뉴얼 프로젝트 

프로젝트 관리 – 슬로워크 웹개발실 임마로 / ed:m유학센터 최원혁, 성지영 

인포메이션 아키텍처 – 슬로워크 웹개발실 김다온 

디자인 – 슬로워크 웹개발실 권지현, 박화진, 신기주, 이윤호

개발 – 슬로워크 웹개발실 류태석, 뭐든지팀 문윤기


홍보 

프로젝트 관리 – 슬로워크 뭐든지팀 조성도

인터뷰/라이팅 – 송혜원 

이미지/촬영 – 슬로워크 뭐든지팀 노길우, 디자인기획실 문광진, 박영현, 곽지은 



> 더 읽기 : 브랜드를 표현하는 또 다른 방법, 글쓰기 스타일
               화면이 작아지면 로고가 변한다? 반응형 로고 디자인



Posted by slowalk


디지털 기술의 발달로 편리한 정보 수집과 생산, 가공이 가능해졌습니다. 덕분에 우리의 삶은 편리해졌지만, 넘쳐나는 정보에 허우적 거리다 보면 소소한 일상에 대한 관심은 줄어갑니다. 오늘은 조금 다른 방식의 인포그래픽을 선보이고 있는 두 디자이너를 소개 합니다. 소소한 일상 속에서 의미를 찾아 아날로그하게 표현하는 조지아와 스테파니의 ‘Dear Data’ 입니다.



조지아 Giorgia Lupi (왼쪽)

조지아는 이탈리아인이고, 현재 뉴욕 데이터 전문 회사에서 인포그래픽 디자이너로 일하고 있습니다. 그녀는 무질서한 것들을 모아 질서를 만들고, 아날로그 방식으로 표현하는것을 좋아합니다. 


스테파니 Stefanie Posavec (오른쪽)

스테파니는 미국인이고, 런던에서 살고 있습니다. 프리랜서 인포그래픽 디자이너로 일하고 있습니다. 그녀는 계산하고, 배열하는 것을 좋아하며, 그림 그리는 것을 좋아합니다.


두 사람은 세계 아티스트들의 모임인 ‘Eyeo festival’에서 처음 만났습니다. 지구의 반대편에서 다른 삶을 살고 있지만, 서로의 공통점을 알아보았고 많은 이야기를 나눕니다. 그리고 일상 속에서 찾아볼 수 있는 사소한 정보들을 손 그림으로 표현하는 ‘Dear Data’를 시작합니다. 


'DEAR DATA WEEK 03 : THANK YOU


'DEAR DATA WEEK 30 : BEING ALONE


일주일에 한 번씩 주고받는 이 엽서에는 혼자 시간을 보내는 횟수, 하루 동안 ‘감사하다’고 말한 횟수 등 일상 속 사소한 정보이 담겨있습니다. 엽서의 앞면에는 인포그래픽이, 뒷면에는 인포그래픽을 읽는 설명서가 있는데요, 깨알같은 손그림을 읽어나가는 재미가 쏠쏠합니다. 디자이너로 활발하게 활동 중인 두 사람에게 ‘Dear Data’ 는 지친 일상에 활력을 불어넣어 주고, 창의적인 생각을 하게 해줍니다. 



위 이미지들은 ‘Dear Data’의 엽서 한 장이 만들어지기까지의 과정입니다. 정보를 수집하고, 분석하는 단계에서 부터 시각화하는 모든 단계인데요, 프로젝트가 색칠놀이 하듯 재미있게 진행되고 있다는 사실을 확인할 수 있습니다. 


‘Dear Data’ 프로젝트를 통해 전문적인 내용이 아니라 사소하게 지나치는 일상 속 정보들로도 재미있는 인포그래픽을 만들 수 있다는 사실을 알게 됩니다. 여러분의 일상 속에서는 어떤 데이터를 찾을 수 있나요? 저는 하루 동안 먹은 초콜릿의 개수, 커피를 마시지 않고 참았던 횟수 등을 체크하여 손그림으로 그려 보려고 합니다. 사소한 것들을 바라보는 작은 관심이 지루했던 일상을 조금 더 다채롭게 해 주지 않을까요?


출처: Dear Data 



by. 고슴도치 발자국



Posted by slowalk



많은 정보를 한눈에 보기 쉽게 만들기 위해 표나 그래프를 만들 때 어떤 툴을 사용하시나요? 슬로워크에서는 다양한 정보를 시각화하기 위해 adobe사의 일러스트레이터를 가장 많이 사용하는데요. 워드나 한글, 파워포인트에서도 표나 그래프를 쉽게 만들 수 있지만, 글과 그래프의 연결 혹은 전체 내용을 어우르는 인포그래픽을 만들기 위해서 문서도구보다는 그래픽 툴인 adobe의 일러스트레이터로 훨씬 쉽게 인포그래픽을 만들 수 있기 때문이지요.


하지만 일반들이 멋진 그래프를 만들기 위해 디자인 툴을 다루기엔 그 진입장벽이 엄청 높습니다. 그렇다고 일일이 디자인회사에 맡기기엔 그 비용이 어마어마한데요. 문서도구로는 많은 시간과 노력이 필요한 인포그래픽 작업을 일반인도 쉽고 간단하게 만들 수 있는 웹사이트를 소개하려합니다.



Timeline JS


Timeline JS는 코딩하지 않고 바로 타임라인을 만들 수 있는 웹페이지입니다. 웹에 글만 쓸 줄 안다면 누구든 인터렉티브 웹 타임라인을 만들 수 있는데요. 더 편리한 부분은 Youtube, Google Maps, Twitter같은 다양한 소스를 활용해서 타임라인을 꾸밀 수 있다는 점입니다. 



(인터렉티브 페이지 바로가기)


타임지(Time)에서도 넬슨 만델라에 대한 타임라인을 Timeline JS를 활용해 만들었는데요. 복잡한 타임라인을 짧은 글과 사진, 인용구 등으로 간결하게 보여주는 점이 인상적입니다. 





Infogam


Infogam은 인포그래픽을 구성할 데이터만 있다면 간단한 클릭만으로 디자이너가 만들어준 것 같은 인포그래픽을 만들어주는 웹사이트입니다.

인포그래픽의 내용에 어울리는 템플릿을 선택한 후


차트, 데이터, 지도, 아이콘 등을 선택해 전체 페이지를 구성합니다. 

Share나 embed 코드를 활용해 원하는 매체 어디에나 활용합니다.


만들기만 하는 것이 아니라 다양한 png나 pdf파일로 다운로드 받을 수 있고 모든 데이터를 완성한 이후에도 웹에서 언제든 수정이 가능한 등 일반인도 전문가 못지 않은 인포그래픽을 만들 수 있는 점이 큰 장점인데요. 무료로 만들 수 있는 컬러 구성이나 그래픽 자체의 수준도 상당해 다양한 분야에서 Infogam의 활용이 기대됩니다. 




Tableau

Tableau는 가장 다양한 분야에서 많이 쓰이는 차트 툴입니다. 웹용으로 사용하는것은 무료인데요. 홈페이지에서 프로그램을 다운받아 그래프를 만들면 어느 웹 페이지던 쉽게 embed할 수 있도록 변환해줍니다. 꼭 Tableau로 차트를 만들지 않더라도 다른 사람들이 Tableau로 만든 다양한 인포그래픽들을 구경하는것도 새로운 재미라 추천해 드립니다. 



소개해드린 인포그래픽 툴들은 무료 혹은 유료버전이 함께 있는 툴도 있기 때문에 활용하실 때 약간의 제약이 있기도 한데요. Infogam처럼 인포그래픽 템플릿을 제공하는 사이트를 참조해 한글이나 워드에서 차트를 만들때 색이나 형태, 구성방법 등을 만들어 보는것도 디자이너를 능가하는 인포그래픽을 만들 수 있는 팁이 아닐까 싶습니다. 



by 사슴발자국




Posted by slowalk

얼마전 인터넷에 “그래프를 더 멋지게 만들기”라는 제목으로 떠돌던 움직이는 그림(gif)이 있었습니다. 아래 그림을 보시면 우리가 흔히 볼 수 있는 그래프를 어떻게 더 간결하게 바꿀 수 있는 방법을 단계별로 보여주고 있습니다. 





The Dark Horse Analytics라는 데이터 시각화 전문회사가 만든 슬라이드인데요. 원문 Data looks better naked를 보시면 더욱 자세한 설명을 보실 수 있습니다.


그럼 간결한 그래프를 위한 방법을 단계별로 살펴 보겠습니다. 


1. 배경을 지워라.

그래프 아래 깔려 있는 나무 질감과 회색 배경이 사라졌습니다. 특히 나무 질감의 배경은 데이터와 큰 상관이 없는 것 같네요.




2. 라벨(범례)를 지워라. 

그래프 우측의 범례와 축의 제목을 지우라고 합니다. 상단의 길었던 제목도 핵심만 나타내도록 줄였습니다. 단순화 시킨 제목과 숫자만으로 그래프가 설명하는 내용을 알 수 있다면 굳이 필요 없겠네요.





3. 테두리(border)를 지워라.

그래프 배경을 감싼 테두리나 막대그래프의 테두리는 굳이 필요 없는 것 같습니다. 이미 면으로 표현을 하고 있으니까요. 지우고 나니 생각보다 테두리가 굵게 쳐져 있었음을 알 수 있습니다. 





4. 색상과 효과를 지워라.

강조하고 싶은 막대(Bacon)를 제외한 나머지 막대의 색상을 무채색으로 바꾸었습니다. 그림자나 입체 효과도 없앴습니다. 그래프가 훨씬 간결해 졌습니다. 

그런데 Bacon처럼 특히 강조해야 할 데이터가 없다면? 색상 또는 패턴(무늬)를 넣어주는 것이 좋다고 생각합니다. 각 데이터가 구분이 되어야 하기 때문이죠. 이때는 반드시 색각이상자들이 구분할 수 있는 안전색상을 선택해야 하겠습니다. 





5. 글꼴의 두께를 줄이고 가볍게 하라.

보다 막대에 집중할 수 있도록 제목과 숫자의 볼드를 없애고, 색상도 보다 가볍게 합니다. 





6. 보조선을 줄이거나 아예 없애 버려라.

세로축의 숫자에 맞춰 그려진 보조선을 줄이거나 없애라고 합니다. 막대에 더욱 더 집중할 수 있고, 내용을 간결하게 하기 위해서 인데요. 선을 간결하게 하는 것은 좋지만 아예 보조선이 없다면 경우 막대만 보고 직관적으로 데이터를 파악하기 어렵지 않을까요? 그래프의 데이터와 상황에 따라 신중한 선택이 필요하겠습니다. 




7. 라벨을 직접 붙여라.

세로축의 숫자는 일정한 간격을 두고 있고, 보조선이 있다고 해도 막대의 데이터를 쉽게 알 수 없습니다. 이럴 경우를 위해 막대에 직접 숫자를 넣어 줍니다. 각 막대의 높이 비교도 되면서 정확한 데이터를 파악할 수 있는 좋은 방법이네요.





이처럼 크게 7단계 정도로 그래프를 간결하게 만드는 방법을 알아 보았습니다. 처음 그래프와 빅하면 훨씬 직관적이고 시각적인 세련된 그래프가 완성되었습니다. 





사실 The Dark Horse Analytics가 제안한 방법은 그저 그래프를 깔끔하고 예쁘게 하는 방법이 아니라 “Data-ink Ratio”라는 개념과 그의 이론에 기초한 것입니다. 


Data-ink Ratio는 Edward Tufte라는 데이터 시각화 학자가 고안한 개념인데요. Data-ink란 간단히 말해 “더 이상 지울 수 없는 핵심 데이터”를 말합니다.  Edward Tufte가 말한 데이터 시각화. 즉, 그래프의 목적은 “그 무엇보다도 데이터를 표현하는 것”이고 앞서 말한 핵심적인 Data-ink 외에 불필요한 디자인과 내용은 지워야 한다는 것이죠. 


그래프나 인포그래픽 작업을 하게 되면 더 세련된 디자인, 더 멋진 그래픽을 만들고 싶은 욕심이 생깁니다. 간혹 멋진 디자인에만 치중하다 보면 정작 중요한 데이터는 보이지 않게 되는 경우가 있죠. 이럴 때 위에 소개한 방법들을 떠올려 보고, 꼭 표현해야 하는 Data-ink가 무엇인가를 생각해 보면 어떨까요?



출처 : 

http://darkhorseanalytics.com/blog/data-looks-better-naked/

http://www.infovis-wiki.net/index.php/Data-Ink_Ratio



북극곰 발자국

Posted by slowalk