본문 바로가기

Technology

‘서울정책아카이브’를 통해 알아보는 아카이브 개발 사례



2005년 Tim O'ReillyWeb 2.0을 표방한 이래 12년이 지났습니다. 우리는 얼리어답터가 아니더라도 한번쯤 개방과 참여, 공유라는 단어를 접해보았고, 구글독스가 오피스 프로그램을 대체하는 현재를 살아가고 있습니다. 플랫폼으로서의 웹사이트, 불특정 다수의 집단지성 이용, 프로그램 릴리스 사이클의 종언, 경량화 프로그래밍 모델, 디바이스의 경계를 넘는 소프트웨어, 폭넓은 사용자경험(UX)의 중요성 등 당시에 제안된 Web 2.0의 원칙을 그리 어렵지 않게 느낄 수 있게 된 것입니다.


이러한 흐름에 발맞추어 최근 민간영역 뿐만 아니라 공공영역에서도 발전된 형태의 웹사이트를 구축하고 운용하는 방법을 고민하고 있습니다. 이러한 시도 중에서도 아카이브 형식을 차용해 웹사이트를 구축하는 사례가 늘고 있습니다. 단순히 기관 또는 사업의 소개를 담거나 정보 저장 및 나열 형식으로 운영되던 이른바 ‘홈페이지'에서 벗어나, 제공되는 정보를 손쉽게 찾을 수 있도록 세밀한 검색기능을 제공하고 수집된 데이터의 큐레이션과 2차 이용 및 가공이 가능한 방법을 제공하는 등 차별화된 이용 방식으로 활용성을 높이는 것을 목표로 하고 있습니다.


여러 사례 중 공공기관으로서는 이례적으로 2013년부터 조기 구축되어 현재까지 운용 중인 서울정책아카이브의 사례를 들어 이러한 흐름에 대하여 살펴보겠습니다.

서울정책아카이브?

서울시 해외도시협력담당관과 서울연구원 글로벌미래연구센터가 공동으로 운영하는 서울정책아카이브는 서울시의 도시 발전에 관한 축적된 지식을 공유하며, 세계 각국의 도시정보를 제공하고, 국내외 도시개발에 관한 민관협력을 촉진하기 위해 만들어졌습니다.


  • 서울정책아카이브는 서울 발전에 큰 영향을 미친 정책들을 체계적으로 수집·연구 저장하고, 국제기구, 기업, 일반 시민들이 이를 통합적으로 검색하고 활용하는 것을 목표로 하고 있습니다.

  • 서울정책아카이브는 시민사회, 기업, 정부 및 학계가 공동으로 활용할 수 있는 세계 도시정보의 저장소로, 세계 도시의 정보 체계적인 축적과 활발한 활용을 지원하는 시스템입니다.

  • 서울정책아카이브는 민간기업 해외진출 사업 행정적 지원과 해외 도시인프라 개발 사업에 대한 정보제공을 주요 기능으로 하며. 성공적인 해외진출을 원하는 민간기업인들의 많은 동참을 기대하고 있습니다.

서울정책아카이브 ‘소개’ 중 발췌


여기서 짚고 넘어갈 것은, 서울정책아카이브 웹사이트는 일반적이고 학술적인 의미의 ‘아카이브'의 정의/개념과는 다소 차이가 있으며, 아카이브의 일부 형식을 차용하여 서울의 우수한 ‘정책’을 중심으로 체계적인 노출을 통해 서울시 우수정책의 해외 진출을 목표로 하고 있다는 점입니다.


더 쉽게 말하자면, 일반적인 기관 웹사이트의 정책 자료실이 발전/특화된 형태라고 할 수 있습니다. 서울정책아카이브 웹사이트는 기본적으로 디바이스의 구분이 없이 PC/태블릿/모바일 등 온라인에서 쉽게 접근과 이용이 가능하도록 적응형(Adaptive) 디자인이 적용되어 있습니다. PDF, DOC 등 바이너리(Binary) 파일로 제공된 정책 콘텐츠들은 웹에 최적화된 문서로 작성하여 검색엔진 또는 자체 검색 기능으로는 데이터의 상세 내용을 찾을 수 없던 점을 개선했습니다. 뿐만 아니라 모든 콘텐츠 페이지 목록을 XML기반의 API를 제공하여 필요시 최신 정보의 공유와 활용이 가능하도록 구성하였습니다.


시작

기획 당시 약 100여 개의 서울시 우수 정책을 효과적으로 노출하고 관리하기 위한 방식부터 고민했습니다. 1950년대부터 지금까지 서울시의 발전과 함께 작성된 자료들은 오프라인에 하드카피로 존재하던 지류 정보와 어플리케이션이 있어야만 조회가 가능한 HWP(한글) 문서, PDF 파일 등 각기 다른 포맷으로 작성되어 있었습니다. 이에 따라, 유관 부처 및 담당자별로 각기 다른 곳에 보관되어 있는 정책 자료들을 모두 취합하고, 이를 ‘온라인’ 상에서 편리하게 제공하는 것이 주요 사업 목적이었습니다.


제공 방향성 수립

우선 ‘정책’ 데이터는 문서의 메타(Meta) 항목만을 데이터로 저장하고, 본문 주요 내용은 일반적인 PDF 또는 HWP 문서 등 바이너리 파일 형태로 제공하는 방식이 아닌, 텍스트로 검색이 가능한 웹 문서 형태로 게시하기로 결정했습니다. 이 경우 최초 콘텐츠의 생산(입력)과 관리에 훨씬 많은 수고가 들지만, 내부의 검색기능이 아닌 외부 검색엔진의 노출이 매우 용이해지고 이로 인한 활용과 노출도 증대에 효과적이기 때문입니다.


<구글 검색시 노출되는 서울정책아카이브의 ‘중앙버스전용차로’ 콘텐츠>


플랫폼 선정

서울정책아카이브는 오픈소스 CMS(콘텐츠관리시스템)엔진인 드루팔(Drupal)을 이용하여 개발되었습니다. 웹 개발을 위한 여러 CMS가 존재하지만 드루팔은 콘텐츠 취급 및 생산, 설계와 활용성 면에서 뛰어난 장점이 있고 분류(Taxonomy)의 그룹핑(Grouping) 및 개별 분류를 콘텐츠 페이지로 사용할 수 있는 점, 그리고 메타 정보를 필드에 구성하거나 이를 자동화하여 SEO(검색엔진최적화) 정책을 세부적으로 수립할 수 있는 점 등 이 사업에 필요한 기술요건에 부합하였습니다.


구현

콘텐츠 생산

웹 콘텐츠의 생산은 일반적인 CMS에서 제공하는 기본 기능입니다. 하지만 아카이브의 속성을 가지고 계속 누적되는 콘텐츠들을 사용자에게 어떤 형태나 분류별로 제공해야 하는 사이트의 성격상, 일반적인 입/출력(쉽게 말해 게시판형) 양식보다 고도화된 생산 기능이 필요하다고 생각했습니다.


사이트의 콘텐츠 중 가장 중요한 정책 콘텐츠는 서울시가 보유한 모든 정책 문서가 동일한 목차나 규격을 가진 형태로 작성되지 않았기 때문에, 이를 최대한 규격화하기 위해 단락별 주제(제목)와 내용을 사용자가 원하는 만큼 추가 입력하고 추후 순서 변경을 쉽게 할 수 있도록 에디터를 개발하여 적용했습니다. 이로 인해 아무리 긴 정책 내용이라도 하나의 텍스트 구역(Textarea)에서 데이터를 입력할 필요 없이 요구되는 섹션을 생성하여 적용하거나 추후 해당 섹션만 수정/삭제하는 것이 매우 쉬워졌습니다.


섹션의 내용을 작성하는 영역은 웹 에디터 중 ‘CKEditor’로 구현해 문서 편집에 필요한 적정 요건을 제공하도록 하였습니다. ‘CKEditor’는 잘못된 HTML태그의 수정이나 보안에 위배되는 코드를 입력단에서 제거하고, 미리 설정한 컬러 Scheme 및 문서 스타일을 편리하게 정의할 수 있는 등 사용자와 관리자의 편의성을 모두 고려한 강력한 편집 기능을 가지고 있습니다.


서울아카이브_정책작성화면캡쳐.jpg

서울아카이브_정책캡쳐.jpg

<정책 콘텐츠 편집 화면(위)과 실제 콘텐츠의 출력 화면(아래) 캡쳐>


또 다른 자료 형식으로 위치정보 기반(Geo Location)의 콘텐츠를 들 수 있습니다. 지금까지 서울시와 정책교류를 하고 있는 도시들의 정보를 지도상에 표시하여 위치와 밀집도, 분포율 등을 시각적인 정보로 체감할 수 있게 구현하는 것을 목표로 하였습니다.


이렇게 구현된 기능으로 단순히 개발자가 코딩한 데이터만 출력되는 것이 아니라, CMS 내부에서 콘텐츠의 생산기능을 이용해 도시별 정책 진출 분야나 사업 연관 내용을 관리자가 직접 작성합니다. 사용자가 조회하는 화면에서는 정보들을 구글지도의 지정된 위치에 출력됩니다. 이후 추가/변경되는 내용을 직접 수정할 수 있고 이를 통해서 기존 이미지 1장으로 표시되던 해외진출도시 정보를 동적으로 제공할 수 있게 되었습니다.


<정책해외진출현황 콘텐츠 편집화면(위)과 실제 콘텐츠의 출력화면(아래) 캡쳐>


이외에도 연구원에서 발행하는 정기 계간지 <세계와 도시>의 섹션별 자료를 단행본 권호별 또는 전체 권호의 특정 섹션만 모아서 볼 수 있도록 분류 체계를 연동하였습니다. 분류가 하위 연결되는 것 뿐만 아니라, 인용이나 참고 형식으로 연계가 가능한 드루팔 CMS의 강점인 ‘분류’ 기능의 이용해 서로 다른 2개 이상의 분류 체계를 동시에 적용하여 콘텐츠를 필터링하도록 구현한 것입니다.


<계간 ’세계와 도시’ 콘텐츠 리스트>


콘텐츠 관리

콘텐츠 관리 시스템인 드루팔은 특정 기능에서 생산된 것을 제외한 모든 콘텐츠가 노드(node) 단위로 구성됩니다. 워드프레스(WordPress) 등 해외에서 제작된 CMS의 대표적 특징은 콘텐츠는 단일 형식으로 규정하고, 콘텐츠의 분류나 속성을 별도로 부여하여 사용하는 것인데, 쉽게 생각하면 서류함에 들어있는 파일을 생각하시면 됩니다.



<node 단위의 도식화>


이 노드에 분류(Taxonomy)를 추가하거나, 입력 항목(필드, Field)를 자유롭게 설정하여 콘텐츠를 생산, 관리할 수 있습니다. 해당 콘텐츠를 분류할뿐만 아니라 노드 입력항목의 속성값 등을 이용해 콘텐츠를 다양한 형태와 방식으로 사용자에게 제공할 수 있습니다.


그리고 이러한 노드들을 콘텐츠(Contents) 화면에서 한 번에 조회하고 관리할 수 있습니다.

<콘텐츠 관리 화면>


또한, 개별 노드에 다국어 기능을 적용하고, 논리적으로 연결되는 node를 추가하여 동일한 콘텐츠의 여러 언어 버전을 효율적으로 관리할 수 있습니다.



콘텐츠 출력 및 API

우리가 게시판으로 인식하는 콘텐츠 목록은 위 노드(Node)의 묶음이라고 볼 수 있습니다. 제목, 작성일, 작성자, 분류 등 콘텐츠의 메타정보를 이용해 원하는 콘텐츠를 선택하거나 검색할 수 있는 화면입니다. 노드가 개별 파일이라면, 콘텐츠 목록은 파일이 들어있는 하나의 서랍(Drawer)으로 이해하시면 되겠습니다.

<파일 서랍, 출처: Pixabay>

<콘텐츠 목록화면>


필요한 경우 목록 우측 상단의 구독하기 버튼으로 XML 형식 출력을 파싱(Parsing) 받아 최신 문서의 정보를 별도의 용도로 활용할 수도 있습니다.

우리도 할 수 있을까?

지금까지 서울정책아카이브에 대해서 특징과 장점을 중심으로 살펴보았습니다. 만일 공공이나 민간영역 등에서 이와 유사한 사업을 준비할 경우 아래의 사항들을 중점으로 접근하시길 바랍니다.

준비

누구를 위해 무엇을 만드는 것인가요?

이것이 완성되었을 때 이용하고 혜택 받을 사람들이 누군지 생각해 보세요. 누가 어떤 식으로 이용하게 될지, 무엇을 위해 이용하는지 고민하는 것은 모든 시스템 구현에서 방향성을 수립하는 시작점입니다. 불특정 개인은 IT 감수성(이용 수준)도 모두 다르고, 이용하는 환경이나 익숙한 형식에도 차이가 있습니다. 물론 모든 사람들을 만족시키는 것은 매우 어렵지만, 주요 사용자 그룹을 정하여 그 범위를 설정할 때 프로젝트가 나아갈 수 있는 방향을 설정할 수 있습니다.


어떤 것을 담게 되나요?

콘텐츠의 종류와 속성을 정의하는 것은 생산과 제공방식을 결정할 수 있는 ‘키포인트’입니다. 접시에 국을 담을 수 없고, 호리병에 밥을 담아 제공하는 것은 이것을 먹으려는 사람을 난처하게 만듭니다. 웹 문서는 단순한 텍스트로 구성된 콘텐트부터 영상과 음성 등의 미디어 자료가 섞인 콘텐트까지 제공할 수 있는 범위에 거의 제한이 없습니다. 다만 이것이 보관되어 운영될 서버의 성능과 사양은 이용자의 수와 함께 보관될 콘텐츠의 용량, 사양, 속성이 복합적으로 고려되어야 하고, 제공되는 모양과 형태를 가장 이상적인 형태로 기획함과 동시에 실제 운용-생산 및 관리-할 수 있는 인적/물적 자원을 분배해야 합니다. 무한정의 자원을 가진 경우가 아니라면 보유한 자원을 효율적으로 이용하기 위해 충분한 고민이 필요합니다.


오픈까지 남은 시간은 얼마나 되나요?

사업을 진행하기에 앞서 허용된 투입자원과 일정을 면밀히 파악하여 분석-기획-설계-제작에 이르는 기간을 각각 충분히 확보하세요. 앞서 열거한 2가지의 속성이 미리 정의되었다면 바로 기획과 설계를 진행할 수 있겠지만, 충분한 분석과 계획 없이 일정에 쫒겨 진행된다면 제작 단계에서 마주치게 될 난관보다 완성되고 난 뒤 제대로 이용될 것이라는 기대를 하기 어렵습니다. 시간적 여유가 충분하다면 본격적인 사업에 앞서 소규모로 시제품(프로토타입)을 만들어 시장성 조사나 내부 테스트를 거치는 것이 큰 도움이 될 수 있습니다.


언제까지 제공될 예정인가요?

시일이 지나 완전히 바뀐 내용을 반영하지 못한 정보들은 오히려 정보가 없는 것보다 사용자를 실망시킬 수도 있습니다. 지난주에 한 블로그에서 찾은 2012년의 맛집을 찾아갔다가 부동산 앞에서 망연자실한 표정을 지었던 저처럼요. 아카이브의 특성상 특정 시일이 지난다면 파기해야 하는 자료가 있을지도 모릅니다. 문서의 생산과 제공만큼 중요한 것은 언제까지 자료를 공개/제공하는지, 언제 파기되어야 하는지 등에 대한 계획입니다.


정리

분류와 정리

이러한 사항들이 어느 정도 정리되었다면, 이제 종이와 비디오 테이프, 한글 및 PDF, 엑셀 파일, 녹음 테이프, 사진, 자필 편지 등 제공하려는 모든 자료들을 찾아 분류를 시작하시기 바랍니다. 분류 체계는 이를 접하는 사용자가 원하는 자료를 찾을 수 있도록 정확하고 상징적인 표현으로 구분되는 것이 중요하고, 이 때 아키비스트(Archivist, 기록보관인)의 도움을 받는 것도 좋은 방법입니다. 어떤 경우는 연대별로 정리하게 될 수도 있고, 특정 사건이나 주제별로 정리되기도 합니다. 웹사이트에 존재하는 콘텐츠들은 이를 다중으로 적용하여 필터링이 가능하므로 기본 분류를 중복으로 부여해도 무방합니다.


디지털 변환

하드카피(물리적 실체)로 존재하는 원본은 안전하게 보관되어야 하지만, 인터넷과 웹사이트를 통해 제공하려는 자료는 디지털 변환이 필요합니다. 스캔, 음성 및 영상을 디지털 전환(Digitization)하거나 수작업으로 전자문서화 하는 노력이 요구됩니다. 파일의 제목은 일정한 형식을 가지고 있어야 추후 일일이 문서를 열어보는 노력을 줄일 수 있으며, 특정 주제별로 폴더를 정리하면 이후 단계에서 더욱 시간을 절약할 수 있습니다. MacOS등 일부 운영체제의 경우 파일에 태그를 부여할 수 있으므로 이를 이용하는 것도 좋은 방법입니다.


마치며

이상으로 아카이브 형식의 웹사이트에 대해 살펴보고 이러한 것을 만들때 필요한 사항을 정리해보았습니다. 충분한 준비되었다면 이를 실행하고 구현할 팀과 함께 더욱 의미있는 사이트를 만들 수 있을 것입니다. 꼭 잊지 말아야 할 점은 ‘어떤 것’을 만드는 것 보다 ‘무엇을 위해’ 만드는 것인지를 매 순간 떠올리는 것입니다. 형식은 목적을 위해 존재하고 방법은 목적을 달성하기 위한 수단이라는 것을 기억하시길 바랍니다.