어울림 - 자연과 어울어지기, 그 첫걸음

About Me

자연을 공부하는 人입니다. 생물의 죽살이 뿐 아니라 그들과 함께 해온 문화와 이야기도 함께 알아가고 싶습니다.

I am studying nature. I want to know not only the life history of living things, but also the culture and stories they and humans have shared together.

Search

License


more detail
블로그의 모든 글과 이미지는 기본적으로 상기의 Creative Commons License를 따르며 기타 인용한 내용이나 스크랩한 글들은 모두 해당 저자에게 저작권이 있음을 알립니다.

Profile

생물목록의 배포방식에 대해서


내가 대학에서 공부하고 있을 때만해도 동물 관련 목록집은 한국곤충명집, 한국동물명집이 있었다. 곤충관련 일을 하면서 식물목록은 따로 없어서 대한식물도감의 종목록을 워드로 쳐서 활용했었다.
이외에 각 분야마다 목록집이 따로 나오거나 했지만 누구나 접하기 용이한 대표적인 목록은 위 2개가 대표적이었다. 그러나 오랫동안 업데이트가 되지 않아 분류군별로 개별적으로 최신의 데이터를 반영한 자체적인 목록을 활용하는 경우가 많았다. 연계의 문제였는지 인력의 부족때문이었는지 혹은 여타의 이유때문이었는지는 모르겠지만 참고할만한 신뢰도있는 생물목록이 없어 직접 목록작업을 하는 개인들도 많았다. 곤충명집의 경우는 학회에서 1994년 한국곤충명집 출간이후 16년만에 여러 분류군의 연구자들이 모여 목록이 나올 정도로 업데이트의 주기가 길었다.

최근 산림청의 국가표준곤충목록이 만들어졌다. 국립생물자원관에서는 국가생물종목록집을 웹으로도 검색이 가능하도록 서비스하고 있다.

국가 단위의 목록집이 나오고 있는데 분리되어 목록이 관리되고 있다는 것은 사용자입장에서 답답하다. 곤충과 식물은 산림청과 국립생물자원관에서 따로 목록작업을 진행중이다. 이는 연구자들간의 의견차인가? 아니면 관리하는 기관들간의 알력다툼인가? 잘은 모르겠지만 참 소비적인 것 같다. 이런 목록작업은 대단한 시간, 노력, 비용이 소요되는 작업인데 왜 이중으로 작업되고 있는지 모를 일이다. 필요상 어쩔 수 없다면 최소한 목록관리자 혹은 관련 연구자라도 연계가 잘 되어 두 목록이 이질적이 되지 않도록 최대한 노력해야 하는 수고로움은 필요해보인다.

책과 같은 출간물의 형태가 아닌 디지털텍스트로 목록이 제공된다는 것은 많은 장점을 가진다.
대표적으로

사용자입장에서는
1. 검색이 가능하다.
2. 특정 분류군만 모아볼 수 있다.
3. 잘못된 부분을 쉽게 제보할 수 있다.

제공자입장에서는
1. 추가 및 수정, 삭제의 업데이트가 쉽다.
2. 잘못된 부분에 대한 오류에 대해 의견을 받기 쉽다.

이외에도 많은 장점이 있겠다.
이런 기본적인 데이터베이스의 장점을 제외하고도 목록으로 할 수 있는 것들은 많다.
활용적인 측면에서는 효과적인 배포방식이 중요하다.
관리하는 기관에서도 목록이 중요한 프로젝트의 결과물이겠지만 공개를 하겠다면 제대로 목록을 제공하는 것이 좋겠다는 생각을 가지고 있다. 개인차원에서도 공부하는 사람들에게는 목록활용에 대한 아이디어가 더 다양할 수 있다. 주요포털에서 API를 제공하여 회사의 서비스를 이용자들이 이용하도록 하여 그 아이디어의 일부를 서비스에 실제로 응용하는 것들을 보면 왜 이 작업이 필요한지를 쉽게 이해할 수 있을 것이다. 하지만 이와 동일선상에서 검색 API의 형태로 공개하는 것은 재고가 필요하다. 이는 프로그래머정도의 수준이 되어야만 활용할 수 있는 것으로 일반성이 떨어진다. 더 많은 사람들이 활용할 수 있도록 하기 위해서는 csv나 엑셀파일형태로 제공해주는 것이 더 편리하다.

현재 산림청에서는 국가표준식물목록, 국가표준곤충목록, 국가표준지의류목록을 엑셀파일로 다운로드 할 수 있도록 서비스를 제공중이다. 아직 국립생물자원관의 국가생물종목록집은 다운로드는 불가하며 검색만 제공한다.

개인적으로는 생물목록의 배포방식이 더 개선되기를 바란다.
목록은 계속 업데이트되고 있다. 제대로 목록이 관리되기를 바란다면 많은 연구자들이 목록작업에 쉽게 의견을 제시해야함은 물론 관심있는 이는 연구자가 아니더라도 누구나 의견을 낼 수 있어야 한다.

목록은 업데이트 주기가 있어 목록이 업데이트되면 이전 목록들로부터 변경된 내역을 정리해주어야 한다. 이는 데이터베이스 설계시 제대로 테이블을 설계했다면 자동으로 내역을 정리할 수 있을 것이다. 이것이 중요한 이유는 이전 목록을 활용하여 프로그램을 만들었거나 개인적인 활용을 한 경우 새로운 목록이 나오면 변경된 부분이 어느 곳인지 모르기 때문에 업데이트가 어렵다. 변경된 부분이 꾸준히 정리되어 제공된다면 이 부분만 주기적으로 체크하여 수정하면 되기 때문에 매우 편리할 것이다.

목록은 엑셀파일형식이 아닌 출간물형태의 목록으로 텍스트파일로 제공되는 것도 고려해볼만 하다. 이유는 가시성이 좋기 때문이다. 개인적으로 일본의 List-MJ(http://listmj.mothprog.com/)는 참고하기 아주 좋은 목록으로 목록작업의 좋은 예라고 생각하고 있다. 이 목록은 Moths of Japan이라는 일본의 가장 권위있는 나방도감의 목록을 기반으로 지속적으로 관리되어 온 것으로 웹이 활성화되기 전에는 소책자 형태로 제공되다가 웹으로 서비스되기 시작했다. 내가 알기로만 10년 넘게 지속된 목록서비스다. 또한 대만의 경우에도 생물종목록을 홈페이지에 전면 공개하며 제공하고 있다. TAIBNET - Catalogue of Life in Taiwan(http://taibnet.sinica.edu.tw/home_eng.php)는 여러 방식으로 종명을 검색할 수 있고 다양한 포맷으로 목록 전체를 다운로드 할 수 있다. pdf버젼은 인쇄판인 듯 한데 2008년 발행본이후 업데이트가 계속 되고 있는지는 확인이 안되지만 온라인 버젼인 txt, xml형식은 지속적으로 업데이트되고 있다. 목록을 다양한 필터링으로 검색이 가능하고 목록제공자도 공개하고 있으며 관련전문가를 내부에서 정하는 것이 아니라 외부에서 자유롭게 등록이 가능하다.

이전에 작성한 글에서도 국가표준식물목록은 국내에서 처음으로 국가기관에서 생물목록을 엑셀파일형태로 일반인에게까지 제공한 최초의 시도였다. 목록의 정확성에 대해서 지적하는 분들도 있지만 잠시 제쳐두고라도 책형태의 목록집이 아닌 디지털형태의 텍스트를 바로 활용가능한 목록이 제공된다는 것은 큰 혜택이었다. 이는 생물에 관심있는 프로그래머라면 누구나 대환영할 일이다. 책형태의 식물목록을 모두 워드로 치치 않아도 활용가능한 최신목록을 항상 구할 수 있다는 것은 아주 많은 혜택을 제공한다. 웹도감같은 것을 만들 때도 이 목록을 기반으로 게시판을 짜거나 테이블을 설계하는데 참고하기가 좋아졌기 때문이다. 생물목록이 많은 사람들의 의견을 반영하여 정확도를 찾는 것은 결국은 연구자들의 몫이겠으나 목록을 기반으로 많은 아이디어를 내는 것은 굳이 연구자들만 할 수 있는 것은 아니라는 생각이다. 최대한 오픈해야 한다고 생각한다. 가능한 많은 형태로 다양한 포맷으로 제공되어야 한다.

지금은 굳이 책으로 생물목록집을 공개하지 않아도 될 정도로 온라인이 활성화되었다. 시대에 맞는 목록작업과 책에서 얻을 수 있는 정도의 목록서비스가 아니라 데이터베이스다운 생물목록집의 면모를 제대로 보여주어야 한다. 실제로 산림청의 생물목록(국가표준식물목록, 국가표준곤충목록, 국가표준지의류목록), 국가생물종목록집 서비스를 체험해보면 답답함을 쉽게 느낄 수 있다.

생물목록은 생물관련 홈페이지나 관련 프로그램 등의 가장 기반이 되는 자료이다. 이 목록이 통일성 있게 관리되고 제공된다는 것은 이 목록을 동일하게 사용한 프로그램간에는 자연스럽게 호환도 쉽게 되고 서로 내용을 신뢰하기도 쉽다. 내 경우 특정 분류군의 목록뿐만 아니라 생물 전반의 목록을 수집하고 있는데 이는 생물상호간의 관계에 관심이 많기 때문이다. 여러 분류군에 관심을 가질수록 그만큼 해당 분류군들의 기본 목록이 필요하기 마련이다. 그래야 해당 목록의 종들에 대해 체계적으로 정리도 가능하고 상호관계를 분석하기도 편리하기 때문이다. 하지만 여러 분류군에 관심을 가질수록 주된 분류군 이외에는 깊이있고 신뢰도 높은 정보를 고르는데에 시간이 걸리기 마련이다. 목록작업이 잘 되어 있고 서비스가 잘 되어 있을수록 이런 연계된 연구에 큰 도움이 될 수 있다. 분류군 하나하나를 보면 단순목록에 불과하다고 생각할 수 있지만 여러 가능성을 고려해본다면 목록들은 가장 중요한 기반자료라 할 수 있는 것이다. 이것이 기반 목록 관리가 중요한 이유이며 배포가 최대한 가공하여 활용하기 쉬운 형태로 제공되어야 하는 이유이다.