생물정보학과 생물데이터베이스에 대한 생각
생물정보학이란 학문이 있다. 웹이란 생물정보학에 매우 유리한 환경으로 생물전분야에 적용될 수 있음에도 불구하고 유독 우리나라에서는 유전공학에만 치우쳐 있는 것 같다. TOL(Tree of Life)나 EOL(Encyclopedia of Life)를 비롯해 여러 생물관련 데이터베이스도 생물정보학분야에 속한다. 국내에도 가장 대표적으로 국가생물종지식정보시스템이 구축되어 있지만 이는 크기만 거대해졌지 기존의 생물데이터베이스와 구조적으로만 보면 크게 달라진 것이 하나도 없다. 식물종정보와 연계된 점을 빼면 그리 나아진 것이 없다는 생각이다. 사진기반에 종정보를 제공하는 정도에 그치고 있다. 나 역시 대학에서 이 프로젝트에 수년간 참여했지만 기대치만큼은 아니었다고 생각한다.
그보다는 홈페이지의 외관은 별로였지만 영남대에서 운영했던 사이버자연사박물관의 시도는 매우 좋은 시도였다고 평가한다. 이용하는 입장에서는 국가생물종지식정보시스템이 방대한 도감과도 같아 이용하기에는 편리하다. 하지만 이는 중앙에서 자료를 수집하고 관리하는 중앙집중적인 데이터베이스다. 이에 비해 사이버자연사박물관은 전공자가 신청만 하면 아이디를 발급하여 의견을 올리고 자료도 업로드할 수 있는 시스템을 갖추었었다. 하지만 이는 국내의 연구자들이 자료를 쉽게 공유하지 않는 경향이 많아 제대로 자료수집이 되지 않았고 자료를 올리기에는 데이터베이스의 인터페이스가 완성형이 아니었다고 생각된다. 하지만 여느 대학박물관이나 대학의 생물관련 학과, 기관에서는 거의 보기 힘든 분산형 데이터베이스 구축방식이었다는 점이 눈여겨 볼 점이라고 생각된다.
이런 생각은 국외의 wikipedia가 국내에서 성공하지 못한 이유와도 동일하다고 생각된다. 국내의 위키서비스와 국외의 위키서비스를 비교해보면 우리나라의 위키백과사전은 자료의 양적인 면에서나 질적인 면에서도 크게 떨어진다. 모 강연에서 이런 이야기를 들은 적이 있는데 우리나라 사람들의 사고는 위키와 정서상 맞지 않으며 우리나라식의 위키는 네이버의 지식검색으로 대변된다고 했다. 지식의 공동작성의 형태가 아닌 개인이 작성한 질문과 답형식의 특이한 지식의 형태가 창출되었다는 것이다. 이는 국내의 생물데이터베이스 구축에도 눈여겨 볼 부분이라고 생각한다. 거대한 국가생물종지식정보시스템이 있음에도 그저 온라인의 거대한 도감으로밖에는 이용되지 않으며 사람들의 생각이 모이는 중심축이 되지 못하고 있다. 반면 장수하늘소.com이나 한국의 잠자리(http://www.jasa.pe.kr)등은 커뮤니티형태이나 사람들의 생각이 모이는 장이 되었다. 훌륭한 데이터베이스를 가지고도 중심축이 되지 못하는데에는 분명 이유가 있을 것이다.
개인적인 생각으로는 국가생물종지식정보시스템은 쪼개져야 한다. 통합검색의 장점을 살리되 영국자연사박물관의 데이터베이스처럼 주제별로 분류군별로 쪼개어져 다양한 검색엔진을 개발하고 분류군별로 보다 체계적인 데이터베이스를 구축하고 이를 재활용할 수 있도록 인터페이지의 개선도 필요하다. 국가생물종지식정보시스템이 정보의 장이 되지 못하는 가장 큰 이유는 소수의 관리자가 관리하기에는 너무나 큰 범위의 종을 다루고 있기 때문이다. 위에서 언급한 사이트도 특정분류군만 다루는데도 관리자나 운영자의 노력이 상당히 많이 들어간다. 이런 노력은 지속적으로 동호인들을 모으고 자연스럽게 정보들이 쌓여나가는 것이다.
EOL(Encyclopedia of Life)이나 국외의 생물데이터베이스를 모니터링해보면 정보가 잘 연계되어 있다는 것을 알 수 있는데 개인이 운영하더라도 사이트의 정보가 좋으면 서로 연계하여 정보를 통합 제공하여 이용자들의 편의를 돕고 있다. 홈페이지의 DB를 구축하는 것과 별도로 이를 xml과 같은 형태로 일정한 규격으로 정보를 가공하여 정보를 공유하고 어느 곳에서 검색하더라도 해당 사이트의 해당정보로 이동해 줄 수 있는 중계가 필요하다. 즉 통합이 필요하다는 것인데 이는 또 하나의 거대한 데이터베이스를 만들자는 것이 아니라 기존의 작은 여러개의 사이트를 그대로 두고 이들 정보를 효과적으로 모아 제공해주는 통합엔진의 개발을 이른다.
GBIF에 등록된 국내 생물데이터베이스중에 우리나라는 국립수목원이 가장 상위에 위치해있고 전세계 20위 안에 들어있는 것을 본 적이 있는데 단순히 종수, 혹은 개체수가 아니라 기존의 개인 및 공공기관에서 구축된 정보만 잘 모아도 훌륭한 데이터베이스가 될 것이란 생각이 든다. 다소 현실감이 없을지느 모르겠지만 국가에서 개인사이트를 포함해 양질의 생물데이터베이스를 구축, 운영하고 있는 곳에 도메인이나 홈페이지 계정을 유지해준다거나 일정 지원금을 지속적으로 지원해주는 방법도 좋지 않을까 생각해 본적이 있다.
0 개의 댓글:
댓글 쓰기