어울림 - 자연과 어울어지기, 그 첫걸음

About Me

자연을 공부하는 人입니다. 생물의 죽살이 뿐 아니라 그들과 함께 해온 문화와 이야기도 함께 알아가고 싶습니다.

I am studying nature. I want to know not only the life history of living things, but also the culture and stories they and humans have shared together.

Search

License


more detail
블로그의 모든 글과 이미지는 기본적으로 상기의 Creative Commons License를 따르며 기타 인용한 내용이나 스크랩한 글들은 모두 해당 저자에게 저작권이 있음을 알립니다.

Profile

GBIF & KBIF


'GBIF'단어로 네이버 검색을 해보면 아래의 두 사이트가 가장 위쪽에 노출된다.

세계생물다양성정보기구
http://www.gbif.org/

한국생물다양성정보기구
http://www.kbif.re.kr/

자세한 내용은 모르지만 예전에 관심있게 보면서 제공해주는 번역문서들을 죽 본 적이 있다. 이들 기구에서 하는 가장 중요한 일은 생물다양성을 어떻게 파악할 것이냐에 대한 방법론적 연구일 것이다. 각 지역별 혹은 국가별 생물다양성을 파악하려는 노력은 지속적으로 이루어져왔지만 한번도 전세계적인 규모의 생물다양성을 파악하고자 하는 노력은 있었다고 하더라도 개인 혹은 단체로서도 굉장히 어렵고 오랜 시간 및 비용을 소요하는 일로 일부 분류군에 한정되어 작업이 이루어져왔다.

GBIF에서 방법론으로 제시한 것은 표준안이라고 생각한다. 전세계에 이미 존재하는 혹은 앞으로 만들어질 데이터베이스의 구조적인 문제를 해결하기 위한 방안으로 이에 대한 표준안을 제시하는 방법이다. 예를 들어 엑셀에 전세계 종목록을 정리한다고 했을 때 각 나라마다 저마다 다른 양식으로 정리해서 보내주면 이를 합칠 때 서로 다른 양식으로 난관에 부딪히기 마련인데 정리방식에 대한 표준안을 먼저 제시한 후 자료를 모은다면 작업이 훨씬 수월해지게 된다. 이를 위해서는 여러가지 방법이 가능한데 적은 양의 자료를 정리한다면 엑셀로 정리해도 되겠지만 웹이나 배포 프로그램을 통해 데이터베이스를 구축하는 것이 가장 손쉬운 방법이다. 방식은 데이터베이스의 구조에 대한 기본 설계도(Schema)를 프로젝트에 참여시 제공해준다. 그럼 해당 국가 혹은 기관, 개인은 제공받은 설계도대로 DB를 설계하고 자료를 입력한 뒤 나온 목록을 표준안에 맞게 내보낸 뒤 출력해서 제출한다. 프로젝트를 관장하는 곳에서 제출된 자료를가 표준안에 맞는지를 검토한 뒤 통합하기만 하면 쉽게 결과를 낼 수 있게 되는 것이다. 프로젝트를 관장하는 곳에서는 단순히 표준안을 제시해주고 통합하는 역할이 주를 이룰 뿐 종정보의 정확도에 대해서는 실제 데이터베이스를 설계하고 자료를 입력하는 곳에서 책임지고 작성후 확인해야 한다.

한국생물다양성정보기구(KBIF)에서도 국내에서 가장 많이 이용되고 있는 웹 DB중 하나인 MySQL에서 사용할 수 있는 데이터베이스 스키마(schema)를 제공해주고 있는데 이곳(http://www.kbif.re.kr/download/sub05_6.do)을 방문하면 확인할 수 있다. 파일을 다운로드 받은 뒤 메모장이나 에디터로 열어보면 테이블의 구조가 SQL문으로 작성되어 있다. 데이터베이스를 공부한 사람이라면 쉽게 알아볼 수 있지만 간단히 설명하면 엑셀(excel)의 목록을 만들 때 각 열별로 어떤 항목들을 고려해서 만들어야 하는지를 제시해주는 파일이라고 생각하면 된다. 또한 지리정보를 활용하기 위해 몇가지 방법을 보여주는데 국내의 여러지도서비스를 활용하는 것도 좋지만 국내의 지도서비스는 한국에 한정되어 있어서 구글어스를 활용한 방법이 추천된다. 구글어스가 아니더라도 유사한 서비스를 제공해준다면 어느 곳을 활용해도 무방하다. 중요한 것은 경도, 위도와 같은 위치정보를 기준에 따라 통일통일해야 한다. 보통 세계측지계(WGS-84)를 많이 사용한다.

GBIF의 등록현황을 보면 국내에서는 산림청의 국가생물종지식정보시스템이 가장 많은 개체를 등록시켰는데 2000년 즈음부터 종정보DB사업이 여러 곳에서 활발히 진행되면서 GBIF에 많은 표본들이 등록되어 누구나 기본적인 정보를 검색할 수 있게 되었다. 국내에는 나리스(국가자연사 연구종합정보 시스템, http://www.naris.go.kr/)에서 각 기관별로 작성된 정보를 통합검색가능하다.

표준안이 중요한 이유는 바로 이런 점때문인데 기관별로 개별적으로 데이터베이스를 구축하고 자료를 저장했어도 표준안에 따랐으면 이미지나 파일같은 자료를 직접 제공하는 것이 아니라 기본이 되는 정보를 엑셀파일과 같은 포맷으로 제공만 해주면 다른 기관에서도 동일하게 검색이 가능하고 표준안에 따른 기관들간에는 정보를 공유하는 것이 그만큼 쉬워진다. 이것은 KBIF에서 제공하는 데이터베이스의 구조가 GBIF에서 제공해주는 폼과 동일한 경우 국내뿐 아니라 전세계 통합 검색엔진이 있으면 국내정보를 동일하게 검색해서 결과를 얻어낼 수 있다. 요약하면 데이터베이스를 구축한 곳에서는 직접 입력해 만든 자료로 이전과 동일하게 검색엔진을 만들 수 활용할 수 있는 것 뿐 아니라 다른 곳에 자료를 넘겨주기 편리해지고 사용자입장에서는 기관마다 일일이 돌아다니면서 자료를 검색하지 않고도 프로젝트에 참여한 기관의 자료를 한 곳에서 간편하게 검색하여 활용할 수 있게 된다.

보다 쉬운 예를 들자면 국내의 도서관검색방식의 변화를 보면 보다 쉽게 알 수 있다. 비교적 최근인데 도서관마다 개별적으로 구축했던 도서검색프로그램이 통합되어 지금은 전국 주요도서관의 도서를 한곳에서 모두 검색할 수 있다. 자신의 동네에 있는 도서관 홈페이지에 접속하면 전국의 도서관의 자료를 검색할 수 있는 것은 물론이고 대신 대여해주거나 반납해주는 서비스를 해주고 있다. 도서관에 가보면 정말 다양한 책들이 다양한 방식으로 정리되어 있고 책마다 고유한 번호를 부여받아 관리되고 있는 것을 볼 수 있는데 이는 생물분류방식과 상당히 많이 닮아있으며 방식도 유사하다. 생물분류만큼이나 도서관의 역사도 오래되어 사서의 도서분류방식에 대한 연구도 역사가 깊은데 방법론은 생물학이나 사서학이나 유사한 점이 많으므로 참고하면 도움이 많이 된다.

논문검색방식도 마찬가지다. 연구자는 논문검색시 논문과 함께 논문을 효과적으로 관리하기 위해 웹프로그램이나 Endnote와 같은 프로그램을 구매하여 논문목록을 DB로 관리하는 경우가 많은데 논문검색홈페이지에서는 다양한 포맷으로 해당문헌의 정보를 제공해준다. 예를 들면 Tagged(EndNote Tagged formatted file), XML(XML formatted file), BibTex(BibTEX formatted file)과 같은 형식이다. 이미 사용하고 있는 사람은 알고 있겠지만 논문검색시 구석에 작은 아이콘으로 표시되어 있으며 누르면 파일형태로 다운로드 받을 수 있다. 이를 이용해 사용자는 통합된 데이터베이스의 정보를 활용하면서 자신만의 데이터베이스를 만들 수도 있고 이렇게 새롭게 만들어진 DB를 필요로 하는 사람들과 재공유할 수도 있게 된다.

표준안의 장점은 분명히 있다. 하지만 표준안은 표준안일 뿐이라고 생각한다. 생물의 경우 분류군별로 데이터베이스의 구조가 따로 있는 것도 아니고 보통 생물통합으로 제공되는 것이기 때문에 데이터베이스 설계시 너무 많은 항목을 고려한 구조일 수 있다. 쉽게 설명하자면 구축하려는 데이터베이스는 단순한데 엑셀에 너무 장황한 표를 그려놓고 목록을 작성하는 것과 같다. 표준안은 참조만 하면 된다. 중요한 것은 표준안을 꼭 참고한 다음 데이터베이스의 기본정보를 내보내어 공유할 때 표준안의 형식으로 가공하여 내보내기를 하면 된다. 이런 식으로 기존에 구축되어 있는 데이터베이스도 약간의 수정만으로도 표준안에 부합되는 결과물을 얻어낼 수 있다. 단 요구되는 정보의 양이 적을 수 있겠지만 일단 표의 구조는 동일한 포맷으로 변경할 수는 있다. 데이터베이스의 구조를 통일시키자는 것이 아니라 자료를 공유할 수 있는 공통의 포맷을 만들자는 취지이기 때문에 원하는 데이터베이스의 최적화된 형태로 구축하면 된다. GBIF나 KBIF에서 제공해주는 표준안을 자세히 살펴보면 앞서 이야기 했듯이 많은 생물종에 공통으로 적용할 수 있는 구조를 만들려는 노력이 보이는데 실제 구축할 데이터베이스는 일부 분류군일 경우가 대부분이므로 일부는 생략해도 무방하다는 것이다. 즉 데이터베이스의 구조를 획일화시키는 것이 아니라 자료교환시 데이터의 포맷을 표준화하자는 것이라고 보아야 할 것이다.

국립생물자원관에서도 개인표본의 현황을 체크하기 위해 공문을 발송한 것을 본 적이 있는데 2000년경부터 시작된 주요 대학, 기관, 단체의 표본정보는 대략 파악이 되었고 해마다 약간씩만 업데이트되면 되지만 이보다는 못하겠지만 전국에 흩어져 있는 개인표본의 현황파악이 중요하다는 것을 정부차원에서도 인지한 결과라고 생각된다.

에드워드윌슨을 필두로 시작된 생명의 백과사전 (EOL, Encyclopedia of Life, http://www.eol.org/) 프로젝트는 대표적인 전세계적인 규모의 생물종 파악을 위한 좋은 사례이다. 생물을 바라보는 시각이 범세계적이라는 발상이 간단해보이지만 결단을 내리고 실행한다는 것은 그리 쉬운 일이 아니다. 좋은 시작이라는 생각이 든다. 프로젝트의 크기만큼이나 참여자들도 많아 종종 접속속도나 검색속도가 느리기는 하지만 참고할만한 정보들이 많은 곳이다.

잘은 모르겠지만 EOL이 표본사진이나 표본정보 못지 않게 사진자료를 중요시 여기는 것처럼 국내에도 사진자료를 소중히 여기는 때가 올거라 생각된다. 생태사진은 표본을 직접 확인할 수 있는 것을 제외하면 표본이 제공하지 못하는 다른 많은 정보를 제공해주기 때문에 자료로서 충분한 가치가 있다.

국내에는 여러 생물관련 동호회나 카페, 블로그, 개인홈페이지가 많다. 모두 개성있고 성격에 맞는 형식으로 정리되고 있지만 이들 자료를 효율적으로 통합해서 검색하기에는 포탈의 검색엔진으로는 부족한 점이 많다. 차차 보완되겠지만 앞으로는 훨씬 쉬운 방법으로 국내의 생물이나 전세계 생물에 대한 정보를 손쉽게 검색하여 참고할 수 있는 시대가 오는 것도 멀지 않은 듯 보인다.