어울림 - 자연과 어울어지기, 그 첫걸음

About Me

자연을 공부하는 人입니다. 생물의 죽살이 뿐 아니라 그들과 함께 해온 문화와 이야기도 함께 알아가고 싶습니다.

I am studying nature. I want to know not only the life history of living things, but also the culture and stories they and humans have shared together.

Search

License


more detail
블로그의 모든 글과 이미지는 기본적으로 상기의 Creative Commons License를 따르며 기타 인용한 내용이나 스크랩한 글들은 모두 해당 저자에게 저작권이 있음을 알립니다.

Profile

생물정보학에 대한 생각2


아래 글을 읽으면서 공감하는 부분이 여러 곳 있었다. 요즈음 대학시절에 교양과목보다는 컴퓨터관련 수업을 더 들었으면 좋았을 걸 하는 생각이 자주 드는데 한편으로는 그때 프로그래밍을 배웠다면 아마도 야외에서의 경험이나 느낌들이 반감되었을지도 모르겠다는 생각도 들기에 지금의 프로그래밍 공부가 늦은 감이 있지만 한편으로는 다행이라는 생각도 든다. 이유인 즉, 프로그래밍이라는 것이 수학적기반과 프로그래밍 언어의 이해를 필요로 하는 일이지만 내게 있어 프로그래밍은 그동안 야외에서 경험하고 배우고 익힌 것들을 보다 포괄적으로 바라보고 자료들을 보다 편리하게 활용하기 위한 것이어서 자연을 바라보는 시각이나 경험이 프로그래밍에 무엇보다도 중요한 전제조건이었기 때문이다. 프로그램을 설계하는 과정에서 이전의 프로그래밍에 대한 무지가 안타깝기도 하지만 야외에서의 많은 경험이 실제 프로그래밍 과정의 여러 면에서 도움이 될 때가 많았다. 채집을 다닐때나 보고서를 작성할 때, 연별 통계를 내거나 자료를 통합하고 정리할 때 불편했던 점, 바랬던 점들을 보다 구체화하여 프로그램을 만들어내고나면 당시 조금이라도 프로그래밍을 할 수 있었다면 훨씬 편리하고 빠르게 일을 마쳤을텐데 하는 아쉬움이 절로 나오지만 그때 고생한 덕에 문제점이 무엇이었는지에 대한 고민은 어느정도 해 둔 셈이어서 프로그램 설계시 도움이 많이 된다.

이전에 다른 저자의 글에서 읽은 기억이 나는데 프린스턴대학에서 1학년 1학기 과정에 프로그래밍과정을 넣은 것은 내게도 부러운 일이었다. 어떤 프로그래밍 언어를 선택하느냐가 문제일 수 있겠지만 적어도 프로그래밍적인 사고를 할 수 있는 계기가 되기만 해도 충분하다고 생각한다. 내 경우 프로그래밍은 비주얼베이직을 한 학기 배우고 무모하게 배운 자바 한 학기(거의 알아듣지 못함, 객체지향이 뭔지만 알아들었음. ^^;;)가 정규과정으로 배운 전부다. 웹프로그래밍은 2000년 군에서 정보화교육으로 받은 1주일짜리 html교육을 시작으로 독학으로 홈페이지를 운영하다가 2007년에 php, mysql을 본격적으로 접했다. 데이터베이스를 접하면서 전공이 도움이 되었다. 분류체계를 다루고 유형화하던 경험이 데이터베이스를 설계할 때 많은 도움을 주었다. 프로그래밍 언어는 외국어처럼 하나의 언어를 습득하는 과정으로 자신이 생각하는 바를 컴퓨터가 알아들을 수 있는 언어로 설명해 처리하도록 하는 것이다. 물론 코딩하는데 여러 기술도 필요하고 경험도 필요하겠지만 가장 중요한 것은 역시 프로젝트를 진행하는 개발자의 문제의식과 경험이 아닌가 싶다. 몇년간 공부를 했지만 아직도 스스로를 초짜라고 부른다. 정규과정없이 독학으로 한 거라 기초가 부족하고 책 몇권과 웹에 공개된 여러 동영상 강좌로 익힌 실력이라 아직 부족한 게 많다. 한참 공부하다가 문득 통계청의 TV광고를 보면서 '당신의 능력에 통계를 보태세요'라는 멘트가 참 크게 다가온 적이 있는데 솔직히 문제의식이 먼저냐 기술이 먼저냐를 두고 어느것이 먼저 갖추어져야 할 항목이라고 말하기는 어려울 것 같다. 그리고 모든 사람에게 프로그래밍 기술이 필요한 건 아니라고 생각한다. 내 경우 단지 데이터베이스가 하는 일에 필요했고 여러사람과 실시간으로 구축할 수 있는 방식이 오프라인이 아닌 온라인방식이었기 때문에 웹프로그래밍을 선택했을 뿐이다. 구입해두고 몇년을 방안 책꽂이에 꽂아두었던 PHP책을 집어든 것은 아마도 그때가 공부할 시기라고 판단했기 때문이었을 것이다. 그 전엔 몇번을 보려고 해도 몇장을 넘기지 못하고 덮곤 했는데 어느날부터인가 시작해 몇년을 꾸준히 공부해왔다.

이전과 비교하면 지금은 인터넷상에서 찾을 수 있는 정보의 양이 엄청나게 늘어났다. 내 경우만 해도 논문 주제였던 '곡식좀나방과', 'tineidae'을 비롯한 많은 검색어로 웹페이지를 검색해도 유용한 정보를 찾기가 정말 어려웠는데 지금은 찾을 수 있는 자료의 양이 비약적으로 늘어났다. 지금은 정보를 창출하는 것 못지 않게 방대한 자료를 어떻게 하면 효율적으로 수집하고 활용하느냐도 중요한 기술이라고 생각한다. 채집을 다니면서 자주 들었던 생각중 하나가 개인이 야외에 나와서 경험하는 것들중 적어도 한두가지는 쓸모있는 정보가 있기 마련이다. 하지만 구슬도 꿰어야 보배라고 개별지식만으로는 소용이 되는바가 적을 때가 많다. 그래서 보통은 카페나 동호회에서 활동하면서 사진이나 경험한 내용을 공유하지만 이마저도 자료가 쌓이면 검색의 어려움으로 활용하기가 어렵다. 당시엔 프로그래밍을 할 수 없고 단순히 html과 php를 약간 수정하는 정도의 수준이어서 시도해보지 못했지만 기본적인 아이디어는 당시에 생각한 것 같다. 개인이 경험하는 작은 정보를 모을 수 있는 데이터베이스를 만들어보자는 것이다. 보통 종명을 알아야 종정보데이터베이스를 구축하지 않느냐 하지만 꼭 그렇지 않아도 유용한 정보를 수집할 수 있다. 이는 데이터베이스의 구조적인 문제가 아니라 인터페이스의 문제라고 생각한다. 쉬운 인터페이스와 사용자의 수준에 맞도록 페이지를 구분하여 정보를 수집하면 개개인의 작은 관찰기록이나 경험들을 모아 가공하여 유용한 형태로 제공함으로써 많은 사람들이 활용할 수 있을 것이다.

생물정보학이라는 표현을 쓰고는 있지만 생물학이라는 큰 틀 중에서도 유독 생물정보학이라는 단어로 검색해보면 대부분이 이슈가 되는 유전학, 분자생물학분야에만 한정된 용어로만 해석되고 있다. 생물학과 전산학, 화학, 수학적 조합을 통상 생물정보학이라고 하나 국내 교육과정은 한정된 분야에 치중하고 있는 것이 사실이다. 아래 저자가 사례를 든 경우도 대부분 한정된 범위라고 생각된다. 또한 생물정보학에 활용되는 프로그래밍 언어로 Perl를 자주 예로 드는데 꼭 그렇지만도 않다. Perl이 여러가지 장점이 있기는 하겠지만 언어는 자신에게 맞는 것을 선택하는 것이 맞지 않을까 싶다. 내 경우 곤충분류학을 전공했기 때문에 프로그래밍을 공부하면서 국내외의 많은 데이터베이스를 접했다. 한가지 예만 들어보면 국내의 자연사 박물관 중에서 보유한 표본목록을 제대로 데이터베이스로 제공하고 있는 곳은 거의 없다. 제공되는 형태 역시 거의 피차일반이다. 만약 연구자가 박물관의 수장고에 표본을 검색하러 방문하기를 원하는 경우 대략적인 정보를 제공해주는 것이 이런 종목록일 것이다. 하지만 현재는 대부분 직접 방문해서 직접 찾아야만 표본정보를 확인할 수 있는 경우가 대부분이다. 2005년 이화여자대학교 자연사박물관에서 자원봉사를 하면서 수장고의 종목록이 있는지 문의했으나 조류표본은 작성하다가 중단된지 오래되었고 곤충표본은 손도 못대고 있었다. 4개월간 주당 2-3번씩 방문하여 양서파충류, 어류, 포유류, 조류표본의 종목록을 엑셀로 정리해서 보내주었지만 아직도 웹상에서 파일형태는 물론이고 검색기능을 제공해주지도 않는다. 인력의 부족 때문일수도 있겠지만 인식의 부족 때문이라는 생각이 든다.

자료의 양은 점점 많아진다. 이제는 자료의 수집뿐 아니라 그 자료를 최대한 활용할 수 있는 최적의 데이터베이스의 개발이 중요하다고 생각한다. 국내의 생물관련 데이터베이스는 대부분 나열식이며 약간의 검색기능과 정렬기능이 대부분이다. 또한 이미지 중심적인 데이터베이스인 경우가 대부분이다. 국외에서는 텍스트기반의 데이터베이스도 많이 제공되고 있다. 위에서 예를 들었지만 웹상에서 보유한 표본목록 전체를 다운받거나 열람할 수 있도록 제공하고 있는 곳이 많다. 텍스트기반의 데이터베이스는 일반인이 이용하기에는 불편할 것이다. 하지만 전공자들에게는 사진이 굳이 없어도 텍스트만으로 된 데이터베이스이기에 빠른 속도로 자료를 검색해 원하는 결과를 열람할 수 있다. 같은 데이터베이스로 인터페이스만 달리해 제공하는 형태라면 굳이 이미지기반일 필요는 없다고 생각한다.

단순히 자료를 열람할 수만 있으면 되는가? 실시간으로 검색한 결과를 엑셀이나 텍스트파일의 형태로 다운로드 받아 실제로 활용할 수 있는 곳도 있다. 데이터베이스를 구축하는 것은 해당기관이 보유한 자료를 단순히 외부에 이만큼의 자료를 가지고 있다고 공개하는 것이 아니라 기관내에서는 보유한 자료나 표본을 효율적으로 관리하는 툴로, 이용자는 정보를 편리하게 이용할 수 도구로 사용할 수 있어야 한다. 쉽게 말하면 장식용이나 대외 선전용이 아니라 편리하라고 만드는 것이다. 정보를 창출하는데 있어서도 편리해야 하고 정보를 이용하는데 있어서도 가능한한 편리함을 추구해야 한다. 한마디로 인터페이스에 관한 문제이다. 내 생각에는 이런 인터페이스에 대한 고민이 국내 생물관련 데이터베이스에는 많이 부족하다고 생각한다. 단순히 생물종의 설명에만 치중한 데이터베이스방식은 앞으로 변할 것이다. 기관내에서 제공하는 형태적이거나 단순한 생활사 설명에 그치는 단조로운 방식에서 벗어나 앞으로는 분류군간의 강화된 연동방식, 생태적, 환경적 측면까지 고려된 생물데이터베이스가 출현하게 될 것이다.

생물주권문제가 국제적인 문제로 대두되면서 국립생물자원관을 기점으로 한국생물지사업이 진행되고 성과물이 나오기 시작하는데 1차적인 목표는 아마도 우리나라에 서식하는 생물자원의 정확한 종리스트의 확보라고 생각된다. 다른 분류군도 마찬가지이겠지만 국내의 곤충명집은 1994년에 출간된 것으로 이후 한번도 업그레이드 되지 못하고 연구자들간의 임시적인 자료교환으로 목록이 만들어져 왔다. 해당 연구자들에게야 별 문제가 없었을지 모르겠지만 정확한 종목록없이 아마추어 연구자들이나 취미로 하는 사람들에게는 많은 경우 잘못된 종정보를 이용하게 하는 현상이 반복되어 왔다. 최근의 국가표준식물목록사업이 가장 이상적인 형태라고 보여지는데 그 자료도 완전히 정확한 자료는 아니라고 하지만 꾸준히 업데이트되고 오류가 수정되는 형태라 신뢰할 수 있다. 앞으로의 한반도생물지사업의 방향도 생물지전체까지는 아니더라도 최소한 종목록은 공개되어 실시간으로 오류가 수정되고 꾸준히 업데이트되는 방식이었으면 싶다. 종목록은 생물을 기반으로 정보망을 구축할 때 가장 기반이 되는 기반정보이기 때문에 필히 지속적인 지원과 관리가 필요한 부분이라고 생각한다. 또한 종목록은 출판과 별개로 파일형태로 제공되는 것이 좋지 않을까 싶다. 연구결과물이기 때문에 제공이 안되거나 비매품으로 배포하거나 하는 것은 바람직하지는 않은 것 같다. 한반도 생물지사업이 국가생물주권을 위한 전제조건이기도 하지만 정확한 생물명의 보급이라는 측면도 무시할 수 없는 부분이지 않을까. 파일형태로 제공되면 여러가지 이점이 있다. 일단 프로그래밍시 기본자료로 활용도가 높다. 또한 보편적으로 활용할 수 있어 웹상에서 정확한 종명의 사용확률이 높아진다. 생물종사업에 대한 인지도를 높일 수 있고 국내 종현황에 대한 일반인의 인식도 높아질 수 있다.

생물정보학이 현재의 범위에 머문다면 또 하나의 학문분야로서만 인식될 것이다. 학문이 전문성을 전제로 하지만 범용적인 지식의 창출과 일반화를 의무로 하는게 맞다면 생물정보학으로 인한 결과물이 전문가뿐 아니라 일반 사용자에게도 편하게 다가갈 수 있도록 포괄적인 범위로 바라봐야 하며 인터페이스에 대한 고민도 충분히 고려되어야 한다는 생각이다.

0 개의 댓글: