무버블타입과 정보의 가치.
무버블타입과 관련한 논의를 옮겨 싣습니다. 이코노미21과 이정환닷컴을 예로 들었지만 어느 정도 일반적인 현상이라고 생각합니다.
첫번째 글.
지난주에 '저 낮은 중국'이라는 책을 읽고 이코노미21에 서평을 썼다. 이 서평은 이코노미21의 온라인 사이트에도 올라간다. 물론 이정환닷컴에도 올라간다.
이코노미21 사이트는 닫힌 공간이다. 로그인을 해야 볼 수 있다.
그러나 이정환닷컴은 열린 공간이다.
일주일도 안됐지만 다음 검색에서 '저 낮은 중국'을 찾으면 이정환닷컴이 8번째로 뜬다. 물론 이코노미21 사이트는 뜨지 않는다. 이코노미21 뿐만 아니라 웬만한 신문이 모두 이 책을 소개하는 기사를 썼지만 적어도 인터넷 검색에서는 찾을 수 없다.
구글 검색에서 '부활'과 '일본경제'라는 검색어를 집어넣으면 이정환닷컴이 열두번째로 뜬다. 얼마전에 썼던 '부활하는 일본경제 이렇게 달라졌다'의 서평 때문이다. 이 서평은 358명이 읽었다.
이코노미21이나 다른 뉴스 사이트들, 그리고 이정환닷컴은 어떻게 다른 것일까. 뉴스 사이트는 직접 찾아가야 볼 수 있다. 가만히 앉아서 독자를 기다린다. 이코노미21이 기사를 보여주는 방식은 프리챌의 디카모니와 비슷하다. 외부로 어떤 링크도 갖지 못하며 다만 직접 여기까지 찾아와서 제목을 클릭해야 본문을 읽을 수 있다.
그러나 이정환닷컴은 각각의 페이지마다 수많은 링크로 바깥과 연결돼 있다. 이를테면 이정환닷컴을 전혀 모르는 독자들이 검색엔진의 링크를 타고 찾아든다. 이코노미21이나 뉴스 사이트들이 넓지만 결국 고립된 섬이라면 이정환닷컴은 좁지만 수많은 링크로 단단하게 연결된 대륙이다. 거미줄처럼 퍼져나간 수많은 링크가 익명의 독자들을 끌어모은다.
조회수는 느리지만 시간이 지날수록 놀라운 속도로 꾸준히 늘어난다. 링크가 강화되기 때문이다. 1일 페이지뷰가 7천을 넘어설 때도 있다.
김선일씨가 피살됐을 때 이정환닷컴의 방문자수는 두배 이상 늘어났다. 한달 전에 썼던 '알카에다의 미국인 참수'라는 글 때문이다. 짧고 특별한 내용이 없는 글이었지만 이 글의 조회수는 1만이 넘었다. 동영상 유포의 가능성 때문에 개인 사이트의 순위를 인위적으로 걸러낸 탓에 지금은 바뀌었지만 한때 '참수'라는 단어로 검색할 때 다음과 네이버, 야후의 검색에서 첫번째로 걸려들었다. 언론사 사이트의 수많은 관련기사들보다 이정환닷컴은 검색순위에서 단연 앞섰다.
'몬드라곤'으로 검색하면 당연히 이정환닷컴의 '몬드라곤에서 배우자' 서평이 검색된다. 몬드라곤을 주제로 글을 써서 이정환닷컴에 올려두는 것만으로 나는 수많은 익명의 독자들을 새로 만들게 된다. 내가 '대안연대회의'에 대한 글을 쓰면 대안연대회의에 관심있는 사람들은 그 글을 반드시 보게 된다. LG칼텍스정유의 파업에 대한 글을 쓰면 이와 관련한 정보를 웹에서 찾는 사람들에게 바로 연결된다. 당연하지만 이 당연한게 안되는 사이트가 훨씬 많다.
이를테면 웹 출판의 개념이다. 이런 작업을 계속할수록 인터넷의 네트워크에서 이정환닷컴의 영향력은 갈수록 커진다. 이를테면 나는 지금 네트워크라는 거대한 협업 시스템에 동참하고 있는 셈이다. 나는 변화의 가능성을 본다.
링크의 번식력은 무궁무진하다. 로그 기록을 보면 요즘은 '미역국'이라는 단어로 검색해서 들어오는 사람이 부쩍 늘어났다. 인터넷에 떠도는 미역국과 관련된 수많은 문서들 가운데 이정환닷컴의 미역국 조리법이 단연 검색 순위에서 앞선다. 이정환닷컴의 조리법이 더 훌륭해서가 아니다. 문제는 이정환닷컴이 웹 문서를 저장하는 방식에 있다.
이정환닷컴은 무버블타입이라는 프로그램으로 만들어져 있다.
무버블타입은 새로 글을 쓸 때마다 HTML로 된 하나의 독립된 페이지를 만들어 낸다. 대부분 게시판 프로그램이 별도의 데이터베이스를 저장하고 그때 그때 필요한 데이터베이스를 불러들여 페이지를 잠깐 만들었다가 없애는 것과 다르다.
이를테면 이정환닷컴의 '파업의 재구성'이라는 기사의 주소는 다음과 같다. http://www.leejeonghwan.com/media/archives/000268.html 깔끔한 고유 주소를 갖는다. 무버블타입에서는 이를 퍼머 링크라고 한다.
이코노미21의 지난주 커버스토리 '고구마 날다'의 주소는 다음과 같다. http://www.economy21.co.kr/newsanalysis/newsanalysis_read.asp?news_id=53135&icon=left1
이코노미21은 newsanalysis_read.asp라는 프로그램을 돌려서 53135라는 데이터베이스를 불러오고 그걸 정해진 규칙에 따라 조합하고 화면에 띄워서 보여준다.
무버블타입은 완성돼 있는 페이지를 그냥 보여주기만 하면 되지만 게시판 프로그램은 페이지를 보여주려면 먼저 CGI나 PHP 따위를 굴려서 페이지를 만들어야 한다. 이건 속도의 문제가 아니다. 우리가 링크를 클릭할 때 볼 수 있는 건 거의 비슷하지만 클릭하기 전에 페이지가 이미 존재하는 무버블타입과 달리 게시판 프로그램에서는 데이터베이스가 있을뿐 페이지는 존재하지 않는다.
이건 꽤나 심각한 차이다. 검색엔진은 무버블타입이 만들어낸 페이지는 읽을 수 있지만 게시판 프로그램의 데이터베이스나 있지도 않은 페이지는 읽지 못한다. 무버블타입은 각각의 페이지를 링크로 연결한다. 다른 블로그와 트랙백을 주고 받으면서 무버블타입의 링크는 더욱 늘어난다. 특히 링크에 비중을 두는 구글 같은 검색엔진은 무버블타입이 만든 페이지의 가치를 상대적으로 높게 평가할 수밖에 없다.
블로그는 개인이 직접 콘텐츠를 기획하고 생산하고 유통하는 1인 미디어다. 우리는 대중이 미디어를 직접 소유하고 담론을 만들어 내는 시대에 살고 있다. 적어도 이런 흐름에서 이코노미21 뿐만 아니라 언론사 사이트는 한참 뒤떨어져 있다. 변화는 빠른 속도로 진행되고 있고 어딘가 이런 변화를 먼저 따라잡는 사이트가 나타날 것이다.
핵심은 누가 네트워크에서 우위를 차지하느냐다. 웹에서 콘텐츠를 판매하려는 사람들은 블로그 특히 무버블타입의 가능성에 주목할 필요가 반드시 있다.
두번째 글. 박형영 선배 질문에 대한 답변.
박형영 선배의 질문에 답변합니다. 두서가 없지만 그냥 생각나는대로 적어봅니다.
먼저 비슷한 논쟁과 관련해 지난해 뉴욕타임즈 기사를 소개합니다. 좀 오래된 기사지만 시사하는 바가 많습니다.
참고 : "As Google Goes, So Goes the Nation" (뉴욕타임즈)
'세컨드 슈퍼파워'라는 말을 처음 쓴 데는 뉴욕타임즈입니다. 2월 17일, 이제 지구에는 두 개의 슈퍼파워가 있는데 바로 미국과 세계 민중의 여론이라는 내용의 기사였습니다. 그런데 한달 뒤 3월 31일 조금 다른 의미로 하버드 대학의 제임스 무어라는 사람이 '세컨드 슈퍼파워'라는 말을 썼습니다.
그런데 신기하게도 구글 검색에서 '세컨드 슈퍼파워'를 검색하면 뉴욕 타임즈 기사는 나오지 않고 제임스 무어의 글만 나옵니다. 어이가 없었던지 뉴욕타임즈는 5월 18일 칼럼에서 제임스 무어가 남의 노력을 가로채 자신의 명성을 쌓았고 구글의 검색결과를 오염시켰다고 주장합니다. (여기까지 호찬닷넷에서 참고했습니다.)
비슷한 사례는 조금만 찾아보면 수두룩하게 나옵니다. 자꾸 제 홈페이지 이야기를 해서 쑥스럽지만 만약 제가 이정환닷컴에 '로하스'를 주제로 글을 쓰고 몇일 지나면 그 글이 이코노미21 기사보다 더 중요한 비중을 갖게 될 수도 있다는 이야기입니다. 어이가 없지만 실제로 그렇습니다. 사이트의 지명도나 방문자 수나 모든 것이 뒤지지만 콘텐츠의 저장 방식에서 이정환닷컴이 훨씬 우월하기 때문입니다.
좀 복잡한 이야기로 들어가 보겠습니다.
검색엔진이 데이터베이스 방식의 콘텐츠를 읽을 수 있느냐. 이 부분에 대해 제 사이트에서도 논쟁이 좀 있었는데 아직 결론은 못내렸습니다. 좀더 전문적인 지식이 필요한 부분입니다. 제 영역은 아니니까 이코노미21에서 취재를 좀 해보셔도 좋을 것 같습니다.
그러나 검색엔진이 데이터베이스 방식의 콘텐츠 보다 완성된 HTML 방식의 콘텐츠에 더 비중을 두는 것은 분명해 보입니다.
이코노미21의 기사가 검색엔진에 걸려드는 방식을 생각해보겠습니다. 검색엔진이 이코노미21 사이트를 찾아서 콘텐츠를 직접 읽어들이는 방식이 있고 인터넷에 떠도는 링크를 찾아서 따라 들어오는 방식이 있을 겁니다.
제가 보기에 검색엔진이 직접 스캔을 하는 방식에서 데이터베이스 방식의 콘텐츠는 순위가 뒤떨어질 수밖에 없습니다. 제가 앞의 글에서 말한 것처럼 존재하지 않는 페이지를 읽을 수는 없기 때문입니다. 이코노미21 사이트에서는 데이터베이스가 있을뿐 HTML 문서가 존재하는게 아닙니다. 사용자가 제목을 클릭했을 때 그때그때 데이터베이스를 불러와 페이지를 조합해서 보여줄뿐입니다.
물론 링크를 찾아서 따라 들어오는 방식에서는 여전히 기존의 데이터베이스 방식의 콘텐츠도 영향력을 발휘할 수 있습니다. 퍼머 링크는 아니지만 제목을 클릭할 때 기사가 열리는 등의 링크는 여기에도 존재하니까 말입니다.
역시 고유한 주소를 갖는 것과 갖지 않는 것의 차이는 있습니다. 간단하게 설명해볼까요? 이코노미21 사이트의 '로하스' 기사를 다른 사람에게 보여주려고 할 때 주소를 복사해서 알려줄 수 있습니까. 보통은 이코노미21에 와서 찾아보라고 하지 주소를 알려줘서 링크를 시키지는 않습니다. 주소가 복잡할뿐만 아니라 숨겨져 있기 때문이고 기사를 각각 독자적인 콘텐츠로 인정하지 않고 있기 때문입니다. 이코노미21은 외부의 링크를 차단하는 구조로 설계돼 있습니다. 그게 이코노미21이 검색엔진에서 하찮은 개인 사이트들에게 뒤질 수밖에 없는 이유입니다. 그건 로그인의 문제가 아닙니다.
대형할인점과 방문판매의 차이를 말씀하셨는데 이코노미21은 이코노미21이라는 브랜드 말고는 외부 네트워크를 거의 갖고 있지 않습니다. 이코노미21이라는 이름으로 링크될 뿐이지 각각의 콘텐츠로 링크되지 않는다는 이야기입니다. 그러나 이정환닷컴은 각각의 콘텐츠가 링크를 만들고 방문자들을 끌어모읍니다. 이정환닷컴이라는 이름을 보고 찾아오는 사람의 비중은 얼마 안됩니다. 이를테면 '저 낮은 중국'을 보고 찾아오지 이정환닷컴을 보고 찾아오지는 않는다는 말입니다. 거꾸로 이코노미21은 '로하스'를 보고 찾아오기 보다는 이코노미21에 와서 로하스 기사를 보게 됩니다. 이코노미21의 로하스 기사는 그래서 자칫 묻히거나 실제로 정보를 찾는 사람들에게도 읽히지 않을 가능성이 큽니다.
특히 구글 같은 검색엔진은 링크를 중요하게 판단합니다. 이코노미21에 로하스 관련 기사가 실렸더라. 여기 가서 읽어봐라. 그런 링크 하나하나에 비중을 두고 그게 많을수록 우선 순위를 둔다는 이야기입니다. 없는 페이지를 읽지는 못하지만 그렇게 링크를 타고 들어와 콘텐츠의 존재를 확인합니다. 별것 아닌 것 같지만 그런 링크 하나하나가 콘텐츠의 가치를 판단하는 기준이 됩니다.
흔히 구글 폭탄이라고 하는 것, 아시죠? 구글 검색에서 '학살자'를 검색하면 전두환의 소개 페이지가 뜹니다. 영어로 'miserable failure(참담한 실패)'라고 검색하면 백악관 사이트가 뜹니다. 인터넷 사용자들의 자발적이고 의도적인 링크가 정보의 가치를 바꿔놓은 한 사례입니다. 어이가 없지만 이게 우리 시대의 정보가 유통되는 방식입니다.
다시, 이정환닷컴 이야기로 돌아가겠습니다. '저 낮은 중국'이 10번째에 오른 것은 굉장히 놀라운 사건 아닙니까. 글을 쓴지 일주일밖에 안됐다는 것도 그렇고 개인 사이트가 쟁쟁한 언론사 사이트보다 더 유리한 자리를 차지하고 있다는 것도 그렇고 말입니다. 이건 우연이 아니라 시스템의 차이에서 비롯하는 것입니다.
2번 질문과 관련, 네트워크가 쓰레기가 된다는 우려는 박 선배 말고도 상당히 일반적인 우려로 확산되고 있는 것 같습니다. 이미 뉴욕타임즈 조차도 위협을 느낄 정도 아닙니까. 이런 부분에 대한 논의가 더 필요할 거라고 생각합니다. 이를테면 블로그에 글을 쓴다는 것은 네트워크라는 협업 시스템에 동참한다는 의미고 이에 대한 인식이 확산돼야 할 겁니다.
3번 질문과 관련, 저도 여러군데 물어봤지만 HTML 방식이 데이터베이스 방식보다 오히려 속도에서는 빠릅니다. 제 생각에 템플리트를 활용한 HTML 저장 방식은 콘텐츠의 관리 방식에 획기적인 전환을 가져올 걸로 보입니다.
조선일보와 중앙일보 기사를 보세요. 주소가 '~.html'로 끝납니다. 여러가지 이유가 있겠지만 검색엔진 친화성도 이같은 변화의 한 동인이었을 거라고 생각합니다.
4번 질문과 관련, 수익창출 문제는 따로 이야기할 필요가 있을 것 같습니다. 다만 명분의 문제가 아니라 누가 네트워크에서 우위를 차지하느냐의 문제고 이를 위해 콘텐츠을 어떻게 관리하고 활용할 것인가의 문제라고 생각합니다. 제가 다시 강조하고 싶은 부분은 어떤 언론사들은 이미 기사를 기사로만 다루는게 아니라 정보 콘텐츠로 보고 있다는 겁니다.
이제 정보의 독점과 접근 능력의 차이가 더욱 심각해집니다. 그게 싫으면 뉴욕타임즈처럼 머물러 있으면서 계속 투덜거리면 됩니다. 물밑에서 치열한 경쟁이 벌어지고 있습니다. 무버블타입은 그런 발상의 전환에 성공한 경우라고 볼 수 있을 겁니다.
1 TrackBacks
Listed below are links to blogs that reference this entry: 무버블타입과 정보의 가치..
TrackBack URL for this entry: http://www.leejeonghwan.com/media/mt-tb.cgi/275.
자세히 말하면 조선일보가 '블로그 검색 결과'를 흐리고 있다. 나는 kiseok7님이 만드신 네이버 뉴스 검색 결과를 rss로불러들이는 기능 중 '블로그'란 단어를 rss로 읽고 있다.... Read More
네. MT의 html generating은 그래서 의미가 있습니다.
저는 MT로 블로그 입문 후 1년 사용하다가, tatter tools로 옮겼습니다만.
이제 다시 MT로 flatform을 변경해야 하지 않을까 고민하고 있습니다.
html 페이지를 만드는게 웹의 원래 목표라고 들었습니다. DB화된 정보를 html로 만들어 버리면 전세계 누구라도 볼 수 있다는 것이죠. MT가 블로거들에게 사랑받는 이유도 이런 웹의 기본 공유정신에 투철하기 때무이라고 생각합니다.
단 MT의 html generating이 한가지 문제가 있다면 컨텐츠의 양이 많아지면 많아질수록 관리가 어렵다는 것입니다. 블로그가 개인의 영역에서만 머무른다면 상관이 없는데 그 이상으로 간다면 분명 이것도 문제가 되리라고 봅니다.
와...html를 생성하는 것이 얼마나 중요한지 이제 알았네요.
퍼머링크 타입과 DB 타입에따른 검색엔진 차이는 있다고 보기 힘들다고 봅니다.
인간의 관점에서 보면 '이코노미21'의 주소와 '이정환닷컴'의 주소에는 분명한 차이가 있고, '이정환닷컴'의 주소가 더 인지 되기 쉽다고 볼 수도 있습니다. 저 같은 경우에는, '이정환닷컴'이나 '이코노미21'이나 주소에서 '글 내용 정보'를 얻을 수 없다는 점에서 주소의 차이에 특별한 가치를 두지 않고, 인지의 차이도 느끼지 않습니다. 사실, 둘 다 이게 뭔지 인지하기 어렵습니다. 링크할 때 인수를 조정할 때 빼고는 전혀 신경쓰지 않습니다. (오히려, DB에서 페이지를 형성하는, WikiWiki의 "http://example/wiki.cgi/페이지제목" 식의 주소가 훨신 낫다고 봅니다.)
하지만 검색엔진의 경우는 다릅니다. 검색엔진에서는 '이코노미21'의 주소나 '이정환닷컴'의 주소나 동일하게 취급합니다. '이코노미21'의 주소에 "new_id=숫자"가 붙었다고 해서 new_id=1 ~ new_id=10000 해 보는 것은 아닙니다. 문서내의 a 태그에 있는, 'href' 요소 값을 읽어 파악하는 것입니다.
웹페이지에서 DB로 구성된 페이지와 html 형식으로 저장된 파일을 읽을 때 차이가 있다고 보시나요? (오류메시지가 안뜬다면) 전혀 차이가 없을 것입니다. 검색엔진에서 보는 것도 동일합니다. PHP 등의 웹프로그램은 serverside 입니다. 모든 정보를 서버에서 처리하여 내보내지요. 즉, 검색엔진에서는 DB를 접근하는 게 아니라, 일반 HTML 파일에 접근하는 것입니다. 실제로 현재 구글에서 '저 낮은 중국'을 검색하면, 첫페이지에는 거의 '페이지 생성 형식'의 주소가 나옵니다.
그리고 DB에서 페이지를 생성하는 경우에 페이지 이동을 Javascript를 사용하거나, 이런 저런 조건을 주어 외부 접근을 막을 수 있습니다. (이러한 작업은 .htaccess로 가능하지만, 웹프로그래밍과 연동한다면 더 강력하게 할 수 있습니다.) 일부러 이러한 조건을 준 사이트라면 당연히 검색엔진에서 찾기 어렵겠지요.
페이지 형성 형식의 문제점이라면, 인자가 추가로 붙어서 생기는 문제가 있습니다. 해당 글에 글의 고유 아이디 이외에 추가 인수가 붙을 경우에는 검색엔진에서도 같은 페이지를 두개로 인식할 수도 있고, 주소 길이도 너무 길어지는 게 있겠지요. 또 다른 문제(?)라면 고유 아이디가 없고 가변적이어서 검색엔진에서 찾을 때에 원하는 페이지와 다른 것이 나오는 것인데, 이 것은 프로그램 작성 스타일이니 어쩔 수 없겠지요.
일반적으로 블로그에서 ~~.html 형식을 퍼머링크라고 하는 듯합니다.(요즘은 php?... 형식도 퍼머링크라고 하더군요) 퍼머링크에서 퍼머는 permanent란 단어로, '영구한, 불변의'란 뜻이 있는 단어입니다. 하지만 html 형식이라고 해서 주소가 영원히 존재하는 것이 아니고, php 형식이라고 해서 주소가 매번 바뀌는 것은 아닙니다. html 형식이라면 블로그를 실제 운영하지 않다고 하더라도, 페이지만 남기는 것이 가능하지만, 지금까지 무버블 타입을 그만 두면서 페이지라도 남겨둔 곳을 볼 수는 없었습니다.
답글이 너무 길어진 것 같습니다. 트랙백이 좋았을 텐데, 요즘 태터툴즈 업데이트 관계로 수리중일 때가 많아서 그냥 올립니다.
검색엔진이 데이터베이스 방식의 콘텐츠를 읽을 수 있느냐 없느냐. 이 부분은 검색엔진에 대한 전문적 지식 없이 말로만 내릴 결론은 아니라고 생각합니다.
다만 다시 강조하고 싶은 건 이를테면 이정환닷컴에는 '~.html'이라는 물리적인 페이지가 존재하지만 이코노미21에는 'read.asp'라는 파일만 있을뿐입니다. 제로보드 같은 게시판 프로그램에서 콘텐츠는 데이터베이스에 들어가 있거나 별도의 파일로 저장돼 있습니다. (자세한 설명은 기회가 있으면 따로 하겠습니다.)
그리고 그건 논외로 하더라도 무버블타입의 페이지는 페이지끼리 수많은 링크를 주고 받고 있고 외부로도 쉽게 링크를 주고 받을 수 있는 구조입니다. 사이트 안에 닫힌 구조가 아니라 외부로 열려있도록 설계돼 있다는 말입니다. 링크에 비중을 두는 구글 같은 검색엔진은 무버블타입의 물리적인 페이지와 그들을 엮고 있는 링크를 확실히 높게 평가하는 것 같습니다.
구글에서 '무버블타입'이라고 한번 쳐보시기 바랍니다. 이정환닷컴의 이 페이지가 제일 위에 뜹니다. 왜 이런 일이 일어나는 걸까요.
~.html이란 물리적인 페이지와, read.asp란 파일만의 비 물리적인 페이지는 검색과 전혀 관계없습니다. 그것의 관계는 페이지가 위치한 서버내부에서만 중요할 뿐이죠. 외부에 있어서는 (따로 구분을 두지 않는한) href="~~~~"에 들어있는 ~~~~가 모두 주소일 뿐입니다. 그리고 서버 쪽의 트릭을 쓰면 일반 asp, php인 경우에도 http://도메인/폴더/번호.html" 식으로 인식하게 할 수 있습니다. 그러면 그것은 '.html'의 고유한 파일인가요? {http://no-smok.net/nsmk/WikiSandBox - 이것은 모인모인이라는 WikiWiki를 사용하는 no-smok의 주소입니다. 겉 보기엔 하나의 페이지 또는 디렉토리로 보이지만 실제로는 내부 cgi 프로그램에서 처리하여 내보내는 것입니다.) 위와 같이 실제 링크에 있어 중요한 것은 아니지요.
"콘텐츠는 데이터베이스에 들어가 있거나 별도의 파일로 저장돼 있습니다"라고 해도 실제 페이지가 생성될 때에는 iframe을 사용하지 않는한 콘텐츠는 페이지 안에 생성되있습니다. 이렇게 생성된 데이터가 ~~.html 파일로 생성되었을 때와 다르다고 생각하시나요? 현재 구글에서 어떤식으로 사이트를 평가하는 지는 공개하지 않았기 때문에 알 수 없습니다. 그것을 단지 자신이 쓴 글만을 검색해서 결론을 내는 것은 성급하다고 생각합니다. 윗 글에도 적었지만, 분명 '저 낮은 중국'의 검색에서 일반 ~.html 파일은 높은 위치를 차지하고 있지 않습니다.
구글에서 '무버블타입'쳐서 어떠한 결과를 보기를 원하는 지는 파악하지 못했습니다. (확실한 것은 무버블타입과 태터툴즈를 구글에서 검색해 보았는데, 무버블타입로 검색했을 때에는 무버블 타입에서 생성된 페이지가, 태터툴즈에서 검색하였을 때에는 태터툴즈에서 생성된 페이지가 많이 검색되었습니다. 무버블타입으로 검색해서, ~.html 타입이 낫다라는 결론은 당현히 낼 수 없을 거라 생각합니다)
태터툴즈 블로그 주소도 충분히 많이 다른 블로그에 오르고 있고, 무버블 타입도 그렇습니다. 트랙백에 있어서도, 태터툴즈 형태라 해서 안되는 것이 아닙니다. 이러한 연결은 모두 검색엔진에서 정보를 수집하는 데 도움을 주고 있으며 따로 차별 받고 있다고 볼 수 없다고 생각합니다.
서로 추측만 늘어놓을 뿐이라면 이런 논쟁은 무의미하다고 생각합니다.
일단은 경험적인 결과들이 있습니다. 이를테면 무버블타입과 테터툴스, 또는 제로보드 게시판을 놓고 동일한 콘텐츠를 올렸을 때 어떤 페이지가 검색엔진에 가장 잘 걸려드는가 보면 알 수 있습니다.
또 하나는 검색엔진이 그 수많은 게시판과 방명록을 모두 검색하지 않는다는 것도 분명해 보입니다. 역시 추측이지만 검색엔진이 제로보드로 만든 동호회 게시판과 제로블로그 또는 테터툴스 블로그, 그리고 그 안의 콘텐츠의 가치를 구별할 수 있을까요. 저는 구별할 수 없거나 구별하기 어려울 거라고 생각합니다.
검색엔진은 수많은 링크로 구성된 제로보드 게시판의 글 목록을 유의미한 링크로 판단할까요. 저는 검색엔진이 이런 게시판을 어떤 방식으로든 의도적으로 무시할 가능성이 크다고 생각합니다. 테터툴스도 같은 방식으로 무시될 가능성이 큽니다.
구글의 경우에 한정하면 구글은 링크가 얼마나 많이 걸려있느냐로 콘텐츠의 가치를 판단합니다. 위에도 썼지만 이를테면 사람들이 '학살자'라는 단어로 전두환의 홈페이지에 링크를 걸어놓으면 이 페이지는 의미있는 페이지가 되고 학살자라는 단어로 검색할 때 가장 먼저 뜨게 됩니다. 인터넷 사용자들의 가치판단을 존중하는 거죠.
제가 보기에 검색엔진의 입장에서는 무버블타입의 링크를 사람들이 직접 만든 링크와 구별하지 못하는 것 같습니다. 만약 그렇다면 페이지를 만드는 것만으로도 페이지들을 연결하는 수많은 링크를 갖게 되고 검색엔진이 보기에는 가치있는 페이지가 됩니다. 만들어질 때부터 유의미한 링크를 갖는 페이지와 그렇지 못한 페이지는 검색엔진 순위에서 차이가 날 수밖에 없겠지요.
다시 말하면 테터툴스의 링크는 무시하지만 무버블타입의 링크는 무시하지 못한다는 이야기입니다. 그리고 그 이유는 아마도 완결된 주소를 갖느냐의 차이에서 나온다고 생각합니다.
마지막으로 덧붙이자면 구글에서 '저 낮은 중국' 검색할 때 앞에 떴던 페이지들은 그 페이지의 비중 보다는 그 페이지들을 묶고 있는 사이트 자체가 비중있는 사이트기 때문에 높게 평가받고 있을 가능성이 큽니다. 이 사이트 안의 링크들을 제로보드나 테터툴스처럼 무시하지 못하는 거겠죠. 실제로 바깥에서 걸려있는 링크가 많을 수도 있고요.
분명한 것은 무버블타입으로 만든 페이지가 이들 상업적인 대형 사이트들과 나란히 어깨를 견주고 있다는 겁니다. 대형 사이트가 그냥 그들의 브랜드 밸류로 버티고 있다면 무버블타입으로 만든 페이지는 자체적인 콘텐츠를 내걸고 맞서고 있는 셈입니다. 무버블타입은 확실히 다른 어떤 툴보다 강합니다. 직접 써보시면 알 겁니다.
흥미로운 얘기입니다만, 어차피 추측인 건 마찬가지 아닌가요? 여기서 얘기할 시간에 차라리 구글에 메일을 보내어서 ".....html"인 URL 과 ".....php?no=****" 인 URL을 차별하는지 물어보는 것이 (설마 기업비밀일까요?) 더 낫지 않을까 싶기도 합니다만. :-)
그리고 KEBIL 님 말씀처럼, 검색어 "무버블타입"은 좀 심했습니다. :-) "위키"를 검색하면 위키위키 사이트가 제일 많이 뜨고 "태터툴즈"를 검색하면 태터툴즈로 운영하는 사이트가 전면에 뜨는 마당에 말이죠. "저 낮은 중국"이 뭔지는 잘 모르겠습니다만, 이 경우 이정환닷컴이 "비중있는 사이트기 때문에 높게 평가받을 가능성"은 고려하지 않으시는 건가요? 어쨌거나 위 본문에서 말씀하신 내용이 옳을수도 아닐수도 있는데, 적어도 지금까지 근거로 대신 것은 뭔가 객관적이지 못하다는 생각입니다.
그나저나 참 재미있군요. 8년 정도 전만 해도 개인 홈페이지들은 거의 다 메모장으로 *.html 파일 만들어서 올리는 식이었고, CGI 게시판은 참 신기한 거였는데, 이제는 ~.html 이라는 URL 이 "장점"인 것으로 얘기되는 시대로군요. ^_^
또 하나 가능성이라면 블로그코리아의 영향도 생각해 볼 수 있을 것 같습니다. 블로그코리아라는 영향력 높은 사이트에 페이지 마다 링크가 걸려있는 셈이니까요. 아무래도 다른 페이지보다 검색엔진이 더 비중있게 평가할 수 밖에 없는 것 아닐까요.
더 원론적인 가능성이라면 기존의 제로보드나 게시판들은 페이지의 주소자체에 큰 의미가 없었습니다. 외부의 링크 보다는 직접 그 게시판을 찾아와서 목록을 보고 클릭해서 페이지를 읽는게 유일한 통로였을 테니까요. 그것과 비교하면 블로그는 (스태틱이나 디비형태나 모두) 외부의 링크에 좀더 비중을 두고 설계됐으니까, 다른 말로 하면 좀더 열린 구조로 만들어 졌으니까 자연스럽게 더 많은 링크를 두게 되고 검색엔진이 더 높게 평가하는 것 같습니다.
(무버블타입에 특화된) 또 하나의 가능성이라면 검색엔진이 링크 가운데 어떤 링크를 무시할 수도 있을 것 같습니다. 다시 제로보드를 예로 들면 목록마다 수많은 (내부) 링크를 두고 있지만 검색엔진은 그런 링크를 비중있게 읽지 않거나 무시하는 것 같습니다. 그렇다면 이것은 스태틱이냐 디비냐의 문제가 아니라 글 목록에서 링크를 어떻게 기록하느냐의 문제가 될 것입니다. (제 블로그뿐만 아니라 무버블타입이 검색엔진에 더 잘 걸려드는 것은 경험으로 볼 때 분명해 보입니다. 조만간 몇가지 실험을 해보려고 합니다.