더 나은 세상은 가능하다, 이정환닷컴!

페이스북 공유 이벤트와 데이터 삽질 이야기.

Written by leejeonghwan

August 17, 2018

맥북에어 이벤트가 올해로 벌써 세 번째인데요. 2016년에는 유선방송 회사에서 일하시는 조정만님에게, 2017년에는 스타트업얼라이언스에서 인턴으로 계셨던 정휘준님에게 돌아갔습니다. 올해는 17일 자정까지 취합한 명단으로 20일 아침에 추첨을 할 텐데요.

안타깝게도 해마다 맥북에어 이벤트의 효과가 줄어들고 있다는 걸 확인할 수 있습니다. 맥북에어의 매력이 줄어든 걸 수도 있고 페이스북의 바이럴 효과가 줄어든 걸 수도 있지만 그래도 이 정도 광고 효과라면 충분한 성과를 거뒀다고 자평하고 있습니다.

도달률이 2016년에는 42만604명, 2017년는 28만4879명, 올해는 23만474명인데, 그래도 페이스북 광고 돌리는 것 보다는 나은 것 같습니다.

올해 이벤트에서는 8월1일 오후 5시10분 남소라님부터 8월17일 오후 9시42분 마석님까지 전체 공유로 이벤트에 참여하신 분이 모두 1151명입니다. (전체 공유를 하지 않으면 안타깝게도 집계가 안 됩니다.) 같은 시간에 여러차례 중복 공유를 하신 분은 1건만 반영했습니다.

참고로 2016년 추첨은 이렇게.
https://www.facebook.com/mediatodaynews/videos/1120023514738435

2017년 추첨은 이렇게 했습니다.
https://www.facebook.com/mediatodaynews/videos/1584875361586579

 

사실 지금부터가 본문인데요. 페이스북 포스트를 공유한 사람들 명단을 어떻게 취합하느냐고 묻는 분들이 있었습니다. 이거 꽤나 복잡합니다. 달리 다른 대안이 있는 것도 아니고요.

결국은 노가다지만 삽질을 줄이기 위한 간단히 방법을 소개해 드립니다. 제가 취재 과정에서 지저분한 데이터를 정리할 때 흔히 쓰는 원시적인 방법입니다만, 사실 이 보다 직관적이고 빠른 방법은 찾지 못했습니다.

1. 일단 전체 공유글을 아래로 죽죽죽 끝까지 드래그 한 다음. (엑셀에서 웹 페이지 불러들이는 함수도 있습니다만 이런 무한 스크롤 페이지에서는 안 먹더라고요.)

 

2. 전체 선택해서 텍스트 카피.

3. 그리고 이걸 워드프로세서에 옮겨 놓고 규칙을 발견해야 합니다. 이런 식으로 돼 있습니다.

4. 보통은 이름 뒤에 “shared a post.”라는 문장이 따라오거나. “shared a link.”라는 문장이 따라올 때도 있고요.

5. 아무 것도 안 붙을 때도 있습니다. (공유하는 방식에 따라 다른 듯.) 이 경우는 이름만 있고 바로 다음 줄에 날짜가 시작되죠.

6. 나머지 공유 글에 댓글이 붙어 있거나 페북 계정 주인의 이름이 있는 부분은 모두 불필요한 부분이죠. 이걸 다 날리고 실제로 공유 글의 계정 이름만 뽑아야 합니다.

7. 앞서 발견한 규칙, “shared a post.”나 “shared a link.”를 우리만 알아볼 수 있는 기호 =====로 바꿔놓습니다. 워드프로세서의 찾아 바꾸기 기능을 이용합니다.

8. 한 줄 밑에 날짜가 있는 것도 =====로 바꿔놓습니다. 이 경우는 “엔터+August”를 찾아서 =====로 바꾸면 됩니다. (엔터가 한글에서는 ^n, 워드에서는 ^p죠. 한글이 워드 보다 더 편리합니다. 워드의 경우는 한 줄이 어느 정도 이상 길어지면 감당을 못하는 듯)

9. 그럼 우리는 이제 =====가 들어간 줄만 뽑아내면 됩니다. 흔히 지저분한 데이터 정리할 때 쓰는 원시적인 방법인데요. 일단 공유 한 묶음과 묶음 사이에 줄 바꿈이 두 번, 그러니까 엔터가 두 번 들어가 있는 규칙을 발견할 수 있습니다. 그러면 엔터 2번을 >>>로 바꿔놓고, 엔터 1번은 탭으로 바꿔놓습니다. 그러면 전체 데이터가 1줄의 데이터로 바뀌죠. 그 다음에 >>>를 다시 엔터 1번으로 바꿔놓습니다. 그러면 데이터가 각각 한 줄씩 깔끔하게 정리가 되죠.

10. 이걸 엑셀이나 스프레드시트에 옮기려면 >>>를 탭으로 바꿔주면 됩니다. 한글에서는 ^t로 찾아바꾸기 하면 되겠죠. 그걸 전체 선택해서 엑셀에 붙여넣습니다. 그럼 이런 모양이 됩니다.

 

 

(이 캡춰 화면에서 보면 =====이 들어간 줄이 우리가 필요한 줄이고 =====가 없는 줄은 댓글이라든가 불필요한 부분입니다.)

11. 이걸 엑셀에 옮겨 붙이면 맨 앞에 계정 이름이 나오게 되죠. 우리는 여기서 =====가 들어가 있는 부분만 뽑아야 합니다.

 

 

12. 일단 첫째 컬럼 이외는 모두 쓸모없는 부분이니까 날려 버립니다.

13. 그리고 엑셀 함수를 한 번 써볼까요.
=if(isnumber(find(“=====”,A1)),A1,””)
첫쨋칸에 =====이 들어있으면 그걸 옮겨주고 아니면 빈칸으로 남겨놓으라는 명령어입니다.

14. 그러면 깔끔하게 =====이 들어있는 부분만 뽑아낼 수 있죠.

 

 

15. 다시 워드프로세서로 옮겨서 =====를 탭으로 바꿔주고 다시 전체 선택해서 엑셀에 붙여넣습니다. 그럼 깔끔하게 정리가 되죠. 빈칸만 없애주면 완성!

추첨 결과는 월요일 오후에 공개하겠습니다.

 

leejeonghwan.com audio
Voiced by Amazon Polly

Related Articles

Related

너무 좋아 보이는 것은 실제로 그렇지 않을 수 있다. 너무 나빠 보이는 것 역시 마찬가지다.

너무 좋아 보이는 것은 실제로 그렇지 않을 수 있다. 너무 나빠 보이는 것 역시 마찬가지다.

선택적 보도? 고위공직자 ‘의혹’을 대하는 언론의 자세. 정준희 : 우리 언론은 모든 권력에 대해 의심할 권리, 의혹을 제기할 권리를 가지고 있습니다. 하지만 이러한 권리는 팩트체크와 최소한의 공공성이 전제됐을 때 정당성을 얻고 힘을 발휘할 수 있겠지요. 우리 언론의 모습은 어떨까요? 공직자의 정책 내용보단 정파적 이해관계에 빠져 검증되지 않은 사생활 의혹 보도에만 집중하고 있진 않나요? 과연, 우리 국민들이 언론을 통해 알아야 할, 그리고 알고 싶어 하는, 공직자들의 진짜...

서버 호스팅으로 아나콘다와 파이썬, 주피터 노트북 실행하기.

서버 호스팅으로 아나콘다와 파이썬, 주피터 노트북 실행하기.

대전에서 대학원 수업을 듣기 시작하면서 아, 내가 5년만 젊었어도 지금부터라도 파이썬 공부를 시작할 텐데, 이런 소리를 했었는데 이것저것 하다 보니 결국 날림으로나마 파이썬에 손을 대게 됐습니다. 파이참도 써보고 주피터 노트북도 써봤지만 결국 시간 걸리는 작업은 AWS 호스팅에 원격으로 올려놓고 하는 게 편하군요. 아마존 AWS 호스팅을 아신다면 아래 순서대로 따라하시면 됩니다. 몇 차례 삽질 끝에 셋팅할 때마다 찾아보기 힘들어서 기록 용도로 남겨 둡니다. 아나콘다 설치....

해서는 안 되는 질문은 없다.

해서는 안 되는 질문은 없다.

(월간 신문과방송에서 뭔가 제일 쓰기 어렵고 아무도 쓰고 싶어하지 않는 복잡한 주제를 저에게 던진다는 느낌이 듭니다만 이번달에는 이런 주제로 썼습니다. 기자들이 자기 할 일만 잘 해도 조금 더 좋은 세상이 되지 않을까 싶습니다. 월간 신문과방송 2020년 9월호 기고입니다.) 사회부 기자 시절 자살 사건이 발생해서 장례식장을 찾을 때가 있었다. 일단 들어가서 넙죽 절부터 하고 “그런데 이유가 뭔가요?”하고 물어봤다간 욕 들어먹고 쫓겨나기 십상이다. 하다보니 좀 더 기술적으로...

더 나은 세상은 가능하다, 이정환닷컴!

Join

Subscribe For Updates.

이정환닷컴 뉴스레터를 구독하세요.

Top Tags