'burstiness'에 해당되는 글 1건

  1. 2010.01.09 burstiness (4)
물리2010.01.09 22:20

정말 오랜만에 물리학에 관한 글을 올리는거 같습니다. 매일 seldon님의 글만 눈팅하다가.. 이래선 안되겠다는 마음으로 부족하지만 조금이라도 글을 써보려고 노력중입니다. 아직 seldon님의 글을 다 꼼꼼하게 읽지도 않았고.. 제대로 이해도 못해서 마음잡고 읽어봐야겠습니다. 우선 이번에 제가 이야기 하고 싶은 것은 특정 시계열에서 어떤 사건이 일어날때입니다. 예를 들어서 지진이 발생한다고 하면 어떤땐 긴 잠복기를 가지고 있다가 어떤때 갑자기 연속적으로 자주 발생하죠. 비도 겨울이나 긴 기간동안 비가 오지 않다가 여름한철 장마나 어떤 시기에 몇번에 나뉘서 미친듯이 쏫아져 내릴때도 있습니다. 이러한 현상들을 burst라고 이야기 하는데요. 주로 이말은 별이 폭발 할때 많이 쓰는 표현이죠. 하지만 이런 때도 burst라는 말을 사용합니다. 여기서 각각의 사건들이 발생하는 시간 간격을 특정시간 \tau 라고 하고 이것들을 그래프를 그리면 그것들의 확률밀도 합수가 멱급수 합수를 따르게 됨니다. 

P \propto \tau^{-\alpha}

여기서 \alpha 값은 현상에 따라 다른데요. 이걸 보면 확실히 각각의 게시물들간의 상관 관계가 있다고 예측을 할수 있습니다. 

우선은 그래서 이 \tau들간의 어떤 관계들이 있는 보겟는데요. 논문에선 두가지 값을 가지고 우선 그것을 가늠합니다. 

첫번째로 Burstiness를 의미 하는 B(burstiness parameter)입니다. 

B\equiv \frac{\sigma_\tau - m_\tau}{\sigma_\tau + m_\tau}

여기서 \sigma_\tau 는 시간 간격들의 표준 편차이구요. m_\tau는 시간간격들의 평균입니다. 언뜻보면 이게 burstiness랑 무슨 상관이냐.. 싶기도 하죠. 

\sigma_\tau = m_\tau 일때는 그냥 중립적인 위치라고 하죠. 이때 B=0 입니다.

\sigma_\tau = 0 일때는 표준 편차가 0이니까 모든 값들이 한 값으로 되는 delta function 형태가 됩니다. 즉.. 모든 값이 한가지 값만을 가진게 되죠. 이것은 시간간격이 그렇다는 것이기 때문에 이 사건들은 상당히 주기적으로 나타납니다. 심작박동 같은 것들이 그렇다고 볼수 있죠.  이 때는  B=-1입니다. 

 \sigma_\tau \gg m_\tau 일때는 B=1이되고 burstiness가 존재하게 됩니다.......

실제로 시간간격에 대해서 그림을 그려가면서 해보면 확실하게 이해가 됨니다. 그림도 올려드리고 싶은데.. 논문에 있는것이라.. 혹시나 저작권 문제가 될까 걱정이되서 올리기가 꺼려지네요..ㅠ_ㅠ 혹시 아시는 분은 답변좀 달아주세요.

다음으로 기억효과라는 개념이 나옴니다. 

M= \frac{1}{n_\tau - 1} \sum_{i=0}^{n_\tau -1} \frac{(\tau_{i+1} - m_1)(\tau_i -m_2)}{\sigma_1 \sigma_2}

인접한 사건들의 상관관계를 알아 보는건데요. 보면 대충 표준편차의 표준편차를 구한다는 그런 느낌입니다. 여기서 1,2 로 구분해놨는데 실제로 자기자긴을 한다면 1이든 2든 같은걸로 쓰면 자기자신의 상관관계를 알수 있겠죠?(autocorrelation). 그렇게 하여 처음사건과 바로 다음에 일어나는 사건이 어떤 관계인지를 알수 있게 됨니다. 

이 두가지를 가지고 고광일 교수님과 바라바시의 논문에서는 현상을 분석했는데요. 우선 이 시간간격들을 가지고 그래프를 그려보면 재밋는 것들을 알수 있습니다. 가장 작은 시간을 앞으로 보내고 큰 시간들을 x축의 뒤쪽으로 보내면 어떤 감쇠함수형태를 가지는데요. 여기서 이 메일을 보내는 패턴은 멱급스함수, 특정단어들이 등장하는 글자간격으로 그리면 지수함수를 따르고 심장박동은 특정 한 시간간격에 집중되는 형태의 delta-function(딱히 한국말이 없네요.ㅠ_ㅠ)형태를 지니게 됨니다. 그 다음으로 이런 사건들의 B,M을 구해서 그래프를 그려보면 (M,B diagram 이라고 하는데 이름이 맘에 안듬니다..-_-) 재밋는 모여있는 형태들이 나옵니다.

 

우선 인간행동패턴, 여기서는 이메일은 보내는 패턴이나 휴대전화가입신청, 도서관에서 책을 빌리는 시간간격등을 계산해 보았는데요.  M=0인 결과를 볼수 있습니다. 기억효과가 거의 없는거죠. 바로 전 사건과 다음 사건은 아무런 연관이 없다는 것입니다. 그리고 몇몇 행동에서는 B가 상당히 큰 부분들이 있습니다. 그러니까 사건들이 몰아서 일어나는 경우가 있다는 이야기 입니다. 이에 비해 자연현상들은 어느정도 일차함수 방향으로 점이 찍히는데요. 일본에서 일어나는 지진이나 뉴멕시코주에 강수같은 경우에는 기억효과도 burstiness도 어느정도 존재한다는 것을 말해줍니다. 그리고 글의 경우에는 둘다 0에 가까워서 기역효과도 특정단어가 연이어 나오는 일도 없습니다.  최근 연구 결과로는 인터넷 계시판에 글이 올라오는 시간간격에도 확실한 burstiness가 존재하고 그것을 연구하시는 분도 계시고 저희 그룹도 이것에 관심이 많습니다. 

 

더 많은 재밋는 이야기와 고민들이 많은데 우선은 연구실 일들이라 편하게 이야기 하기는 어렵네요.. ^^

이 글은 스프링노트에서 작성되었습니다.

Posted by blindfish

댓글을 달아 주세요

  1. 지나가다

    논문으로부터 인용하는 것은 저작권에 문제가 되지 않는다고 알고 있습니다.

    2010.01.12 03:11 [ ADDR : EDIT/ DEL : REPLY ]
    • 그렇군요~~^^
      감사합니다.. 출처만 남기면 아무련 상관이 없는거였군요..

      2010.01.12 14:01 신고 [ ADDR : EDIT/ DEL ]
  2. 지나가다 감사인사남깁니다. Burtiness. 이런지수가 있었군요. 일하면서 너무 찾던 개념이라...

    2011.03.11 13:36 [ ADDR : EDIT/ DEL : REPLY ]
    • 그런데 이런 지수가 그럴듯한 건지는

      여전히 논란이 많습니다.

      이 발표를 하셨던 분도 썩 괜찮은 값은 아니라고 하시더군요..

      2011.03.15 12:58 신고 [ ADDR : EDIT/ DEL ]