"이토와 스트라토노비치"의 두 판 사이의 차이

수학노트
둘러보기로 가기 검색하러 가기
(사용자 이름 삭제됨)
 
(다른 사용자 한 명의 중간 판 6개는 보이지 않습니다)
1번째 줄: 1번째 줄:
뭔가 해결되지 않은 문제가 머리 속을 굴러다니다 해야 할 일이 많음에도 갑툭튀 했습니다. 어쩔 수 없죠 뭐. "간단한 경제 모형에서 부의 응집(Wealth condensation in a simple model of economy)"이라는 제목의 [http://dx.doi.org/10.1016/S0378-4371%2800%2900205-3 <피지카 에이> 논문]과 이들 저자의 이름을 딴 부쇼-메자르 모형(Bouchaud-Mezard model)의 풀이에 관한 문제입니다. 이전에도 이 모형을 [http://exactitude.tistory.com/814 제가 소개]한 적이 있습니다.
+
뭔가 해결되지 않은 문제가 머리 속을 굴러다니다 해야 할 일이 많음에도 갑툭튀 했습니다. 어쩔 수 없죠 뭐. "간단한 경제 모형에서 부의 응집(Wealth condensation in a simple model of economy)"이라는 제목의 [http://dx.doi.org/10.1016/S0378-4371%2800%2900205-3 <피지카 에이> 논문]과 이들 저자의 이름을 딴 부쇼-메자르 모형(Bouchaud-Mezard model)의 풀이에 관한 문제입니다. 이전에도 이 모형을 제 블로그에 [http://exactitude.tistory.com/814 소개]한 적이 있습니다.
  
 
<math>\frac{dw_i(t)}{dt}=\eta_i(t)w_i(t)+\sum_{j\neq i}J_{ij}w_j(t)- \sum_{j\neq i}J_{ji}w_i(t)</math>
 
<math>\frac{dw_i(t)}{dt}=\eta_i(t)w_i(t)+\sum_{j\neq i}J_{ij}w_j(t)- \sum_{j\neq i}J_{ji}w_i(t)</math>
17번째 줄: 17번째 줄:
 
이 두 결과의 차이는 노이즈를 어떻게 '해석'할 거냐의 차이에서 오는 것으로 보입니다. 두 가지 해석이 있는데 이토(Ito) 해석과 스트라토노비치(Stratonovich) 해석입니다. 이 얘기도 [http://exactitude.tistory.com/605 예전(2008년 12월)에 제 블로그에서 한 적]이 있습니다. 그때 자세히 짚고 넘어가지 않았던 부분을 오늘 짚어보겠습니다.
 
이 두 결과의 차이는 노이즈를 어떻게 '해석'할 거냐의 차이에서 오는 것으로 보입니다. 두 가지 해석이 있는데 이토(Ito) 해석과 스트라토노비치(Stratonovich) 해석입니다. 이 얘기도 [http://exactitude.tistory.com/605 예전(2008년 12월)에 제 블로그에서 한 적]이 있습니다. 그때 자세히 짚고 넘어가지 않았던 부분을 오늘 짚어보겠습니다.
  
일단 한국어로 풀어보면, 순간적으로 툭툭 생기는 노이즈가 우리가 다루는 시스템에 영향을 줄텐데
+
일단 한국어로 풀어보면, 순간적으로 툭툭 생기는 노이즈가 우리가 다루는 변수에 영향을 줄텐데 노이즈 자체가 순간적으로 변하기 때문에 변수도 순간적으로 변하겠죠. 그렇다면 '연속적인' 미분방정식으로 씌어지는 변수를 노이즈가 가해지기 전의 값으로 쓸 건지, 노이즈가 가해진 후의 값으로 쓸 건지, 아니면 가해지기 전과 후의 평균으로 쓸 건지가 문제가 됩니다. 평균으로 하겠다는 게 스트라토노비치 해석이고 가해지기 전으로 쓰겠다는 게 이토 해석입니다. 이제 수식을 볼까요.
 +
 
 +
랑제방 방정식을 씁니다.
 +
 
 +
<math>\frac{dy(t)}{dt}=A(y)+C(y)\eta(t)</math>
 +
 
 +
여기서 노이즈 η는 평균이 0이고 분산이 Γ라고 합시다. 어떤 시각 t부터 t + Δt 사이에 갑툭튀 노이즈가 하나 발생했다고 합시다. 위 식을 차분방정식 꼴로 다시 써줍니다.
 +
 
 +
<math>y(t+\Delta t)-y(t)=A(y)\Delta t+C\left(\frac{y(t)+y(t+\Delta t)}{2}\right)\int_t^{t+\Delta t}\eta(t')dt'</math>
 +
 
 +
C의 인수를 보시면 '평균'으로 쓴다는 말을 아시겠죠? 노이즈가 가해지기 전 t에서의 변수값과 가해진 후, 즉 t + Δt에서의 변수값의 평균을 넣었습니다. 그런데 왜 A에는 그걸 이용하지 않느냐... 사실 뭘 넣어도 상관없기 때문이겠죠. 이게 말했듯이 스트라토노비치가 한 방법이고요. 이토의 방법은 좀더 간단히 씌어지겠죠.
 +
 
 +
<math>y(t+\Delta t)-y(t)=A(y)\Delta t+C(y(t))\int_t^{t+\Delta t}\eta(t')dt'</math>
 +
 
 +
그래서 이게 무슨 차이를 불러일으키느냐.를 보려면 스트라토노비치의 C를 테일러 전개해보겠습니다. (사실 제대로 하려면 새로운 변수를 도입하고 등등... 이건 반 캄펜의 책 231쪽을 보세요. 저는 제멋대로 해석;;;)
 +
 
 +
<math>C\left(\frac{y(t)+y(t+\Delta t)}{2}\right)\approx C(y(t))+\frac{\Delta t}{2}\frac{dC(y)}{dy}\frac{dy}{dt}</math>
 +
 
 +
C의 인수에 있던 y를 먼저 전개하고 그리고나서 C를 전개한 결과입니다. 위 우변의 첫번째는 이토 해석에 있는 거 그대로죠. 즉 두 해석의 차이는 두번째 항에서 나옵니다. 여기서 dy/dt를 원래 랑제방 방정식으로 바꾸고, 원래 뒤에 붙어 있던 노이즈 적분항도 같이 써줍니다.
 +
 
 +
<math>\frac{\Delta t}{2}\frac{dC(y)}{dy}[A(y)+C(y)\eta(t)]\int_t^{t+\Delta t}\eta(t')dt'=\frac{\Delta t}{2}\dot C(y)C(y)\Gamma</math>
 +
 
 +
여기 등호가 정확한 건지 모르겠지만, Δt가 매우 작다고 하면 노이즈 적분항도 0에 가까워지겠죠. C를 y로 미분한 건 C 위에 점 하나 찍어 나타냈습니다. 그럼 A 항은 날라가는데, 두번째 C 항은 두 η의 곱을 적분한 항이므로 노이즈의 분산인 Γ가 튀어나옵니다. 역시나 수학적으로 엄밀하지는 않습니다만;;; '물리적 허용'이라고 봐달라고 하면 막장인가요. 여튼 저 마지막 결과는 이제 노이즈 항에서 흐름(drift) 항, 즉 A가 있는 자리로 옮겨갈 수 있습니다. 정리하겠습니다.
 +
 
 +
<math>y(t+\Delta t)-y(t)=\left[A(y)+\frac{\Gamma}{2}\dot C(y)C(y)\right]\Delta t+C(y(t))\int_t^{t+\Delta t}\eta(t')dt'</math>
 +
 
 +
그러면 부쇼-메자르 모형의 결과가 왜 두 가지가 나올 수 있는지, 그리고 그 차이가 왜 노이즈의 분산에 비례하는 항인지 알 수 있습니다. 그런데 부쇼와 메자르의 논문에서는 이 두 가지를 서로 바꾸어 말한 것으로 보입니다. [http://dx.doi.org/10.1016/S0378-4371%2800%2900205-3 논문] 537쪽 각주에 "이토 방식으로 쓰면 σ<sup>2</sup>항이 수식에 추가될 것이다"라는 식으로 썼는데요, 그 반대 아닌가;;; 유명하신 분들인데 내가 잘못 이해한 건가 모르겠네요.
 +
[[분류:통계물리]]

2012년 12월 23일 (일) 05:35 기준 최신판

뭔가 해결되지 않은 문제가 머리 속을 굴러다니다 해야 할 일이 많음에도 갑툭튀 했습니다. 어쩔 수 없죠 뭐. "간단한 경제 모형에서 부의 응집(Wealth condensation in a simple model of economy)"이라는 제목의 <피지카 에이> 논문과 이들 저자의 이름을 딴 부쇼-메자르 모형(Bouchaud-Mezard model)의 풀이에 관한 문제입니다. 이전에도 이 모형을 제 블로그에 소개한 적이 있습니다.

\(\frac{dw_i(t)}{dt}=\eta_i(t)w_i(t)+\sum_{j\neq i}J_{ij}w_j(t)- \sum_{j\neq i}J_{ji}w_i(t)\)

이겁니다. 자세한 설명은 이전 글을 참고하세요. 저자들은 평균장 어림으로 이 문제를 푸는데요, J를 모두 똑같다고 가정하고, 위 식을 모든 i에 대해 더하고 N으로 나눠주면 우변의 J 항들이 날라갑니다.

\(\frac{d\langle w\rangle(t)}{dt}=\frac{1}{N}\sum_i\eta_i(t)w_i(t)\)

노이즈인 η도 각 i마다 달라서 이걸 그냥 다 같다고 가정해도 되는건지 모르겠지만, 일단 해봅시다. 또한 노이즈는 평균이 m이고 분산이 2σ2이라고 합니다. 블라블라 풀어줍니다.

\(\langle w\rangle(t)=\langle w\rangle(0)\exp(mt)\)

이럴 줄 알았는데, 논문에서는 다른 답을 제시합니다.

\(\langle w\rangle(t)=\langle w\rangle(0)\exp[(m+\sigma^2)t]\)

이 두 결과의 차이는 노이즈를 어떻게 '해석'할 거냐의 차이에서 오는 것으로 보입니다. 두 가지 해석이 있는데 이토(Ito) 해석과 스트라토노비치(Stratonovich) 해석입니다. 이 얘기도 예전(2008년 12월)에 제 블로그에서 한 적이 있습니다. 그때 자세히 짚고 넘어가지 않았던 부분을 오늘 짚어보겠습니다.

일단 한국어로 풀어보면, 순간적으로 툭툭 생기는 노이즈가 우리가 다루는 변수에 영향을 줄텐데 노이즈 자체가 순간적으로 변하기 때문에 변수도 순간적으로 변하겠죠. 그렇다면 '연속적인' 미분방정식으로 씌어지는 변수를 노이즈가 가해지기 전의 값으로 쓸 건지, 노이즈가 가해진 후의 값으로 쓸 건지, 아니면 가해지기 전과 후의 평균으로 쓸 건지가 문제가 됩니다. 평균으로 하겠다는 게 스트라토노비치 해석이고 가해지기 전으로 쓰겠다는 게 이토 해석입니다. 이제 수식을 볼까요.

랑제방 방정식을 씁니다.

\(\frac{dy(t)}{dt}=A(y)+C(y)\eta(t)\)

여기서 노이즈 η는 평균이 0이고 분산이 Γ라고 합시다. 어떤 시각 t부터 t + Δt 사이에 갑툭튀 노이즈가 하나 발생했다고 합시다. 위 식을 차분방정식 꼴로 다시 써줍니다.

\(y(t+\Delta t)-y(t)=A(y)\Delta t+C\left(\frac{y(t)+y(t+\Delta t)}{2}\right)\int_t^{t+\Delta t}\eta(t')dt'\)

C의 인수를 보시면 '평균'으로 쓴다는 말을 아시겠죠? 노이즈가 가해지기 전 t에서의 변수값과 가해진 후, 즉 t + Δt에서의 변수값의 평균을 넣었습니다. 그런데 왜 A에는 그걸 이용하지 않느냐... 사실 뭘 넣어도 상관없기 때문이겠죠. 이게 말했듯이 스트라토노비치가 한 방법이고요. 이토의 방법은 좀더 간단히 씌어지겠죠.

\(y(t+\Delta t)-y(t)=A(y)\Delta t+C(y(t))\int_t^{t+\Delta t}\eta(t')dt'\)

그래서 이게 무슨 차이를 불러일으키느냐.를 보려면 스트라토노비치의 C를 테일러 전개해보겠습니다. (사실 제대로 하려면 새로운 변수를 도입하고 등등... 이건 반 캄펜의 책 231쪽을 보세요. 저는 제멋대로 해석;;;)

\(C\left(\frac{y(t)+y(t+\Delta t)}{2}\right)\approx C(y(t))+\frac{\Delta t}{2}\frac{dC(y)}{dy}\frac{dy}{dt}\)

C의 인수에 있던 y를 먼저 전개하고 그리고나서 C를 전개한 결과입니다. 위 우변의 첫번째는 이토 해석에 있는 거 그대로죠. 즉 두 해석의 차이는 두번째 항에서 나옵니다. 여기서 dy/dt를 원래 랑제방 방정식으로 바꾸고, 원래 뒤에 붙어 있던 노이즈 적분항도 같이 써줍니다.

\(\frac{\Delta t}{2}\frac{dC(y)}{dy}[A(y)+C(y)\eta(t)]\int_t^{t+\Delta t}\eta(t')dt'=\frac{\Delta t}{2}\dot C(y)C(y)\Gamma\)

여기 등호가 정확한 건지 모르겠지만, Δt가 매우 작다고 하면 노이즈 적분항도 0에 가까워지겠죠. C를 y로 미분한 건 C 위에 점 하나 찍어 나타냈습니다. 그럼 A 항은 날라가는데, 두번째 C 항은 두 η의 곱을 적분한 항이므로 노이즈의 분산인 Γ가 튀어나옵니다. 역시나 수학적으로 엄밀하지는 않습니다만;;; '물리적 허용'이라고 봐달라고 하면 막장인가요. 여튼 저 마지막 결과는 이제 노이즈 항에서 흐름(drift) 항, 즉 A가 있는 자리로 옮겨갈 수 있습니다. 정리하겠습니다.

\(y(t+\Delta t)-y(t)=\left[A(y)+\frac{\Gamma}{2}\dot C(y)C(y)\right]\Delta t+C(y(t))\int_t^{t+\Delta t}\eta(t')dt'\)

그러면 부쇼-메자르 모형의 결과가 왜 두 가지가 나올 수 있는지, 그리고 그 차이가 왜 노이즈의 분산에 비례하는 항인지 알 수 있습니다. 그런데 부쇼와 메자르의 논문에서는 이 두 가지를 서로 바꾸어 말한 것으로 보입니다. 논문 537쪽 각주에 "이토 방식으로 쓰면 σ2항이 수식에 추가될 것이다"라는 식으로 썼는데요, 그 반대 아닌가;;; 유명하신 분들인데 내가 잘못 이해한 건가 모르겠네요.