论文笔记 Mora, T., & Bialek, W. (2011). Are biological systems poised at criticality? Journal of Statistical Physics, 144(2), 268-302. 第 1 部分
之前在动力学系列里提到过 Mora, T., & Bialek, W. (2011). Are biological systems poised at criticality? Journal of Statistical Physics, 144(2), 268-302. 这篇论文
本来打算读完而且把笔记全写完再发出来的,但是一方面公众号的阅读量和文章长度负相关,另一方面平台送的流量包快过期了……
介绍
文献综述中提到的
与临界点有关的一些系统,以及相应论文:
- 沙堆、地震:Bak, P., Tang, C., Wiesenfeld, K.: Self-organized criticality: an explanation of the 1/f noise. Phys. Rev. Lett. 59(4), 381–384 (1987)
- 玩具模型:Bak, P.: How Nature Works. Springer, New York (1996)
- 生物演化:
- Bak, P., Sneppen, K.: Punctuated equilibrium and criticality in a simple model of evolution. Phys. Rev. Lett. 71(24), 4083–4086 (1993)
- Gould, S., Eldredge, N.: Punctuated equilibria: the tempo and mode of evolution reconsidered. Paleobi- ology 3(2), 115–151 (1977)
- 大脑:Usher, M., Stemmler, M., Olami, Z.: Dynamic pattern formation leads to 1/f noise in neural populations. Phys. Rev. Lett. 74(2), 326–329 (1995)
- 生物膜:Veatch, S.L., Soubias, O., Keller, S.L., Gawrisch, K.: Critical fluctuations in domain-forming lipid mixtures. Proc. Natl. Acad. Sci. USA 104(45), 17650–17655 (2007)
生物中的临界现象具体指什么
生物系统处于定态 (stationary state),有大量参数。
系统一方面不关心参数的具体取值,
另一方面又需要不同取值能给出不同的功能(函数值)。
这就要求模型存在多个不同的相 (phase),每个相的内部函数值变化不大,不同的相之间的函数值有定性上的区别。
相与相之间的边界就是临界面 (critical surface)。
文章标题的含义就是作者的假说:在可以于参数空间任意位置取值的情况下,生物系统的取值往往不平凡地位于临界面附近。
只是一个陈述事实的特称命题,不是全称命题,也不涉及为什么。
"Knowledge-based" 基于知识的……
这段在原文中下一节 Zipf’s law 里面,我觉得摘出来放到简介部分比较好。
系统参数 的概率符合波尔兹曼分布:
其中 Z 是配分函数 (partition function),E 是能量, 是波尔兹曼常数,T 是温度。
将无关的量纲都压缩之后:
等号右边可以从实验数据统计出来,左边的能量就可以喂给各种物理模型。
文中没说的:这种玩法叫做 knowledge-based,在人工智能干翻蛋白质、DNA、RNA 结构预测问题之前还挺唬人的。
具体的方法是从结构生物学已经解析过的生物大分子的构型数据库里进行统计,某某官能团/结构域和另外某个官能团/结构域之间的距离/角度的统计分布,然后从统计到概率,从概率到“基于知识的自由能”——
于是在面对新的序列时,试探性地摆弄官能团之间的距离、角度,然后选择各个试探解中“基于知识的自由能”最低的结构作为自己的预测。
就像前面说的,人工智能大力出奇迹,管你这那的,你给我个序列,我给你个结构就完事了呗。
需要注意的是,AI 取代的是结构预测问题的很多解法,而不是结构生物学这一分支。前者以理论工作为主,后者主要是实验科学。最近看某站上有些视频及其中的评论,无限吹 AI 的狗哨,只能说不愧被誉为童厕。
当然某学科分支也确实受到其他领域的腹诽,但这在 AI 时代之前就这样了,主要罪名是仪器 24 小时开机,研究生三班倒内卷,匀速直线发论文。要是说这个的话,难道就只有这个学科如此,【】、【】和【】就不这样了么?
Zipf’s law and criticality
Zipf’s law 的内容:记一门语言中的单词为 ,这个单词在语料中的出现次数的排名为 ,则它出现的频率
写成最后一项是为了避免 1/r 在求和/积分时发散。
熵与能量的线性关系
文章证明了:对于足够大的系统,Zipf’s Law 等价于说熵(大约)是能量的线性函数。
状态密度(在宽为 的能量区间内的状态数)
这个量和熵之间应该是指数关系,在热力学极限下能量和熵都应该和系统的规模 N 正相关
上式中后一项和系统规模无关,在大数 N 极限下趋于 0.
状态的累积密度 (cumulative density of states):
对于足够大的系统
另一方面,词汇频率的排名按定义就是累积密度
以上两式联立
把 Zipf’s law 代入上式
等号左边换成前一节中的能量,整理一下
命题得证。
能量和熵的线性关系意味着临界现象
配分函数
论文中这一段的文字符合语法吗?
配分函数往往是求和或积分形式,每一个分项表示的是对应状态在整个系综中的概率权重。
当上式中的 N 足够大时,根据拉普拉斯方法(英文 | 中文),整个积分结果的近似值取决于其中最大的一个分项,也就归结于求 在 极大值处的取值。 的极大值出现在下式成立的位置:
以上内容没用到 Zipf’s law,对所有统计物理系统都成立。
Zipf’s law 给出了约化熵对约化能量的另一个求导结果:
当 时,指数项是衰减的,整个系统会主要处在最低能级;类似无限复读狗哨和烂梗的童厕弹幕
当 时,指数项是发散的,能级越高的状态,出现的概率也越高;类似“氤氲”、“彳亍”、“嚆矢”满天飞的满分作文
就成为了 Zipf 系统的一个临界点。
本文收录于以下合集: