多样性、创新和马尔可夫模型

为解决问题建模:采取某个行动a,该行动的价值F(a)。如何想出更好的解决方案a?Diversity多样性和Recombination重组。

多样性和重组的力量来自于团队或个人的维度:不同的视角perspectives和启发式heuristics。门捷列夫通过原子量组织元素周期表,牛顿的引力理论,即是一种视角。

好的视角没有太多的局部最优点Local Optima(an action, a , such that neighboring actions have lower values, a peak on the landscape)。

启发式即如何在视角内进行搜索。除非我们对问题有所了解,否则没有哪种启发式比其他更好——no free lunch theorem。但如果我们对问题有了了解,就可以找到更好的启发式。

Teams will be better than the individuals in it because of the perspectives and heuristics. 且团队的局部最优是个体局部最优的交集。

创新来自于看待问题的不同方式及寻找解决方案的不同方式,perspective和heuristic。

Recombinant Growth,把组合重新组合,创造更多的增长。现代大学、印刷术和科学传播等等的兴起,使思想得以从一个地方和一个人转移到另一个地方,所以有了技术革命。因为我们可以分享想法,然后重新组合它们。

Markov Model:1)一组状态a set of states; 2) 转移概率transition probabilities
马尔可夫收敛定理,在Markov Transition Matrix中,只要满足一定的假设,Markov processes收敛于一个均衡。

Equilibrium Point: Nothing changes平衡点:啥都没变
Statistical Equilibrium: The world keeps churning but the distribution of types stays the same. 统计均衡:世界在不断变化,但类型的分布保持不变。

是否就说明历史不重要、干预不重要、初始条件不重要?从马尔可夫模型的收敛角度可能是的,但是对于模型里的数据对象个体,答案会不一样。就好比虽然人均不过百年,蝇营狗苟偷生和光明磊落的丰富还是有区别的。对于个体组合而成的群体亦然,所以才有“一脉相承”“文脉绵长”这样的事情。

另一个Perspective的应用了。

七月的月季

到了阳历的七月,夏至之后接连的小暑大暑,让窗台上的花儿草儿们倍感压力。早晚喷叶面浇水掐虫卵的目标也不过是,鲜活就好了。

所幸的是小区外立面的装修终于完工,月季们在通透的阳光下又开始精神起来。只是花开得有些吃力了。

兵马俑的层次变少了许多,烈日下有些花瓣刚绽开来就被烤干。也许略有逊色,但依然是美的。尤其是在白天并没有空调的环境里,鲜艳和耐热度与夏日切花之王百合有得一拼。

铃之仙子依然颜色姣好,花苞却是肉眼可见地小了许多,毕竟这大热天里,努力地活着就要耗费大部分的养分和精力。

有了兵马俑的教训,不敢再让花骨朵在烈日里完全盛开了。花儿微微张开的早上就剪下来,养在室内的水盆里,开出这许多层花瓣。

若以开花为成绩,月季真的是个straight A的好学生啊。

Model Thinking笔记

最近总是跟朋友开玩笑说年岁渐长的缘故,记忆力不复当年勇了。静下来仔细想想,其实也跟最近的信息接受量和处理模式的改变有关。新知识点chunk:

Central Limit Theorem中心极限定理:如果一群人做出一堆独立的决定,得到的分布会是钟形曲线。这个钟形曲线意味着最有可能的结果是中间的那个。

Normal Distribution正态分布/高斯分布:统计学上重要的概率分布。正态曲线呈钟型,两头低,中间高,左右对称,因此又常被称之为钟形曲线bell curve。正态分布中,±1σ、±2σ、±3σ下的概率分别是68.3%、95.5%、99.73%,±6σ则为3.4ppm(part per million 百万分之)——六西格玛管理体系的由来。
延伸到产品质量案例,若要求的产品厚度为500-560mm,那么中间值mean是530,Six Sigma Standard Deviation要求就应该是5。
标准差Standard Deviation是方差的算术平方根,反映组内个体间的离散程度。比如1至9这九个自然数的均值为5,每个数字减去均值分别为:-4,-3,-2,-1,0,1,2,3,4;均值平方得到:16,9,4,1,0,1,4,9,16;然后求和=60;标准差=根号下60/(9-1)=根号下7.5,即方差开平方。

Game of life在netlogo里的路径:文件-模型库-computer science-cellular automata。

Ceteris Paribus :在其他条件都不变的情况下。,最常见的是解释某个线性回归模型的系数。通常指在其他变量不变的情况下,系数所属的变量的变动所带来的边际影响。

Spatial Model的有趣案例:如果一个人买电脑的主要有四个考虑因素,屏幕尺寸、运行速度、电池寿命和价格,那么最有可能有spatial preference的是屏幕尺寸。因为它对于购买者来讲有一个ideal point,而其他因素要么是越快越好要么是越长越好或越低越好。
所以新产品开发和传达的重点不仅是找到关键因素,而且是其中的spatial preferences!

Tipping Points:直接临界和环境临界,(平衡、周期、随机、复杂)类间、类中。
衡量方法:Diversity Index多样性指数(number of types)、Entropy熵(所需信息量)

72法则对应的精确指数计算在excel=power

Solow Growth Model比basic多的部分是技术变量A(t),在Basic Growth Model的基础上增加技术因素之后,Long Run GDP就会增加A²倍。增长模型不仅适用于国家等经济体,同样适用于个人:除了努力工作,也要投资于技术和创新的增长,让它保持在1以上的系数。

Back to Normal

昨天到陆家嘴参加京东云数智平台优加的会,又有点slowly back to normal的感觉了。

疫情前每年两三次的marketing或data的行业交流会,总会有类似于“沉下去做事情,浮上来看世界”的主张里,“浮上来看大家”的感觉。

大概在这又一个莺飞草长季节的缘故,看到陌生的同行们济济一堂,有些生机勃勃的感慨。

无论是咨询公司、品牌方还是平台的分享,都带着些京东的质朴感,有不少值得学习和思考的地方。许是时间节奏控制的缘故,期待的更深入的拆解和案例比较少。

有一点可爱的地方:前边嘉宾们分享全域经营、全业务线数智化等等,后边优加DaaS讲数据能力“数据可用不可见”。一方面的确事实如此,品牌有品牌的追求,平台有平台的顾虑;另一方面也说明作为品牌方,从平台转化和沉淀consumer数据的同时,在数据架构和流程中给每个电商平台建subpool和routine还是很有必要的。

感觉再国内外各旅游一次,就真的back-to-normal了。

RoadMap备忘录

再整理下data analysis的roadmap。这里的细节,就算被无视或轻视,也要保持初心,一点一点地认真走整个完整的流程。就像造一个房子,从地基开始,马虎不得。从第一秒开始做项目备忘录文档。沟通时不要心急,Be professional, keep calm and enthusiastic.

Ask 3+8–memo1),word
尽早了解案例研究的困难和问题非常重要,这样就可以专注于涉众的需求。
· Identify the problem
· Determine key stakeholders
· Explore the data and establish metrics 继续阅读“RoadMap备忘录”