如何给一条 Twitter 消息建立衰变模型?

36氪  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

如何给一条 Twitter 消息建立衰变模型?

如何给一条 Twitter 消息建立衰变模型?

\n\n

有时流量数据会让人上瘾。谁不想看看到底谁在浏览自己的网页呢?但你肯定没有见过《连线》作者 
\nRhett Allain 这么玩儿数据的:为一条含有链接的推讯建立衰变模型。

\n\n

如何给一条 Twitter 消息建立衰变模型?bit.ly 会给任何 bit.ly 链接提供即时数据。你只需在 bit.ly 链接后面加上一个“+”即可以看到该页面的访问信息,比如这个:
\nhttp://bit.ly/loMBP9+。很酷吧。

\n\n

上面这些数据来自Rhett的一个
\n链接,流量高峰几乎可以肯定是因为《连线》官推(@wired)发了一条含有该链接的推讯,该账户有85万粉丝。而 Rhett(
\n@rjallain)只有500多粉丝。

\n\n

##可以像考虑衰变问题那样为上述流量建模吗?

\n\n

Rhett当时的第一反应就是这些数据看上去像是放射性衰变。于是他打算计算出一条转发推讯的半衰期。什么是半衰期呢?

\n\n

他假定有某种东西,比如放射性原子或啤酒沫。假设这种东西数量为 (
\nN),并且假定这些东西减少的速度与其数量成比例。在给定的时间间隔 Δt 内,可以表达如下:

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

如果 Δt 趋于零,我们可以得到一个导数。数量是时间的函数:

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

这一点很容易验证。只要看数据是否满足某个指数函数。当然,除了连线官推(
\n@wired)带来的流量之外,还有其它因素,但几乎可以忽略不计。

\n\n

下面是流量数据和指数函数的拟合情况(通过 Vernier 的 Logger Pro 软件模拟而成):

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

拟合函数和拟合参数如下:

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

点击基准数为 Logger Pro 自动添加。这表明在指数衰变模型下,Rhett每分钟能获得约20次点击。
\nN 并非总点击数,而是每分钟点击数。把点击数作为时间的函数,可以得到一条plot曲线。

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

似乎衰变模型并不适合这种情况。每分钟点击次数的减少速度似乎和每分钟点击数无关。于是他打算换个方法。

\n\n

##另一个流量模型

\n\n

接着 Rhett 采用了一种完全不同的办法,假定如下:

\n\n

*@wired 转发了这个链接。

\n\n

*有85万关注者可能会看到这个链接。此处忽略了那些看到链接的非关注者。将此变量设为 
\nF。

\n\n

*这些关注者中的确有些会查看自己的 Twitter 消息。假定这部分关注者为 
\nw。

\n\n

*这些看到链接的关注者中还有一部分会打开链接,假定这部分人为 
\nc。

\n\n

*还有些人会通过其它途径点击该链接,但和连线官推无关,假定这部分人为 
\nB。
\n用图表可表示如下(大圈为总关注者数,中圈为查看者,小圈为点击者):

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

也就说是只有一部分关注者会看到这个链接,并且其中只有一部分会点击链接。

\n\n

含有链接的推讯发出一分钟后,所获得点击数如下:

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

那么下一分钟呢?还有 
\nF 个关注者,但如果他们点击过的话不会再次点击。担忧例外,比如 Rhett 的老爸通常一个链接会点击两次,因为他认为只有这样才能打开链接。

\n\n

w也可能生变。但这里假定其近似为常量。

\n\n

那么点击链接的人数 
\nc呢?这部分人更少。假定你是一名 Twitter 用户,第一分钟内没有点击该链接。现在你在看到这个链接之前已经看过20条推讯。那么你点击这条含有链接的连线官推的几率有多大呢?这取决于推讯的多少,以及你的冲动程度。但显然不是线性函数关系,因为如果是的话过一段时间之后几率会变成零。

\n\n

假定你是一名看到这个链接的人,并假定每分钟你都会在feed中看到一个新链接。Rhett 假定你点击某个链接的几率和链接总数成比例。所以,前两分钟内:

\n\n

如何给一条 Twitter 消息建立衰变模型?l 是某个常量,代表增加的推讯数。0.25 是一个假定比例,针对没有链接被点击的情况。

\n\n

在这里假定其它点击次数(
\nB)也为常量。还有另一个假设,有些点击者会转发该链接,假定其为二阶效应,可以忽略不计。

\n\n

由此得出第二分钟内的函数关系:

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

N
\n1 代表第一分钟内的点击次数。然后Rhett
\n在 Google 文档内对该模型进行了研究。得出以下参数:

\n\n

*w = 0.02

\n\n

*B = 15
\n对于 
\nc,取 
\nl0 = 25,亦即假定每分钟普通推友能看到25条新推讯。通过这些推讯,Rhett得出一个概率系数0.45。结果好于预期。

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

拟合的不错,但 Rhett 相信可以找出一个通用模型。

\n\n

##另一起事件

\n\n

推友 
\n@majornelson 更新了一条含有 Rhett 文章链接的推讯此人友24万粉丝。

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

Rhett 打算通过这次事件验证上面的出的模型。假定两者粉丝情况类似,以便得出相同的 
\nw 和 
\nc。同样假定
\nB=5,这样变量只有一个 
\nF。

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

拟合度并不理想。可能原因如下:

\n\n

*模型本身问题。

\n\n

*两者粉丝截然不同。这意味着 Rhett 模型的某些参数有所不同。

\n\n

*和每天中的时间段有关。连线发推是在中午12点左右,而后者在3:30左右。Rhett 的模型没有考虑到时间段。
\nRhett 首先验证第二点。这种可能性很大,后者粉丝明显少于前者,但在第一分钟内点击次数类似。Rhett把
\n@majornelson事件中的 
\nw 从 0.02 调高到 0.055,得到下面的曲线:

\n\n

如何给一条 Twitter 消息建立衰变模型?

\n\n

还不错吧。Rhett 认为 
\n@majornelson 的粉丝更有可能查看自己的 Twitter feed。他觉得这说得过去。或许很多连线的粉丝都真正注意吧。

下面几篇文章的内容与这篇文章的内容相似,也许你也会有兴趣:

Twitter 将推自有图片分享服务,Twitpics 等服务何去何从?

Twitter移动端网站全面改版,体验更轻便快捷

不到一年涨42%,Twitter月活跃用户数达2亿

Twitter或将砍掉推出仅6个月的#Music应用

谁在替twitter高管们敲钟?

即将裁员 336 人?这也许会是 Twitter 重生的第一步

\n\n

来源:
\n《连线》

\n\n

Rhett Allain 为东南路易斯安那大学物理学助理教授,喜欢教授和讨论物理学。有时把东西拆散了无法组装回原样。你可以在 Twitter 上关注他(
\n@rjallain)。

\n\n

 

如何给一条 Twitter 消息建立衰变模型?

下载36氪APP,获得更好阅读体验

随意打赏

twitter是什么twitter登陆twitter注册twitter下载twitter如何建立模型
提交建议
微信扫一扫,分享给好友吧。