发人深思:如何测度网络中的影响力
快速测试
假设你是一家银行的客服经理(唯一的)。你需要做对银行最好的决定。现在假设你可以知道等待服务的客户的名字,然后选择服务对象。你需要说出你选择服务的对象。
准备好了吗?
这是第一批正在等待服务的顾客名单: Steve Dormack 先生;Alicia Suvay女士;马克•平卡斯先生(星佳公司创始人) 这个选择时容易的,平卡斯先生非常乐意接受你的服务。
这是第二批顾客的名单: 西尔维亚库克女士;埃隆•马斯克先生(特斯拉的首席执行官);比尔盖茨先生(是的,微软的比尔盖茨) 现在你将首先向谁提供服务呢?一个比较难的抉择。
言归正传,我们做很多决策时都基于我们对人物影响力的主观判断。有时,这些判断是简单的(例如你遇到的第一组顾客)。但是有的时候这些判断又是令人心烦的(例如你遇到的第二组顾客)。想象一下你遇到10个类似顾客清单的场景,判断将很难做出。
在本文中,我们给给出一个框架,并用数据科学的手段来判断影响力。
当今世界影响力的重要性
现在让我们考虑更加实际的情况。你需要为某一技术公司雇佣商务发展人员。合格的候选人应该能够自己赢得合同并建立顾客及相关人群的网络。你能漂亮地找到这样的候选人吗?
情形1
你接到了1000份需要浏览的申请。通过一种的奖励整理,你提取了以下信息:
- 40%的求值者拥有商务学位,其中50%拥有硕士学位。
- 10%的求职者有MBA学位。
- 99%的求职者有商务化人际关系网账户。
- 15%的求职者参加过托福考试,其中20%的分数超过110分
- 15%的求职者有咨询背景其中20%有3年以上的咨询工作经验
- 70%的求职者目前的薪资低于你提供的薪资的80%。
这些信息可能是有用的,但是这将耗费很长的时间去发现最终的候选人。
也许你可以将这项工作完成的更有智慧。
情形2
对于相同的公司,你从商务化人际关系网购买了几个网络关系的参数。此外,你有如下信息:
a 每个候选人的网络综合指数。这个指数从以下几个方面衡量求职者:
- 网络关系的规模
- 网络关系是否多样化
- 求职者在其商务化人际关系网中的影响力
- 多少人浏览他们的更新并进行评论
b 领域特定网络指数。这是和a 类似的机制,但是针对的人群为特定领域的人群。因此你可以获得金融、咨询、营运、业务拓展等领域的网络指数。
如果你有这些信息结合情形1中的信息,你的工作是不是变得简单?这些指数会不会帮之你更快的制定决策?
影响力测量
假设你被要求设计一个网络指数(在上例中),然后提出一个综合分数来评估一个人在商务化人际关系中的重要性。你首先需要做的是找到合适的目标函数。
我们将通过网络指数评估以下的几个方面:
- 该网络关系使用者的关系人数
- 这些人的影响力
- 这些人的领域差异
- 这些不同领域的人是如何工作的
如果我们找到一个机制将以上4个方面都考虑进去,我们将创造一种新工具。我的想法是开发一种很简单的东西可以完成上述功能。接下来给出一些我创建该指数时的定义:
- 地理覆盖范围:将世界划分为10*10的区域(你可以选择任何数据)。然后统计朋友们在各个区域出现的次数。下表中的数据表征朋友的数目。在这个例子中地理覆盖范围为6.为了消除噪音和波动我们可以设置一个阈值,当每一区域人数超过该阈值时在纳入统计。
- 地理压缩率:使1中的分块更大,重新计算大块覆盖率。在上文给的例子中大块覆盖率依旧是6。我定义地理压缩率为(地理覆盖率/大块覆盖率)。在上文的例子中地理压缩率为1.在我的例子中这个值将在4到1之间。这个值越小点的分散率越高。因此地理压缩率越小则效果越好。
- 综合影响: 目前为止我们只考虑了网络关系中的人数,然而关系的质量并没与纳入考虑。因此,综合影响是遍及所有网络使用者的所有指数(之后定义)的得分之和。
- 专业领域的多样性:让我们简单地将领域分为: 金融、市场、运营、制造、信息技术。现在我们来做一个类似于地理覆盖范围的工作。我设置2个人为统计的阈值。这里领域分散度是2。
创建综合得分
我们现在拥有了所有的成分。让我们来分析一下各个成分的具体情况:
- 地理覆盖率(G):越大越好
- 地理压缩率(C):越小越好
- 综合影响(I):越大越好
- 领域多样性(D):越大越好
正如你所看到的,计算综合影响力并不是直接的,需要反复迭代。我们可以从一般1开始逐步迭代得到综合影响。
现在来定义综合得分
个人影响得分= G I D/C 其中I=网络中所有个人的得分之和。
当然,你可以根据你的需求调整个人得分。
这里还有一些可以包含在方法中的变化。例如,你只是需要研究咨询领域的个人影响得分。你可以简单地将上述全部领域缩减到咨询领域。然后计算相似的指数。当然还可以有很多的变化。再例如,你可以将地理范围压缩到亚洲领域等。
via:数据工匠
End.