干货丨扒一扒数据挖掘行业的黄油和面包

数据观  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

声明:本文指的是做数据挖掘这行,不是数据仓库。

我干这行有几年了,见了很多人,干了很多公司,爆一爆这个行业的状况吧……让后来人有所了解,也让猎头挖人挖的有点方向,起码和candidates聊天的时候不至于什么也不清楚谈不明白,不清楚价值,等等。

个人的经验,干这行最重要的第一是人,第二是项目,绝对的人才加上做合适的项目才能成长起来,其余都是扯淡的,就算理论知识再完备,没有机遇也难以成长。

   ▊目录:

1-哪些公司主要招这个行业的人

2-这个行业的基本待遇如何

3-以后的发展之路

4-如何成为混合型人才

5-未来的路我也看不清楚

   公司

说起公司,有很多种分类方式,我这里选择几个指标(规模、产品线、solution、项目数量):

一级:IBM、Teradata、SAS

二级:Accenture、Ernst &Young、Deloitte、KXEN、Fair Isaac、招行

   三级:百度、网易、腾讯、搜狐、淘宝、 阿里 巴巴、京东、新蛋、天涯、千橡、盛大、360、人民搜索、优酷、当当……一堆想做又不知道怎么做,连思路和成功案例都没有的公司,主要为互联网公司、零售业的一些公司

三级公司还包括国内的厂商和咨询公司:亚信、华为、斯特奇、融通、华胜、中盈、神马、联创、新华信……这些见过猪跑,没吃过猪肉的类型……

   至于为什么这样分类,有人肯定不同意,那也没关系,我列出以下理由:

IBM,Teradata这俩公司有自己的DW产品、DM产品,CRM产品(包含ACRM和OCRM),同时这两个公司单子很多,也就是挖掘的项目很多,电信、金融都有。

SAS在中国也很牛,软件很厉害,就是贵的真要命啊,不是小喽喽能玩的起的,而且只租不卖,在中国solution做的不多,就是个卖软件。SAS在北京西安有研发中心,这个是其他公司不具备的,因此SAS有资格成为一级公司,IBM和Teradata在中国也有研发中心,不过对其挖掘的产品开发工作不多,这个可以去打听一下,一个在上地,一个在五道口。

AC、EY、DT三家都是咨询背景的,没产品是绝对的缺陷,都是绑着别人做的,不过单子也不少,AC,EY主要干电信,DT金融单子多点。招行列在这的原意是:招行是唯一一个有自己挖掘团队的国内金融客户,我指的是真正能做出来东西的团队,不是其他四大行那种混日子的团队,招行的钱也不少哦。

   人才

   数据挖掘的”正规军“: 一般都在一级、二级公司任职,圈子很小,互相都认识,比如坛子上也基本不说话,新人想入行的老人也不咋教,核心技术与业务核心理念存在于几个人脑子里,没文档描述,就算有也是给客户看的,没什么用处,给新人模型也看不懂,只要不给解释,那就是不可能明白其中的业务思考深度和模型的构建逻辑,进来的人基本上靠天赋和机遇,碰上心好的前辈口口相传,慢慢积累出来突然一天发现,我的妈呀,终于入行了!门槛挺高的,多是大厂商出来的或者pure咨询背景的兄弟姐妹,不知道我发完帖子之后会不会一大帮哥们蹦出来骂我哈。

   数据挖掘 的”野战军“: 存在于三级公司,想法多,思路多,专注于算法、代码等等,根本不会去想数据挖掘的商业价值,如何把知识转换为生产力,如何赚钱,cost control,marteting等等商业问题。

正规军具备详尽的知识体系、战略思想、解决方案、软件架构、较好的数学,计算机,统计理论背景等等,这些都是野战军不具备的,当然野战军中也有游侠一样的高人,出来也是秒杀正规军一片人马,我这里指的只是一般情况。

   ▊待遇:

   一二级公司: junior,1~2W/月,senior,2.5~4W/月左右,mgr,4~6W/月左右,SM,6~9W/月,Director,10W~,partner没数了……,也有疯狂的,见过一个AC的SM,140万package,当然也要背quota,他能力也超强。

   三级公司 就便宜多了,三级公司基本照着码农、码奴的要求招人,所以去的人也少,只知道一个百度的大哥,70W的package,是中层了;因此,市场上活蹦乱跳天天招人的那些公司还在每天活蹦乱跳的招。AC、EY、DT的薪水是超过IBM和Teradata很多的。

待遇其实是由市场决定的,一级二级公司的人做的都是银行电信的单子,大项目,拿钱多正常的,三级公司给自己做,钱少点,所以没啥牛人,web mining的项目居多,多以尝试为主,没有经济效益。

接到猎头电话的时候,我一般三级公司就是瞧瞧看看,一级二级的才列为正式考虑的对象。

   发展

顾问路线:c-sc-mgr-sm-director-partner

技术路线:se-ae-pm-spm-director-vp-cfo

还有很多路线:比如sales、software路线等等,这个就因人而异了

   能力

一定要懂点战略、才能结合商业;

一定要漂亮的presentation、才能buyin;

一定要有global view、才能打单;

一定要懂业务、才能结合市场;

一定要专几种工具、才能干活;

一定要学好excel、才能有效率;

一定要有强悍理论基础、才能入门;

一定要努力、才能赚钱;

最重要的:一定要务实、才有reputation;不懂的化以后慢慢就明白了。

   ▊目标:

1-做过多少个项目?

2-业务背景有哪些,是否跨行业?

3-做过多少种类型的模型?做了多少个模型?

4-基于模型做过多少次完整的marketing闭环?

   以上四个问题,足以秒杀95%以上的忽悠和菜鸟!

   未来

行业今后如何,我也不知道,反正养家活口不成问题,有转甲方的,有做sales的,有做partner的,自己开公司的也有;

自己努力的话,永远不会被社会甩掉;

不能转化为生产力的数据挖掘是永远没有市场的一项技术!

前景很好,与同学们共同努力!

   注:本文系中国统计网授权数据观转载,作者:云开_sky (中国统计网特邀认证作者),版权著作权属原创者所有,禁止二次转载。编辑: Fynlch(王培),数据观微信公众号(ID:cbdioreview),欲了解更多大数据行业相关资讯,可搜索数据观(中国大数据产业观察网www.cbdio.com)进入查看。

责任编辑:王培

随意打赏

数据挖掘工程师什么是数据挖掘数据分析干货数据挖掘算法大数据干货干货有哪些干货数据干货市场
提交建议
微信扫一扫,分享给好友吧。