干货丨扒一扒数据挖掘行业的黄油和面包
声明:本文指的是做数据挖掘这行,不是数据仓库。
我干这行有几年了,见了很多人,干了很多公司,爆一爆这个行业的状况吧……让后来人有所了解,也让猎头挖人挖的有点方向,起码和candidates聊天的时候不至于什么也不清楚谈不明白,不清楚价值,等等。
个人的经验,干这行最重要的第一是人,第二是项目,绝对的人才加上做合适的项目才能成长起来,其余都是扯淡的,就算理论知识再完备,没有机遇也难以成长。
▊目录:
1-哪些公司主要招这个行业的人
2-这个行业的基本待遇如何
3-以后的发展之路
4-如何成为混合型人才
5-未来的路我也看不清楚
公司
说起公司,有很多种分类方式,我这里选择几个指标(规模、产品线、solution、项目数量):
一级:IBM、Teradata、SAS
二级:Accenture、Ernst &Young、Deloitte、KXEN、Fair Isaac、招行
三级:百度、网易、腾讯、搜狐、淘宝、 阿里 巴巴、京东、新蛋、天涯、千橡、盛大、360、人民搜索、优酷、当当……一堆想做又不知道怎么做,连思路和成功案例都没有的公司,主要为互联网公司、零售业的一些公司
三级公司还包括国内的厂商和咨询公司:亚信、华为、斯特奇、融通、华胜、中盈、神马、联创、新华信……这些见过猪跑,没吃过猪肉的类型……
至于为什么这样分类,有人肯定不同意,那也没关系,我列出以下理由:
IBM,Teradata这俩公司有自己的DW产品、DM产品,CRM产品(包含ACRM和OCRM),同时这两个公司单子很多,也就是挖掘的项目很多,电信、金融都有。
SAS在中国也很牛,软件很厉害,就是贵的真要命啊,不是小喽喽能玩的起的,而且只租不卖,在中国solution做的不多,就是个卖软件。SAS在北京西安有研发中心,这个是其他公司不具备的,因此SAS有资格成为一级公司,IBM和Teradata在中国也有研发中心,不过对其挖掘的产品开发工作不多,这个可以去打听一下,一个在上地,一个在五道口。
AC、EY、DT三家都是咨询背景的,没产品是绝对的缺陷,都是绑着别人做的,不过单子也不少,AC,EY主要干电信,DT金融单子多点。招行列在这的原意是:招行是唯一一个有自己挖掘团队的国内金融客户,我指的是真正能做出来东西的团队,不是其他四大行那种混日子的团队,招行的钱也不少哦。
人才
数据挖掘的”正规军“: 一般都在一级、二级公司任职,圈子很小,互相都认识,比如坛子上也基本不说话,新人想入行的老人也不咋教,核心技术与业务核心理念存在于几个人脑子里,没文档描述,就算有也是给客户看的,没什么用处,给新人模型也看不懂,只要不给解释,那就是不可能明白其中的业务思考深度和模型的构建逻辑,进来的人基本上靠天赋和机遇,碰上心好的前辈口口相传,慢慢积累出来突然一天发现,我的妈呀,终于入行了!门槛挺高的,多是大厂商出来的或者pure咨询背景的兄弟姐妹,不知道我发完帖子之后会不会一大帮哥们蹦出来骂我哈。
数据挖掘 的”野战军“: 存在于三级公司,想法多,思路多,专注于算法、代码等等,根本不会去想数据挖掘的商业价值,如何把知识转换为生产力,如何赚钱,cost control,marteting等等商业问题。
正规军具备详尽的知识体系、战略思想、解决方案、软件架构、较好的数学,计算机,统计理论背景等等,这些都是野战军不具备的,当然野战军中也有游侠一样的高人,出来也是秒杀正规军一片人马,我这里指的只是一般情况。
▊待遇:
一二级公司: junior,1~2W/月,senior,2.5~4W/月左右,mgr,4~6W/月左右,SM,6~9W/月,Director,10W~,partner没数了……,也有疯狂的,见过一个AC的SM,140万package,当然也要背quota,他能力也超强。
三级公司 就便宜多了,三级公司基本照着码农、码奴的要求招人,所以去的人也少,只知道一个百度的大哥,70W的package,是中层了;因此,市场上活蹦乱跳天天招人的那些公司还在每天活蹦乱跳的招。AC、EY、DT的薪水是超过IBM和Teradata很多的。
待遇其实是由市场决定的,一级二级公司的人做的都是银行电信的单子,大项目,拿钱多正常的,三级公司给自己做,钱少点,所以没啥牛人,web mining的项目居多,多以尝试为主,没有经济效益。
接到猎头电话的时候,我一般三级公司就是瞧瞧看看,一级二级的才列为正式考虑的对象。
发展
顾问路线:c-sc-mgr-sm-director-partner
技术路线:se-ae-pm-spm-director-vp-cfo
还有很多路线:比如sales、software路线等等,这个就因人而异了
能力
一定要懂点战略、才能结合商业;
一定要漂亮的presentation、才能buyin;
一定要有global view、才能打单;
一定要懂业务、才能结合市场;
一定要专几种工具、才能干活;
一定要学好excel、才能有效率;
一定要有强悍理论基础、才能入门;
一定要努力、才能赚钱;
最重要的:一定要务实、才有reputation;不懂的化以后慢慢就明白了。
▊目标:
1-做过多少个项目?
2-业务背景有哪些,是否跨行业?
3-做过多少种类型的模型?做了多少个模型?
4-基于模型做过多少次完整的marketing闭环?
以上四个问题,足以秒杀95%以上的忽悠和菜鸟!
未来
行业今后如何,我也不知道,反正养家活口不成问题,有转甲方的,有做sales的,有做partner的,自己开公司的也有;
自己努力的话,永远不会被社会甩掉;
不能转化为生产力的数据挖掘是永远没有市场的一项技术!
前景很好,与同学们共同努力!
注:本文系中国统计网授权数据观转载,作者:云开_sky (中国统计网特邀认证作者),版权著作权属原创者所有,禁止二次转载。编辑: Fynlch(王培),数据观微信公众号(ID:cbdioreview),欲了解更多大数据行业相关资讯,可搜索数据观(中国大数据产业观察网www.cbdio.com)进入查看。
责任编辑:王培