·最新消息
最新消息
您所在的位置:首页 > 最新资讯 > 最新消息
机器学习对猎头行业培养高产值顾问的启示(下)
发布时间:2017/7/6 | 已被阅读:2026
 

​​ 上一节聊到,“强化学习”可以把无监督学习和有监督学习两者优势有机的结合在一起,那么代表着最炫最酷的学习方法,它有什么特别之处呢? 

AlphaGo

1706277267.jpg1706277267.jpg

话说AlphaGo一开始也是使用有监督的学习,学习的对象是人类高手上千年积累下来的对弈棋谱,那些棋谱的输赢结果是知道的,也就相当于人为地标注上了那步是好棋,那步是差棋。这个与Google通过开发详细的街景地图,来实际无人驾驶技术是一样的道理。

寻求突破

但是AlphaGo如果只是沿着人类的思路去学习,不单进步的速度慢,而且恐怕学得再多也不可能比人类的棋艺高出一大截。当然,因为围棋的变化太多,虽然计算机速度快,但在围棋领域试错也是不现实的。

不得不说,在没有了解之前,我一直以为AlphaGo是因为运算速度快,能提前算出每步棋的胜负概率才赢的人类,后来才知道不是这么的简单。更何况AlphaGo学习的目的是实现机器的高智能化,要突破人类思维的局限性是重点攻克的一环。

改进

为此AlphaGo就采用改进版的“强化学习”,它的方法说起来非常简单,就是机器在没有人为标注方向的情况下,自己先试着走一个方向,然后人告诉它好不好,也就是说它自己可以选择任何一个方向,包括之前人类没有想过的方向,然后人来告诉它这个方向可不可行。

特斯拉

1706278457.jpg1706278457.jpg

特斯拉的无人驾驶技术,它事先没有什么详细的街景地图等标注好的数据,它就根据人的反馈不断进行学习。一开始上路只能靠着车道识别的功能,沿着划定清晰的车道行驶,但到了车道不清楚的地方,或者是分叉等特殊情况的时候,特斯拉就蒙了,只能乱开。

更正确的方向

这个时候坐在同一辆车上的人就会干预,一旦它开错了人就马上接手控制车辆。这样虽然并没有详细的告诉它要如何开才是对的,但接受得多人为的反馈,它会朝着更正确的方法去驾驶。这也是“强化学习”。

现在想起来,我当时看到特斯拉的无人汽车还需要一个人在旁边看着的资讯,心里还嘲笑埃隆·马斯克竟然研发这种鸡肋。真应了一句话,没文化真可怕。

猎头

1706275879.png1706275879.png

说回到猎头上面,乍一看“强化学习”与无监督学习好像有点像,没错,两者都会很开心的鼓励你去撞墙,区别在于后者在你撞墙后,你也不知道你为什么就撞上了,所以下次再撞上去的机率会很高。而后者则是在你撞墙的那一瞬有人把你给拉回来,或者是你撞上后,有人详细的分析给你听,为什么会撞上了,它的底层逻辑是怎么样的。

顾问培养

当然这个反馈怎么样才是高明的?如何判断反馈水平的好坏?更何况在猎头这里,还要兼顾输出的服务质量,不能光顾着给新人试错而让客户吃亏。许多猎头公司都希望能多培养高产值的猎头,但其实培养那个能训练出高产值猎头的顾问,才是根本的解决之道。可惜对于反馈如何做到更好,Google就没有公开更详细的资料了,否则也许会对我们有进一步的启发。

强化学习

好了,说完了后你也许会发现,这个“强化学习”怎么这么眼熟?是的,它跟我们平常生活中的一些原理是相通的,打个比方,家长教育小孩子,你不一定要把什么可以做,什么不可以做都告诉他,只要在他做得好的时候表扬一下,做的不好的时候批评他,慢慢的他自己就会向好的方向发展。培训新手也一样,别急于指点江山,你的水平就不会成为他们的天花板,他们也能给你的认知打开一道新的门。

作者:Susan——Talentview创始合伙人

            泰能猎头,始于1998年,重生于非典后,闯过了2008年的金融危机,始终用自己专业的态度为企业和人才提供稳定优质的服务。愿我们的低调稳重,为你开创一条金光大道。

原创文章,转载请注明出处!


 

 

©2024 泰能猎头 版权所有 © Copyright 2011 Talentview Power by gd-www 粤ICP备2020092143号 About us | Contact us | Feedback