首页 > 科技数据 > 有哪些数据科学新人不知道老手才知道的?
2017
03-30

有哪些数据科学新人不知道老手才知道的?

千淘万漉博客阿里云大使推广链接

 

Q:有哪些数据是初学者不知道而只有数据专家知道的?

What do experienced data scientists know that beginner data scientists don’t know?

36大数据专稿, 本文由36大数据翻译,不授权任何网站使用,除了36大数据网站和微信公众号,所有其他的转载均为侵权!

回答1:

A(I-Kang Ding,来自纽约软件公司capital one labs的数据专家):(2016.5.25选自Jeffrey shen,yelp网站的数据专家)

谢邀!其实在这些浩瀚无边的事务中,我算不上是一个“经验老手”,仅仅是相比几年前更有经验了一些而已(理论上应当如此)。这里是我对这个问题的一些看法。

1、“蜜罐不在乎!

(别人不会注重你的过程只是关注你的结果)”:在大多数的情况下,你的商业伙伴(利益共同者)不会真的那么在意你是怎样完成这件事的(Jerrod Lowmaster在这一点上的回答是完全正确的)你真正要做的是提取出你所认识的事物内在的专业知识然后用非专业人士熟知的语言向他们解释。

大数据漫画

2、“善待未来的自己”

在另一方面,那些维持或者替换你的准则的人们是很在意你如何完成一件事的。通常,这些人对你的未来起着十分重要的作用。所以一定要为未来的自己留下丰富的评论和证明。

大数据漫画

3、“人们经常没有明白他们真正需要的是什么”

乔布斯

“很多情况下,人们并不知道自己想要的是什么,直到你展示给他们看。——史蒂夫乔布斯”

好吧,也没有乔布斯说的那么极端,但是你必须能够时常从海量的重复信息中提供精简的有用的信息给你的合作伙伴。你的利益伙伴们经常会问一些有正确的大方向的问题,但是并不是足够明确而让你可以着手去做。比如当你被要求建立一个模型时,你大概首先会想:(1)我们需要去解决的问题是什么?(2)在解决这些细节的问题时建立模型是否是最佳途径?

不得不让人难过地承认的是,一些生意上的问题并不存在定量的数据解决方案,所以如果你能尽快去发现到是否值得追求数据科学解决办法那就是再好不过了。

回答2:

(邓宇俊,在机器学、统计学、最佳分析、神经语言计算机学方面兴趣较大)

谢邀!从我经历的一些失误当中我获得了一些个人的经验总结。

1.学会观察你的数据:在把你的数据组进行回归分析和计算机统计之前,观察你的数据是很重要的。有些时候你也许会从一些完全不同的数据组中获得非常相似的结果。就拿“安斯库姆四重奏”作为一个例子,这四组图表有相同的平均值、变化趋势,甚至是相同的回归模型。然而,很显然他们互不相同。

2、得出推论才是你的终极目标:我见过很多人非常喜欢建模并且认为是最关键的环节。但是,大多数人,尤其是那些非专业的人是不会重视你有什么样的模型的,他们关注的只是从调查中获得的分析和推论。

3.培养较强 的“讲故事能力”(良好表达能力):这个与第二条结论有关,而且它不仅仅适用于成为数据学家 这个目的。如果你有精确的模型、准确 的分析、合理的推断甚至是完美 的成套体系,如果你缺少这种“讲故事的能力”,你仍然不能够将你的研究传达给你的上司或是顾客。在世界上的各界精英全部都是具备良好的演说能力的。

回答3:

丹尼尔?顿克朗—给我数据,我会探究出个究竟(亚历克斯?布洛克,谷歌数据专家,哈佛大学数据学博士,大部分时间是计算生物学家,Lili Jiang,Quora 数据科学部门经理)

对问题中的两个概念笼统地概括是很危险的——如今有一些非常具有洞察力的成熟的新一代数据科学家。同时,有一些事,我希望你们最好从经历过的伤疤中学到。

?当产生怀疑时,缩小范围。想出能检验你假说的最低强度的试验方法,或者至少是一些接近你的假说的答案。时间是你最稀缺的资源,所以你必须充分利用时间来加快学习速度。

?正如皮特?诺维格(谷歌研发主管)所说, 莫妮卡?罗加蒂补充道:越来越多的数据打败了智能算法。数据的质量打败了数据的数量。初级数据科学家们,尤其是刚从学校毕业的那些,必须学会更少关注模型和算法,而是把重点转到数据的数量和质量上来。

?就算是老练的数据科学家也会遇到认知的偏差。当我们看到随机噪声的时候我们能察觉到信号。当我们处理数据的过程中简单地出现了一个漏洞时,我们太着急以至于无法察觉出确定的证据。但是我也相信经验能帮助我们养成健康正确的怀疑态度。或者这些也仅仅是来自我的认知偏差。

本文》有 0 条评论

留下一个回复