人工智能 · 2024年1月20日 0

2017年机器学习和数据科学调查:Kaggle

数据平台 Kaggle 近日发布了 2017 机器学习及数据科学调查报告,这也是 Kaggle 首次进行全行业调查。调查共收到超过 16000 份回复,受访内容包括最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等。

下面主要看看工具使用方面的结果。请注意,该报告包含多个国家的数据,可能存在收集不够全面的情况,仅供参考。

年龄

从全球范围来看,本次调查对象的平均年龄在 30 岁左右。当然,各个国家的数值会有差异,中国的机器学习从业者年龄的中位数是 25 岁。

2017年机器学习和数据科学调查:Kaggle

全球全职工作者为 65.7% ,其中中国为 53.% ,美国占比较高,达 70.9% 。

2017年机器学习和数据科学调查:Kaggle

Logistic 回归是除了军事和国安领域外,最常用的数据科学研究方法。在军事和国防安全领域,神经网络被使用更多。

2017年机器学习和数据科学调查:Kaggle

在工具语言使用方面,Python是数据科学家使用最多的语言。同时,统计学家对 R 语言的忠诚度很高。

2017年机器学习和数据科学调查:Kaggle

关系型数据是最常用的数据类型,学术研究者和国防安全领域则更亲睐文本和图像。

2017年机器学习和数据科学调查:Kaggle

Git 是他们最常用的代码共享和托管方式。

2017年机器学习和数据科学调查:Kaggle

Dirty Data (脏数据)是从业者遇到的最大障碍。此外,理解不同算法的能力不够也是困扰数据工作者的一大障碍。缺乏有效管理和资金支持,是面临的两大外在困境。

2017年机器学习和数据科学调查:Kaggle