数据科学, 顾名思义即数据相关的科学研究, 它是一门利用数据学习知识的学科, 包含两方面--用数据的方法来研究科学和用科学的方法来研究数据。 其目标是通过从数据中提取出有价值的部分来生产数据产品, 结合了诸多领域中的理论和技术, 包括应用数学, 统计, 模式识别, 机器学习, 数据可视化, 数据库, 以及高性能计算。
数据科学的应用覆盖了医学与公共卫生, 工程, 法律, 教育, 设计, 商业, 经济, 政策规划等广泛的领域, 也将为这些领域带来巨大的变革与发展。
数据科学在目前还算是一门新兴学科, 追溯其发展历史, 我们可以看到只有短短的40年时间, 而真正快速发展阶段也就10年左右时间。
1974年彼得诺尔 (Peter Naur) 发表文章首次提出“数据学“和 ...
大数据
数据分析师
热门
机器学习
学习 - 机器学习
搜信息 - 数据挖掘
机器人 - 人工智能
R语言是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。它有UNIX、LINUX、MacOS和WINDOWS版本,在R的安装程序中只包含了8个基础模块 ...
机器学习 :
机器学习是人工智能的一个分支,是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。机器学习在近30多年已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动 ...
Apache Hadoop :
Apache Hadoop是一款支持数据密集型分布式应用程序并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。Hadoop是根据谷歌公司发表的MapReduce和Google文件系统的论文自行实现而成。Hadoop框架透明地为应用提供可靠性和数据移动。它实现了名为MapReduce的编程范式:应用程序被分区成许多小部分,而每个部分都能在集群中的任意节点上运行或重新运行。
TensorFlow :
TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从流图的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。
数据科学与数据挖掘的区别? 数据挖掘就是对观测到的数据集(经常是很庞大的)进行分析,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据。 数据科学是处理数据的科学,一旦数据与其代表事物的关系被建立起来,将为其他领域与科学提供借鉴。 它的主...
闵万里
点击查看个人主页
人工智能科学家,产业智能专家,北高峰资本及坤湛科技创始人兼CEO 。曾任阿里云机器智能首席科学家。2017年被《福布斯》杂志评选为中国人工智能领军人物,同年当选科技部新一代人工智能战略咨询委员会委员。
李笛
点击查看个人主页
前微软(亚洲)互联网工程院副院长 ,现任小冰公司首席执行官,毕业于清华大学 。他领导一支分布在多个国家的全球团队,负责人工智能小冰框架系统的技术研发、产品革新及商业落地,主持公司的日常经营、行政和业务活动。
Larry Page
点击查看个人主页
美国密歇根大学安娜堡分校的荣誉毕业生,拥有密歇根大学理工科学士学位和斯坦福大学计算机科学博士学位。佩奇是Google公司的创始人之一,2011年4月4日正式出任谷歌CEO 。2013年,Larry Page获选2013美国40岁以下最有影响力CEO。
Andrew Ng
点击查看个人主页
中文名为吴恩达,1997年毕业于卡内基梅隆大学(CMU)的计算机科学专业,现为斯坦福大学的计算机科学系与电子工程系的副教授,人工智能实验室主任。他和Daphne Koller共同创建Coursera,2014年5月16日加盟百度,成为百度首席科学家,于2017年3月22日宣布离职。
陆奇
点击查看个人主页
陆奇毕业于复旦大学,获计算机科学硕士学位,此后就读于卡耐基梅隆大学,获计算机科学博士学位。陆奇除了在学术界发表过一系列高质量的研究论文,还持有40多项美国专利。其于2013年出任微软集团全球执行副总裁,2017年1月加入百度,担任百度集团总裁兼首席运营官、百度董事及董事会副主席。2018年5月,卸任百度集团总裁兼首席运营官。