尽管Python在数据科学领域取得了惊人的发展,但编程语言R仍吸引着开发分析应用程序的开发人员。R的开源社区,其算法的丰富性,在学术界的吸引力以及在咨询业务中使用的便利性正在推动增长。
R由两位统计学家设计并于年发布,是为统计建模而创建的。目的是能够快速检查统计概念,将这些概念用于数据整理和分析,以及进行决策。CitiusTech数据科学业务负责人YogeshParte说:“只要需要快速浏览数据或通过有限的干预就可以生成报告,R就会成为首选。”
数据具有三种格式-二进制(数字),文本或语音和图片。R可以快速处理大量二进制文件,但不能处理文本或图像。那就是Python得分的地方。“在计算方面,R在过去五年中输给了Python。Masureq全球服务分析负责人AllenRoy说:“Python是新的冠军,不是因为它的算法丰富,而是因为它可以处理的大量非结构化数据(语音,文本或图片)。”