大数据&&云环境,程序员应有技能:

2013年11月28日 由 Creater 留言 »

大数据与云,大数据本身就是一个问题集,云技术是目前解决大数据问题集最重要有效的手段。云计算提供了基础架构平台,大数据应用在这个平台上运行。目前公认处理大数据集最有效手段的分布式处理,也是云计算思想的一种具体体现。[1]

我们程序员关心在云计算大环境下,我们的工作变了。我们需要至少掌握以下内容:

  1. NOSQL 和云存储。尤其是HBase和Mangodb
  2. 计算框架:Hadoop ,Spark,RHadoop
  3. 数据仓库:Hive
  4. 自然语言处理工具Lucene,Solr等。
  5. 机器学习工具Mahout和Weka。
  6. 数据挖掘算法。
  7. 统计知识。
  8. 推荐系统。
  9. 牢固的基础:语言技术+数据结构+算法。
  10. 架构设计。

参考文献:

[1] http://www.ciotimes.com/cloud/cyy/72659.html

广告位

发表评论

你必须 登陆 方可发表评论.