• 欢迎浏览“String me = Creater\忠实的资深Linux玩家;”,请文明浏览,理性发言,有侵犯你的权益请邮件我(creater@vip.qq.com).
  • 把任何的失败都当作一次尝试,不要自卑;把所有的成功都想成是一种幸运,不要自傲。
  •    5年前 (2013-11-28)  心情感悟 |   4 条评论  18 
    文章评分 0 次,平均分 0.0

    大数据与云,大数据本身就是一个问题集,云技术是目前解决大数据问题集最重要有效的手段。云计算提供了基础架构平台,大数据应用在这个平台上运行。目前公认处理大数据集最有效手段的分布式处理,也是云计算思想的一种具体体现。[1]

    我们程序员关心在云计算大环境下,我们的工作变了。我们需要至少掌握以下内容:

    1. NOSQL 和云存储。尤其是HBase和Mangodb
    2. 计算框架:Hadoop ,Spark,RHadoop
    3. 数据仓库:Hive
    4. 自然语言处理工具Lucene,Solr等。
    5. 机器学习工具Mahout和Weka。
    6. 数据挖掘算法。
    7. 统计知识。
    8. 推荐系统。
    9. 牢固的基础:语言技术+数据结构+算法。
    10. 架构设计。

    参考文献:

    [1] http://www.ciotimes.com/cloud/cyy/72659.html

     

    除特别注明外,本站所有文章均为String me = "Creater\忠实的资深Linux玩家";原创,转载请注明出处来自http://unix8.net/home.php/2705.html

    关于

    发表评论

    暂无评论

    切换注册

    登录

    忘记密码 ?

    切换登录

    注册

    扫一扫二维码分享