| 当前位置：拓步ERP资讯网 >>管理咨询 >>CIO技术专栏 >>CIO基础设施

Hadoop扩展过程中的7个危险信号

发布日期：2014-09-11 11:13:30 来源：www.toberp.com 编辑：拓步ERP资讯网浏览：评论

摘要：开源到生产环境使用从来都不是件容易的事情，而大型分布式计算框架Hadoop的实施无疑更加复杂，在其具体的实施过程中隐藏着潜在的危机，雅虎前任CTORaymie根据经验罗列了7项危机信号和相应的解决方案，帮助使用者提前避免灾难的发生。 原标题：Hadoop扩展过程中的7个危险信号 原作者：发表时间：2014/9/10 Raymie Stata 来源：云创存储

　　所有Hadoop实施都存在着潜在的危机，包括一些非常棘手的Hadoop运行问题。这类问题出现在投入生产环境前会导致Hadoop被弃用，但是如果发生在投入生产环境后，则意味着一场“成功的灾难”(其实更有可能是一场纯粹的灾难)。

　　Hadoop的扩展和实施是非常复杂的。但是如果你能确切的认识到问题根源所在，还是可以避免“灾难”的发生，以下是根据经验总结出的一些危机信号。

　　危机信号1：无法投入生产环境

　　从概念验证到生产环境使用是大数据工作流程的重要一步。Hadoop扩展工作充满了挑战，较大的工作量往往不能被及时完成，测试环境不能完全覆盖真实运行环境，例如数据测试中常见的一种问题是：概念验证经常使用不切实际的小型或单一的数据集。

　　在投入生产环境之前，需要进行规模及压力测试，通过这类测试的应用程序具备可扩展性及容错能力，也可协助开发自身容量规划模型。

　　危机信号2：开始延期

　　第一个应用程序投入生产环境标志着你能够轻松实现SLA，但随着Hadoop集群数量增加，其运行时间变得不可预知，首次延期问题很容易被忽略，而随着时间的推移，这种情况变得越来越糟，最终导致危机出现。

　　千万不要等到危机爆发后再采取行动。在容量遭到挑战之前，可适当的扩展容量或优化程序。调整预期容量模型，尤其注意要在最糟糕的性能环境下进行容量检测，使其具备更加贴近现实的性能。

　　危机信号3：开始告诉客户不可能保存所有数据

　　危机爆发的另一征兆是减少数据保留需求。起初你希望为每年的数据分析保留13个月的数据，但由于空间限制，你开始缩减保留数据的时间，这在某种程度上等价于丢失了Hadoop大数据分析能力的优势。

　　缩减数据保留时间并不能解决问题，要避免这种问题必须要及早行动，重新审视容量模型，寻找预测失败原因，然后调整模型以便更好的追踪问题根源所在。

　　危机信号4：数据科学家们失去地位

　　过度使用Hadoop集群会扼杀创新，会导致数据科学家没有足够的资源去运行大型作业，没有足够的空间为科学家们存储大量运算结果。

　　容量规划经常容易被忽视，数据科学家的作用也经常被忽视。被忽视加上生产环境负载规划不足，意味着数据科学家经常被边缘化。请确定你的需求里包括对数据科学家的需求，并能在容量问题出现早期发挥作用。

　　危机信号5：数据科学家通过Stack Overflow解决问题

　　在Hadoop实施初期，运维团队和数据科学家协同工作。随着Hadoop实施的成功，运维团队的维护压力随之增加，科学家们必须自己解决Hadoop的问题，通常会通过Stock Overflow寻找处理方法。

　　随着Hadoop扩展及关键任务的增加，维护的工作量开始增加，如果想要保证数据专家们集中在数据研究上，则需要重新调整运维团队的大小。

　　危机信号6：服务器温度升高

　　分配服务器电力供应时，我们常常假设它们不会满负荷运行，但是大型的Hadoop作业很可能让服务器满载数个小时，严重威胁到你的电网(冷却方面也有类似的问题)。所以请确保你的Hadoop集群可长时间在全功率环境下运行。

　　危机信号7：开支失控

　　在基于IaaS部署的Hadoop环境中，排名第一的“成功灾难”是开支失控。你会突然发现账单费用是上个月的三倍，严重超出预算。

　　容量规划是基于IaaS的Hadoop实施中相当重要的一步，不仅仅是为了管理容量也为了管理成本。但好的容量规划只是一个开始，如果你想要扩展基于Iaas的Hadoop实施，最好要像Netflix那样大力投资系统来追踪并优化成本。

　　平缓Hadoop扩展

　　Hadoop计划通常低估了保持Hadoop集群稳定运行所需的工作量，这种误判是可以理解的。传统企业应用程序的初始优化实施成本比后续的维护与支持高出许多个数量级，人们通常误认为Hadoop遵循同样的模式，实际上Hadoop的维护非常困难，需要大量的运维工作。

　　优质的容量规划是必不可少的;拥有良好容量模型的同时，还需要及时的更新以避免其偏离实际应用场景;不要让创新成为后期问题，给予数据科学家足够的支持;扩容不是解决问题的唯一办法，管理使用情况也同样重要;让用户(及业务所有者)做足够的作业优化，一点点的优化都可以降低现有成本。

核心关注：拓步ERP系统平台是覆盖了众多的业务领域、行业应用，蕴涵了丰富的ERP管理思想，集成了ERP软件业务管理理念，功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理，全面涵盖了企业关注ERP管理系统的核心领域，是众多中小企业信息化建设首选的ERP管理软件信赖品牌。

转载请注明出处：拓步ERP资讯网 http://www.toberp.com/

本文标题：Hadoop扩展过程中的7个危险信号

本文网址：http://www.toberp.com/html/consultation/10839616205.html

关键词标签： Hadoop扩展过程中的7个危险信号,Hadoop Hadoop扩展分布式计算框架 IaaS,ERP,ERP系统,ERP软件,ERP系统软件,ERP管理系统,ERP管理软件,进销存软件,财务软件,仓库管理软件,生产管理软件,企业管理软件,拓步,拓步ERP,拓步软件,免费ERP,免费ERP软件,免费ERP系统,ERP软件免费下载,ERP系统免费下载,免费ERP软件下载,免费进销存软件,免费进销存,免费财务软件,免费仓库管理软件,免费下载,

本文转自：e-works制造业信息化门户网

本文来源于互联网，拓步ERP资讯网本着传播知识、有益学习和研究的目的进行的转载，为网友免费提供，并尽力标明作者与出处，如有著作权人或出版方提出异议，本站将立即删除。如果您对文章转载有任何疑问请告之我们，以便我们及时纠正。联系方式：QQ：10877846 Tel：0755-26405298。

上一篇：塔式UPS与模块化UPS投资对比分析

下一篇：解析：企业存储选型3大误区

相关文章

管理咨询

拓步ERP系统软件平台11.5专业版v10.1.2...

拓步ERP系统平台库存管理系统培训视频教材


	ERP新闻动态拓步新闻行业新闻关注产品观点纵横企业管理企业应用

	ERP解决方案按ERP应用行业分类按ERP企业规模分类按ERP管理领域分类按ERP软件功能分类按ERP系统特性分类用友ERP解决方案金蝶ERP解决方案易飞ERP解决方案速达ERP解决方案其他ERP解决方案

	ERP顾问咨询 ERP管理咨询 ERP战略诊断 ERP流程分析 ERP流程优化 ERP风险分析 ERP可行性研究 ERP整体规划 ERP选型招标 ERP实施监理 ERP评审验收 ERP绩效评价 ERP基础知识 ERP课程培训 ERP培训教育 ERP视频教材

	CIO技术专栏 CIO企业应用 CIO网络通信 CIO信息安全 CIO基础设施 CIO云计算

	ERP技术支持技术支持知识库常见问题资料库在线学习资料库日常办公资料库企业管理知识库

	ERP系统价格拓步ERP系统价格体系拓步EIS软件价格体系合作品牌ERP价格体系技术支持服务价格体系

	合作品牌用友UFIDA 金蝶KingDee 神州数码Digital 速达SuperData 拓步ERP系统成功案例

	代理加盟合作联盟策略代理合作指南代理联盟前景联盟技术支持快速搜索ERP软件资讯

	关于拓步公司介绍公司愿景企业文化诚聘英才联系我们在线留言在线订购意向下载体验登记

ERP顾问咨询

ERP原理知识

ERP实施培训

CIO技术专栏

CIO企业应用

CIO网络通信

CIO信息安全

CIO基础设施

CIO云计算

即时联系

服务热线

快捷互动

猜您喜欢