加载中 ...
首页 > 个股 > 个股导读 > 正文

[江淮动力重组]Yahoo的新一代大数据技术架构解析

2024-02-04 10:18:05 来源:倾延资


? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?Hadoop是当时最盛行的大数据技能架构,许多大数据使用都是建立在Hadoop渠道根底之上。许多人都知道Hadoop是Apache基金会的尖端开源项目,但并不是每个人都知道,在Hadoop的演进开展中,70%的奉献是来自Yahoo公司。

Yahoo公司是Hadoop渠道最大的用户、最有力的使用支撑者和Hadoop商业化的重要推动者,Hadoop一直是Yahoo公司云核算渠道的中心,Yahoo公司最大的单个Hadoop集群由4000个节点组成,Yahoo公司的引荐体系、广告剖析等使用均建立在Hadoop分布式核算渠道上,Yahoo公司通过开发者论坛等办法每年培养了许多把握Hadoop渠道的专业技能人员,Yahoo公司分拆出来并出资的Hadoop技能研发部门-Hortonworks现在是全球开展最快的Hadoop商业化公司之一。Yahoo 公司并没有躺在这些成果上自鸣得意,相反他们在活跃推动Hadoop2.0——Yahoo新一代大数据技能架构。

Yahoo的新一代大数据技能架构由以下几个部分组成:

中心YARN。YARN或称为MapReduce2.0是这个技能架构的中心,它能够看作Yahoo新一代大数据渠道的操作体系。为了处理Hadoop1.0的功能瓶颈问题,YARN将MapReduce中一个JobTacker中所具有的两个首要功能(资源管理和作业调度/监控)完成了别离,首要办法是创立一个大局的资源管理器(ResourceManager,RM)和若干个针对使用程序的使用主服务器(ApplicationMaster,AM)。通过这样的改变,YARN在扩展性方面有很大改善,能够支撑10000+核算机集群,一起改善了MapReduce的功能,而且支撑Hadoop之外的其他核算结构,如低延时、流核算等结构。

核算处理结构。除了支撑批处理的Hadoop之外,还有Spark和Storm等核算结构的集成。其间,Hadoop用于离线数据剖析,Spark用于多迭代批处理数据剖析, Storm则是用于流数据的实时剖析和猜测。凭借YARN,Yahoo将大数据离线、近线和实时数据完成了整合。

——Storm。Storm原本是Twitter的流核算东西。Yahoo在新一代技能架构实践中,将Storm与YARN整合成为Storm-YARN来支撑的实时的流核算剖析。Storm是专门针对实时数据类型(即流数据)的核算剖析结构,在流数据不断改变运动的过程中实时地进行剖析,捕捉到可能对用户有用的信息,并把成果敏捷发送出去。例如,为了支撑个性化查找广告,体系需求实时处理来自几百万仅有用户每秒不计其数次的查询,并即时剖析用户的会话特征来进步广告相关性和猜测模型的准确度。

——Spark。Spark是发源于美国加州大学伯克利分校AMPLab的集群核算渠道,已正式申请加入Apache孵化器,Yahoo新一代技能架构将其YARN进行整合。Spark立足于内存核算,从多迭代批量处理动身,兼收并蓄数据仓库、流处理和图核算等多种核算范式,具有轻量、快速核算等特色。Spark根据Scala言语,是一个比Hadoop代码行少的轻量级体系,但它的核算速度非常快,对小数据集能到达亚秒级的推迟,对大数据集典型的迭代机器学习、即席查询、图核算等使用,Spark版别比根据MapReduce、Hive和Pregel的完成快上十倍到百倍。

存储层。底层存储则仍是根据Hadoop的文件体系HDFS和NOSQL数据库HBase。

虽然,现在以YARN为中心的新一代技能架构还有许多方面需求完善,但其在Yahoo中战略地位现已根本建立。其一向的开源战略,也将给大数据业界带来福音。

摘自:2013-2014年我国互联网职业大数据使用年度研究报告
数据剖析, 数据发掘
猜你喜欢的标签:范卓 万向钱潮股吧 孟宪慧

“走马消息,分享精选全球有价值的财经新闻”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与

我们联系删除或处理,客服邮箱,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同

其观点或证实其内容的真实性。

  • 声音提醒
  • 60秒后自动更新
  • 中国8月CPI年率2.3%,预期2.1%,前值2.1%。中国8月PPI年率4.1%,预期4.0%,前值4.6%。

    08:00
  • 【统计局解读8月CPI:主要受食品价格上涨较多影响】从环比看,CPI上涨0.7%,涨幅比上月扩大0.4个百分点,主要受食品价格上涨较多影响。食品价格上涨2.4%,涨幅比上月扩大2.3个百分点,影响CPI上涨约0.46个百分点。从同比看,CPI上涨2.3%,涨幅比上月扩大0.2个百分点。1-8月平均,CPI上涨2.0%,与1-7月平均涨幅相同,表现出稳定态势。

    08:00
  • 【 统计局:从调查的40个行业大类看,8月价格上涨的有30个 】统计局:从环比看,PPI上涨0.4%,涨幅比上月扩大0.3个百分点。生产资料价格上涨0.5%,涨幅比上月扩大0.4个百分点;生活资料价格上涨0.3%,扩大0.1个百分点。从调查的40个行业大类看,价格上涨的有30个,持平的有4个,下降的有6个。 在主要行业中,涨幅扩大的有黑色金属冶炼和压延加工业,上涨2.1%,比上月扩大1.6个百分点;石油、煤炭及其他燃料加工业,上涨1.7%,扩大0.8个百分点。化学原料和化学制品制造业价格由降转升,上涨0.6%。

    08:00
  • 【日本经济已重回增长轨道】日本政府公布的数据显示,第二季度经济扩张速度明显快于最初估值,因企业在劳动力严重短缺的情况下支出超预期。第二季度日本经济折合成年率增长3.0%,高于1.9%的初步估计。经济数据证实,该全球第三大经济体已重回增长轨道。(华尔街日报)

    08:00
  • 工信部:1-7月我国规模以上互联网和相关服务企业完成业务收入4965亿元,同比增长25.9%。

    08:00
  • 【华泰宏观:通胀短期快速上行风险因素主要在猪价】华泰宏观李超团队点评8月通胀数据称,今年二、三季度全国部分地区的异常天气(霜冻、降雨等)因素触发了粮食、鲜菜和鲜果价格的波动预期,但这些因素对整体通胀影响有限,未来重点关注的通胀风险因素仍然是猪价和油价,短期尤其需要关注生猪疫情的传播情况。中性预测下半年通胀高点可能在+2.5%附近,年底前有望从高点小幅回落。

    08:00
  • 【中国信通院:8月国内市场手机出货量同比环比均下降】中国信通院公布数据显示:2018年8月,国内手机市场出货量3259.5万部,同比下降20.9%,环比下降11.8%,其中智能手机出货量为3044.8万部,同比下降 17.4%; 2018年1-8月,国内手机市场出货量2.66亿部,同比下降17.7%。

    08:00
  • 土耳其第二季度经济同比增长5.2%。

    08:00
  • 乘联会:中国8月份广义乘用车零售销量176万辆,同比减少7.4%。

    08:00
  • 央行连续第十四个交易日不开展逆回购操作,今日无逆回购到期。

    08:00
  • 【黑田东彦:日本央行需要维持宽松政策一段时间】日本央行已经做出调整,以灵活地解决副作用和长期收益率的变化。央行在7月政策会议的决定中明确承诺将利率在更长时间内维持在低水平。(日本静冈新闻)

    08:00
  • 澳洲联储助理主席Bullock:广泛的家庭财务压力并非迫在眉睫,只有少数借贷者发现难以偿还本金和利息贷款。大部分家庭能够偿还债务。

    08:00
  • 【 美联储罗森格伦:9月很可能加息 】美联储罗森格伦:经济表现强劲,未来或需采取“温和紧缩”的政策。美联储若调高对中性利率的预估,从而调升对利率路径的预估,并不会感到意外。

    08:00
  • 美联储罗森格伦:经济表现强劲,未来或需采取“温和紧缩”的政策。美联储若调高对中性利率的预估,从而调升对利率路径的预估,并不会感到意外。

    08:00
  • 美联储罗森格伦:鉴于经济表现强劲,未来或需采取“温和紧缩的”政策。

    08:00