• 笔记本显示屏升级技术区
  • 爱拆客笔记本改装俱乐部淘宝旗舰店
  • 纯紫铜管
  • 三合一机器人太阳能玩具
  • 爱拆客店产99元抽风式散热器
  • UX501J
  • TF导热垫
  • 7783
  • 68套装
  • 固态相变硅脂
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 0
  • 8968阅读
  • 26回复

【科普】J版口袋简史系列:X86平台发展旅程及其历代经典产品(现金奖) [复制链接]

上一主题 下一主题
离线jsntrgsy
 
发帖
2723
拆客金币
22768
威望
160
贡献值
4
主机
P175EM
板儿
MiPad 64G
备机
K29
爪机
iphone6
坐骑
11
只看楼主 倒序阅读 正文  发表于: 2011-12-16
— 本帖被 tony 执行加亮操作(2011-12-16) —
【科普】J版口袋简史系列:X86平台发展旅程及其历代经典产品

      在IT的历史上,四十年前正是第一款微处理器发明的时间,在这四十年间微处理器遵循着“摩尔定律”中所描述的速度发展着,而摩尔定律所描述的微处理器发展速度直到今天还依然在生效着。从简单纯粹的运算单元,到拥有多指令并行发射机制,再到多级流水线的产生,高速缓存的纳入,频率冲破GHz,再到内存控制器的集成,直至今天GPU的整合,这一切便是过去三十年来x86 CPU架构的进化历程。

      英特尔和AMD是这个历史的缔造者,它们最初基于相同的架构,中途分道扬镳,彼此又不断借鉴对方的优秀创意(互授专利),在此起彼伏的交锋中共同将x86带向未来。  

                                                ———谨以此文缅怀那些为微处理器设计作出贡献的工程师,不分彼此是Intel或者AMD

Intel简介

      作为x86指令集的创建者,英特尔公司在当年也只能算是一个小角色,这家成立于1968年的半导体企业远远无法同IBM这样的“百年老店”相提并论,它和AMD都是源于仙童半导体的分裂体——英特尔的创始人安迪·格罗夫、戈登·摩尔、罗伯特·诺伊斯和AMD的创始人杰瑞·桑德斯都是仙童的同事,后来他们都离职创业,进入半导体领域。

      英特尔最初的业务是生产存储器,它们成功地拥有了源于仙童的半导体制作工艺,即一种类似于印刷的工艺将大量的电子器件集成在一个硅片中,这就是集成电路的概念。而早在1965年,戈登·摩尔还在仙童的时候,他就在一篇文章中总结出了一个现象:即芯片中的晶体管和电阻器的数量每年会翻番,原因是工程师可以不断缩小晶体管的体积。这就意味着,半导体的性能与容量将以指数级的方式增长,并且这种增长趋势将继续延续下去。1975年,摩尔又修订了这个定律,他认为,每隔24个月,晶体管的数量将翻番。其时,摩尔已经是英特尔公司的联合创始人,这个定律后来也被英特尔奉为经典,当然追本溯源,摩尔定律最初描述的对象是半导体存储器。

x86之前的微处理器

      四十年前,Intel工程师霍夫发明第一颗商用微处理器,它就是英特尔4004处理器。全球第一台计算机ENIAC诞生25年之后出现的史上第一颗商用微处理器在计算速度上并不惊人,它的时钟频率仅为108KHz,性能与ENIAC相当,不过它的集成度却远非ENIAC所能比拟。(ENIAC,全球第一台计算机,诞生于1946年,诞生于美国宾夕法尼亚大学,这台计算机的“始祖”使用了18800个真空管,长50英尺,宽30英尺,占地1500平方英尺,重达30吨,而它的运算速度仅仅是每秒机型5000次加法运算而已,这一计算速度当然无法和现在的计算机相比,但在当时确实是惊人的发明。)

        4004处理器集成了2300只晶体管,一颗芯片的重量不超过一盎司,相比第一台电子计算机占地1500平方英尺的大小来说,英特尔4004处理器确实是太小了。当然,仅有108KHz的4004处理器基于4位设计,只有45条指令,每秒也只能执行五万条指令,用今天的眼光来看,4004处理器的性能简直可以用羸弱来形容。但这款处理器的发布开创了微处理器的新时代,微型处理器的后来者都将以4004作为起点,而4004则作为全球首款商用微处理器而永载史册,当然这并不是英特尔高瞻远瞩的结果,而是他们接到日本Busicom公司的订单,Busicom需要一块芯片来生产电算机,就选择英特尔作为供应商。从这个意义来说,x86架构应该是Busicom无意识下的产物,而不是英特尔雄才伟略的结果。

      时隔一年之后的1972年4月,英特尔又推出了另一款微处理器产品Intel 8008,这个编号正好是4004的两倍,这应该是英特尔刻意为之,因为8008芯片的规格和性能差不多也是4004的两倍。由于8008采用的是P沟道MOS微处理器,因此仍属第一代微处理器。实际上在英特尔推出4004处理器之时,业界的反响并不能和4004处理器的历史地位相匹配,大家普遍认为4004虽然很棒,但是计算性能有些偏弱,并不足以担任微型计算机的“大脑”,或者说以 4004为架构设计的微型计算机在性能上偏弱。而在英特尔8008处理器诞生之后,这样的问题得到了大大的改善。英特尔8008处理器集成了3500个晶体管,能够处理8Bit位宽的数据,频率也同样是双倍提升。Intel的8008处理器其实也开创了一个时代,关键就在于英特尔在8008处理器时代开始拥有自己的指令技术,这同样是一个历史拐点,未来处理器的基础就将基于指令和指令集合。

  (8008芯片原本是为德克萨斯州的Datapoint公司设计的,但是这家公司最终却没有足够的财力支付这笔费用。于是双方达成协议,英特尔拥有这款芯片所有的知识产权,而且还获得了由Datapoint公司开发的指令集。这套指令集奠定了今天英特尔公司X86系列微处理器指令集的基础。)

  很多人都错误地认为英特尔的8080处理器是第一款微处理器,实际上这也是有原因的。英特尔8080处理器实际上是在1974年8月推出的英特尔第三颗微处理器,8080处理器以N沟道MOS电路取代了P沟道,成为第二代微处理器。但是8080处理器的名气实在是太大了,因为8080的频率比8008高出了10倍,而性能也是8008的至少十倍之多。

      事实上英特尔8080处理器在发布之初便让当时业界为之震动,因为采用了复杂的指令集以及40管脚封装,8080的处理能力大为提高,其功能是8008的10倍,每秒能执行29万条指令,集成晶体管数目6000,运行速度更是达到了史无前例的2MHz。

      虽然在8080的时代,微处理器的优势已经被业内人士所认同,不过与此同时,更多的公司开始介入这一领域(RCA(美国无线电公司)、Honeywell、Fairchild、美国国家半导体公司、AMD、摩托罗拉以及Zilog公司。),竞争开始变得日益激烈。微处理器工业已形成Zilog、摩托罗拉和英特尔三足鼎立的格局——Zilog公司在1976年开发的Z80微处理器,被广泛用于微型计算机和工业自动控制设备;摩托罗拉推出的M68000 16位微处理器,也占据了相当的市场份额。但在整个处理器工业中,微处理器只是不起眼的小角色,高性能的RISC处理器才是当时的主流。
英特尔 8080成为了第一款个人计算机Altair的大脑。据说Altair这个名称是源自《星际旅行》电视节目中一个星际飞行计划(Starship Enterprise)的目的地名称。计算机爱好者花费395美元即可购得 Altair 套件。数月内,Altair的销售量达到数万台,造成了电脑销售历史上第一次缺货现象。可以说8080处理器在电脑发展历史中的重大意义。

趣闻:

      一、苹果公司在1976年推出的Apple Ⅰ个人电脑,风靡美国市场,令当时计算机业巨头IBM大感震动。IBM紧急成立了一个项目组,开发针对个人用户的计算机,以同苹果竞争。然而,IBM那些脑袋僵化的工程师们无法理解个人用户要拿计算机来做什么,他们想了半天,结论是大概可以给家庭主妇记录菜单之类的。既然他们认为PC可有可无,自然不愿意花费大力气去开发,而是找了一系列供应商—比如CPU部分,他们就将订单交给英特尔这家小公司,当时IBM虽然有非常顶尖的Power架构,但他们认为这种用在超级计算机的高级货不应该浪费在PC上面。这个决策所导致的最终后果就是:IBM失去了PC时代,成就了英特尔、AMD、微软等一系列的IT巨头。英特尔之所以能拿到IBM的订单,除了价格低廉的优势外,技术和产品成熟也是个关键。因为在英特尔成立之后,除了制造存储器件外,也一直有为其他公司代工设计,生产微处理器的传统。

      二、微软公司的创始人,比尔·盖茨和保罗·艾伦第一次接触CPU就是从8008开始,那时他们还都是年轻人,两人合力为该芯片编写了简单的Basic编程语言,但是没有成功;但他们最终在性能强劲一些的8080处理器上实现了这个目标,并在新墨西哥镇成立了一家软件小公司,这家公司就成为了微软的前身—这也成为英特尔和微软亲密关系的开始。

      又过了四年,到来的1978年,英特尔推出了首枚16位微处理器,这就是同样大名鼎鼎的8086,而随着8086同时推出的还有与之配合的数学协处理器8087,值得一提的是这两种芯片使用相同的指令集,以后英特尔生产的处理器,均对其兼容,这也是指令集真正意义上的开端,从1978年至今,微处理器将迎来指令集传承和发展的时代。当然8086处理器也获得了市场端的成功,而英特尔也再接再厉推出了8086的精简版8088处理器(它只采用8位数据总线,所以只能称作准16位),英特尔在1978年的产品就是8086、 8087和8088,它们的频率也各不相同,三款处理器都拥有29000只晶体管,速度可分为5MHz、8MHz、10MHz版本,内部数据总线(处理器内部传输数据的总线)、外部数据总线(处理器外部传输数据的总线)均为16位(8088除外),地址总线为20位,可寻址1MB内存。这样一来,在1978年,英特尔拥有了三款同一产品线不同定位的产品,这也是英特尔首次向消费者提供同一代微处理器的多种选择方案,而这一做法也一直延续到了今天。

      对于英特尔来说,1978年的三款产品意义可能更加重大,因为英特尔成功将 8088销售给IBM全新的个人计算机部门。1981年,IBM推出的首批个人电脑机选用了英特尔8088芯片,使得8088成为了IBM全新热销产品 IBM PC的大脑。本来IBM准备采用摩托罗拉的芯片,但是最终阴差阳错,还是由8088芯片承担了这项光荣的使命。随着个人电脑的流行,英特尔也开始名扬四海。

       8088的大获成功使英特尔顺利跻身财富500强之列,而日后大名鼎鼎的IBM PC兼容机系列也在这一年开始展露峥嵘。8088被IBM所采用,为后续英特尔占据微处理器绝对主流奠定了坚实的基础,甚至《财富》杂志也将英特尔评为 “Business Triumphs of the Seventies”,我们必须正视8088对英特尔乃至对计算机行业的重要意义。

      IBM决定在自己的PC中采用英特尔的芯片,这个决定成就了今天x86的地位。与苹果的封闭做法不同,IBM确立了开放式的PC标准,这也是最早的开放策略—与今天安卓在智能手机市场的快速崛起类似,大量的兼容PC也纷纷出现,所有的兼容PC厂商都唯IBM马首是瞻,于是英特尔和微软都沾光分获了大量的订单,作为标准制定者的IBM,由于慷慨到“忘记”注册专利,最终就失去了这个市场。

      同样又是四年后1982年,英特尔推出来80286微处理器。80286同样是一款重量级产品,这同样是一款销量极大的微处理器产品,根据当年的统计,在英特尔80286处理器发布后的6年内,全世界基于 286处理器的个人计算机便达到了大约1500万台,这一数字相当恐怖,而我们所说的PC286也正是指采用了80286微处理器作为核心的PC机型。

      80286是处理器进入全新技术时代的标准产品,虽然仍为16位芯片,但集成了14.3万只晶体管,具有6MHz、8MHz、10MHz、12.5 MHz四个主频的产品,最后居然有20MHz产品。在之后的所有产品时代,英特尔都提供了不同频率的版本给消费者自由选择,这也是微处理器真正多元化的开始。

      80286是Intel第一款具有完全兼容性的处理器,兼容了8086所有功能,使8086的汇编语言程序可以不做修改直接运行。80286微处理器内部有4个功能部件,即地址部件AU、指令部件IU、执行部件EU和总线部件BU。这四个部件的并行操作,提高了吞吐率,加快了处理速度。这一软件兼容性也成为了Intel处理器家族一个恒久不变的特点,而之后所有的处理器也都将基于这一理念而设计。80286是英特尔最后一款16位处理器,而为人们所熟知的则是以80286作为核心的PC 286产品,这也意味着个人PC已经成为主流,未来的历代产品都将站在80286的成功所铸成的肩膀之上。






本主题包含附件,请 登录 后查看, 或者 注册 成为会员
1条评分贡献值+1
tony 贡献值 +1 本文已被录入爱拆客笔记本改装俱乐部技术资源库,请楼主留下您的支付宝账号领取稿费! 2011-12-16
主用机:CLEVO P175EM:i7-3740QM QS/32GB DDR3 1600/512GB mSATA+4TB HDD/nVIDIA Quadro K4000M 4GB GDDR5/17.3"1080P+ASUS PA238Q/BCM4352ac
便携本:Lenovo K29:i7-3540M QS/8GB RAM/256GB M4 SSD/12.5寸 768P/BCM4352ac//8芯 续航6h/1.7kg
测试机:Lenovo SR420M:14.1"1280*800/Core2 Duo T5600/2GB DDR2/80G HDD+ODD
Server:ThinkPad E130:i3 3227U@1.9GHz/4GB RAM/32GB PM830 SSD/11.6寸 768P//续航6h/1.5kg//正版Server 2012R2标准版
移动AP:Apple iPhone5C(yellow)16GB A1529
主力机:Huawei P9Plus 麒麟955+4GB RAM+64GB ROM/5.5" 1080P AMOLED + EMUI5 with Android 7.0
备用机:NOKIA E73
小平板:Mi Pad 3G RAM+64G ROM+64G C10U1 TF
电子书:KPW3
离线jsntrgsy
发帖
2723
拆客金币
22768
威望
160
贡献值
4
主机
P175EM
板儿
MiPad 64G
备机
K29
爪机
iphone6
坐骑
11
只看该作者 1楼 发表于: 2011-12-16
x86时代的到来
Intel篇

一、386~486:英特尔成为PC领导者

      1985年,英特尔又向全球推出了全新一代的微处理器80386,这款处理器的发布也意味着英特尔的产品开始走向32位时代。是80X86系列中的第一种32位微处理器,而且制造工艺也有了很大的进步,与80286相比,80386内部内含27.5万个晶体管,时钟频率为12.5MHz,后提高到 20MHz,25MHz,33MHz。

      80386的内部和外部数据总线都是32位,地址总线也是32位,可寻址高达4GB内存。为了实现兼容,80386采用“类286”总线结构,这样就可以保持软硬件的兼容性,降低整机的开发和制造成本。其次,80386有三种工作模式(具有实模式、保护模式外,还有一种叫虚拟86的工作方式),适应的操作系统比较多,对现有的程序兼容性比较好。再者,80386首度引入多任务处理机制,这就使它能被各行各业广泛使用。

      虽然当时80386没有完善和强大的浮点运算单元,但配上80387协处理器,80386就可以顺利完成AutoCAD等需要大量浮点运算的任务,从而顺利进入了主流的商用电脑市场。针对内存速度相对低下的瓶颈,英特尔为80386设计了高速缓存(Cache),采取预读内存的方法来缓解这个问题。英特尔最初计划将L1 Cahce直接内置入80386芯片中,但受到工艺、成本、工期等方面的限制,英特尔最终选择了L1 Cache芯片外置主板的方案—从此之后,Cache就和CPU成为了如影随形的东西。Cache的设计也相当大程度影响着CPU的性能。

      80386衍生出庞大的家族,除了标准版的80386DX,还包括廉价版的80386SX,以及移动版、低功耗的80386SL和80386DL。1988年推出的80386SX是市场定位在80286和80386DX之间的一种芯片,其与80386DX的不同在于外部数据总线和地址总线皆与80286相同,分别是16位和24位(即寻址能力为16MB)。除了SX芯片之外,英特尔在1990年推出的80386SL和80386DL都是低功耗、节能型芯片,主要用于便携机和节能型台式机。80386 SL与80386 DL的不同在于前者是基于80386SX的,后者是基于80386DX的,但两者皆增加了一种新的工作方式:系统管理方式(SMM)。当进入系统管理方式后,CPU就自动降低运行速度、控制显示屏和硬盘等其它部件暂停工作,甚至停止运行,进入“休眠”状态,以达到节能目的。

      从386时代开始,英特尔就一反被动局面,主动推进PC系统的升级。而在市场竞争的驱使下,各个PC厂商都或主动或被动地追随英特尔的脚步,这也是英特尔确立自身在PC产业界地位的开始。

      在1985年,英特尔公司有着远比今天多得多的竞争对手:大家熟知的摩托罗拉在当时凭借着自己出色的芯片产品,成为英特公司的强有力竞争者;IT业界巨头IBM也在秘密研究自己的286微处理器;今后的对手AMD公司也开始涉足到CPU制造领域,他们正在开发称一片被为386的的芯片。此时英特尔全力开发出的这款80386处理器产品则完全将其拉升到了一个全新的高度首颗32位处理器的性能是毋庸置疑的,更为引人注意的是80386的软硬件兼容性,承袭 80286的软硬件兼容特性令其成为了当时微处理器界的璀璨明珠。

  1989年,英特尔发布了80486处理器(也叫i486处理器)。486处理器是英特尔非常成功的商业项目。很多厂商也看清了英特尔处理器的发展规律,因此很快就随着英特尔的营销战而转型成功。80486处理器制造工艺提升到1微米,集成了125万个晶体管,时钟频率由25MHz逐步提升到33MHz、40MHz、 50MHz及后来的100Mhz。

  80486处理器的内外部数据总线是32位,地址总线为32位,可寻址4GB的存储空间,支持虚拟存储管理技术,虚拟存储空间为64TB。片内集成有浮点运算部件和8KB的cache(L1 cache),同时也支持外部cache(L2 cache)。整数处理部件采用精简指令集RISC结构,提高了指令的执行速度。此外,80486微处理器还引进了时钟倍频技术和新的内部总线结构,从而使主频可以超出100MHz。

  从80486开始,国内用户也开始较大规模的接触到了个人计算机,当时的IBM PC486 PC机便是以80486作为核心而设计的,此时个人电脑已经进入了国内,先行者已经开始用上了这款大受欢迎的处理器。英特尔486处理器首次采用内建的数学协处理器,将负载的数学运算功能从中央处理器中分离出来,从而显著加快了计算速度。英特尔的386和486推向市场后都受到了广泛欢迎,而英特尔在芯片领域的霸主地位也基本稳固。在此之后,英特尔开始进入到了Pentium时代这同样是人们熟悉名字。
在80486时代,英特尔已经开始成为PC业的核心,PC厂商开始新一轮的惯性升级,尽管面临AMD、Cyrix这些厂商的竞争,但英特尔已经稳稳地居于业界的主导。当然,真正让它走向辉煌的还是“奔腾”时代。

二、Pentium~Pentium Ⅲ:x86架构的成熟

1.第一代Pentium:超标量、MMX指令集、动态执行

  1994年,英特尔发布了一款名为Pentium的处理器芯片,Pentium这个名字将在随后的20多年里一直陪伴着我们,直至今日,英特尔依然在发布Pentium系列的产品,所以Pentium的名号也就是从这一年开始打响。

  其实按照英特尔这十年来的命名习惯,Pentium处理器应该被命名为80586处理器才对,但阿拉伯数字无法用来注册商标,而英特尔又很不希望AMD、Cyrix这些竞争对手用同样的名字来抢自己的饭碗,所以打算注册一个全新的商标——“Pentium”,它同时也有一个响亮的中文名称“奔腾”。这个名字其实也是“第五”的意思,通常认为它是希腊文“五(penta)”加拉丁文中代表名词的接尾语“ium”的造词。

    英特尔奔腾处理器采用了0.60微米工艺技术制造,核心由310万个晶体管组成。支持计算机更轻松的集成“现实世界”数据,如语音、声音、手写体和图片等,也正因为奔腾处理器的这些特性,在当时采用奔腾处理器的PC也被人们称作“多媒体电脑”,当然,之后也出现过“全媒体电脑”的说法,不过并非主流称谓。

    Pentium是x86系列一大革新。时钟频率由最初推出的60MHz和66MHz,最后提高到200MHz。即便是66MHz的Pentium微处理器,它的运算性能都比33MHz的80486DX提高了3倍多,而100MHz的Pentium更是快6~8倍。由于Pentium的制造工艺优良,并把十年未变的工作电压降至3.3V,所以整个系列的CPU的浮点性能也是各种各样性能是CPU中最强的,可超频性能最大。“超频”这种不花钱提升性能的好方法开始在用户中广泛流行起来,这也让Pentium赢得586级处理器的大部分市场。

      超标量(Superscalar)架构是Pentium在架构上主要革新之一,它拥有两个资料路径(管线, pipelines),可以达到在一个时钟周期内完成一个以上的指令。一个管线(称为“U”)可以处理任意指令,另外一个(称为“V”)可以处理简单和通用的指令,相当于吸收了传统RISC处理器设计的特色,这种设计显示出两种技术融合的可能性,也提升了x86的运行效率。不过在指令执行机制上,Pentium架构还是顺序执行(in-order),后来在Pentium Ⅱ时代则被乱序执行所取代。

      早期60MHz~100MHz的Pentium处理器在浮点运算单元上存在一个问题,极少数情况下会导致除法运算的精确度降低。这个缺陷在1994年被发现,英特尔随即陷入巨大的窘态,不得不召回有问题的处理器。另外,早期0.8微米工艺的Pentium也由于热量过高备受指责,当然后来制程升级至0.6微米之后才被一一解决

  奔腾的名字第一次出现,这也宣告了奔腾系列处理器在微处理器行业中长达十年的“统治”开始,而1996年可说是国内电脑行业开始盛行的一年,越来越多的国人开始加入到PC带来的全新领域中。


  随后推出了Pentium MMX芯片,Pentium-MMX是Pentium架构的一次关键升级,除了采用0.35微米制作工艺外,它在X86指令集的基础上加入了57条多媒体指令。这些指令专门用来处理视频、音频和图象数据,使CPU在多媒体操作上具有更强大的处理能力,这些指令集其实是快速执行的硬件,不过要让程序从中获得好处,就必须在编码时支持MMX指令技术,这种附加指令集机制也成为后来所有x86处理器的基准。由于应用程序都会支持MMX指令,也增强了英特尔在该领域的垄断地位。

      *Pentium MMX还使用了许多新技术。

      单指令多数据流SIMD技术能够用一个指令并行处理多个数据,缩短了CPU在处理视频、音频、图形和动画时用于运算的时间;流水线从5级增加到6级,一级高速缓存扩充为16K,一个用于数据高速缓存,另一个用于指令高速缓存,因而速度大大加快;Pentium MMX还吸收了其他CPU的优秀处理技术,如分支预测技术和返回堆栈技术。

    Pentium MMX等于是Pentium的加强版中央处理器芯片(CPU),除了增加57个MMX(Multi-Media eXtension)指令以及64位数据型态之外之外,也将内建指令及数据暂存(Cache)从之前的8KB增加到16KB,内部工作电压降到2.8V。而英特尔之后的桌上型中央处理器皆包含了MMX指令。

  1996年,英特尔在Pentium的基础上推出第六代x86处理器(内核代号P6),这便是Pentium Pro(中文称为“高能奔腾”)。Pentium Pro内部含有高达550万个的晶体管,内部时钟频率为133MHz,主频则有150MHz、166MHz、180MHz、200MHz等多种规格。Pentium Pro配置了8KB指令和8KB数据的一级片内缓存,另外在Pentium Pro的处理器封装中,除CPU芯片外还包括有一个256KB的二级缓存芯片,两个芯片之间用高带宽的内部总线互连,处理器与高速缓存的连接线路也被安置在该封装中,这样就使得高速缓存可以容易地运行在高频率上—比如Pentium Pro 200MHz CPU的高速缓存也是运行于200MHz,二者步调一致,这种设计使得Pentium Pro的性能达到最优化。

2.Pentium Ⅱ到Pentium Ⅲ:平滑升级之路

  1997年5月7日,英特尔发布Pentium II 233MHz、Pentium II 266MHz两款PII处理器,后期推出了300MHz的高频版本。第一个版本核心代号为Klamath,采用了0.35微米工艺技术,核心提升到750万个晶体管组成。采用SLOT1架构,通过单边插接卡(SEC)与主板相连,SEC卡盒将CPU内核和二级高速缓存封装在一起,二级高速缓存的工作速度是处理器内核工作速度的一半Pentium Ⅱ其实延续了Pentium Pro的架构—动态执行技术,加入MMX指令集支持,L1 Cache的容量提升到32KB(16KB指令+16KB数据)。Pentium Ⅱ拥有512KB的L2 Cache,这已经是比较现代的数字了,当然它仍然还是位于芯片外部。Pentium Ⅱ没有继续采用针脚的Socket式插座,而改用了槽式的Slot 1,这种设计也被后来的Pentium Ⅲ沿用。

      1998年1月,代号为Deschutes的第二代Pentium Ⅱ处理器发布,它的运行频率为333MHz,前端总线也提升到100MHz,改用更先进的0.25微米制造工艺,发热量获得显著降低。这个版本的Pentium Ⅱ最高达到450MHz主频。

      Pentium Ⅱ时代的PC有过大量的变革,比如SDRAM内存替代了老式的EDODRAM,AGP显卡开始引入。另外,削减二级缓存的Celeron(赛扬)处理器和针对服务器的Xeon处理器都开始出现。Xeon拥有一个全速的二级缓存,并且有512KB、1MB、2MB等多个版本。当时笔记本电脑已经开始进入高端商业领域,英特尔也因此开发出Pentium Ⅱ的移动版本,它将256KB二级缓存集成于芯片内部,封装尺寸也更小巧。

      在这个时期100MHZ频率的SDR内存已经出现在市场上,但是Intel却惊人地宣布他们将放弃并行内存而主推一种名为Rambus的内存,而一时间众多大公司如西门子、HP和DELL等都投入了Rambus的门下,最后事实证明这并非明智选择。

      英特尔Pentium II处理器在此时迎来了自己最为强硬的对手,即以AMD的K6-2为核心的Socket 7平台,而在英特尔Pentium II处理器的时代,英特尔方面最出彩的却是Mendocino核心的赛扬300A、333、366这样的经典处理器。

英特尔Pentium II处理器

第一代
☆ 1997年6月2日,英特尔发布MMX 指令技术的Pentium II 233MHz处理器,采用了0.35微米工艺技术,核心由450万个晶体管组成。
☆ 1997年8月18日,英特尔发布L2 cache为1M的Pentium II 200MHz处理器,采用了0.35微米工艺技术,核心由550万个晶体管组成。

第二代
☆ 1998年1月26日,英特尔发布Pentium II 333MHz处理器,采用了0.35微米工艺技术,核心由750万个晶体管组成。
☆ 1998年4月15日,英特尔发布Pentium II 350MHz、Pentium II 400MHz和第一款Celeron 266MHz处理器,此三款CPU都采用了最新0.25微米工艺技术,核心由750万个晶体管组成。
☆ 1998年8月24日,英特尔发布Pentium II 450MHz处理器,采用了0.25微米工艺技术,核心由750万个晶体管组成。
  1999年2月26日,英特尔发布了代号为Katmai的第一代Pentium Ⅲ处理器:Pentium III 450MHz、Pentium III 500MHz处理器,但它其实只是Pentium Ⅱ的改进版:指令集升级为更强大的SSE,一级缓存控制器作一些改进,依旧使用半速的512KB二级缓存、0.25微米制造工艺和Slot 1封装,核心由950万个晶体管组成。奔腾3的传奇历程也就这样开始了。
Pentium III是给桌上型计算机的中央处理器芯片(CPU),新增七十条新指令(SIMD,SSE)。Pentium III与Pentium II一样有 Mobile、Xeon以及Cerelon等不同的版本。
Pentium Ⅲ最大的争议在于加入了CPU序列号,英特尔的说法是为增强网上电子商务的安全,让每一颗Pentium Ⅲ处理器都具有识别用户的号码——事实上,英特尔明显超越了作为芯片厂商的权限,为此不得不随后发布补丁工具允许用户关闭。
第一代Pentium Ⅲ最高主频截止到600MHz,最后被代号为“Coppermine(铜矿)”的第二代Pentium Ⅲ所取代。一般认为,“铜矿”才是真正意义上的Pentium Ⅲ:它拥有新的架构、新的接口、新的制造工艺,性能的提升也相当巨大。Coppermine发布于1999年10月,它采用了当时最先进的0.18微米铜互连技术制造,同时将256K B二级缓存直接集成于CPU内核中,新工艺让Coppermine拥有更低的发热量,CPU也能够工作在更高的主频上——Coppermine从733MHz起跳,它最终突破1GHz的关口,在x86微处理器史上值得书下一笔。
Coppermine也奠定了日后英特尔微处理器的基础,它采用三发射设计,同时可以执行三条指令;流水线为12级,32KB一级缓存和256KB二级缓存,通过100MHz~133MHz前端总线与芯片组相连。这套架构影响深远,事实上,后来迅驰平台的Pentium-M,乃至于今天的Core微架构,都是脱胎于Coppermine。
Coppermine有一个短命的后续者,这就是0.13微米工艺的Tualatin(图拉丁)内核,Tualatin将二级缓存的容量提升到512KB,工作频率最高突破1.4GHz,在当时性能完全不亚于频率高得多的Pent ium 4。芯片组也支持快速的DDR SDRAM,平台的整体性能颇为出色。问题在于Tualatin的流水线依然只有12级,1.4GHz频率已经到了极限,而当时频率至上的思想相当普遍,Tualatin并没有得到应有的重视。但是在注重低功耗的笔记本电脑领域,Tualatin也广受欢迎,以至于Pentium 4-M备受冷落。这颗被中国用户称为“图拉丁”的神奇处理器可以轻松地跃上133MHz外频,而正是从“图拉丁”开始,中国用户开始关注起处理器的超频。当然,不能不提的是后来英特尔的酷睿系列处理器和Tualatin Celeron也有着一些联系。
在Coppermine时代,AMD第一次对英特尔构成真正意义上的挑战—虽然此前的K6、K6-2系列获得不菲战绩,但那只是凭借性价比而非性能优势。AMD在发布K7架构的Athlon处理器之后,竞争的天平就开始逆转,Athlon早在Coppermine之前突破1GHz大关,并且性能表现强劲,虽然当时缺乏良好的芯片组支持,但足以证明AMD可以制造出同英特尔相媲美的产品。

  Pentium III光是桌上型就拥有Katmai Slot 1 、Coppermine Slot 1以及Coppermine Socket 370等三种不同的系列。到后期,英特尔放弃插卡式界面而又回归到插槽界面(Socket 370)。socket370封装开始推出的时候,有一部分消费者舍弃了slot1平台而选择了新的处理器。新的PGA封装分为PPGA和FC-PGA两种,前者较为廉价,因而被赛扬处理器所采用,而更为昂贵的后者则被奔腾III处理器所采用。
本主题包含附件,请 登录 后查看, 或者 注册 成为会员
主用机:CLEVO P175EM:i7-3740QM QS/32GB DDR3 1600/512GB mSATA+4TB HDD/nVIDIA Quadro K4000M 4GB GDDR5/17.3"1080P+ASUS PA238Q/BCM4352ac
便携本:Lenovo K29:i7-3540M QS/8GB RAM/256GB M4 SSD/12.5寸 768P/BCM4352ac//8芯 续航6h/1.7kg
测试机:Lenovo SR420M:14.1"1280*800/Core2 Duo T5600/2GB DDR2/80G HDD+ODD
Server:ThinkPad E130:i3 3227U@1.9GHz/4GB RAM/32GB PM830 SSD/11.6寸 768P//续航6h/1.5kg//正版Server 2012R2标准版
移动AP:Apple iPhone5C(yellow)16GB A1529
主力机:Huawei P9Plus 麒麟955+4GB RAM+64GB ROM/5.5" 1080P AMOLED + EMUI5 with Android 7.0
备用机:NOKIA E73
小平板:Mi Pad 3G RAM+64G ROM+64G C10U1 TF
电子书:KPW3
离线jsntrgsy
发帖
2723
拆客金币
22768
威望
160
贡献值
4
主机
P175EM
板儿
MiPad 64G
备机
K29
爪机
iphone6
坐骑
11
只看该作者 2楼 发表于: 2011-12-16
三、P4-Netburst架构:频率至上的歧途

      2000年11月,备受瞩目的Pentium 4处理器发布,也就是著名的奔腾4,Pentium 4相信大家都不陌生。Pentium 4属于英特尔生产的第七代x86处理器,并且也是继1995年出品Pentium Pro之后的第一次微架构重新设计,这也是英特尔市场策略进入新纪元的开始。从P4开始,Intel已经不再每一两年就推出全新命名的中央处理器芯片(CPU),反而一再使用 Pentium 4这个名字,这个作法导致了Pentium 4这个家族有一堆兄弟产品,而且这个P4家族延续了五年,这在英特尔的市场策略历史中是前所未见的。奔腾4是英特尔历史上寿命最长的处理器型号,可能直到目前(2011年)市场上还能够找到为数不多的奔腾4处理器产品,而当时英特尔的广告已经铺天盖地,被人们所熟知的“灯!等灯等灯!”也成为英特尔处理器的标志性声音。

      第一款Pentium 4的核心代号是Willamette,它采用0.18微米工艺生产,集成4200万个晶体管,接口方式为Socket 423。Pentium 4的起步频率就达到1.4GHz,前端总线频率也达到400MHz ,这些指标都要比Pentium Ⅲ高出许多,也优于对手Athlon的266MHz速度。但令人意外的是,Pentium 4没有在“整数处理速度”和“浮点性能”这两方面性能上表现出任何优势,原因在于Pentium 4为了追求高频率,采用多达20级的长流水线设计——流水线越长,提高工作频率就越容易,但每个时钟能处理的任务就会变少。因此尽管拥有1.4GHz的高频率,但它的性能却不如最高频率的Pentium Ⅲ,基本上属于不进反退的类型。而在实际测试中,Willamet te的表现几乎让人大失所望,它几乎在所有的测试应用中都无法超过AMD Athlon和最高频率的Pent ium Ⅲ,甚至对于AMD低端产品Duron处理器也没有太大的优势。而英特尔此时野心膨胀,妄图通过Pentium 4平台控制内存市场,采用了当时技术前卫,但价格奇贵无比的RDRAM作为搭配对象,导致Pentium 4平台的价格更为高昂。幸亏英特尔有众多PC厂商的死撑,Pentium 4平台在高阶PC市场还是获得不错的业绩。

      但是从产品层面来看,Willamette绝对是失败之作,姑且不说与RDRAM搭配的做法,就是Willamette核心本身也不够完善。许多业界专家都认为,最初1.4GHz和1.5GHz的Pentium 4只是赶工之作,而未能真正体现出它的应有能力。根据这些专家的观点,Willamette的发布是因为当时竞争对手AMD Athlon处理器的性能已经超过了Pentium Ⅲ,并且英特尔之前并没有考虑对Pentium Ⅲ进行深度改进,面对竞争对咄咄逼人的态势,及早推出Pentium 4就显得非常有必要。

    Socket 478平台上的奔腾4显然更加成熟,其中最为经典的便是Netburst的奔腾4处理器产品,而后来的Intel高主频处理器产品还依然沿用了这种架构。在新的处理器中,英特尔还应用了一系列的新技术,例如支持快速视频流编码的SSE2指令集等。

      随着处理器主频和内部集成晶体管数目的增加,处理器消耗的能量也开始大大增加。为了满足处理器所需要的巨大电能,因为奔腾四处理器的功率达到了72W,因此它需要在主板上附设额外的电源接口来满足处理器的供电需要,而由于发热量的增加,一个散热风扇也成了一个必需品。

      英特尔将这套架构称为“Netburst”,号称“网际爆发”,宣传它是与互联网应用最佳匹配的架构。事实上,Netburst的美名更多只是市场营销的需要。而在技术理念上,Netburst的精髓就是通过高频率的法则最终获得性能优势,英特尔在发表Pentium 4时向大众宣布说,NetBurst架构能够运行在10GHz。然而,NetBurst架构最终在4GHz就遇到了无法解决的高功耗问题。最终迫使英特尔在2005年年中放弃了这套架构,转向能效比更高的Pentium-M架构;而在之后的Core架构开发上,英特尔从过去的“频率至上”180度转变到“能效至上”,其实只是对Netburst错误开发思路的反思。

  内存方面,Intel主推的与奔腾四搭配的平台是850平台,双通道的Rambus XDR内存达到了前所未有的2.5GB/S的内存数据带宽,但是由于 Rambus XDR内存价格昂贵所以使得早期P4平台相当昂贵。而由于契约的限制Intel又无法使用当时已经出现在市场上的DDR内存。

      经过了漫长的等待,Intel终于和Rambus达成了协议,之后Intel马上推出了845D和845GD两种基于DDR内存平台的芯片组。虽然 DDR相对SDR数据带宽增加了一倍,但是相对于Rambus还是有所不足,直到后来双通道DDR内存的出现才解决了这一问题。

      第一代Willamette被公认为失败之作,不过第二代Nor thwood内核则获得一致肯定。这一次,Pentium 4终于表现出性能上的优势,搭配的内存也改用平易的DDR SDRAM——当频率突破2GHz时,Pentium 4终于在性能上击败了对手。这一次,英特尔可以松了口气。Nor thwood的主要改进包括0.13微米工艺、512KB二级缓存,并改用Socket 478接口。

      Northwood架构寿命较长,早期的400MHz FSB版本,后来的533MHz FSB,最后的800MHz FSB,以及Hyper-Threading超线程技术的引入,最高频率甚至到了3.4GHz。Netburst架构的第三位成员就是“Prescott”,它发布于2004年1月,采用了先进的90纳米工艺制作,流水线长度从20级增加到31级,并且支持SSE3指令集,改用饱受争议的LGA775接口。Prescot t的目标依然是追求更高的工作频率,但更长的流水线设计让它效率更低,加上早期90纳米工艺并不完美,导致Prescott每个时钟周期比Northwood多产生大约60%的热量;插座类型的转换(从Socket 478到LGA 775)原本希望能够将发热降低到可以接受的水平,但是实际上却是产生了相反的效果,同时功率消耗也增加大约10%—最终,Prescott的整体功耗轻松超过百瓦大关,基本上属于火炉的标准,几乎所有的评论都是负面的。如果说Prescott有什么新特点,那就是它拥有很多新技术的引入,比如硬件防病毒技术Execute Disable Bit(EDB)、节能省电技术Enhanced Intel SpeedStep Technology(EIST)、虚拟化技术Intel Virtualization Technology(Intel VT),等等,另外在2005年第一季度,英特尔发布了代号为“Prescott 2M”的编号6x0的新版Prescott内核,这让Pentium 4获得了执行64位x86代码的能力。

      Cedar Mill是Pentium 4家族中最后的成员,采用65纳米工艺制作,将处理器的功耗降低到86瓦的水准,但在内部架构上,Cedar Mill没有多少建树,它只是修改了Prescott内核电路上的一些Bug,性能未有进步,Cedar Mill的最高频率止于3.8GHz,这也是Netburst家族最后的光荣。

      超线程(HT)技术是奔腾4首先采用的,而目前的英特尔i3/i5/i7所使用的超线程技术也都是从超线程奔腾4处理器中得到的灵感并加以技术升级所得到的崭新技术,可想而知当时的超线程技术(当时桌面级产品中根本没有双核产品)给业界带来的冲击有多大。

      在2005年第二季度,我们看到双内核Pentium D处理器的诞生——Pentium D在一颗芯片中集成了两个Prescott内核,与传统的多处理器没有什么区别,功耗超过150瓦,可想而知它是一个可怕的电老虎。到Cedar Mill时代,英特尔干脆采用更简单的做法,即将两枚Cedar Mill芯片封装在一块晶片上,达到提高良品率和降低成本的目的,当然,这一代Pentium D的功耗也是相当可怕的。

      AMD在2003年9月发布了K8架构,籍由64位指令和整合内存控制器的创新设计,加之在性能、功耗方面的不凡表现,开始给英特尔造成巨大的麻烦。基本上在这个时代,双方打成了平手,AMD一直保持强势的姿态,这种局面直到后来Core微架构的出现才被重新改变。


本主题包含附件,请 登录 后查看, 或者 注册 成为会员
 
主用机:CLEVO P175EM:i7-3740QM QS/32GB DDR3 1600/512GB mSATA+4TB HDD/nVIDIA Quadro K4000M 4GB GDDR5/17.3"1080P+ASUS PA238Q/BCM4352ac
便携本:Lenovo K29:i7-3540M QS/8GB RAM/256GB M4 SSD/12.5寸 768P/BCM4352ac//8芯 续航6h/1.7kg
测试机:Lenovo SR420M:14.1"1280*800/Core2 Duo T5600/2GB DDR2/80G HDD+ODD
Server:ThinkPad E130:i3 3227U@1.9GHz/4GB RAM/32GB PM830 SSD/11.6寸 768P//续航6h/1.5kg//正版Server 2012R2标准版
移动AP:Apple iPhone5C(yellow)16GB A1529
主力机:Huawei P9Plus 麒麟955+4GB RAM+64GB ROM/5.5" 1080P AMOLED + EMUI5 with Android 7.0
备用机:NOKIA E73
小平板:Mi Pad 3G RAM+64G ROM+64G C10U1 TF
电子书:KPW3
离线jsntrgsy
发帖
2723
拆客金币
22768
威望
160
贡献值
4
主机
P175EM
板儿
MiPad 64G
备机
K29
爪机
iphone6
坐骑
11
只看该作者 3楼 发表于: 2011-12-16
四、Pentium-M架构的崛起

       Pentium 4的高功耗在笔记本电脑市场就遭遇麻烦,Pentium 4-M的功耗达到35瓦,这个数字显然太高了,而架构的先天限制,让Pentium 4根本无法进一步改善节能。为此,英特尔一方面还是依赖Pentium Ⅲ-M来撑撑场面,另一方面则开发新的架构解决问题—英特尔的官方决策是让台式机、服务器选择高频率的Netburst,移动市场则采用新的低功耗架构,这便是后来的Pentium-M。

       Pentium-M其实并不是英特尔的正式开发计划,而是英特尔位于以色列研发中心的一些工程师的构想。大约在90年代末,笔记本电脑市场刚刚开始喷涌,以色列研发中心的一些工程师和欧德宁就谈论专门开发笔记本电脑芯片的想法,其目的在于,在提供较长电池使用时间的条件下,也能够获得较高的性能。这个想法获得高层的支持,当Pentium 4毁誉参半的时候,该计划的结晶,也就是Pentium-M却成为新希望所在。

       尽管英特尔的官员曾表示Pent ium-M是一款全新设计的芯片。但真相却是,Pentium-M其实是基于Pentium Ⅲ架构之上的重大修改版。当初第一版的Pentium 4反而不如Pentium Ⅲ,饱受外界诟病,以至于AMD的官员嘲笑说:“如何使Pentium 4表现更好?那就采用Pentium Ⅲ。”据英特尔的前首席芯片设计师鲍勃回忆说,当时他们曾经提出了改进Pentium Ⅲ的20~30项措施,使之能够实现显著的性能提升,但计划并没有真正付诸实施,最后以色列的设计人员对它进行了改进。Pent ium-M就是在这样的背景下诞生,因此它确实不是一款全新的芯片。该芯片的设计师之一埃登在谈到Pentium-M时说:“它不再强调速度(频率),而是对客户需求的响应。”

       Pentium-M的流水线仅有14级,比Pentium 4的20级小得多,只比PentiumⅢ的12级略多,这种设计保证了在频率提升空间的同时,又能做到出色的指令性能。其次,Pentium-M的分支预测和预取机制获得大量改进,简单点说它采用了Prescott核心的成果,最终使得Pentium-M的分支预测效能比Pentium Ⅲ高出20%。第三,Pentium-M引入Micro Fusion(微操作融合)技术,一些相关性的微操作指令被捆绑在一起执行,此举显著提升了硬件的执行效率——根据测试,这项技术让整数数据的处理速度提升5%,浮点数据的处理速度提升9%。第四,Pentium-M拥有一个1MB的L2 Cahce,并且它被划分为4个部分,每个部分都可以单独访问,这样在运行中的某个时刻,只要有一部分L2 Cahce开启即可,此举将L2 Cahce的功耗降低1/4。而作为Cache的SRAM过去一向是耗能大户。第五,Pentium-M采用Pentium 4的QPB型前端总线,这就让内存与CPU之间拥有更大的数据吞吐量。

      上述改进的效果立竿见影,Pentium-M在较低的频率下就表现出强劲的性能——比如说Pentium-M 1.6GHz的实际性能就可以同Pentium 4 2.8GHz相媲美,巨大的反差足以让Pentium 4被判了死刑。


      第一代Pentium-M代号为Banias,它发布于2003年2月,采用0.13微米制造工艺,集成了7700万个晶体管,工作频率从1.3GHz~1.6GHz。英特尔标新立异地提出“Centrino(迅驰)”平台的概念:将英特尔的Pentium-M CPU、i855系列芯片组和802.11b无线网卡捆绑在一起,这种行销策略大获成功,也推动了802.11b无线网络的普及。另外,Pentium-M的TDP功耗只有24.5瓦,配合其他节能措施,将笔记本电脑的电池时间提升到3小时以上—而过去无论Pentium Ⅲ-M还是Pentium 4-M,都只有2小时左右的水平。

      2004年10月,代号为Dothan的第二代Pentium-M发布,它采用90纳米工艺制造,二级缓存提高到2MB的规格,晶体管总数也飙升到1.4亿个。相比Banias多出来的那部分,其实基本都用于二级缓存。Dothan的工作频率在1.7GHz~2.0GHz之间,它的性能表现更令人刮目相看,同时芯片TDP功耗还降低到21瓦的水准。基于Dothan的第二代迅驰平台,拥有54Mb/s的802.11g无线网络,带动了整个无线设备市场的更新换代。

      最后一代Pentium-M架构代号为“Yonah”,它也是英特尔史上第一种原生双核心x86处理器。Yonah以Core品牌发行,国内称之为“酷睿”,但它在本质上只是两个Dothan的整合,主要革新点在于两个CPU可以共享2MB二级缓存,而不是独自占有,此举显著提升了双核处理器的任务配合能力。其次,Yonah加入了SSE3指令集、英特尔虚拟化技术(Intel Virtualization Technology)与英特尔病毒防护技术(Intel Execute Disable Bit),功能特性也比较丰富。

      Yonah Core平台发布于2006年1月,制造工艺为65纳米,尽管整合了双核心,它依然保有24瓦的超低功耗水平。Yona h的最高频率达到2.33GHz,不过此时其TDP功耗提升到31瓦。此时此刻,Pentium 4即便拥有3.8GHz的高频率,也无法同Yonah相提并论。当然,到此为止,Pentium Ⅲ时代或者说Pentium Pro架构的最后荣光,也就划上了句号。

      Pentium-M的成功令Pentium 4无地自容,最终驱使Pentium 4开发团队引咎辞职,这些人另立门户成立了一个名为Stexar的小公司,其CEO兰迪·斯特克,是Pentium Pro、Pentium Ⅱ、Pentium Ⅲ和Pentium 4开发小组领导人;工程部副总裁Gary Brown,曾任Northwood设计和编程经理;首席架构设计师Darrell Boggs也是Netburst架构的首席设计师,并曾参与Hyperthreading的开发。Stexar公司在2006年9月份被NVIDIA收购,现在这些人估计正在为NVIDIA的Denver计划努力。
本主题包含附件,请 登录 后查看, 或者 注册 成为会员
主用机:CLEVO P175EM:i7-3740QM QS/32GB DDR3 1600/512GB mSATA+4TB HDD/nVIDIA Quadro K4000M 4GB GDDR5/17.3"1080P+ASUS PA238Q/BCM4352ac
便携本:Lenovo K29:i7-3540M QS/8GB RAM/256GB M4 SSD/12.5寸 768P/BCM4352ac//8芯 续航6h/1.7kg
测试机:Lenovo SR420M:14.1"1280*800/Core2 Duo T5600/2GB DDR2/80G HDD+ODD
Server:ThinkPad E130:i3 3227U@1.9GHz/4GB RAM/32GB PM830 SSD/11.6寸 768P//续航6h/1.5kg//正版Server 2012R2标准版
移动AP:Apple iPhone5C(yellow)16GB A1529
主力机:Huawei P9Plus 麒麟955+4GB RAM+64GB ROM/5.5" 1080P AMOLED + EMUI5 with Android 7.0
备用机:NOKIA E73
小平板:Mi Pad 3G RAM+64G ROM+64G C10U1 TF
电子书:KPW3
离线jsntrgsy
发帖
2723
拆客金币
22768
威望
160
贡献值
4
主机
P175EM
板儿
MiPad 64G
备机
K29
爪机
iphone6
坐骑
11
只看该作者 4楼 发表于: 2011-12-16
五、Core时代:四发射成为关键王牌

       尽管Yonah开始拥有“Core”的新商标,但真正意义上的Core架构却是从Merom内核开始的,Merom是英特尔反思Pentium 4教训和汲取Pent ium-M营养的翻身之作,它发布于2006年第三季度。Merom终于能够原生支持64位的EM64T架构,但其成就远不止于此。Merom同样出自以色列人之手。在这个时代英特尔也放弃台式机、移动不同架构的做法,将两者重新整合在了一起。显然,英特尔被Pentium 4的高热量吓坏了,这次它优先设计低能耗的Merom,然后再衍生出针对台式机市场的“Conroe”,也就是我们俗称的“扣肉”。

       经历过奔腾D时代的人都知道,这一时代虽然英特尔依然占据统治地位,但AMD的K7和K8架构却焕发出了惊人的竞争力,而英特尔在奔腾产品上显然已经陷入到了频率之争的误区中,而酷睿2产品的出现则让英特尔在产品端重新站在了制高点,而直到现在,最高端的桌面处理器依然出自英特尔。

     “酷睿”是一款领先节能的新型微架构,设计的出发点是提供卓然出众的性能和能效,提高每瓦特性能,也就是所谓的能效比。早期的酷睿是基于笔记本处理器的。
酷睿2:英文名称为Core 2 Duo,也叫C2D,这是是英特尔在2006年推出的新一代基于Core微架构的产品体系统称。于2006年7月27日发布。酷睿2是一个跨平台的构架体系,包括服务器版、桌面版、移动版三大领域。其中,服务器版的开发代号为Woodcrest,桌面版的开发代号为Conroe,移动版的开发代号为 Merom。

      酷睿2处理器的Core微架构是Intel的以色列设计团队在Yonah微架构基础之上改进而来的新一代英特尔架构Conroe在内部架构上同Merom没有任何区别,功能上也完全一致,只是作为台式机处理器,它在功耗方面的要求更加宽松,这就使得Conroe也可以做到更高的频率—虽然还无法同Pentium 4比肩,但卓越的指令效率,让它最终获得惊人的性能,与Pentium 4拉开了很大的差距。最显著的变化在于在各个关键部分进行强化。为了提高两个核心的内部数据交换效率采取共享式二级缓存设计,2个核心共享高达4MB的二级缓存。Core2 Duo的内核采用较短的14级有效流水线设计,每个核心都内建32KB一级指令缓存与32KB一级数据缓存,2个核心的一级数据缓存之间可以直接传输数据。每个核心内建4组指令解码单元,支持微指令融合与宏指令融合技术,每个时钟周期最多可以解码5条X86指令,并拥有改进的分支预测功能。每个核心内建 5个执行单元子系统,执行效率颇高。加入对EM64T与SSE4指令集的支持。

  相比奔腾D,酷睿2处理器的频率一点也不占优势,正相反,酷睿2前所未有地出现了“新一代反而比老一代处理器主频更低”的情况,实际上酷睿2和奔腾D处理器完全就不是一个体系的产品,而对于酷睿2处理器来说,最重要的是效能而非绝对频率,酷睿2能够用不到2GHz的频率在性能方面秒杀3.5GHz的奔腾 D,这在当时来说绝对是令人震惊的。

      回头来看Merom,它最伟大的设计就是做到了四发射,也就是同时可解码四道指令—而之前的x86处理器只能做到三道。这意味着在一个时钟周期内,Merom已经在指令解码方面直接获得33%的性能增长。如果是RISC处理器,四发射设计并不困难,绝大多数RISC产品都是这么干,这是RISC产品优于CISC的关键点。深层次原因在于RISC指令系统简单,而x86指令系统仍然较为复杂,硬件强行四发射设计,会出现频率难以提升的陷阱。Merom吸收了RISC的营养,英特尔将指令分为20%的热指令与80%的冷指令,并进行深度优化,从而做到四发射和频率提升的均衡。这项成就迄今为止都是英特尔的技术壁垒,AMD的K10架构无论如何改进都无法突围,据说其新一代“推土机”架构,才实现四发射,但也传闻其遭遇频率难升的麻烦。Merom另一项关键改进就是Macro Fusion(宏指令融合)技术,宏指令融合技术比微操作融合技术的应用更为广泛,如If和Jump指令结合,这项技术进一步增加了执行效率。总之,在一系列提高效率到牙齿的技术环绕下,Merom的每瓦性能高到不可思议的地步,AMD的Athlon X2系列毫无还手之力,只能依靠性价比取胜。

      Merom时代的迅驰平台代号为Santa Rosa,该平台包含四大组件,分别是Merom处理器、i965M系列芯片组、i4965AGN无线模块和Intel Turbo Memory模块。这其中最有意义的是无线模块,让300Mb/s的802.11n标准取代了低速的802.11g;而最糟糕的当属那个叫做“迅盘”的Intel Turbo Memory模块,它本来应该起到加速作用的,但用户普遍发现它其实会让开关机变得缓慢无比,最终这个模块没有继续发展,因为兴起的SSD固态硬盘显然是更好选择。

      Merom的接替者是45纳米工艺的Penryn,它发布于2007年11月(台式机版与服务器版)和次年的一季度(移动版),Penryn并没有带来太多的新技术特性,SSE4指令集应该算一个,还有一个就是动态加速技术。Penryn的性能提升幅度也比较小,因为这个时候英特尔已经在性能方面遥遥领先于AMD,所以没有太大必要快马加鞭。不过Penryn时代出现了四核心处理器,这主要针对台式机和服务器市场。得益于先进的45纳米High-K工艺,Penryn的功耗水平更低,移动处理器依然停留在25瓦水平,同时由于节能技术更丰富全面,Penryn平台笔记本电脑的电池续航力仍有一定的提升。



本主题包含附件,请 登录 后查看, 或者 注册 成为会员
主用机:CLEVO P175EM:i7-3740QM QS/32GB DDR3 1600/512GB mSATA+4TB HDD/nVIDIA Quadro K4000M 4GB GDDR5/17.3"1080P+ASUS PA238Q/BCM4352ac
便携本:Lenovo K29:i7-3540M QS/8GB RAM/256GB M4 SSD/12.5寸 768P/BCM4352ac//8芯 续航6h/1.7kg
测试机:Lenovo SR420M:14.1"1280*800/Core2 Duo T5600/2GB DDR2/80G HDD+ODD
Server:ThinkPad E130:i3 3227U@1.9GHz/4GB RAM/32GB PM830 SSD/11.6寸 768P//续航6h/1.5kg//正版Server 2012R2标准版
移动AP:Apple iPhone5C(yellow)16GB A1529
主力机:Huawei P9Plus 麒麟955+4GB RAM+64GB ROM/5.5" 1080P AMOLED + EMUI5 with Android 7.0
备用机:NOKIA E73
小平板:Mi Pad 3G RAM+64G ROM+64G C10U1 TF
电子书:KPW3
离线jsntrgsy
发帖
2723
拆客金币
22768
威望
160
贡献值
4
主机
P175EM
板儿
MiPad 64G
备机
K29
爪机
iphone6
坐骑
11
只看该作者 5楼 发表于: 2011-12-16
六、第二代Core架构与核芯显卡:兼容并包

2008年至今:英特尔智能处理器时代

      从07年Penryn架构开始,英特尔就制定了一套“钟摆计划”(Tick-Tock战略)。Tick-Tock就是时钟的“嘀嗒”的意思,一个嘀嗒代表着一秒,而在Intel的处理器发展战略上,每一个嘀嗒代表着2年一次的工艺制程进步。

  每个Tick-Tock中的“Tick”,代表着每隔两年的奇数年工艺的提升、晶体管变小,并在此基础上增强原有的微架构,而Tick-Tock中的“Tock”,则每隔两年的偶数年在维持相同工艺的前提下,进行微架构的革新,这样在制程工艺和核心架构的两条提升道路上,总是交替进行。很多人又把英特尔的“Tick-Tock”看成是一个巨人在用他的两条腿前进,左脚代表制程工艺,右脚代表架构,这也能看出英特尔提出这样的前进路线也有基于市场稳妥方面的考虑。


      时间表到了2008年,新一代架构Nehalem出炉,这是Core2架构的首度重大革新,革新点主要两方面:一是将内存控制器整合于CPU内部,可支持三通道DDR3(配合X58的酷睿i7产品),这种设计可以有效降低内存系统的延迟,借此进一步提高性能;二是引入高速QPI总线技术,便于多处理器的互联与扩展;其他外加增添了SMT、三级缓存、TLB和分支预测的等级化、IMC等技术,智能睿频技术的加入也让处理器的工作变得更加智能,更值得一提的是超线程技术也在Nehalem处理器中再次加入。AMD有足够的理由指责英特尔在抄袭,因为这不过是2003年K8架构就实现的东西;当然AMD其实也在抄袭RISC阵营的设计。

      Nehalem在内部设计方面还有大量的改进,但我们认为这些常规的改进不值一提,前面所说的两个革新才是Nehalem获得性能突破的关键。从Merom时代开始,英特尔就一直在CPU性能上占据压倒性的优势,Nehalem时代同样是如此,不过此时AMD吸纳了ATI的图形技术,在市场上给英特尔的威胁反而加大。

      在Nehalem时代,“迅驰”商标寿终正寝,英特尔开始强调“酷睿”品牌,这其实是一种倒退,实际上我们也认为并非明智之举。既然不再捆绑式销售,PC厂商有自由的选择了么?NO,PC厂商还是必须选择英特尔的处理器、芯片组和无线网络模块。英特尔认为自己通吃比较好,结果它得罪了几乎整个产业界,不断逼出NVIDIA、ARM等更强硬的竞争对手。

   到了2009年,英特尔开始将制造工艺升级到32纳米,这便是Westmere。Westmere实现了六核心设计,拥有高达12MB的三级缓存,不过移动版还是以双核心为主。Westmere最大的创举还是将GPU整合在处理器内部。当然,你知道,它提供了够用但不强悍的性能,无论3D或高清视频方面都还马马虎虎,虽然无法同NVIDIA、AMD的GPU技术相提并论,但此举让英特尔进一步蚕食了独立图形市场。

      虽然将GPU与CPU整合在一起依然是AMD的主意,这也是AMD并购ATI的主要目的之一,但问题是AMD一直停留在纸面谈论阶段,反而让英特尔抢了先机。虽然Westmere仅仅是将GPU芯片同CPU封装在一起,但从今天来看,英特尔这抢先的一步棋着实对“整合”的趋势起到了重要的推动作用。

      CPU与GPU的整合大潮,也让NVIDIA的生存空间被挤压殆尽,NVIDIA先期被迫放弃了芯片组市场,低端显卡市场也不断萎缩,但它以GPU通用计算来反戈一击,同时将 Tegra移动芯片发展得风生水起,接着它与微软结盟,准备以ARM架构的Denver进入PC市场,可以说NVIDIA今后将是英特尔巨大的麻烦。

      2011年1月,新一代架构Sandy Bridge出炉,这代架构的主要特点则是加入了game instrution AVX(Advanced Vectors Extensions)技术,也就是之前的VSSE。AVX技术将矢量运算的宽度从之前的128bit扩展到256bit。英特尔宣称,使用AVX技术进行矩阵计算的时候将比SSE技术快90%,其重要性堪比1999年 Pentium Ⅲ引入SSE。不过,Sandy Bridge最引人注目的地方还是将GPU直接集成于芯片内,做到硬件层面的高度融合,同时CPU、GPU可以共享三级缓存,显著改善了GPU的性能表现。至于GPU本身的架构也得到相当的增强,使得Sandy Bridge的图形性能直逼低端独立显卡。此外,Sandy Bridge中还集成了视频引擎,可以对1080p高清媒体进行硬件解码,这样就不必再消耗CPU资源。内存控制器方面,Sandy Bridge可以支持双通道DDR3-1600。

      除了性能的增长外,Sandy Bridge拥有相当多的人性化技术,比如新一代 “Turbo Boost”智能动态加速技术更为有效,CPU、GPU可以分别动态运行,节能效果相当出众。总之,Sandy Bridge是相当值得称道的产品,它不仅在CPU性能方面有10%~30%的提升,GPU性能也接近翻番,该平台的笔记本电脑普遍拥有4~5个小时的续航能力,整体表现极为出众。

      然而,尽管新平台如此的出众,英特尔面临的市场竞争压力不仅没有因此变小。作为老对手,AMD在CPU领域的弱势地位一直没有改变,并且性能差距幅度相当可观,但伴随着ATI图形技术的整合,AMD平台的整体吸引力越来越强——CPU性能过剩已经是共识,高一点或低一点对实际体验影响有限。而图形性能对用户体验影响显著,AMD在这一领域的优势十分显著,它在今年6月份发布Fusion APU,并且提出“异构计算”的理念,籍由GPU来加速高密集度的计算任务,从而获得综合的性能优势。

      由于英特尔没有强有力的图形技术,先前开发的Larrabee项目又转向其它并行处理领域,这意味着在异构计算时代它的CPU只是一个配角。伴随着OpenCL的确立,我们相信支持异构计算的应用程序将会越来越多,包括多媒体视频编解码、文件压缩、Flash动画、图像处理和音频制作等涉及密集运算量的场合,异构计算将成为标准,无论英特尔拥有多么强大的CPU,都无法同更擅长此道的GPU相对抗,这也是它在未来要面对的严峻局面。


本主题包含附件,请 登录 后查看, 或者 注册 成为会员
主用机:CLEVO P175EM:i7-3740QM QS/32GB DDR3 1600/512GB mSATA+4TB HDD/nVIDIA Quadro K4000M 4GB GDDR5/17.3"1080P+ASUS PA238Q/BCM4352ac
便携本:Lenovo K29:i7-3540M QS/8GB RAM/256GB M4 SSD/12.5寸 768P/BCM4352ac//8芯 续航6h/1.7kg
测试机:Lenovo SR420M:14.1"1280*800/Core2 Duo T5600/2GB DDR2/80G HDD+ODD
Server:ThinkPad E130:i3 3227U@1.9GHz/4GB RAM/32GB PM830 SSD/11.6寸 768P//续航6h/1.5kg//正版Server 2012R2标准版
移动AP:Apple iPhone5C(yellow)16GB A1529
主力机:Huawei P9Plus 麒麟955+4GB RAM+64GB ROM/5.5" 1080P AMOLED + EMUI5 with Android 7.0
备用机:NOKIA E73
小平板:Mi Pad 3G RAM+64G ROM+64G C10U1 TF
电子书:KPW3
离线jsntrgsy
发帖
2723
拆客金币
22768
威望
160
贡献值
4
主机
P175EM
板儿
MiPad 64G
备机
K29
爪机
iphone6
坐骑
11
只看该作者 6楼 发表于: 2011-12-16
AMD篇

       一直充当英特尔竞争对手的AMD。这家公司最奇特的地方就在于屡败屡战,同时屡有出格的夸张宣传。不过如果你了解AMD的创建者,硅谷里大名鼎鼎的杰瑞·桑德斯,一定会对AMD的这种文化抱以深度理解—在英特尔孤独地垄断市场的那些岁月,正是AMD让我们看到了变革的希望,即便你是英特尔的铁杆支持者,也不得不承认AMD的存在总是让英特尔不得不保持前进,同时也让它在某些时候不得不打降价牌。如果单从市值来看,AMD只是英特尔的零头,比如在它意气风发的2002年,英特尔公司市场价值2050亿美元,AMD刚好是它的零头:50亿美元。英特尔每年都盈利几十亿美元,而AMD三天两头都在亏损,不过这家奇怪的公司不仅生存下来,而且又重新变得非常强大。

AMD简介


       AMD的创建者杰瑞. 桑德斯(Jerry Sanders),同英特尔创始人安迪·格罗夫、戈登·摩尔、罗伯特·诺伊斯都曾在仙童半导体就职。杰瑞·桑德斯是一位富有传奇色彩的营销大师,它对市场的把握能力甚至曾经连乔布斯也不敢争锋,不过换个角度说就是杰瑞·桑德斯是技术的外行,但这并不妨碍它成为创业团队信赖的领导,也不妨碍AMD的成功。

       和许多传奇人物一样,桑德斯有一个坎坷的童年,他出生在好莱坞,母亲生他时年仅15岁,父亲是交通路灯修理工。小桑德斯在不到五岁时,父母就离异,他不得不和母亲过着颠沛流离的生活。后来,母亲也离开了他,桑德斯就投奔了祖父母。学生时代的桑德斯成绩出众,但常常卷入打架斗殴。“我经常卷入争斗,是因为我经常失败。”桑德斯回忆说。桑德斯的斗争精神在过去34年来一直为人们津津乐道。最富有传奇色彩的故事是他曾经在芝加哥街头与人混战,被打得头破血流,不省人事,连牧师都准备帮他举行默祷超渡时,他却又奇迹般地活了过来——当你看到这里,便会知道AMD的屡败屡战事出有因,这种顽强更多只是一种生活习惯,渗透进AMD的文化基因里。

       成年后的桑德斯曾在道格拉斯飞机公司当过空调系统设计师。但是这个打工仔一天到晚做白日梦:他希望能拥有自己的别墅,开着豪华的汽车,拿到丰厚的薪金。他很快就发现干营销比工程师赚钱要快得多,于是他大胆地跑去摩托罗拉应聘当销售经理,结果一流的口才让他被顺利录取。事实证明,桑德斯绝对是硅谷六七十年代一等一的推销高手,没多久他被挖进了仙童公司。到上世纪60年代末,仙童公司发生了内部分裂,IT业界出现了三家对后来半导体发展举足轻重的公司:国家半导体、英特尔和AMD。其中,国家半导体由查理·史波克和皮埃尔·罗蒙德组建,高层精明而实际;英特尔则拥有诺依斯、摩尔和格鲁夫三大技术干将,讲究团体智慧;而AMD的创业则充满了磨难、奋斗以及与生俱来的坚韧。因为AMD最早的总部是设在一个创业者的家中,所以AMD的企业文化也被人叫做“客厅文化”。
AMD的创立更多是一种无奈,当时桑德斯被突然解雇,他一下子陷入经济困境,直到有一天,与桑德斯境况相似的约翰·凯里主动找到他,两个人合计要成立一家半导体企业。首要的事情就是去筹集资金,结果他东奔西跑只筹集到5万美元,同英特尔500万美元的起步资金完全无法比拟。当初极其坚韧的桑德斯便是在这样的困境之下起步,一个天才的销售人员,进入了他不擅长的半导体领域。

      在创办初期,AMD的主要业务是为其它公司重新设计产品,提高它们的速度和效率,并以“第二供应商”的方式向市场提供这些产品,他们最大的优势就是在于能够让自己的产品比竞争对手更加可靠。任何一个产品的检测都是根据军方MIL-STD-883标准进行的,他们提供了业内前所未有的品质保证,并且不会加收任何费用。凭借可靠性的特长,AMD也在半导体市场站稳了脚跟,并开始进入正轨。在AMD创立五周年时,AMD已经拥有1500名员工,生产200多种不同的产品。其中很多都是AMD自行开发的,年销售额将近2650万美元。1979年,AMD公司股票在纽约证券交易所上市,此时的AMD已经拥有多个半导体工厂,年销售超过1亿美元。
AMD后来的历程广为人知,它进入了x86处理器市场,并且开始与英特尔长达30年的缠斗。在这30年间,AMD占据上风的时间几乎寥寥无几,但它始终没有退缩过。对于AMD的故事,土生土长的硅谷人迈克尔·马龙的评价或许最为恰当:“在所有的高科技故事中,AMD的故事是最可怕,也是最英勇的。它年复一年,代复一代,顽强地挑战某个星球上最成功、最具竞争力的公司。”

从Am386到K6-3:向x86的转身

      AMD进入x86处理器行业同样纯属偶然,当年IBM将订单交给英特尔,但英特尔自身的产能根本无法满足需要。而英特尔高层和AMD高层都是仙童的老相识,英特尔很自然地找到AMD请求帮忙,并且答应给AMD最新的CPU资料,换句话说,AMD这个强硬对手其实是英特尔的无心之作。

      为了说服AMD,英特尔干脆与AMD签署x86系列微处理器的技术交换协议,显然这是一份慷慨的永久性授权——当然那时的x86处理器根本就是无足轻重的小角色,英特尔自身都没有想过有一天它居然能够击败RISC占据主导地位。这份协议的内容是:AMD为英特尔生产既定数量的微处理器,英特尔除了支付报酬外,还向对方分享微处理器的资料。就这样,AMD在随后的几年为英特尔生产了大量的286处理器(代号为AM286),AMD也因此拥有英特尔x86处理器的全部秘密。

      然而,这个协议在履行几年之后就宣告中断,英特尔忌惮AMD进入这个市场,成为自己强有力的竞争对手,所以不再将x86处理器的资料交给AMD,而AMD也因此不再为英特尔生产微处理器。最终双方闹上法庭,这场官司从1987年开始,直到1992年才结束,AMD最终获得生产和销售386系列芯片的权力——这个诉讼案的胜利也就是AMD今天能够自由生产x86处理器,不会像VIA、NVIDIA一样总是被英特尔以x86专利进行威胁的原因。

      1985年,AMD进入《财富》杂志500强,此时距离桑德斯创立公司已经过去了16年光阴,但这16年只能算是AMD的起步阶段,它的辉煌其实刚刚开始。也是在这一年,英特尔推出风光无匹的80386处理器,引发PC厂商的热烈追随,在随后的几年,英特尔就一举取代IBM,成为PC业真正的领袖。此时此刻,AMD终于坐不住了,桑德斯决定进入386市场,从英特尔手中分得一杯羹。1991年,AMD的Am386处理器正式发布,英特尔垄断局面被证实打破,就在推出的当年,AMD就销售出超过百万片Am386芯片,这对桑德斯是个巨大的鼓舞。


      Am386在架构上是英特尔80386的克隆版本,也就是二者基本完全相同。1993年,AMD的Am486处理器诞生,它的特点就是高性价比——在提供相同性能的条件下,Am486具有20%的价格优势,这让它赢来大量的客户,康柏公司就在1994年与AMD达成长期战略联盟,在康柏电脑中大量搭载AMD的处理器,让英特尔吃了一记闷拳。

       Am486的频率从25MHz开始,最高到120MHz,此时其性能甚至接近英特尔早期的Pentium处理器。1995年,AMD接着推出AM5x86处理器,它其实只是Am486的高频版本,主频达到133MHz。Am5x86的制作工艺为0.35微米,拥有16KB的L1 Cahce,整体延续了性价比竞争的路线。

      真正能与Pent ium同级的处理器便是K5。K5最早在1994年的微处理器论坛中亮相,它也是AMD第一款真正完全由自身设计和生产的x86处理器,显然AMD在K5开发中吃尽了苦头,导致其直到1996年才得以发布,比英特尔Pent ium晚了许多。K5的性能非常一般,整数运算能力不如Cyrix的6x86,虽然比Penitum还算略强,但浮点性能就远远比不上Pentium。更糟的是,K5的良品率较低,工作主频最高只能到116MHz,PR(实际性能标称)值为166,而Pentium可是货真价值能跑到200MHz。总体而言,K5是一款实力非常平庸的产品,它仍然只是依靠低价格来吸引消费者。

      相对于K5,AMD在1997年推出的K6处理器水平就要高出一截,K6也是AMD最后一款采用英特尔兼容总线的产品,它集成了930万个晶体管,拥有64KB一级缓存(32KB指令集和32KB数据),流水线长度为6级,工作主频在150MHz~400MHz,接口方式为Socket 7。K6的实际性能令人满意,它的整数性能超过当时的Pentium-MMX,不过浮点性能仍然仅为同频率英特尔处理器的一半左右。

      K6初期采用的是0.35微米制造工艺,后期改用了0.25微米,K6家族真正迎来辉煌还是著名的K6-2处理器。K6-2的设计目的是作为Pentium
Ⅱ的竞争对手,为此它增强了浮点性能,并引入AMD第一套浮点单指令多数据指令集,也就是著名的3DNow!这套指令集获得很大的反响,并成功地提升了K6-2处理器在运行3D渲染时的性能表现。


      几乎所有K6-2都是在100MHz前端总线的Super 7平台上开发,它的主频从300MHz起步,后来陆续推出400MHz、450MHz和500MHz的版本。这其中K6-2 300MHz的受欢迎度最高,并在零售市场获得热卖,AMD的市场影响力也是从K6-2时代开始的。K6-2 300的竞争对手是著名的Celeron 300A,后者通过削减缓存容量降低了成本,但它具有卓越的浮点性能。这两者凭借强大的超频能力,当时在市场中都极受欢迎,共同原因都是具有一流的性价比——当时的Pentium Ⅱ尽管性能更加出色,但它的价格却要高出不少。


      当英特尔带来Pent ium Ⅲ的时候,K6-2已经明显力不从心,当时Athlon仍在开发阶段,为了抵御对手AMD对K6进行新一轮的升级,推出了K6-3。K6-3在K6-2基础上增加了256KB的二级缓存,原先内建于主板的缓存则自动变为三级缓存,此举显著提升了K6-3的整数性能表现,但对其浮点性能并没有多少帮助。K6-3的市场寿命较短,当Athlon出现之后,K6-3就迅速退出市场。

      Am386到K6-3,AMD从一个x86微处理器领域的跟随者,成长为一家独立的处理器设计厂商,尤其是在K6-2时代的优良业绩让AMD获得了良好的市场基础和财政稳定性,为日后发布Athlon做好了充分的准备。

K7出世:AMD崭露头角

      AMD不再被人称为逆向工程专家,始于K7时代。在这个时代中,AMD实现了性能上的全面超越,给竞争对手带来巨大的威胁;同时也将市场拓展到高端的双路服务器、主流台式机PC、低端的廉价PC以及笔记本电脑市场。芯片组方面,AMD也获得来自VIA、NVIDIA和ATI的支持,初步具备与英特尔全面对抗的实力。

      1998年,AMD正式发布代号为K7的Athlon处理器(中文名为“速龙”),这在AMD史上称得上是一个里程碑。领导K7开发团队的就是AMD的前任CEO Dirk Meyer(德克·梅耶尔),此人曾是DEC ALPHA处理器的首席设计师,所以Athlon在很多程度上继承了ALPHA的血统,尽管它仍然是x86处理器。德克·梅耶尔1995年加入AMD,并在2008年成为AMD的CEO,但在2011年1月即引咎离职,原因在于他在任期间忽视了平板电脑、智能手机等移动市场,当然这是后话。

       我们先来看看K7的体系结构:第一,它拥有3个并行的x86指令解码器,可以同时发射3条指令,这一点同Pentium Ⅲ是一致的。其次,K7拥有9个独立的超标量执行管线,分别为3个整数、3个地址和3个浮点,其中整数流水线为10级,浮点流水线为15级,较长的流水线对于提升主频相当有帮助;第三,K7的一级缓存容量多达128KB(64KB指令+64KB数据),支持512KB~8MB的二级缓存,两级缓存的数据并不重叠。第四,K7支持扩展的3DNow!指令集,主要改进在于新增了5条新的指令,用于增强其在DSP方面的性能,并且让K7系列处理器能够模拟SSE,对SSE指令集进行解码。

       K7的前端总线设计也明显优于Pentium Ⅲ,后者采用的是GTL+系统总线协议,而K7采用了DEC公司的的Alpha系统总线协议EV6。EV6总线可支持点对点布局,有着更优秀的构造;其次,EV6总线可以工作在200MHz频率下,而Pentium Ⅲ当时的外频只有100MHz,更高的外频意味着更大的内存吞吐量,最终使得K7成为第一个从DDR内存中受益的处理器。

       第一代经典型Athlon处理器采用插槽式的Slot A接口,板载二级缓存,它表现出强劲的整数性能和浮点性能,第一次可以在速度上战胜对手。同时,Athlon保有良好的性价比优势,在它发布之后立刻成为市场的焦点。不过,第一代Athlon仍然不够完善,比如CPU的发热量较大,缺乏成熟的芯片组支持也是致命伤,而在这一领域,VIA给过AMD大量的支持,当然VIA自身也受益匪浅。制造工艺方面,Athlon首先采用0.25微米,包括500MHz、650MHz和700MHz三个版本,都拥有半速256KB二级缓存;等到750MHz版本之后,AMD就升级至0.18微米工艺,而由于缺乏高达350MHz~400MHz的缓存,AMD不得不降低缓存的速度。750MHz、800 MHz、850 MHz的Athlon有一个2/5的缓存分配器—必须提到的是,AMD在2000年推出850MHz的Athlon,第一次在主频方面领先对手,这对它说也是个巨大的胜利。当AMD想再一次提高Athlon的速度时,他们又遇到了同样的问题,即缓存速度太低,于是他们再次将缓存速度降低到原来的1/3——经典版Athlon 900MHz、Athlon 950MHz和1GHz用的都是1/3缓存分配器。这种折衷措施让AMD第一次赢得频率大战,Athlon也成为第一款主频突破1GHz大关的CPU,当时的Pentium 3 Coppermine 866MHz根本无法与Athlon 1GHz对抗,Athlon就成为当时市场上速度最快的处理器,这是英特尔第一次遭遇败绩。
面对这种情况,英特尔感到相当的恐慌,于是它们将二级缓存加到了Pent ium Ⅲ内部电路板中以加快缓存的速度,并抛弃了Slot 1接口改为Socket 370,这也就是著名的Pentium Ⅲ Coppermine处理器。Coppermine终于在主频上赶上AMD的脚步,性能也获得微幅的领先。不过英特尔来不及松口气,因为AMD专门对付Coppermine的“Thunderbird”K7内核也接着出现了。

       2000年6月,代号为“Thunderbird(雷鸟)”的新一代K7处理器发布,这是第二代Athlon。Thunderbird Athlon改用插座式的Socket A接口,CPU则是采用陶瓷封装—在接口方面,AMD还是一直追随竞争对手的脚步,直到现在依然如此。与Pentium Ⅲ Coppermine类似,Thunderbird将二级缓存直接集成于芯片上,容量仍为256KB,二级缓存得以全速运行,性能提升非常显著。同时,Thunderbird也具有Athlon家族具有的强大超频能力,这一点让它饱受发烧友追捧。同时,为了与低端的Celeron处理器对抗,AMD也推出缓存减半的Duron(毒龙)处理器,它同样在性能方面取得优势。

      Thunderbird也主要依赖VIA的芯片组支持,但该平台在成熟度上不及英特尔,关键的磁盘性能一直都相对落后,并且缺乏温控功能,CPU可能出现烧毁事件。PC业界自然对这样的产品不太放心,所以Thunderbird时代的Athlon主要活跃在零售市场,规模更大的OEM领域一直为英特尔所把持。Thunderbird Athlon的主频从650MHz开始,最高截至1.4GHz,随后它被新一代内核“Palomino”所取代。

      Palomino内核发布于2001年10月,它采用0.18微米制造工艺,核心电压为1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz。该内核的处理器也从“Athlon”更名为“Athlon XP”,这个模仿“Windows XP”的命名方式一向都是营销高手桑德斯的最爱。Palomino核心Athlon XP的目标已经是Pentium 4处理器,它启用了PR标识,以扭转频率低在宣传上的劣势。Palomino在架构上仍然承袭Thunderbird,仅仅作了一些改良设计比如:增加温度监控电路、降低功耗和功率、支持SSE指令集、改良数据预取技术、提高缓存TLB的数据命中率等,处理器的封装也该为有机塑料的OPGA。这一代处理器的PR从1500+到2100+,之后被0.13微米的Thoroughbred所取代,后者由于使用新工艺,发热量更低,超频能力更强,但架构上没有什么革新。


      著名的“Barton”是最后一代K7核心,它发布于2002年秋,Bar ton的改进就是将二级缓存提升到512KB,外频有166MHz和200MHz两种,PR在2500+到3200+之间。Barton Athlon XP拥有强悍的性能,超频能力也十分杰出,但遗憾的是容易烧毁和核心缺乏保护的缺点依然存在,另外它的性能已经落后于英特尔同时代的Pentium 4了—显然,AMD推出新一代架构的时间到了。值得一提的是,在Barton时代,NVIDIA的nForce2芯片组成为当红大热,加上原有的VIA芯片组,AMD已经拥有成熟的芯片组平台支持。

      也是在2002年,年迈的桑德斯辞去首席执行官的职务,AMD结束了一个时代,海克特·鲁毅智接替桑德斯成为新的CEO。

K8降临:实现由弱至强的华丽转身


      2003年9月,AMD传说已久的K8架构正式出炉,这也是AMD第八代x86处理器—K8完全贯彻了AMD自主的开发思想,支持64位x86指令,集成内存控制器的大胆设计意味着AMD成为技术风潮的领导者。K8时代一直延续至今,AMD完成了从英特尔的二流对手到能够与它完全分庭抗礼的地位。在这期间,AMD处理器从台式机PC拓展到高性能计算机、服务器、笔记本电脑等领域,同英特尔进行针锋相对的对等竞争,这一点在后来人所共知。

1.K8架构的特点

      K8架构有许多独创性,其中关键点集中在64位x86指令、整合内存控制器与HyperTransport总线三个方面。我们知道,32位x86是英特尔在386时代创下的,但此后英特尔一直没有将x86扩展到64位的想法,英特尔甚至顽固地认为64位应该只给服务器市场,比如它的Itanium平台;32位用于PC,两者壁垒分明。在当时,只有高端的RISC处理器才有64位的设计,但AMD的开发团队认为64位x86是一种趋势,赶在竞争对手之前推出也可以在宣传上占据制高点。另一方面,64位指令系统不仅效能更高,而且可以管理超过4GB容量的内存——在当时4GB内存看起来大得不可思议,但今天我们回过头来,足以感受到AMD的确富有远见。

      内存控制器原本是北桥芯片的功能,它主要负责内存的管理。在RISC系统中,内存控制器往往被直接整合入CPU内,这样做的好处是可以将内存响应延迟降低一半,从而显著提升系统的整体性能,缺点是失去了搭配的灵活性。在当时,内存与CPU是彼此不同的系统,芯片组厂商才是决定者,用户也更喜欢灵活搭配的法则。AMD这一次同样作风大胆,将内存控制器整合于K8内核中,这项设计也令K8架构拥有极出色的指令效能,最终也迫使英特尔不得不追随。


       K7使用的是EV6总线技术作为前端总线,但在K8系统中,用于CPU-内存传输的前端总线已经不复存在,CPU和内存能够直接沟通,但此外CPU需要另外一种方式同芯片组以及其他的处理器相连—HyperTransport就是专为此目的开发的总线。它采用点对点串行设计,并以DDR方式工作,比如800MHz频率、16位的HyperTranspor t总线,就能提供高达6.4GB/s的带宽,并且极具拓展空间。HyperTransport总线对于AMD的服务器平台业务居功至伟,在它的帮助下,AMD可以方便地建立起任意多路Opteron系统,令Opteron在后来得以进入超级计算机市场。

       除了这三项根本性的改进,K8在微架构方面也有明显提升,它依然采用三发射设计,不过其整数流水线长度提升到12级,浮点流水线则提高到17级,均比K7提高了两级,为进一步的频率提升打下基础,又保证了指令性能。其次,K8拥有128KB一级缓存和1MB二级缓存,二级缓存容量比之前的Barton增加了一倍。此外,K8可以支持增强3DNow!、SSE、SSE2指令集。至于K7易烧毁、易损坏的问题也获得完满解决:K8的封装在CPU芯片上增加了金属保护盖,内部增加温控电路,另外还增加了Cool ‘n’ Queit节能技术。
      K8架构衍生出台式机的Athlon 64、服务器的Opteron和移动版的Athlon 64-M,经过多次升级和名称变动,但更多只是制造工艺、二级缓存等规格的调整,架构本身并未作多少改动——总之,在单核心时代中,K8系列同样击败同时期的Pentium 4,这个市场优势一直延续到2006年底Core微架构的出现。


      K8时代的双核处理器Athlon 64 X2诞生于2005年5月,当时AMD掀起了“真双核”的论战,寓意指对手的Pentium D是拼凑的货色,结果英特尔愚蠢地进行回应使口水战升级,AMD接着大张旗鼓邀请英特尔参加“双核决斗”,并找了一堆评测机构。英特尔最终无奈表示希望事情终结,结果这场口水战看起来就是AMD销售人员出题,英特尔工程师老实回答的游戏。但就技术层面而言,Athlon 64 X2采用RISC处理器的做法,让两个核心分享一套内存控制器,多核协作高效进行;而Pentium D的双核沟通效率低下,加上自身效能不济,就被对手打得灰头土脸。

      在K8时代,AMD平台芯片组差的弊病彻底成为历史,NVIDIA为它制造了强大的nForce家族,这一度令英特尔感到胆寒。AMD和NVIDIA有着共同的敌人,英特尔则与ATI走得很近,两者联姻呼声甚高。然而世事无常,AMD最终因为财力的因素而选择并购ATI,这是发生在2006年7月的事情。AMD为此耗费54亿美金,其中的25亿美金还是贷款。在此之后,AMD元气大伤,多次面临资金用尽的困窘,后来它将沉重的半导体制造业务剥离出售,变为无工厂的IC设计商,这在后来也被证明是明智之举。

2.K10:只是一次改进式的升级


      K8时代的辉煌被英特尔Cor e微架构彻底终结,后者在指令效能方面占据压倒性的优势,整体性能也遥遥领先。迫使AMD推出新一代K10内核应对—时间已经是2007年10月份。

      然而,K10并不是我们想象中的全新架构,只不过是K8的深度改良。K10的技术特性主要包括以下几点:原生四核设计、引入共享的三级缓存、CPU独立的供电设计和更灵活的节能机制、HyperTransport 3.0总线技术和支持DDR2内存、SSE执行单元宽度加倍到128bit和支持AMD-V虚拟化技术。这些改良措施的确显著提升了处理器的性能,但它仍然无法与英特尔当时的Core系列产品相对抗。

      K10时代AMD逐渐弱化了Athlon的品牌,启用Phenom来代替它,接口方式改为Socket AM2+(后期为AM3)。尽管没有在性能上压倒对手,但并不妨碍AMD继续提升市场份额,因为Phenom平台具有一流的性价比,AMD同时还提供三核心的Phenom,这让它在面对双核Core系列处理器时颇具物理核心的优势。另外在移动领域,AMD的Turion 64 X2获得一定的应用,但受限于电池续航力的不足,AMD在笔记本电脑仅仅是小有斩获。

      在这一阶段,NVIDIA无奈退出芯片组市场,因为AMD通过并购ATI获得的芯片组业务也成熟起来,并结合ATI的显卡技术,打造强有力的3A平台,这在营销上为AMD增色不少。然而,保证性价比优势也让AMD付出惨重代价,它在并购ATI之后就连续亏损两个财年,基本属于勉强撑起CPU、图形、半导体制造共进的大局。
转机出现在2008年10月,AMD成功地完成拆分,将旗下半导体工厂出售给阿联酋阿布扎比政府,并获得84亿美元的强势注入。作个简单的计算,AMD相当于用半导体工厂换取一个ATI,还剩余出30亿美金,无论从哪个角度看,这都是个非常划算的买卖。

       2008年11月,AMD高调发布代号为“Shanghai”的新一代处理器家族,主要改进在于采用45纳米SOI工艺,同时三级缓存加大到6MB,但除此之外,K10.5的内在改进委实不多,它的优点在于弹性极好,衍生出双核、三核、四核以及六核处理器,给用户丰富的选择。

      在K10.5的时代,AMD的芯片组和图形技术都蒸蒸日上,一改往日连续亏损的阴霾,虽然它的处理器不如对手,但图形性能却占据显著的优势,而在日常应用中,处理器性能过剩是不争的事实了,图形系统备受重视,这样整体来看,AMD平台在很多时候都更具吸引力。在2009年度,AMD获得2.93亿美元的净利润,2010年度则进一步提升至4.71亿美元,AMD终于摆脱了困境,而APU的诞生更是为它的未来发展注入澎湃动力。

融合才是未来:高瞻远瞩的APU


      AMD收购ATI不久,就对外公布了Fusion混合处理器的开发计划,。在计划中,未来的CPU与GPU将被集成在一枚芯片上,两者共同分享高速缓存和内存系统,CPU和GPU之间高效地协作。

      在2007年,提出这样的理念是相当前卫的——CPU与GPU处理的任务并不相同,二者的整合是否有意义?在接下来的几年,AMD不断地展示这种思路,但迟迟不见相关的产品出现,加上当时AMD境况糟糕,外界对于Fusion混合处理器也就不以为然。

      2009年,英特尔抢先推出带有G P U 芯片的处理器,这便是Westmere,不过英特尔的简单做法更像是一种打击图形厂商的商业谋略,即便是现在的Sandy Bridge将CPU和GPU集成在一起,但性能与内部协助都不够出彩。

      2011年3月,AMD终于发布代号为“Bobcat”(山猫)的第一款Fusion APU平台,CPU部分为精简的x86核心,GPU则基于AMD的Di rectX 11 Radeon平台,它所针对的是超轻薄笔记本电脑、上网本等市场,竞争对手是英特尔的Atom。6月,代号为Llano的主流级APU正式发布,这才是AMD真正的重头戏!Llano APU的处理器为K10.5架构, CPU均支持Turbo Core动态加速技术;集成的GPU则为Radeon HD 6500——它拥有多达400个SP单元,同HD 6570显卡相当接近。Llano APU采用32纳米SOI工艺制造,芯片集成的晶体管数量高达14亿5千万个,比英特尔Sandy Bridge四核心的9亿9500万颗晶体管多出近50%,这其中主要体现了GPU的差距。

      针对不同的市场,Llano APU分别有A8(四核心)、A6(四核心)和A4(双核心)系列等多种配置,并且都有台式机版和移动版本。在实际测试中,台式机版本的Llano APU不负众望,它的图形性能非常抢眼,以压倒性的优势战胜英特尔Sandy Bridge核心的Core 2系列产品,弥补了CPU性能弱势的不足。
Llano APU一经发布,即获得市场的热烈追捧,相当出色的图形性能,一流的性价比,让消费者趋之若鹜。而Llano APU的移动版也受到笔记本电脑厂商的青睐,该芯片被大规模用于注重娱乐性的消费级笔记本电脑中。受此拉动,AMD在2011年二季度的市场份额强劲,其中台式机市场提升至28.9%,笔记本电脑市场则提升至15.2%,提升幅度为1.8%。但是在性能敏感的服务器市场,Opteron已经无昔日荣光,市场份额仅剩下5.5%。

      对AMD来说,APU最大的杀伤力并不是在于图形性能方面的优势,而是未来OpenCL异构计算的整合。所谓异构计算,即CPU和GPU联手共同处理计算任务,CPU更多完成整数运算,高密集度的浮点运算交给GPU负责—后者在密集计算中对于CPU有不对称的性能优势。一旦应用程序能够支持异构计算,APU平台将能够在整体性能上获得全面的领先。

      对于异构计算的前瞻也直接影响到AMD新一代“Bulldozer(推土机)”微架构的开发中。“Bulldozer”最值得期待的改进就是实现了四发射,这意味着AMD有机会在指令效能方面赶上对手,但“推土机”的浮点模块实际上被人为削减,AMD认为未来的浮点计算任务更多会由GPU来完成,AMD本身也有意识地推进异构应用程序的开发。由此节省出的资源则被用于整数计算模块以及GPU部分。这也意味着AMD开始以全局的视野来构建新一代处理器,而不再局限于x86或GPU自身的限制,这对于微处理器工业而言不吝是新时代的开启。

未来... ...


       在三十余年的演进中,x86处理器迎来了发展史上真正意义的转折点:PC不再是唯一的计算终端,各种移动设备登台亮相,云计算让PC的重要性大大削弱,ARM架构开始对x86造成威胁,微软公司也放弃了多年以来的Wintel联盟,开始谋求建立自己的Win-ARM新帝国。然而,尽管面对这样的转折,但x86在未来的十年,恐怕都还是最重要的架构。x86固然有着CISC指令系统低效的缺憾,可是x86的进化始终在进行:更高效的微架构、更先进的半导体工艺总是第一时间引入,英特尔与AMD的强大研发实力有目共睹,我们也期待x86在强敌出现时有惊人的表现。

~~~~~~~~~~~~~~~~~~END~~~~~~~~~~~~~~~~~~
谢谢欣赏


本主题包含附件,请 登录 后查看, 或者 注册 成为会员
 
主用机:CLEVO P175EM:i7-3740QM QS/32GB DDR3 1600/512GB mSATA+4TB HDD/nVIDIA Quadro K4000M 4GB GDDR5/17.3"1080P+ASUS PA238Q/BCM4352ac
便携本:Lenovo K29:i7-3540M QS/8GB RAM/256GB M4 SSD/12.5寸 768P/BCM4352ac//8芯 续航6h/1.7kg
测试机:Lenovo SR420M:14.1"1280*800/Core2 Duo T5600/2GB DDR2/80G HDD+ODD
Server:ThinkPad E130:i3 3227U@1.9GHz/4GB RAM/32GB PM830 SSD/11.6寸 768P//续航6h/1.5kg//正版Server 2012R2标准版
移动AP:Apple iPhone5C(yellow)16GB A1529
主力机:Huawei P9Plus 麒麟955+4GB RAM+64GB ROM/5.5" 1080P AMOLED + EMUI5 with Android 7.0
备用机:NOKIA E73
小平板:Mi Pad 3G RAM+64G ROM+64G C10U1 TF
电子书:KPW3
离线s04025
发帖
80
拆客金币
1142
威望
4
贡献值
0
主机
板儿
备机
爪机
坐骑
只看该作者 7楼 发表于: 2011-12-16
辛辛苦苦的看完intel了  一會再看amd  加油
 
离线xeon2400
发帖
496
拆客金币
1621
威望
107
贡献值
0
主机
板儿
备机
爪机
坐骑
只看该作者 8楼 发表于: 2011-12-16
从386时代开始的路过。
曾收藏一块上面焊接I386SX及外接I387的主板;一块焊接I486SX的主板;486-50MHZ(Cyrix)、I486DX-66MHZ(REMARK)、I486DX-100;Pentium 100MHZ、Pentium 166MHZ(MMX)、Pentium 233MHZ(MMX)、Pentium PRO 200MHZ;Pii和PII XEON、PIII和PIII XEON等。若干年后被家人变卖,才卖了10元,气得几乎吐血。
离线xeon2400
发帖
496
拆客金币
1621
威望
107
贡献值
0
主机
板儿
备机
爪机
坐骑
只看该作者 9楼 发表于: 2011-12-16
回 xeon2400 的帖子
xeon2400:从386时代开始的路过。
曾收藏一块上面焊接I386SX及外接I387的主板;一块焊接I486SX的主板;C486-50MHZ、I486DX-66MHZ(REMARK)、I486DX-100;Pentium 100MHZ、Pentium 166MHZ(MMX)、Pentium 233MHZ(MMX)、Pentium PRO 200MHZ;Pii和PII XEON、PIII和PIII XEON等。若干年后被家人变 .. (2011-12-16 19:12) 

O,还有K6-2 350MHZ和K7650MHZ,K7-650刚出的时候与主板捆绑3300元,折腾数年后阵亡......,取而代之的是Piii 933,N年后制成了钥匙扣。
快速回复
限100 字节
批量上传需要先选择文件,再选择上传
 
上一个 下一个