Nền tảng Kiến trúc Penryn, công nghệ 45nm High-K metal gate của Intel

Ngày 12 tháng 11 vừa qua, Intel đã công bố các bộ xử lý dành cho máy

chủ trong gia đình Penryn. Đó là những bộ xử lý đầu tiên và đánh dấu cho

kỷ nguyên 45nm. Thế hệ tiếp theo của các bộxử lý kiến trúc Core. Với

hai dòng sản phẩm Wofldale (hai nhân) và Yorkfiled (4 nhân).

Bạn đã nhận thấy được sức mạnh cũng như hiệu năng tuyệt vời của các

bộ xử lý kiến trúc Core. Và bạn sẽ tự hỏi, liệu Penryn đơn giản chỉ là thu

hẹp kích thước transitor từ kiến trúc Core 65nm xuống công nghệ sản

xuất nhỏ hơn. Intel đã khẳng định rằng các bộ xử lý Penryn không chỉ

đơn giản là thu hẹp kích thước sản xuất, mà các kỹ sư Intel đã cải tiến và

nâng cao rất nhiều thứ bên trong Penryn để tăng hiệu năng cao hơn mà

không phải đưa tốc độ CPU lên cao hơn.

Trước khi bắt đầu tìm hiểu kiến trúc 45nm, chúng ta hãy cùng nhìn lại

kiến trúc Core.

Intel lầu đầu tiên giới thiệu vi kiến trúc Core vào năm 2006, cùng lúc với

việc sản xuất các bộ xử lý Intel Core 2 dưới công nghệ xử lý 65nm. Thế

hệ đầu tiên của vi kiến trúc đa nhân đã được tối ưu hóa. Với việc hiệu

năng cao hơn cũng như tiêu thụ điện năng ít hơn, kiến trúc Core của Intel

đã trở thành nền tảng cho rất nhiều các giải pháp mới và các nền tang

mới.

Vi kiến trúc Core có khả năng xử lý tối đa 4 instruction trên một clock

cycle, nhanh hơn bất kỳ CPU nào hiện có. Excution pipeline của vi kiến

trúc Core có 14 stage, ngắn hơn nhiều so với Prescott, Smithfield, .

thuộc kiến trúc NetBurst (với hơn 30 stage). Nếu xét về hiệu năng trên

mỗi wat thì pipeline ngắn hơn có một lợi thế không cần phải bàn cãi.

Vi kiến trúc Core là hai nhân thực, gồm 2 nhân nằm trên cùng một die, có

64 KB L1 Cache (32 KB cho tính toán và 32 KB cho dữ liệu), hỗ trợ

EM64T không như Pentium M và Core Duo (Yonah) chỉ hỗ trợ tính toán

32 bit

pdf16 trang | Chia sẻ: oanh_nt | Lượt xem: 1255 | Lượt tải: 0download
Nội dung tài liệu Nền tảng Kiến trúc Penryn, công nghệ 45nm High-K metal gate của Intel, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nền tảng Kiến trúc Penryn, công nghệ 45nm High-k metal gate của Intel Ngày 12 tháng 11 vừa qua, Intel đã công bố các bộ xử lý dành cho máy chủ trong gia đình Penryn. Đó là những bộ xử lý đầu tiên và đánh dấu cho kỷ nguyên 45nm. Thế hệ tiếp theo của các bộ xử lý kiến trúc Core. Với hai dòng sản phẩm Wofldale (hai nhân) và Yorkfiled (4 nhân). Bạn đã nhận thấy được sức mạnh cũng như hiệu năng tuyệt vời của các bộ xử lý kiến trúc Core. Và bạn sẽ tự hỏi, liệu Penryn đơn giản chỉ là thu hẹp kích thước transitor từ kiến trúc Core 65nm xuống công nghệ sản xuất nhỏ hơn. Intel đã khẳng định rằng các bộ xử lý Penryn không chỉ đơn giản là thu hẹp kích thước sản xuất, mà các kỹ sư Intel đã cải tiến và nâng cao rất nhiều thứ bên trong Penryn để tăng hiệu năng cao hơn mà không phải đưa tốc độ CPU lên cao hơn. Trước khi bắt đầu tìm hiểu kiến trúc 45nm, chúng ta hãy cùng nhìn lại kiến trúc Core. Intel lầu đầu tiên giới thiệu vi kiến trúc Core vào năm 2006, cùng lúc với việc sản xuất các bộ xử lý Intel Core 2 dưới công nghệ xử lý 65nm. Thế hệ đầu tiên của vi kiến trúc đa nhân đã được tối ưu hóa. Với việc hiệu năng cao hơn cũng như tiêu thụ điện năng ít hơn, kiến trúc Core của Intel đã trở thành nền tảng cho rất nhiều các giải pháp mới và các nền tang mới. Vi kiến trúc Core có khả năng xử lý tối đa 4 instruction trên một clock cycle, nhanh hơn bất kỳ CPU nào hiện có. Excution pipeline của vi kiến trúc Core có 14 stage, ngắn hơn nhiều so với Prescott, Smithfield, ... thuộc kiến trúc NetBurst (với hơn 30 stage). Nếu xét về hiệu năng trên mỗi wat thì pipeline ngắn hơn có một lợi thế không cần phải bàn cãi. Vi kiến trúc Core là hai nhân thực, gồm 2 nhân nằm trên cùng một die, có 64 KB L1 Cache (32 KB cho tính toán và 32 KB cho dữ liệu), hỗ trợ EM64T không như Pentium M và Core Duo (Yonah) chỉ hỗ trợ tính toán 32 bit. Vi kiến trúc Core được thiết kế cho nhiều phân khúc thị trường khác nhau. Intel cam kết chỉ cần giảm 15 % xung nhịp thì công xuất tiêu thụ điện giảm đến 50 %. Khả năng này cho phép sản xuất các dòng CPU cho các phân khúc thị trường desktop, laptop và server dựa trên vi kiến trúc Core. Merom sẽ nhanh hơn thế hệ CPU cho laptop hiện tại của Intel là Core Duo (Yonah) khoảng 20 %, công xuất tiêu thụ điện không vượt quá 35W. Woodcrest sẽ nhanh hơn thế hệ Xeon hiện tại khoảng 80 %, công xuất tiêu thụ điện khoảng 80 W (giảm 35 %). Conroe sẽ nhanh hơn Pentium D 900 series khoảng 40 %, công xuất tiêu thụ điện của Conroe dòng đa dụng khoảng 65 W (giảm 40 %). Đối với người dùng gia đình, thiết kế của kiến trúc Core mang đến hiệu năng cao hơn, không gian yên tĩnh hơn, và tiêu thụ điện năng ít hơn. Đối với ngành công nghiệp IT, bạn có thể đưa ra những tính toán chính xác hơn, nhanh hơn, giảm thiểu nhiệt lượng tỏa ra từ các máy chủ cơ sở dữ liệu, qua đó chi phí tiêu thụ điện năng sẽ giảm đi rất nhiều. Đối với người dùng di động, bạn sẽ được sở hữu một chiếc máy tính năng động hơn, thời gian sử dụng pin dài hơn, đồng thời vi kiến trúc Core cho phép nhà sản xuất thu nhỏ kích thước hệ thống qua đó các thiết bị di động trở nên linh hoạt hơn hơn, nhỏ gọn hơn. Điều gì làm cho kiến trúc Core trở nên mạnh mẽ như thế, Intel đã trang bị cho vi kiến trúc Core các công nghệ vượt trội so với vi kiến trúc NetBust. Trong đó có năm công nghệ nổi bật, bao gồm: Intel Wide Dynamic Execution. Intel Intelligent Power Capability. Intel Advanced Smart Cache. Intel Smart Memory Access. Intel Advanced Digital Media Boost Penryn, thế hệ tiếp theo của vi kiến trúc Core. Hôm nay, cái mà chúng ta đang nói đến chính là sự ra đời của Penryn, trong năm 2006 là năm ra đời của bộ xử lý Conroe trên kiến trúc Core, và Penryn là codename của dòng vi xử lý mới của Intel trên công nghệ 45nm, nó thay thế cho dòng Conroe và đều được gọi với tên gọi Core 2, trong lúc này bạn sẽ thấy ít có sự thay đổi trong công nghệ 45nm, cho đến khi Intel áp dụng công nghệ 45nm mới với cổng kim loại High-k vào trong việc sản xuất ra các bộ vi xử lý. Một điều cũng hết sức quan trọng đáng chú ý là ngoài việc cung cấp các bộ vi xử lý cho các máy tính, Intel còn sản xuất các bộ xử lý cho các thiết bị di động. Nơi mà vi kiến trúc của nhân CPU được xem là yếu tố quyết định. Như một cách nhận định dễ hiểu, Penryn là cái tên quá thông dụng khi sử dụng để chỉ các CPU mới trên kiến trúc 45nm. Nhưng thực tế nó dùng để gọi các bộ xử lý di động. Đối với các máy tính để bàn, thì các bộ vi xử lý Penryn dual-core và quad-core có tên gọi khác là Wolfdale và Yorkfield. Hiện tại thì Penryn vẫn chia sẽ cùng vi kiến trúc với Conroe , tại thị trường bán lẻ thì nó được sắp cùng danh mục Core 2. Đã có 6 bộ xử lý Penryn, bao gồm các bộ xử lý hai nhân và bốn nhân dành cho máy tính để bàn, một bộ xử lý hai nhân dành cho di động, tất cả các bộ xử lý này đều được gọi dưới cái tên Intel Core. Đối với các bộ xử lý hai nhân và bốn nhân dành cho máy chủ vẫn sử dụng tên gọi Intel Xeon. Và cho đến thời điểm này, Intel đã có tổng cộng 16 sản phẩm 45nm nằm trong lộ trình. Các bộ xử lý 45nm thế hệ tiếp theo của bộ xử lý Intel Core 2 Quad sẽ có tới 820 triệu bóng bán dẫn. Trong khi bộ xử lý QX6850 với nhân Kenfield chỉ có 582 triệu bong bán dẫn bên trong. Điều gì cho phép Intel tăng số lượng bóng bán dẫn nhiều như thế? Đó là nhờ vào việc Intel áp dụng công thức cổng kim loại High-k. Công nghệ xử lý cổng kim loại 45nm High-k của Intel. Chúng ta sẽ bắt đầu phân tích những đặc điểm nổi bật của các bộ xử lý mới này với các tiến trình sản xuất mới. Đó là tiến trình xử lý 45nm mà cho phép tạo nên các bộ xử lý Penryn. Tiến trình này không chỉ cho phép thu nhỏ kích thước nhân nhằm nâng cao khả năng sản xuất ra bộ xử lý hiệu năng cao mà nó còn cho phép giảm điện thế hoạt động của bộ xử lý, đồng nghĩa với việc sự tỏa nhiệt sẽ ít hơn đồng thời cho phép nâng cao xung nhịp xử lý trong tương lai. Công nghệ sản xuất mới vô cùng thú vị bởi vì Intel đã phải thực hiện việc đổi mới hoàn toàn. Và kết quả là: vật liệu sản xuất truyền thống đã được sản xuất từ những năng 60 để sản xuất ra bóng bán dẫn là oxit silic đã được thay thế bằng vật liệu hoàn toàn mới với những nguyên vật liệu khó kiếm trên quả địa cầu. Các bóng bán dẫn 45nm sử dụng đóng gói kim loại làm từ polysilicon (NMOS + PMOS) và chất điện môi High-k dựa trên chất Hafnium. Những thay đổi này trong thiết kế các phần tử chất bán dẫn giúp cho Intel cùng lúc giải quyết được các vấn đề nan giải. Tiến trình công nghệ 45nm gần như tăng gấp đôi mật độ bóng bán dẫn trên die. Hơn nữa, nó còn tăng tốc độ đảo mạch của chúng lên khoảng 20% và giảm điện năng cần cho hoạt động này là 30%. Thêm vào đó, việc sử dụng nguyên liệu mới cho phép giảm bớt sự thất thoát điện năng một cách đáng kể trong sự thất thoát nguồn điện bởi hệ số 5 và sự thất thoát của cổng oxide bởi hệ số 10. Mặt khác, tiến trình sản xuất bộ xử lý 45nm sử dụng liên kết đồng, với đĩa bán dẫn 300mm và kỹ thuật in 192nm. Vì thế, quá trình sản xuất mới này không đòi hỏi Intel phải thay thế hầu hết các công cụ gia công của họ. Điều này mang đến cho chúng ta hy vọng rằng việc sản xuất đại trà các bộ xử lý Penryn sẽ không gặp bất kỳ trở ngại nào, và Intel sẽ đưa ra những chip năng suất cao. Tấm wafer chứa các con chip Penryn 45nm Chip Penryn và một đồng xu Mỹ. Cũng giống như chúng ta đã quen với thuật ngữ đồng hồ sinh học, mọi hoạt động của chúng ta đều xoay quanh cái đồng hồ đó. Với nhà sản xuất bộ vi xử lý khổng lồ như Intel cũng tương tự như vậy, họ đi theo cái gọi là Silicon Cadence (được hiểu như Tick-Tock) một kế hoạch chiến lược trong việc phát triển các bộ vi xử lý của máy tính theo từng nhịp thời gian, và đồng bộ cứ theo mỗi hai năm, như một quy luật, thời gian thực sự bắt đầu với một tiếng tick(sự thay đổi công nghệ) thì liền theo sau (một năm) là tiếng tock(sự thay đổi về cấu trúc thiết kế). Cứ sau mỗi hai năm, Intel lại thay đổ thiết kế của bộ xử lý, bạn có thể thấy ở trên, Intel đã chuyển từ vi kiến trúc NetBust sang vi kiến trúc Core cùng lúc với việc chuyển từ công nghệ 90nm sang công nghệ 65nm. Và cũng với hai năm sau, Intel đã thay đổi công nghệ 65nm bằng công nghệ 45nm với vi kiến trúc Penryn, và hai năm sau bạn sẽ lại nhìn thấy vi kiến trúc Penryn sẽ lại có thế hệ tiếp theo là Nehalem. Những đổi mới trong vi kiến trúc Penryn: Penryn, dòng vi xử lý đầu tiên dựa trên công nghệ silicon High-k 45nm của Intel, sử dụng một cách hiệu quả những bóng bán dẫn bổ sung mà công nghệ này có thể đóng gói vào trong một con chip. Họ vi xử lý Intel Core 2 và Intel Xeon High-k 45nm thế hệ tiếp theo sẽ mang đến nhiều đặc điểm kiến trúc và cải tiến mới làm cho phần mềm chạy nhanh hơn cũng như cải thiện hiệu suất sử dụng điện năng. Bộ chia nhanh Radix-16: Các bộ xử lý Penryn cung cấp hiệu năng xử lý nhanh gấp hai lần vi kiến trúc thế hệ trước trong tính toán khoa học, chuyển đổi 3D và các tiến trình tính toán cao. Việc bao hàm một công nghệ chia nhanh mới được gọi là radix 16 làm tăng tốc độ chia của cả phép tính dấu phẩy động và số nguyên. Với radix-16, Penryn có thể thực hiện 4 tính toán 4 bit trong một vòng lặp so với kiến trúc Core là 4 tính toán 2 bit. Công nghệ ảo hóa cải tiến: Penryn tăng tốc độ thời gian chuyển máy ảo (đi vào/ thoát ra) trung bình từ 25 đến 75%. Tất cả được thực hiện thông qua cải tiến vi kiến trúc và không cần đến bất cứ thay đổi phần mềm máy ảo nào. (Ảo hóa phân vùng một máy tính, vì thế nó có thể chạy những hệ điều hành và phần mềm khác nhau trên mỗi phân vùng, tận dụng tốt hơn sức mạnh bộ xử lý đa nhân, nâng cao hiệu suất và cắt giảm chi phí thông qua cho phép một máy tính thể hiện như là nhiều máy ảo.) Siêu động cơ dao động: Với việc triển khai một khối dao động độ rộng đầy đủ, có độ rộng 128- bit, các bộ xử lý Penryn có thể thực hiện dao động đầy đủ độ rộng trong một chu kỳ đơn. Điều đó tăng gấp đôi tốc độ của phần lớn các phép toán với byte, từ hoặc từ kép dữ liệu SSE và cắt giảm đáng kể độ trễ và thông lượng của các lệnh SSE2, SSE3 và SSE4 của Intel có những phép toán giống dao động như đóng gói, giải đóng gói và dịch gói rộng hơn. Điều đó mang lại sự cải thiện tổng thể trong nhiều thuật toán SSE2. Chuyển tiếp lưu trữ: Để tăng tốc độ đọc kết quả của một lưu trữ "được cân chỉnh sai" trải trên một đường biên địa chỉ 8-byte và vẫn còn đang ở trong đường ống, các bộ xử lý Penryn có thể chuyển tiếp kết quả của lưu trữ đến tải một cách trực tiếp thay vì đợi cho đến khi việc lưu trữ được hoàn tất và viết vào bộ nhớ. Các bộ xử lý có lõi và giao diện tốc độ cao hơn: Dòng Penryn sẽ chạy ở tốc độ lõi cao hơn (hơn 3GHz đối với một số phiên bản) so với các bộ xử lý dòng Core 2 trước đây. Tốc độ của bus mặt trước (front side bus) sẽ được nâng lên tới 1600MHz, bổ sung vào các tốc độ hiện có là 1066 và 1333 MHz. Điều đó sẽ cải thiện hiệu năng hệ thống tổng thể. Hiệu năng gốc đồng bộ hệ điều hành được cải tiến: Những hệ điều hành nhất định hoặc "che" các ngắt khi bắt đầu một phần mã quan trọng và cần có truy nhập riêng biệt trên một tài nguyên như là thiết bị vào ra. Thông qua năng lực đặt ngắt/xóa ngắt nhanh hơn (CLI/STI), các bộ xử lý Penryn có thể đi vào và thoát khỏi chế độ này nhanh hơn, qua đó cải thiện hiệu năng hơn. Hơn nữa, chúng có thể thực hiện các lệnh khóa (như là XCH, ADD/XADD/NEG/BTS/AND, và CMPXHCG) một cách nhanh chóng hơn. Các bộ xử lý Penryn còn đặc trưng cho tốc độ truy cập nhanh hơn của bộ đếm nhãn thời gian. Đây có thể là một hàm thường xuyên được gọi đến trong cơ sở dữ liệu hoặc tải máy chủ dựa trên xử lý giao dịch. Bên cạnh những lợi ích của công nghệ High-k 45nm của Intel, họ vi xử lý Penryn xây dựng những tính năng mang lại hiệu quả năng lượng của vi kiến trúc Core với hai bổ xung quan trọng: công nghệ tắt nguồn sâu và công nghệ tăng tốc độ động của Intel Công nghệ tắt nguồn sâu: Đây là một trạng thái quản lý nguồn mới và tiên tiến (được gọi là C-state) giúp cắt giảm đáng kể nguồn điện của bộ xử lý trong những chu kỳ rỗi vì thế dòng rò của bóng bán dẫn nội bộ không còn là vấn đề nữa. Trạng thái "ngủ" của bộ xử lý là trạng thái nguồn thấp nhất mà một bộ xử lý có được và giúp kéo dài thời gian sử dụng pin. Nó cho phép Penryn đạt mức độ cải thiện đáng kể so với trạng thái nguồn thấp nhất của Meron - thế hệ trước của kiến trúc Core của Intel dành cho thiết bị di động. Khi chuyển sang trạng thái tắt nguồn sâu, bộ xử lý xóa bộ nhớ đệm, lưu trữ trạng thái vi kiến trúc nội bộ và tắt nguồn cấp cho các lõi và bộ nhớ đệm L2. Khi ở trong chế độ tắt nguồn sâu, chipset vẫn tiếp tục phục vụ lưu lượng bộ nhớ dành cho vào/ra (I/O) nhưng không phục vụ bộ xử lý. Khi cần đến lõi xử lý, điện áp được tăng lên, xung nhịp được bật lên, bộ xử lý được khởi động lại, trạng thái vi kiến trúc được khôi phục và hoạt động xử lý lệnh cũng được khôi phục lại. Trạng thái C-state càng sâu thì chi phí năng lượng của việc chuyển đi chuyển lại trạng thái này càng cao. Việc chuyển quá thường xuyên sang trạng thái C-state sẽ gây ra mất mát năng lượng. Để ngăn chặn vấn đề này, chip Penryn có một năng lực tự hạ thấp trong đó sử dụng trí tuệ để xác định lúc nào thì việc tiết kiệm chu kỳ rỗi sẽ đem lại lợi ích từ việc tắt và khởi động lại bộ xử lý. Nếu không có lợi thì yêu cầu Tắt nguồn sâu được hạ xuống mức C4 - một trạng thái quản lý nguồn ít sâu hơn. Kết quả là việc tiết kiệm nguồn tương ứng với chu kỳ rỗi có thể Công nghệ tăng tốc độ động được cải tiến của Intel® (Intel® Dynamic Acceleration Technology) Để nâng cao hơn nữa hiệu năng của các ứng dụng đơn luồng, Intel đã cải tiến Công nghệ Tăng tốc độ động đã có trong các bộ xử lý Core 2 hiện tại của Intel. Tính năng này sử dụng lượng nguồn khả dụng được giải phóng khi một lõi được đưa vào trạng thái chờ để nâng cao hiệu năng của lõi còn đang hoạt động. (Hãy tưởng tượng như một vòi tắm có hai hoa sen. Khi một hoa sen được đóng lại thì áp lực nước hay hiệu năng trên hoa sen còn lại sẽ tăng lên). Nếu một lõi ở trạng thái C3 hoặc C-state sâu hơn, một lượng điện năng của lõi đó có thể được chuyển cho lõi hoạt động trong khi vẫn nằm trong giới hạn bức xạ nhiệt được thiết kế cho bộ xử lý. Điều đó làm tăng tốc độ mà các ứng dụng đơn luồng có thể được xử lý, vì thế cải thiện hiệu năng của nhiều ứng dụng. Trên đây là một số cải tiến của Penryn. Tuy nhiên, nhờ vào việc áp dụng công nghệ xử lý High-k 45nm mà dòng vi xử lý Penryn còn có được hai cải tiến đáng chú ý nhất đó là bộ nhớ đệm Cache L2 lớn hơn và các tập lệnh đa phương tiện SSE4l Bộ nhớ đệm Cache L2: Những lợi thế của công nghệ xử lý High-k 45nm cho phép các kỹ sư của Intel có thể nâng cao số lượng bóng bán dẫn trên bộ vi xử lý mà không làm cho kích thước bảng mạch bộ xử lý lớn hơn. Khả năng này luôn được dùng vào việc tăng bộ nhớ đệm L2 ngay khu vực đầu tiên. Trong khi thế hệ bộ xử lý Conroe hai nhân được trang bị 4MB bộ nhớ đệm chia sẽ, thì trên các bộ xử lý hai nhân Woftdale 45nm có bộ nhớ đệm L2 lên đến 6MB. Khu vực trên khuôn của bộ xử lý đã được nắm giữ bởi bộ nhớ đệm L2 cuối cùng cũng đã trở nên lớn hơn bất kỳ đơn vị xử lý nào trên bộ xử lý, như bạn có thể thấy qua hình ảnh của khuôn bộ xử lý Wolfdale Và với kết quả trên, các bộ xử lý bốn nhân Penryn sẽ có bộ nhớ đệm L2 lên đến 12MB, với 6MB cho mỗi cặp của lõi. Hay nói cách khác, ở đây không có bất kỳ sự thay đổi nào trong thiết kế dẫn đến việc phải chuyển sang những tiến trình sản xuất mới. Các cặp lõi vẫn được định vị trên những vị trí khác nhau và sẽ trao đổi dữ liệu thông qua bus hệ thống và bộ nhớ. Bộ nhớ đệm của Core 2 Extreme QX9650 Bộ nhớ đệm của Core 2 Quad Q6600 Bộ xử lý Yorkfield có bộ nhớ đệm lớn hơn 50% với kiểu liên kết cao cấp hơn. Chúng có tới 24 đường liên kết bộ nhớ đệm L2 khi so sánh với 16 đường liên kết trong các thế hệ trước. Như là một kết quả, Intel hy vọng có thể sử dụng bộ nhớ đệm L2 hiệu quả hơn và duy trì khả năng tìm kiếm dữ liệu nhanh hơn. Bộ nhớ đệm của dòng vi xử lý Penryn còn có năng lực chia tải dòng đệm cải tiến. Một tải được phân tách xảy ra khi một giá trị dữ liệu được đọc và một phần của dữ liệu nằm ở một dòng trong một bộ nhớ đệm và một phần khác lại nằm ở một dòng trên một bộ nhớ đệm khác. Việc đọc dữ liệu từ hai dòng của bộ nhớ đệm chậm hơn vài lần so với đọc dữ liệu từ một dòng dữ liệu nếu dữ liệu không được sắp đặt một cách hợp lý. Tải chia dòng bộ nhớ đệm được cải tiến của dòng vi xử lý Penryn cải thiện hiệu năng một cách đáng kể bằng cách gửi theo ước đoán cả hai nửa của một tải phân tách trước những tải hoặc phần lưu trữ khác. Điều đó có thể nâng cao hiệu năng của những ứng dụng nhất định trong đó có thực hiện quét dữ liệu, như là ước đoán di chuyển hình ảnh. Tập lệnh SSE4 mới của Intel: Dòng vi xử lý Penryn bao gồm tập lệnh Mở rộng Luồng SIMD 4 (SSE4) của Intel®. Tập lệnh Intel SSE4 là sự cải tiến về kiến trúc tập lệnh đáng kể nhất kể từ năm 2001. Tập lệnh mới này mở rộng kiến trúc tập lệnh Intel® 64 để giành ưu thế của quá trình sản xuất silicon 45 nm thế hệ tiếp theo và nâng cao hiệu năng cũng như tính năng của kiến trúc Intel®. Tập lệnh Intel SSE4 mang lại hiệu năng cao hơn cho các phần mềm SIMD (một lệnh, đa dữ liệu) và cho phép các bộ vi xử lý Penryn mang lại hiệu năng và hiệu suất năng lượng cực cao đến cho nhiều phần mềm 32 và 64 bit. Các ứng dụng có thể có lợi từ điều này bao gồm các ứng dụng đồ họa, mã hóa và xử lý video, hình ảnh 3D và game. Những lệnh này cũng sẽ mang lại lợi ích cho các ứng dụng hiệu năng cao như các thuật toán nén âm thanh, hình ảnh và dữ liệu cùng với nhiều điều khác nữa. Việc triển khai tập lệnh Intel SSE4 của dòng Penryn sẽ nâng cao hiệu năng thông qua: • Bổ sung hỗ trợ hai phép toán nhân số nguyên 32 bit theo vectơ khác nhau. • Giới thiệu các phép toán min/max 8 bit không dấu, cùng với các phiên bản 16 và 32 bit có dấu và không dấu. • Giới thiệu các tính năng cải thiện năng lực của trình biên dịch để vec tơ hóa số nguyên và mã có độ chính xác đơn một cách hiệu quả hơn – Trộn, Kiểm thử và Làm tròn, cũng như mở rộng dấu/số không, là những thay thế trực tiếp của những phép toán phức tạp hiện tại – Chèn, Tách là những khối cấu thành để thu thập (tìm kiếm) phát tán, kéo tải và kéo lưu trữ. • Bổ sung những phép toán đặc trưng có thể cung cấp những lợi ích ở cấp độ ứng dụng trong: o Các chức năng tăng tốc độ mã hóa video. o Phép nhân dấu phẩy động (rất quan trọng trong game và tạo ra các nội dung 3D) o Lệnh tải luồng (rất quan trọng đối với xử lý video, hình ảnh và các ứng dụng chia sẻ dữ liệu giữa bộ xử lý đồ họa và vi xử lý) 0digg 0

Các file đính kèm theo tài liệu này:

  • pdfphan_cung_5.PDF
Tài liệu liên quan