Ngày 12 tháng 11 vừa qua, Intel đã công bố các bộ xử lý dành cho máy
chủ trong gia đình Penryn. Đó là những bộ xử lý đầu tiên và đánh dấu cho
kỷ nguyên 45nm. Thế hệ tiếp theo của các bộxử lý kiến trúc Core. Với
hai dòng sản phẩm Wofldale (hai nhân) và Yorkfiled (4 nhân).
Bạn đã nhận thấy được sức mạnh cũng như hiệu năng tuyệt vời của các
bộ xử lý kiến trúc Core. Và bạn sẽ tự hỏi, liệu Penryn đơn giản chỉ là thu
hẹp kích thước transitor từ kiến trúc Core 65nm xuống công nghệ sản
xuất nhỏ hơn. Intel đã khẳng định rằng các bộ xử lý Penryn không chỉ
đơn giản là thu hẹp kích thước sản xuất, mà các kỹ sư Intel đã cải tiến và
nâng cao rất nhiều thứ bên trong Penryn để tăng hiệu năng cao hơn mà
không phải đưa tốc độ CPU lên cao hơn.
Trước khi bắt đầu tìm hiểu kiến trúc 45nm, chúng ta hãy cùng nhìn lại
kiến trúc Core.
Intel lầu đầu tiên giới thiệu vi kiến trúc Core vào năm 2006, cùng lúc với
việc sản xuất các bộ xử lý Intel Core 2 dưới công nghệ xử lý 65nm. Thế
hệ đầu tiên của vi kiến trúc đa nhân đã được tối ưu hóa. Với việc hiệu
năng cao hơn cũng như tiêu thụ điện năng ít hơn, kiến trúc Core của Intel
đã trở thành nền tảng cho rất nhiều các giải pháp mới và các nền tang
mới.
Vi kiến trúc Core có khả năng xử lý tối đa 4 instruction trên một clock
cycle, nhanh hơn bất kỳ CPU nào hiện có. Excution pipeline của vi kiến
trúc Core có 14 stage, ngắn hơn nhiều so với Prescott, Smithfield, .
thuộc kiến trúc NetBurst (với hơn 30 stage). Nếu xét về hiệu năng trên
mỗi wat thì pipeline ngắn hơn có một lợi thế không cần phải bàn cãi.
Vi kiến trúc Core là hai nhân thực, gồm 2 nhân nằm trên cùng một die, có
64 KB L1 Cache (32 KB cho tính toán và 32 KB cho dữ liệu), hỗ trợ
EM64T không như Pentium M và Core Duo (Yonah) chỉ hỗ trợ tính toán
32 bit
16 trang |
Chia sẻ: oanh_nt | Lượt xem: 1244 | Lượt tải: 0
Nội dung tài liệu Nền tảng Kiến trúc Penryn, công nghệ 45nm High-K metal gate của Intel, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nền tảng Kiến trúc Penryn, công nghệ 45nm High-k metal gate của
Intel
Ngày 12 tháng 11 vừa qua, Intel đã công bố các bộ xử lý dành cho máy
chủ trong gia đình Penryn. Đó là những bộ xử lý đầu tiên và đánh dấu cho
kỷ nguyên 45nm. Thế hệ tiếp theo của các bộ xử lý kiến trúc Core. Với
hai dòng sản phẩm Wofldale (hai nhân) và Yorkfiled (4 nhân).
Bạn đã nhận thấy được sức mạnh cũng như hiệu năng tuyệt vời của các
bộ xử lý kiến trúc Core. Và bạn sẽ tự hỏi, liệu Penryn đơn giản chỉ là thu
hẹp kích thước transitor từ kiến trúc Core 65nm xuống công nghệ sản
xuất nhỏ hơn. Intel đã khẳng định rằng các bộ xử lý Penryn không chỉ
đơn giản là thu hẹp kích thước sản xuất, mà các kỹ sư Intel đã cải tiến và
nâng cao rất nhiều thứ bên trong Penryn để tăng hiệu năng cao hơn mà
không phải đưa tốc độ CPU lên cao hơn.
Trước khi bắt đầu tìm hiểu kiến trúc 45nm, chúng ta hãy cùng nhìn lại
kiến trúc Core.
Intel lầu đầu tiên giới thiệu vi kiến trúc Core vào năm 2006, cùng lúc với
việc sản xuất các bộ xử lý Intel Core 2 dưới công nghệ xử lý 65nm. Thế
hệ đầu tiên của vi kiến trúc đa nhân đã được tối ưu hóa. Với việc hiệu
năng cao hơn cũng như tiêu thụ điện năng ít hơn, kiến trúc Core của Intel
đã trở thành nền tảng cho rất nhiều các giải pháp mới và các nền tang
mới.
Vi kiến trúc Core có khả năng xử lý tối đa 4 instruction trên một clock
cycle, nhanh hơn bất kỳ CPU nào hiện có. Excution pipeline của vi kiến
trúc Core có 14 stage, ngắn hơn nhiều so với Prescott, Smithfield, ...
thuộc kiến trúc NetBurst (với hơn 30 stage). Nếu xét về hiệu năng trên
mỗi wat thì pipeline ngắn hơn có một lợi thế không cần phải bàn cãi.
Vi kiến trúc Core là hai nhân thực, gồm 2 nhân nằm trên cùng một die, có
64 KB L1 Cache (32 KB cho tính toán và 32 KB cho dữ liệu), hỗ trợ
EM64T không như Pentium M và Core Duo (Yonah) chỉ hỗ trợ tính toán
32 bit.
Vi kiến trúc Core được thiết kế cho nhiều phân khúc thị trường khác
nhau. Intel cam kết chỉ cần giảm 15 % xung nhịp thì công xuất tiêu thụ
điện giảm đến 50 %. Khả năng này cho phép sản xuất các dòng CPU cho
các phân khúc thị trường desktop, laptop và server dựa trên vi kiến trúc
Core. Merom sẽ nhanh hơn thế hệ CPU cho laptop hiện tại của Intel là
Core Duo (Yonah) khoảng 20 %, công xuất tiêu thụ điện không vượt quá
35W. Woodcrest sẽ nhanh hơn thế hệ Xeon hiện tại khoảng 80 %, công
xuất tiêu thụ điện khoảng 80 W (giảm 35 %). Conroe sẽ nhanh hơn
Pentium D 900 series khoảng 40 %, công xuất tiêu thụ điện của Conroe
dòng đa dụng khoảng 65 W (giảm 40 %).
Đối với người dùng gia đình, thiết kế của kiến trúc Core mang đến hiệu
năng cao hơn, không gian yên tĩnh hơn, và tiêu thụ điện năng ít hơn. Đối
với ngành công nghiệp IT, bạn có thể đưa ra những tính toán chính xác
hơn, nhanh hơn, giảm thiểu nhiệt lượng tỏa ra từ các máy chủ cơ sở dữ
liệu, qua đó chi phí tiêu thụ điện năng sẽ giảm đi rất nhiều. Đối với người
dùng di động, bạn sẽ được sở hữu một chiếc máy tính năng động hơn,
thời gian sử dụng pin dài hơn, đồng thời vi kiến trúc Core cho phép nhà
sản xuất thu nhỏ kích thước hệ thống qua đó các thiết bị di động trở nên
linh hoạt hơn hơn, nhỏ gọn hơn.
Điều gì làm cho kiến trúc Core trở nên mạnh mẽ như thế, Intel đã trang bị
cho vi kiến trúc Core các công nghệ vượt trội so với vi kiến trúc NetBust.
Trong đó có năm công nghệ nổi bật, bao gồm:
Intel Wide Dynamic Execution.
Intel Intelligent Power Capability.
Intel Advanced Smart Cache.
Intel Smart Memory Access.
Intel Advanced Digital Media Boost
Penryn, thế hệ tiếp theo của vi kiến trúc Core.
Hôm nay, cái mà chúng ta đang nói đến chính là sự ra đời của Penryn,
trong năm 2006 là năm ra đời của bộ xử lý Conroe trên kiến trúc Core, và
Penryn là codename của dòng vi xử lý mới của Intel trên công nghệ
45nm, nó thay thế cho dòng Conroe và đều được gọi với tên gọi Core 2,
trong lúc này bạn sẽ thấy ít có sự thay đổi trong công nghệ 45nm, cho đến
khi Intel áp dụng công nghệ 45nm mới với cổng kim loại High-k vào
trong việc sản xuất ra các bộ vi xử lý.
Một điều cũng hết sức quan trọng đáng chú ý là ngoài việc cung cấp các
bộ vi xử lý cho các máy tính, Intel còn sản xuất các bộ xử lý cho các thiết
bị di động. Nơi mà vi kiến trúc của nhân CPU được xem là yếu tố quyết
định. Như một cách nhận định dễ hiểu, Penryn là cái tên quá thông dụng
khi sử dụng để chỉ các CPU mới trên kiến trúc 45nm. Nhưng thực tế nó
dùng để gọi các bộ xử lý di động. Đối với các máy tính để bàn, thì các bộ
vi xử lý Penryn dual-core và quad-core có tên gọi khác là Wolfdale và
Yorkfield. Hiện tại thì Penryn vẫn chia sẽ cùng vi kiến trúc với Conroe ,
tại thị trường bán lẻ thì nó được sắp cùng danh mục Core 2.
Đã có 6 bộ xử lý Penryn, bao gồm các bộ xử lý hai nhân và bốn nhân
dành cho máy tính để bàn, một bộ xử lý hai nhân dành cho di động, tất cả
các bộ xử lý này đều được gọi dưới cái tên Intel Core. Đối với các bộ xử
lý hai nhân và bốn nhân dành cho máy chủ vẫn sử dụng tên gọi Intel
Xeon. Và cho đến thời điểm này, Intel đã có tổng cộng 16 sản phẩm
45nm nằm trong lộ trình.
Các bộ xử lý 45nm thế hệ tiếp theo của bộ xử lý Intel Core 2 Quad sẽ có
tới 820 triệu bóng bán dẫn. Trong khi bộ xử lý QX6850 với nhân
Kenfield chỉ có 582 triệu bong bán dẫn bên trong. Điều gì cho phép Intel
tăng số lượng bóng bán dẫn nhiều như thế? Đó là nhờ vào việc Intel áp
dụng công thức cổng kim loại High-k.
Công nghệ xử lý cổng kim loại 45nm High-k của Intel.
Chúng ta sẽ bắt đầu phân tích những đặc điểm nổi bật của các bộ xử lý
mới này với các tiến trình sản xuất mới. Đó là tiến trình xử lý 45nm mà
cho phép tạo nên các bộ xử lý Penryn. Tiến trình này không chỉ cho phép
thu nhỏ kích thước nhân nhằm nâng cao khả năng sản xuất ra bộ xử lý
hiệu năng cao mà nó còn cho phép giảm điện thế hoạt động của bộ xử lý,
đồng nghĩa với việc sự tỏa nhiệt sẽ ít hơn đồng thời cho phép nâng cao
xung nhịp xử lý trong tương lai.
Công nghệ sản xuất mới vô cùng thú vị bởi vì Intel đã phải thực hiện việc
đổi mới hoàn toàn. Và kết quả là: vật liệu sản xuất truyền thống đã được
sản xuất từ những năng 60 để sản xuất ra bóng bán dẫn là oxit silic đã
được thay thế bằng vật liệu hoàn toàn mới với những nguyên vật liệu khó
kiếm trên quả địa cầu. Các bóng bán dẫn 45nm sử dụng đóng gói kim loại
làm từ polysilicon (NMOS + PMOS) và chất điện môi High-k dựa trên
chất Hafnium.
Những thay đổi này trong thiết kế các phần tử chất bán dẫn giúp cho Intel
cùng lúc giải quyết được các vấn đề nan giải. Tiến trình công nghệ 45nm
gần như tăng gấp đôi mật độ bóng bán dẫn trên die. Hơn nữa, nó còn tăng
tốc độ đảo mạch của chúng lên khoảng 20% và giảm điện năng cần cho
hoạt động này là 30%. Thêm vào đó, việc sử dụng nguyên liệu mới cho
phép giảm bớt sự thất thoát điện năng một cách đáng kể trong sự thất
thoát nguồn điện bởi hệ số 5 và sự thất thoát của cổng oxide bởi hệ số 10.
Mặt khác, tiến trình sản xuất bộ xử lý 45nm sử dụng liên kết đồng, với
đĩa bán dẫn 300mm và kỹ thuật in 192nm. Vì thế, quá trình sản xuất mới
này không đòi hỏi Intel phải thay thế hầu hết các công cụ gia công của
họ. Điều này mang đến cho chúng ta hy vọng rằng việc sản xuất đại trà
các bộ xử lý Penryn sẽ không gặp bất kỳ trở ngại nào, và Intel sẽ đưa ra
những chip năng suất cao.
Tấm wafer chứa các con chip Penryn 45nm
Chip Penryn và một đồng xu Mỹ.
Cũng giống như chúng ta đã quen với thuật ngữ đồng hồ sinh học, mọi
hoạt động của chúng ta đều xoay quanh cái đồng hồ đó. Với nhà sản xuất
bộ vi xử lý khổng lồ như Intel cũng tương tự như vậy, họ đi theo cái gọi
là Silicon Cadence (được hiểu như Tick-Tock) một kế hoạch chiến lược
trong việc phát triển các bộ vi xử lý của máy tính theo từng nhịp thời
gian, và đồng bộ cứ theo mỗi hai năm, như một quy luật, thời gian thực
sự bắt đầu với một tiếng tick(sự thay đổi công nghệ) thì liền theo sau
(một năm) là tiếng tock(sự thay đổi về cấu trúc thiết kế).
Cứ sau mỗi hai năm, Intel lại thay đổ thiết kế của bộ xử lý, bạn có thể
thấy ở trên, Intel đã chuyển từ vi kiến trúc NetBust sang vi kiến trúc Core
cùng lúc với việc chuyển từ công nghệ 90nm sang công nghệ 65nm. Và
cũng với hai năm sau, Intel đã thay đổi công nghệ 65nm bằng công nghệ
45nm với vi kiến trúc Penryn, và hai năm sau bạn sẽ lại nhìn thấy vi kiến
trúc Penryn sẽ lại có thế hệ tiếp theo là Nehalem.
Những đổi mới trong vi kiến trúc Penryn:
Penryn, dòng vi xử lý đầu tiên dựa trên công nghệ silicon High-k 45nm
của Intel, sử dụng một cách hiệu quả những bóng bán dẫn bổ sung mà
công nghệ này có thể đóng gói vào trong một con chip. Họ vi xử lý Intel
Core 2 và Intel Xeon High-k 45nm thế hệ tiếp theo sẽ mang đến nhiều
đặc điểm kiến trúc và cải tiến mới làm cho phần mềm chạy nhanh hơn
cũng như cải thiện hiệu suất sử dụng điện năng.
Bộ chia nhanh Radix-16:
Các bộ xử lý Penryn cung cấp hiệu năng xử lý nhanh gấp hai lần vi kiến
trúc thế hệ trước trong tính toán khoa học, chuyển đổi 3D và các tiến trình
tính toán cao. Việc bao hàm một công nghệ chia nhanh mới được gọi là
radix 16 làm tăng tốc độ chia của cả phép tính dấu phẩy động và số
nguyên. Với radix-16, Penryn có thể thực hiện 4 tính toán 4 bit trong một
vòng lặp so với kiến trúc Core là 4 tính toán 2 bit.
Công nghệ ảo hóa cải tiến:
Penryn tăng tốc độ thời gian chuyển máy ảo (đi vào/ thoát ra) trung bình
từ 25 đến 75%. Tất cả được thực hiện thông qua cải tiến vi kiến trúc và
không cần đến bất cứ thay đổi phần mềm máy ảo nào. (Ảo hóa phân vùng
một máy tính, vì thế nó có thể chạy những hệ điều hành và phần mềm
khác nhau trên mỗi phân vùng, tận dụng tốt hơn sức mạnh bộ xử lý đa
nhân, nâng cao hiệu suất và cắt giảm chi phí thông qua cho phép một máy
tính thể hiện như là nhiều máy ảo.)
Siêu động cơ dao động:
Với việc triển khai một khối dao động độ rộng đầy đủ, có độ rộng 128-
bit, các bộ xử lý Penryn có thể thực hiện dao động đầy đủ độ rộng trong
một chu kỳ đơn. Điều đó tăng gấp đôi tốc độ của phần lớn các phép toán
với byte, từ hoặc từ kép dữ liệu SSE và cắt giảm đáng kể độ trễ và thông
lượng của các lệnh SSE2, SSE3 và SSE4 của Intel có những phép toán
giống dao động như đóng gói, giải đóng gói và dịch gói rộng hơn. Điều
đó mang lại sự cải thiện tổng thể trong nhiều thuật toán SSE2.
Chuyển tiếp lưu trữ:
Để tăng tốc độ đọc kết quả của một lưu trữ "được cân chỉnh sai" trải trên
một đường biên địa chỉ 8-byte và vẫn còn đang ở trong đường ống, các bộ
xử lý Penryn có thể chuyển tiếp kết quả của lưu trữ đến tải một cách trực
tiếp thay vì đợi cho đến khi việc lưu trữ được hoàn tất và viết vào bộ nhớ.
Các bộ xử lý có lõi và giao diện tốc độ cao hơn:
Dòng Penryn sẽ chạy ở tốc độ lõi cao hơn (hơn 3GHz đối với một số
phiên bản) so với các bộ xử lý dòng Core 2 trước đây. Tốc độ của bus
mặt trước (front side bus) sẽ được nâng lên tới 1600MHz, bổ sung vào
các tốc độ hiện có là 1066 và 1333 MHz. Điều đó sẽ cải thiện hiệu năng
hệ thống tổng thể.
Hiệu năng gốc đồng bộ hệ điều hành được cải tiến:
Những hệ điều hành nhất định hoặc "che" các ngắt khi bắt đầu một phần
mã quan trọng và cần có truy nhập riêng biệt trên một tài nguyên như là
thiết bị vào ra. Thông qua năng lực đặt ngắt/xóa ngắt nhanh hơn
(CLI/STI), các bộ xử lý Penryn có thể đi vào và thoát khỏi chế độ này
nhanh hơn, qua đó cải thiện hiệu năng hơn. Hơn nữa, chúng có thể thực
hiện các lệnh khóa (như là XCH, ADD/XADD/NEG/BTS/AND, và
CMPXHCG) một cách nhanh chóng hơn. Các bộ xử lý Penryn còn đặc
trưng cho tốc độ truy cập nhanh hơn của bộ đếm nhãn thời gian. Đây có
thể là một hàm thường xuyên được gọi đến trong cơ sở dữ liệu hoặc tải
máy chủ dựa trên xử lý giao dịch.
Bên cạnh những lợi ích của công nghệ High-k 45nm của Intel, họ vi xử lý
Penryn xây dựng những tính năng mang lại hiệu quả năng lượng của vi
kiến trúc Core với hai bổ xung quan trọng: công nghệ tắt nguồn sâu và
công nghệ tăng tốc độ động của Intel
Công nghệ tắt nguồn sâu:
Đây là một trạng thái quản lý nguồn mới và tiên tiến (được gọi là C-state)
giúp cắt giảm đáng kể nguồn điện của bộ xử lý trong những chu kỳ rỗi vì
thế dòng rò của bóng bán dẫn nội bộ không còn là vấn đề nữa. Trạng thái
"ngủ" của bộ xử lý là trạng thái nguồn thấp nhất mà một bộ xử lý có được
và giúp kéo dài thời gian sử dụng pin. Nó cho phép Penryn đạt mức độ
cải thiện đáng kể so với trạng thái nguồn thấp nhất của Meron - thế hệ
trước của kiến trúc Core của Intel dành cho thiết bị di động.
Khi chuyển sang trạng thái tắt nguồn sâu, bộ xử lý xóa bộ nhớ đệm, lưu
trữ trạng thái vi kiến trúc nội bộ và tắt nguồn cấp cho các lõi và bộ nhớ
đệm L2. Khi ở trong chế độ tắt nguồn sâu, chipset vẫn tiếp tục phục vụ
lưu lượng bộ nhớ dành cho vào/ra (I/O) nhưng không phục vụ bộ xử lý.
Khi cần đến lõi xử lý, điện áp được tăng lên, xung nhịp được bật lên, bộ
xử lý được khởi động lại, trạng thái vi kiến trúc được khôi phục và hoạt
động xử lý lệnh cũng được khôi phục lại.
Trạng thái C-state càng sâu thì chi phí năng lượng của việc chuyển đi
chuyển lại trạng thái này càng cao. Việc chuyển quá thường xuyên sang
trạng thái C-state sẽ gây ra mất mát năng lượng. Để ngăn chặn vấn đề
này, chip Penryn có một năng lực tự hạ thấp trong đó sử dụng trí tuệ để
xác định lúc nào thì việc tiết kiệm chu kỳ rỗi sẽ đem lại lợi ích từ việc tắt
và khởi động lại bộ xử lý. Nếu không có lợi thì yêu cầu Tắt nguồn sâu
được hạ xuống mức C4 - một trạng thái quản lý nguồn ít sâu hơn. Kết quả
là việc tiết kiệm nguồn tương ứng với chu kỳ rỗi có thể
Công nghệ tăng tốc độ động được cải tiến của Intel® (Intel® Dynamic
Acceleration Technology)
Để nâng cao hơn nữa hiệu năng của các ứng dụng đơn luồng, Intel đã cải
tiến Công nghệ Tăng tốc độ động đã có trong các bộ xử lý Core 2 hiện tại
của Intel. Tính năng này sử dụng lượng nguồn khả dụng được giải phóng
khi một lõi được đưa vào trạng thái chờ để nâng cao hiệu năng của lõi
còn đang hoạt động. (Hãy tưởng tượng như một vòi tắm có hai hoa sen.
Khi một hoa sen được đóng lại thì áp lực nước hay hiệu năng trên hoa sen
còn lại sẽ tăng lên). Nếu một lõi ở trạng thái C3 hoặc C-state sâu hơn,
một lượng điện năng của lõi đó có thể được chuyển cho lõi hoạt động
trong khi vẫn nằm trong giới hạn bức xạ nhiệt được thiết kế cho bộ xử lý.
Điều đó làm tăng tốc độ mà các ứng dụng đơn luồng có thể được xử lý, vì
thế cải thiện hiệu năng của nhiều ứng dụng.
Trên đây là một số cải tiến của Penryn. Tuy nhiên, nhờ vào việc áp dụng
công nghệ xử lý High-k 45nm mà dòng vi xử lý Penryn còn có được hai
cải tiến đáng chú ý nhất đó là bộ nhớ đệm Cache L2 lớn hơn và các tập
lệnh đa phương tiện SSE4l
Bộ nhớ đệm Cache L2:
Những lợi thế của công nghệ xử lý High-k 45nm cho phép các kỹ sư của
Intel có thể nâng cao số lượng bóng bán dẫn trên bộ vi xử lý mà không
làm cho kích thước bảng mạch bộ xử lý lớn hơn. Khả năng này luôn được
dùng vào việc tăng bộ nhớ đệm L2 ngay khu vực đầu tiên. Trong khi thế
hệ bộ xử lý Conroe hai nhân được trang bị 4MB bộ nhớ đệm chia sẽ, thì
trên các bộ xử lý hai nhân Woftdale 45nm có bộ nhớ đệm L2 lên đến
6MB.
Khu vực trên khuôn của bộ xử lý đã được nắm giữ bởi bộ nhớ đệm L2
cuối cùng cũng đã trở nên lớn hơn bất kỳ đơn vị xử lý nào trên bộ xử lý,
như bạn có thể thấy qua hình ảnh của khuôn bộ xử lý Wolfdale
Và với kết quả trên, các bộ xử lý bốn nhân Penryn sẽ có bộ nhớ đệm L2
lên đến 12MB, với 6MB cho mỗi cặp của lõi. Hay nói cách khác, ở đây
không có bất kỳ sự thay đổi nào trong thiết kế dẫn đến việc phải chuyển
sang những tiến trình sản xuất mới. Các cặp lõi vẫn được định vị trên
những vị trí khác nhau và sẽ trao đổi dữ liệu thông qua bus hệ thống và
bộ nhớ.
Bộ nhớ đệm của Core 2 Extreme QX9650
Bộ nhớ đệm của Core 2 Quad Q6600
Bộ xử lý Yorkfield có bộ nhớ đệm lớn hơn 50% với kiểu liên kết cao cấp
hơn. Chúng có tới 24 đường liên kết bộ nhớ đệm L2 khi so sánh với 16
đường liên kết trong các thế hệ trước. Như là một kết quả, Intel hy vọng
có thể sử dụng bộ nhớ đệm L2 hiệu quả hơn và duy trì khả năng tìm kiếm
dữ liệu nhanh hơn.
Bộ nhớ đệm của dòng vi xử lý Penryn còn có năng lực chia tải dòng đệm
cải tiến. Một tải được phân tách xảy ra khi một giá trị dữ liệu được đọc và
một phần của dữ liệu nằm ở một dòng trong một bộ nhớ đệm và một phần
khác lại nằm ở một dòng trên một bộ nhớ đệm khác. Việc đọc dữ liệu từ
hai dòng của bộ nhớ đệm chậm hơn vài lần so với đọc dữ liệu từ một
dòng dữ liệu nếu dữ liệu không được sắp đặt một cách hợp lý. Tải chia
dòng bộ nhớ đệm được cải tiến của dòng vi xử lý Penryn cải thiện hiệu
năng một cách đáng kể bằng cách gửi theo ước đoán cả hai nửa của một
tải phân tách trước những tải hoặc phần lưu trữ khác. Điều đó có thể nâng
cao hiệu năng của những ứng dụng nhất định trong đó có thực hiện quét
dữ liệu, như là ước đoán di chuyển hình ảnh.
Tập lệnh SSE4 mới của Intel:
Dòng vi xử lý Penryn bao gồm tập lệnh Mở rộng Luồng SIMD 4 (SSE4)
của Intel®. Tập lệnh Intel SSE4 là sự cải tiến về kiến trúc tập lệnh đáng
kể nhất kể từ năm 2001. Tập lệnh mới này mở rộng kiến trúc tập lệnh
Intel® 64 để giành ưu thế của quá trình sản xuất silicon 45 nm thế hệ tiếp
theo và nâng cao hiệu năng cũng như tính năng của kiến trúc Intel®. Tập
lệnh Intel SSE4 mang lại hiệu năng cao hơn cho các phần mềm SIMD
(một lệnh, đa dữ liệu) và cho phép các bộ vi xử lý Penryn mang lại hiệu
năng và hiệu suất năng lượng cực cao đến cho nhiều phần mềm 32 và 64
bit. Các ứng dụng có thể có lợi từ điều này bao gồm các ứng dụng đồ họa,
mã hóa và xử lý video, hình ảnh 3D và game. Những lệnh này cũng sẽ
mang lại lợi ích cho các ứng dụng hiệu năng cao như các thuật toán nén
âm thanh, hình ảnh và dữ liệu cùng với nhiều điều khác nữa.
Việc triển khai tập lệnh Intel SSE4 của dòng Penryn sẽ nâng cao hiệu
năng thông qua:
• Bổ sung hỗ trợ hai phép toán nhân số nguyên 32 bit theo vectơ khác
nhau.
• Giới thiệu các phép toán min/max 8 bit không dấu, cùng với các phiên
bản 16 và 32 bit có dấu và không dấu.
• Giới thiệu các tính năng cải thiện năng lực của trình biên dịch để vec tơ
hóa số nguyên và mã có độ chính xác đơn một cách hiệu quả hơn – Trộn,
Kiểm thử và Làm tròn, cũng như mở rộng dấu/số không, là những thay
thế trực tiếp của những phép toán phức tạp hiện tại – Chèn, Tách là
những khối cấu thành để thu thập (tìm kiếm) phát tán, kéo tải và kéo lưu
trữ.
• Bổ sung những phép toán đặc trưng có thể cung cấp những lợi ích ở cấp
độ ứng dụng trong:
o Các chức năng tăng tốc độ mã hóa video.
o Phép nhân dấu phẩy động (rất quan trọng trong game và tạo ra các nội
dung 3D)
o Lệnh tải luồng (rất quan trọng đối với xử lý video, hình ảnh và các ứng
dụng chia sẻ dữ liệu giữa bộ xử lý đồ họa và vi xử lý)
0digg 0
Các file đính kèm theo tài liệu này:
- phan_cung_5.PDF