Apple A7 – 64 bity, które zmieniają wszystko [cz. 1]

2013 to dobry rok dla użytkowników sprzętu Apple'a. W czerwcu poznaliśmy kosmicznie zapowiadającego się Maca Pro, zobaczyliśmy iż 13-calowy ultrabook może trzymać na baterii nawet ponad 12h, a dzisiaj posiadacze Phone'a 5S korzystają z pierwszego na świecie smartfona uzbrojonego w 64-bitowy procesor. Ten wbrew krzykom malkontentów zmienia naprawdę wiele.

Apple A7

Apple A7 (idownloadblog.com)

Wstęp teoretyczny, czyli poziom z największym zamieszaniem

Zdecydowana większość dzisiejszych smartfonów i tabletów ma procesory oparte na architekturze Advanced RISC Machine (w skrócie ARM), której historia sięga 1983 roku. Dziś prawa do tej architektury są w posiadaniu brytyjskiej firmy ARM Holdings, która udziela nań licencji największym firmom technologicznym na świecie (począwszy od Microsoftu, NEC przez Intela po Nvidię, Samsunga i Apple).

ARM Holdings oferuje również gotowe konstrukcje (processor licence) o różnej architekturze rdzeni — Cortex-A9, Cortex-A15 (znany z Exynosów 5). Jeżeli producent decyduje się na takie rozwiązanie, kupuje praktycznie gotowy schemat procesora, w którym może dokonać drobnych zmian (np. zasilania) i dobrać do niego odpowiednie GPU. W ten sposób powstają gotowe SoC (System on the Chip), np. Exynosy Samsunga czy Tegry Nvidii

ARM Holdings licencjonuje również tzw. architectural license, dzięki której firmy mogą tworzyć własne CPU używając ISA (Instruction Set Architecture — zbioru instrukcji) autorstwa brytyjskiej firmy. Procesor Apple A6 i A6X znajdujące się w iPhonie 5 i iPadzie 4 generacji powstały właśnie w ten sposób, w oparciu o standardy ARMv7 (najpopularniejsze ISA w świecie mobilnych procesorów). To była spora zmiana polityki — wcześniej Apple korzystało również z "processor license" ARM. Były one produkowane głównie przez Samsunga, stąd ich podobieństwo do Exynosów, które wychodziło na jaw pod mikroskopem (tzw. die shot). Z architectural license korzysta również Qualcomm projektując rdzenie Scorpion i Krait (aktualnie najmocniejsze to 400 i 450), które znajdziemy w procesorach serii Snapdragon.

Rdzenie Swift, które zaprojektowało Apple na potrzeby A6 i A6X okazały się jednym z najlepszych rozwiązań na rynku, prezentując świetny stosunek mocy do pobieranej energii. Jednak od tego czasu minęła dłuższa chwila, Qualcomm wprowadził Krait 300 i Krait 400, a Samsung mocuje się z technologią big.LITTLE i rdzeniami Cortex A-15 oraz nadchodzącymi A53 i A57. Apple A7 nie jest po prostu kolejnym procesorem, ale próbą pokazania, że Cupertino potrafi stworzyć topowy SoC samemu. Jak na razie wychodzi im to całkiem nieźle.

Na początku warto potwierdzić to, co i tak już wszyscy wiedzą. Za produkcję A7 jak na razie odpowiada głównie Samsung (chociaż już coraz głośniej mówi się o przeniesieniu większej części produkcji do TSMC). Procesor jest wykonany w procesie technologicznym 28 nm High/K Metal-Gate, takim samym jak w przypadku Exynosów 5410/5420.

Apple A7 - Gate Pitch

Potwierdzenie tej informacji pochodzi od Chipworks, które zabrało się do dokładnego badania A7. Na zdjęciu powyżej pokazano minimalną odległość między tranzystorami (tzw. Contacted Gate Pitch), która jest sporo mniejsza niż w przypadku Apple A6, wykonanego w 32 nm procesie technologicznym. Wydaje się, że na razie jest za wcześnie by na poważnie myśleć o produkcji CPU w 20 nm, tak samo jest za wcześnie by TSMC przejęło całość produkcji procesorów dla Apple.

Kość Apple A7

Zobacz również: Huawei Ascend Mate7 w naszych rękach

Chipworks dostarczyło również zdjęcie wnętrza całego układu, tzw. die shot. Anand la Shimpi z AnandTech przyglądając się fotografii stwierdził:

Jeżeli w dolnym prawym roku faktycznie znajdują się dwa rdzenie Cyclone, to układ wygląda trochę inaczej niż to co widzieliśmy w zeszłym roku w Apple A6.

Cyclone to prawdopodobnie nazwa architektury rdzeni w A7, odpowiedników Swift z zeszłorocznego układu.

Shimpi w swojej recenzji iPhone'a 5S stwierdził, iż Cyclone bardziej przypomina "dopakowany" rdzeń Swift (albo co najmniej inspirowany Swiftem) niż zupełnie nową architekturę, i że jest wciąż za wcześnie by były to jednostki Cortex A53 lub A57. Jednak po dłuższej analizie zrozumiał, że to pierwsze założenie jest błędne, co wyjaśnił w recenzji iPada Air.

W recenzji iPhone 5S głośno rozmyślałem, sugerując, że Cyclone jest raczej rozbudowaną architekturą Swift, a nie zupełnie nowym projektem. Ostatecznie jaki sens miałoby tworzenie nowego rdzenia, a rok później zaprojektowanie od zera kolejnego? Okazuje się, że byłem w błędzie.

Na 64 bitach historia się nie zaczyna, i nie kończy

Cyclone to 64-bitowy rdzeń zgodny z instrukcjami ARMv8, które nadają A7 sporo usprawnień i pozwalają osiągać sporo większą moc niż poprzednik. Więcej rejestrów, bardziej przejrzysty set instrukcji, ulepszone rozszerzenia i poprawione SIMD (o czym później) oraz, co bardzo ważne ze względu na czytnik linii papilarnych, akceleracja algorytmów kryptograficznych.

Najważniejszą zmianą jest jednak możliwość wykonywania przez A7 sześciu instrukcji jednocześnie. Poprzednik wykonywał maksymalnie trzy (chociaż w większości przypadków kończyło się na dwóch), a jeżeli mieszaliśmy instrukcje liczb całkowitych ze zmiennoprzecinkowymi, śmiało możemy stwierdzić, że Swift były rdzeniami wykonującymi 1.5 instrukcji na cykl. A7 to zupełnie inna bajka — potrafi wykonywać równolegle cztery dodawania liczb całkowitych (integer) i dwa liczb zmiennoprzecinkowych (FP), co jest wynikiem w najlepszym wypadku co najmniej trzy razy lepszym od Kraitów i A6 / A6X.

Bardzo ważne zmiany dotyczą również pamięci cache. L1 została zwiększona dwukrotnie z 32/32 do 64/64 Kb. Delikatnie zwiększy to opóźnienie dostępu, jednak znacznie wzrośnie hit-ratio. Zwiększy się szansa na trafienie przez procesor i znalezienie szukanej danej w cache, co powinno z nawiązką wynagrodzić opóźnienie. Rozmiar pamięci L2 pozostał niezmieniony — 1 MB na oba rdzenie. Jednak drastycznie zmieniły się opóźnienia — wg pomiarów Shimpiego dostęp teraz jest o połowę szybszy niż w przypadku rdzeni Swift.

Przepustowość pamięci podręcznej

W procesorze znalazło się również miejsce na 4 MB SRAM. Jest to rodzaj pamięci statycznej wewnątrz CPU, w której dane pozostają dopóki jest do niej doprowadzone zasilanie. Powszechnie kojarzony RAM (ściśle DRAM) wymaga cyklicznego odświeżania. Bardzo dużą zaletą pamięci SRAM jest błyskawiczny dostęp — nawet 7 krotnie szybszy niż do pamięci RAM (w teorii). W przypadku A7 SRAM jest wykorzystany jako nie tylko cache kolejnego poziomu (L3) dla całej jednostki, ale również pamięć dla GPU. Pojedynczy rdzeń procesora uzyskuje do niej dostęp w ok 70 ns. Dla danych o większej wadze (np. 16 MB) przechowywanych w DRAM jest to nawet 200 ns. Przepustowość SRAM-u zastosowanego w A7 to ok. 10 GB/s, a ogólna przepustowość pamięci to ok. 8GB/s — pierwszy raz w historii iUrządzeń jest tak wysoka.

Wciąż przeglądam inne SoC, ale jak na razie nie natrafiłem na żaden wśród rozwiązań opartych o architekturę ARM mogący konkurować z tym co Apple tutaj zbudowało. Wszyscy poza Intelem są z tyłu.

A7 to krok naprzód praktycznie na każdej płaszczyźnie - od drobnych usprawnień (od 6% do nawet 60% większa przepustowość szczytowa pamięci) po większe, jak ulepszony kontroler pamięci (opóźnienie dostępu zmniejszone o 20%).

Od strony technicznej można nawet stwierdzić, że 64-bitowy Apple A7 to ukoronowanie pracy nad mobilnymi układami. Co z tego wyniknie dla nas, użytkowników? O tym będziecie mogli przeczytać już jutro w drugiej części wpisu.

Apple A7 – 64 bity, które zmieniają wszystko [cz. 2]

Podziel się:

Także w kategorii Technologie:

Przyszłe Windows Phone’y będą wiedzieć, kiedy mają się uciszyć? Tegra 4i i Tegra 5 oficjalnie na początku 2014 roku. Szału nie będzie Następny flagowiec Nokii będzie oferować funkcję “3D Touch”? Samsung szykuje smartfona z wyświetlaczem nawiniętym na jego boki. Steve Jobs byłby zachwycony? Człowiek od Siri pomoże Samsungowi zrobić lepszego asystenta głosowego?

Popularne w tym tygodniu:

Linux on Galaxy, czyli Samsung DeX wskoczy na nowy poziom Pixel Visual Core - pierwszy mobilny układ Google'a w Pixelu 2 Qualcomm Snapdragon 636 oficjalnie. Świetne rozwiązanie dla niedrogich smartfonów z ekranami 18:9 aptX HD to przyszłość. Czym właściwie jest i jak można go wykorzystać? Pojedynczy aparat i ładnie rozmyte tło, czyli jak Google'owi udało się zastąpić dwa aparaty jednym