Alpha: история в фактах и комментариях 1
Этот труд посвящён Alpha процессорам, наборам системной логики и архитектуре в целом. Это не просто обзор, но в то же время и без претензий на звание исключительно технической справки. Откровенно говоря, рассматривается вся история архитектуры Alpha, от самых начал и до наших дней. Впрочем, статья содержит большое количество разнообразной справочной информации, поскольку иначе она была бы весьма неполной и нелёгкой для понимания. Нельзя вести серьёзный разговор на историческую тему без предоставления фактов в подтверждение своей точки зрения и без их анализа. Возможно, эта статья смотрелась бы получше, если бы была написана и опубликована несколько лет назад, когда Alpha системы ставили очередные рекорды производительности, a их будущее ожидалось совсем не таким, каким оно выглядит с точки зрения дня сегодняшнего. Как знать. Однако, именно в наше время можно подвести финальную черту, объяснить, что же на самом деле произошло и почему одна из самых интересных и перспективных компьютерных архитектур оказалась брошенной в забвение.
PDP и VAX
» Нажмите, для открытия спойлера | Press to open the spoiler «
Digital Equipment Corporation (сокращенно DEC), основанная в 1957 двумя инженерами, Кеннетом Ольсеном (Kenneth Olsen) и Харланом Андерсоном (Harlan Anderson), выпускниками Массачусетского технологического института, была одной из старейших и наиболее значимых компаний мировой компьютерной индустрии.
До основания компании, Ольсен работал в Линкольнской лаборатории при том же институте и участвовал в разработке одного из первых транзисторных компьютеров под названием TX-2. Кстати, эта лаборатория в те годы пользовалась активной финансовой поддержкой Министерства обороны США. Первое время компания разрабатывала и продавала элементарные модули для вычислительной техники, но уже в 1960 представила свой первый компьютер, 18-битный PDP-1 (Programmable Data Processor - 1), способный производить около 100 тыс. операций в секунду. Кроме всего прочего, именно на нём была написана первая в известной истории компьютерная игра, Spacewar Стивена Рассела (Steven Russell). 12-битный PDP-8, запущенный в производство в 1964, вполне заслуженно считают первым серийно выпускаемым "миникомпьютером" из-за довольно компактных размеров (с небольшой шкаф или холодильник) и невысокой цены — около 18000 USD (1965) в базовой комплектации. Благодаря отличному соотношению цены и производительности, этот компьютер смог составить достойную конкуренцию знаменитым мэйнфрэймам IBM. К 1968 было произведено около 1450 машин (не считая поздних многочисленных модификаций), когда был представлен 36-битный PDP-10, основанный на дизайне экспериментального PDP-6 и рассчитанный на использование в центрах обработки данных, исследовательских лабораториях и для военных нужд. Работы над усовершенствованием 36-битной архитектуры продолжались в рамках проекта "Единорог" (the Unicorn project) под руководством Леонарда Хьюджеса (Leonard Hughes) и Дэвида Роджерса (David Rogers), но в июне 1975 проект был закрыт, а все его ресурсы были переведены на поддержку новой 32-битной архитектуры.
16-битный PDP-11, запущенный в производство в начале 1970-х, являлся наследником модельного ряда PDP-8, хотя и характеризовался многочисленными усовершенствованиями. В частности, он был первым компьютером DEC, в котором использовались 8-битные байты. Благодаря простой и удачной архитектуре, основанной на системной шине Unibus (или её модификации под названием Q-bus), довольно эффективному набору инструкций и невысокой производственной стоимости, модельный ряд PDP-11 обрёл большую популярность. Вполне закономерно, что PDP-11 вскоре стали широко клонировать, в том числе и в "странах народной демократии": СМ-4 (СССР, Болгария, Венгрия), СМ-1420 (СССР, Болгария, ГДР), СМ-1600 (СССР), ИЗОТ-1016 (Болгария), ДВК (СССР). Для PDP-11 было разработано множество операционных систем: P/OS, RSX-11, RT-11, RSTS/E, а также несколько вариантов DOS. В конце концов в Bell Laboratories на PDP-7 и PDP-11 в 1971 было сделано первое издание ОС UNIX, тогда ещё на ассемблере. PDP-11 ушёл с рынка в течение 1980-х по одной, но неизбежной причине: недостаточный размер адресного пространства, который послужил причиной перехода на новую 32-битную, но все ещё CISC, архитектуру.
Ей стала VAX (Virtual Address eXtension), официально утверждённая на заседании VAX Architecture Committee в апреле 1975. Эта архитектура стала логическим завершением нескольких месяцев работы проекта "Звезда" (the Star project) под руководством Гордона Белла (Gordon Bell). Этот проект осуществлялся параллельно с вышеупомянутым проектом "Единорог", но был сочтён более перспективным. Если коротко, то задачей проекта "Звезда" было измерение прироста производительности, полученного при увеличении разрядности целочисленных регистров PDP-11 с 16 бит до 32 бит и их числа с 8 до 16, а также в связи с основательными изменениями в наборе команд. В октябре 1977 был анонсирован первый представитель новой архитектуры, модель 11/780. Несколько месяцев спустя, в феврале 1978, была выпущена новая операционная система для VAX'ов, VMS (Virtual Memory System) версии 1.0. К слову, эта ОС, многопользовательская и многозадачная, поддерживала до 64Мб оперативной памяти, встроенные сетевые функции (DECnet), адаптивный планировщик задач, расширенное управление процессами и многие другие возможности, значительно опередившие своё время. Переименованная в VAX/VMS и основательно обновлённая, в апреле 1980 вышла версия 2.0. На VAX также была портирована классическая UNIX ОС. VAX'ы производились и продавались с успехом в течение 1980-х. Даже на рубеже веков они поставлялись ограниченными партиями по спецзаказам. Модельный ряд насчитывал несколько десятков наименований: от компактных рабочих станций (MicroVAX) до 6-процессорных серверов мэйнфрэйм-класса. На протяжении 1980-х DEC выпускала несколько поколений процессоров VAX на основе собственных CMOS технологических процессов: CVAX в 1985 (12МГц максимум, 0,2 млн. транзисторов, 2,0µ CMOS1), Rigel в 1987 (37МГц максимум, 0,4 млн. транзисторов, 1,5µ CMOS2), Mariah в 1989 (63МГц максимум, 0,8 млн. транзисторов, 1,0µ CMOS3). Последние два процессора этой архитектуры под названиями NVAX и NVAX+ были выпущены в 1992 году. Оба процессора располагали 1,3 млн. транзисторов и производились по собственному 3-слойному 0,75µ CMOS4 техпроцессу. Максимальная тактовая частота NVAX составляла 83,3МГц, а NVAX+ — 90,9МГц. Хотя они и основывались на одном и том же функциональном дизайне, NVAX поддерживал унаследованные шинные интерфейсы, в то время как NVAX+ был совместим с Alpha 21064 (EV4). И в наше время тысячи VAX'ов работают в структуре Министерства обороны США и NSA (National Security Agency), а также во многих коммерческих организациях.
»» Нажмите, для закрытия спойлера | Press to close the spoiler «« Проект PRISM
» Нажмите, для открытия спойлера | Press to open the spoiler «
В начале 1980-х DEC была на вершине финансового могущества, в значительной мере благодаря стабильно растущим объёмам продаж VAX'ов и программного обеспечения к ним. Тем не менее, ничто не вечно и было очевидно, что в своё время и VAX придётся уйти с рынка в пользу какой-нибудь более сложной и гибкой архитектуры, как это уже происходило с PDP-11. В то время многие компании начали обращать внимание на перспективные разработки в среде RISC, да и DEC явно не желала остаться в стороне. С 1982 по 1985 в составе компании активно работали несколько команд, занимавшихся исследованиями в области RISC:
Titan, высокоскоростная разработка Западной исследовательской лаборатории (Western Research Laboratory; DECwest) в Пало-Альто (Калифорния, США), под руководством Фореста Бэскетта (Forest Baskett), с 1982;
SAFE (Streamline Architecture for Fast Execution), под руководством Алана Котока (Alan Kotok) и Дэвида Орбица (David Orbits), с 1983;
HR-32 (Hudson RISC 32-bit), при полупроводниковой фабрике DEC в Хадсоне (Массачусетс, США), под руководством Ричарда Витека (Richard Witek) и Дэниела Добберпуля (Daniel Dobberpuhl), с 1984;
CASCADE Дэвида Катлера (David Cutler) в Сиэтле (Вашингтон, США), с 1984.
В 1985, с подачи Катлера касаемо создания так называемого корпоративного RISC-плана, все 4 проекта были объединены в один под названием PRISM (PaRallel Instruction Set Machine), и совместными усилиями к августу 1985 была подготовлена первая спецификация на новый RISC-процессор. Стоит упомянуть, что к тому времени DEC уже принималa активное участие в разработке процессора MIPS R3000 и даже инициировала создание консорциума Advanced Computing Environment для продвижения архитектуры MIPS на рынке.
Нет ничего удивительного в том, что разрабатываемый процессор унаследовал много черт, присущих архитектуре MIPS, но в то же время и отличия были очевидны. Все команды имели фиксированную длину в 32 бита, из них верхние 6 и нижние 5 были собственно кодом команды, а остальные 21 предназначались для непосредственно данных либо их адресации. Были определены 64 основных 32-битных целочисленных регистрa (MIPS определяла 32), а также 16 дополнительных 64-битных векторных регистра и 3 контрольных регистра для векторных операций: два 7-битных (vector length и vector count) и один 64-битный (vector mask). Регистр состояния процессора отсутствовал, поэтому результат сравнения двух скалярных операндов помещался в целочисленный регистр, а результат сравнения двух векторных операндов — в vector mask. Встроенный блок вычислений с плавающей запятой не предусматривался. Также присутствовал набор специальных инструкций под названием Epicode (Еxtended processor instruction code), реализованных программно (посредством загружаемого микрокода) и предназначавшихся для облегчения решения специальных задач, присущих определённой среде или операционной системе и не предусмотренных стандартным набором команд. Впоследствии эта функция была реализована в архитектуре Alpha под названием PALcode (Privileged Architecture Library code).
К 1988 проект был всё ещё в стадии разработки, когда высший менеджмент DEC закрыл его, посчитав дальнейшую поддержку нецелесообразной. Протестуя против этого решения, Катлер уволился и ушёл в Microsoft, где возглавил подразделение по разработке Windows NT (в то время называвшейся OS/2 3.0).
В начале 1989 DEC представила свои первые рабочие станции с RISC-процессорами, DECstation 3100 на основе 32-битного MIPS R2000 с частотой в 16МГц и DECstation 2100 на основе того же процессора, но с частотой в 12МГц. Обе машины работали под ОС Ultrix и стоили довольно умеренно, например, около 8000 USD (1990) за DECstation 2100 в стандартной конфигурации.
»» Нажмите, для закрытия спойлера | Press to close the spoiler «« Проект Alpha
» Нажмите, для открытия спойлера | Press to open the spoiler «
В 1989 морально стареющая архитектура VAX уже с трудом могла конкурировать с RISC-архитектурами 2-го поколения, такими как MIPS и SPARC, и было вполне очевидно, что следующее поколение RISC оставит VAX немного шансов на выживание. В середине 1989 перед инженерами DEC была поставлена задача по созданию конкурентноспособной RISC-архитектуры с перспективным потенциалом, в то же время минимально несовместимой с VAX, чтобы облегчить перенос на неё VAX/VMS и всей сопутствующей программной базы. Также было определено, что новая архитектура должна изначально быть 64-битной, так как конкуренты уже были в процессе перехода на 64-битные решения. Была создана рабочая группа, в которой главными архитекторами были Ричард Витек и Ричард Сайтс (Richard Sites).
Первое официальное упоминание об архитектуре Alpha датируется 25 февраля 1992 на конференции в Токио. Одновременно в небольшом обзоре для USENET-конференции comp.arch были перечислены ключевые моменты новой архитектуры. Там же было оговорено, что "Alpha" является кодовым именем нового процессора, а рыночное название будет представлено позже. Процессор обладал "чистой" 64-битной RISC-архитектурой с инструкциями фиксированной длины по 32 бита каждая, 32 64-битными целочисленными регистрами, а также работал с 43-битным виртуальным адресным пространством, которое могло быть расширено вплоть до 64-битного в будущих представителях архитектуры. Как и в VAX, использовался little-endian порядок следования байт (то есть, когда младший байт регистра занимает при записи младший адрес в памяти; поддерживался Intel в противовес к big-endian, изначально внедрённому Motorola и используемому большинством процессорных архитектур того времени, когда старший байт регистра занимает при записи младший адрес в памяти). Математический сопроцессор был изначально интегрирован в ядро вместе с 32 64-битными вещественными регистрами. Кстати, использовался произвольный доступ к ним в отличие от примитивного стэкового, практикуемого сопроцессорами Intel x87. Срок службы новой архитектуры был определен, как минимум, в 25 лет.
Поддерживаемый набор команд был упрощён с целью максимального облегчения конвейеризации и состоял из 5 групп:
команды для целочисленных вычислений;
команды для вещественных (с плавающей запятой) вычислений;
команды обработки переходов и операций сравнения;
команды загрузки и сохранения данных;
команды PALcode.
Стоит отметить, что команды целочисленного деления аппаратно отсутствовали, так как являлись наиболее сложными в расчётном плане и плохо поддавались конвейеризации, а поэтому просто эмулировались. Это было вполне приемлемо, так как на практике необходимость в командах этого типа появлялась относительно редко, особенно учитывая возможность использования команд сдвигов (shifts) для многих целочисленных операций деления и умножения.
Архитектура Alpha была настоящей RISC, в отличие от микроархитектур x86 прошлого и настоящего начиная с NexGen 586, Intel P6 и AMD K6. Фактически, их можно считать RISC только на уровне функциональных устройств процессоров. Концептуально разница между RISC (Reduced Instruction Set Computing) и CISC (Complex Instruction Set Computing) состояла (и до сих пор состоит) в нескольких моментах:
Примечание: Данная таблица относится только к процессорам общего назначения, поскольку цифровые сигнальные процессоры (DSP) и прочие встраиваемые процессоры значительно от них отличаются. К слову, их наборы команд типично малы из-за высокого уровня специализации решений. Процессор предполагалось запустить в производство на очень высокой для того времени тактовой частоте — 150МГц, которую планировалось довести до 200МГц при тех же конструкторских нормах. Это оказалось возможным как благодаря удачной архитектуре, так и благодаря отказу разработчиков от использования систем автоматического проектирования и выполнению всех работ по схемотехнике исключительно вручную. Проект вступил в производственную стадию и вскоре был реорганизован в регулярное подразделение DEC.
Трудами отдела маркетинга DEC новая архитектура получила название AXP (или Alpha AXP), хотя до сих пор неизвестно, аббревиатурой чего было это недоразумение. Вполне возможно, что и ничего. В прошлом DEC имела проблемы с торговой маркой VAX, на которую претендовала компания по производству пылесосов, и тогда дело дошло до суда. Также мотивировалось, что рекламный слоган этой компании ("Nothing sucks like a Vax!" — "Ничто не сосёт так, как Vax!") дискредитирует продукцию DEC. Так что вскоре в компьютерном мире появилась шутка, что AXP означает это "Almost eXactly PRISM", то есть "почти точно PRISM".
»» Нажмите, для закрытия спойлера | Press to close the spoiler «« Alpha 21064 (EV4, EV45) and 21066 (LCA4, LCA45)
» Нажмите, для открытия спойлера | Press to open the spoiler «
Первый процессор из семейства Alpha получил название 21064 ("21" указывал, что Alpha — это архитектура XXI века, "0" — процессорное поколение, "64" — разрядность в битах) и кодовое наименование EV4 ("EV" является [предположительно] аббревиатурой "Extended VAX", а "4" — поколением технологического процесса, CMOS4; в свою очередь, CMOS есть аббревиатура Complementary Metal Oxide Semiconductor). Стоит отметить, что прототип EV4 был готов ещё в 1991, хотя и на основе менее детализированного CMOS3 техпроцесса, а поэтому с уменьшенными кэшами и без блока вычислений с плавающей запятой. Тем не менее, он сыграл свою роль в отладке архитектуры и программного обеспечения. EV4 был представлен в ноябре 1992 на COMDEX в Лас-Вегасе (Невада, США) и поступил в производство на собственном 3-слойном 0,75µ техпроцессе (впоследствии производство было переведено на оптическую модификацию CMOS4 — 0,675µ CMOS4S). Состоял из 1,68 млн. транзисторов, обладал площадью ядра в 233мм² и был рассчитан на напряжение питания в 3,3В. Выпускался с тактовыми частотами от 150МГц до 200МГц (ТDP от 21Вт до 27Вт). Поддерживал работу в многопроцессорном режиме как один из ключевых моментов архитектуры. Форм-фактор: PGA-431 (Pin Grid Array).
Кэш-память L1 была интегрирована: 8Кб для команд (I-cache, instruction cache), с прямым отображением (direct-mapped), а также 8Кб для данных (D-cache, data cache), с прямым отображением и сквозной записью (write-through). Задержки при чтении из D-cache составляли 3 такта. Каждая строка I-cache состояла из 32 байт команд, 21-битного тэга, 8-битного поля истории переходов и нескольких вспомогательных полей. Каждая строка D-cache состояла из 32 байт данных и 21-битного тэга. Кэш-память L2 (B-cache, back-up cache) был рекомендуемой опцией, набирался на микросхемах синхронной или асинхронной статической памяти, работал в режиме обратной записи (write-back) с прямым отображением и упреждающим чтением (read-ahead), мог иметь размер до 16Мб (обычно от 512Кб до 2Мб). Каждая строка B-cache состояла из 32 байт данных или команд с 1-битным long-word parity или 7-битным long-word ECC, максимум 17-битного тэга с 1 битом чётности и 3 битов состояния с 1 битом четности. Скорость чтения/записи B-cache программировалась в тактах процессора. Системная шина данных была шириной в 64 или 128 бит (программируемо, с 1-битным long-word parity или 7-битным long-word ECC) и мультиплексировалась с шиной данных к B-cache, так что физические линии переключались при необходимости между этими логическими шинами. Ширина системной шины адреса составляла 34 бита. Организационно B-cache был включающим (inclusive) D-cache, то есть поддерживал полную копию содержимого последнего. Операции чтения/записи в B-cache являлись прерогативой исключительно процессора, но системной логикe было разрешено чтение файла тэгов (B-tag), что было удобно для обеспечения согласованности (cache coherence) B-cache. Другими словами, системная логика могла проверять содержимое B-cache во время так называемых отслеживающих операций (snoop operations) без вмешательства процессора.
EV4 имел один целочисленный конвейер (E-box, 7 стадий) и один вещественный конвейер (F-box, 10 стадий). Декодер и планировщик инструкций (I-box) был в состоянии подавать 2 команды за такт в порядке очереди (in-order) на исполняющие устройства, то есть на E-box, F-box и блок загрузки/сохранения (A-box). Контроллер кэш-памяти и системной шины (C-box) работал в тесном взаимодействии с A-box и управлял как интегрированными I-cache и D-cache, так и внешним B-cache. Расчёт виртуальных адресов входил в компетенцию E-box. Также присутствовал блок предсказания переходов (branch prediction unit) с таблицей переходов на 4096 записей (branch history table) по 2 бита каждая. I-TLB (Instruction TLB) обладал 8 записями для 8Кб страниц и 4 записями для 4Мб страниц, а D-TLB (Data TLB) — 32 записями для страниц размером от 8Кб до 4Мб. Оба TLB были полностью ассоциативны (fully-associative).
Первая рабочая станция архитектуры Alpha от DEC была выпущена в ноябре 1992, DEC 3000 Model 500 AXP (кодовое имя Flamingo), с 150МГц 21064, 512Кб B-cache, 32Мб оперативной памяти, интегрированным 8-битным видеоконтроллером с 2Мб VRAM, SCSI HDD на 1Гб, SCSI CD-ROM, встроенным контроллером Ethernet 10Мбит (толстый коаксиал и витая пара), встроенным звуковым и ISDN контроллером, а также с 19-дюймовым монитором (1280х1024x72Гц). Вся периферия обслуживалась шиной TURBOchannel собственной разработки. Цена была впечатляющей: 39 тыс. USD, хотя предлагалась и более дешёвая DEC 3000 Model 400 AXP (с 133МГц 21064), но всё же была необходимость в более доступном решении.
DEC пыталась создать персональный компьютер на основе 21064 и периферийной шины EISA или ISA начиная с февраля 1991. Было успешно спроектировано и выпущено 35 систем в рамках проекта Бета (the Beta project), каждая из которых обладала 100МГц прототипом EV4, набором системной логики Intel 82380 с поддержкой шины ISA, а также многим другим аппаратным обеспечением как собственного производства, так и доступного на рынке. Последующий проект Тета (the Theta project) постигла неудача из-за ошибок при проектировке материнской платы на основе набора системной логики Intel 82350DT с поддержкой шины EISA. Тем не менее, две команды разработчиков из Мэйнарда (Массачусетс, США) и Эйра (Шотландия, Великобритания) сумели устранить неполадки и выпустили DECpc AXP 150 (кодовое имя Jensen) в августе 1992. Эта машина располагала 150МГц EV4, 512Кб B-cache, материнской платой формата AT, стандартными 72-контактными FPM parity SIMMs и EISA периферией. Хотя DECpc AXP 150 работал с DEC OSF/1 и OpenVMS, но его будущее всё же связывалось с Windows NT. Он был представлен 28 октября 1992 в Нью-Йорке (Нью-Йорк, США) на презентации Windows on Wall Street, когда Билл Гэйтс впервые продемонстрировал общественности свою новую ОС.
Также имелось три семейства серверов на основе 21064: 2-процессорные DEC 4000, 6-процессорные DEC 7000 (с 182МГц процессорами) и DEC 10000 (с 200МГц процессорами). DEC 7000 и DEC 10000 были модульными машинами, которые располагали по 4Мб B-cache на каждый процессор и до 14Гб оперативной памяти (с 7 установленными 2Гб модулями). В то время как DEC 4000 был рассчитан на работу с периферийной шиной FutureBus+, DEC 7000 и DEC 10000 также могли быть сконфигурированы для работы с периферийной шиной XMI (при установке соответствующего модуля или даже нескольких). DEC 7000 и DEC 10000 под названиями VAX 7000 и VAX 10000 предлагались с процессорами NVAX+ (переконфигурация была возможна путём простой замены процессорных модулей).
Несмотря на отличную производительность, 21064 был довольно дорог для значительной части потенциальных покупателей, а поэтому в сентябре 1993 был анонсирован его бюджетный собрат, 21066 (LCA4 или LCA4S). Этот процессор был основан на ядре 21064, но с дополнительно интегрированными контроллерами оперативной памяти и шины PCI, а также некоторыми второстепенными функциональными блоками. Однако, разрядность системной шины данных была урезана до 64 бит, что негативно сказалось на производительности. LCA4 производился по 0,675µ CMOS4S техпроцессу и его площадь оказалась ещё меньше, чем у оригинального EV4 (209мм² по сравнению с 233мм²), а тактовые частоты были занижены (от 100МГц до 166МГц), в значительной мере из-за потенциальной угрозы перегрева в плохо вентилируемых настольных системных блоках того времени, а также чтобы не создавать дополнительной конкуренции EV4. Количество транзисторов в ядре составило 1,75 млн., a напряжение питания — 3,3В. Дизайн этого процессора был лицензирован Mitsubishi, которая также производила LCA4, включая и 200МГц версию.
В октябре 1993 на Microprocessor Forum был анонсирован 21064А (EV45) — обновлённая версия EV4, производимая по собственному 4-слойному 0,5µ CMOS5 техпроцессу. В ноябре 1994 на COMDEX был представлен 21066А (LCA45), почти аналогично модифицированная версия LCA4. Стоит отметить, что манера маркетологов DEC добавлять букву к модели процессора при перепланировке ядра под новый техпроцесс сохранилась и в будущем. Собственно состав процессорных ядер изменился незначительно. EV45 теперь обладал удвоенным размером кэш-памяти L1 (16Кб I-cache + 16Кб D-cache), к полям данных и тэгам I-cache и D-cache было добавлено по биту чётности, поля истории переходов I-cache были расширены до 16 бит, ассоциативность D-cache была увеличена до 2 каналов (2-way set associative), а к режимам контроля над системной шиной данных был добавлен 1-битный byte parity. Также в EV45 и LCA45 был незначительно модифицирован F-box (оптимизация деления: в EV4 одна операция требовала 34 такта для операндов одинарной точности и 63 такта для операндов двойной точности вне зависимости от значений операндов; в EV45 она уже требовала от 19 до 34 тактов для операндов одинарной точности и от 29 до 63 тактов для операндов двойной точности в зависимости от значений операндов). LCA45 производился также и на мощностях Mitsubishi. Площади ядер уменьшились: до 164мм² у EV45 и до 161мм² у LCA45. Количество транзисторов в ядре EV45 возросло до 2,85 млн., а в ядре LCA45 осталось неизменным — 1,75 млн. В конечном результате, энергопотребление обоих процессоров в расчёте на единицу частоты сократилось, хотя напряжение питания осталось неизменным — 3,3В. Тактовые частоты 21064A составляли от 200МГц до 300МГц (TDP от 24Вт до 36Вт), а 21066A — от 166 до 233МГц.
21066 и 21066A, в основном, нашли своё применение в персональных компьютерах DEC UDB (Universal Desktop Box; кодовое имя Multia), хотя машины с этим названием также оснащались процессорами Intel Pentium. Помимо этого, 21066 и 21066A использовались в Tadpole ALPHAbook 1, первом (и единственном?) Alpha-ноутбуке.
Так как DEC участвовала в разработках оборудования под заказ Министерства обороны США, то в 1994 были спроектированы процессоры 21068 (66МГц) и 21068А (100МГц), являвшиеся вариантами LCA4 и LCA45, адаптированными под военные нужды (пассивное охлаждение, переносимость к вибрации и жёстким температурным условиям, пр.). Например, к военному обородованию могли предъявляться требования по сохранению работоспособности в температурном режиме от -54 °C до +70 °C при 30-минутном допуске в +85 °C (взято из MIL-E-5400T, General Specification for Electronic Equipment, Aerospace от мая 1990). В 1986 DEC заключила соглашение с Raytheon Company о ведении совместных разработок для Министерства обороны, тогда ещё на основе архитектуры VAX (доработка VAX 6200). Проектирование DEC AXPvme 64 было завершено к 1994. В основе системы лежал 66МГц 21068 со стандартной для военного оборудования периферийной шиной VME64, а также некоторой PCI и ISA периферией, включая DEC 21040 Ethernet-контроллер. Этот модуль продавался как Raytheon Model 910.
В июле 1994 были анонсированы первые рабочие станции на основе 21064A: DEC 3000 Model 900 AXP и Model 700 AXP (кодовые имена Flamingo45 и Sandpiper45 соответственно). Первая оснащалась 275МГц процессором, а вторая — 225МГц. Обе рабочие станции обладали 2Мб B-cache, 128Мб оперативной памяти, 24-битной видеокартой семейства ZLX, периферией FastSCSI и тем же сетевым, звуковым и ISDN аппаратным обеспечением, что и Model 500 AXP. Первая рабочая станция предлагалась по цене в 43,4 тыс. USD, вторая — в 27,7 тыс. USD.
Первые наборы системной логики для архитектуры Alpha использовали периферийные шины TURBOchannel, FutureBus+ и XMI. В частности, безымянный набор для DEC 3000 состоял из 6 микросхем: 1 ADDR ASIC, 1 TC (TURBOchannel) ASIC, и 4 SLICE ASICs; последние обслуживали 128-битный канал данных системной шины, 256-битный канал данных шины памяти и 32-битный канал данных к TC ASIC. Хотя эта и другие реализации были весьма скоростными для своего времени (около 100Мб/с на шину), они не получили широкого распространения, а количество доступной периферии было небольшим. Поэтому DEC обратила внимание на новую перспективную шину PCI. В начале 1994 был представлен набор системной логики DEC Apecs в двух исполнениях: с 64-битной системной шиной данных (21071) и 128-битной (21072). Вся разница между ними состояла в том, что 21071 состоял из 4 микросхем (1 универсальный контроллер — COMANCHE, 2 микросхемы data slice — DECADE, 1 контроллер шины PCI — EPIC), а 21072 — из 6 (дополнительно ещё 2 DECADE). Поддерживал частоту системной шины в 33МГц, до 16Мб B-cache, до 4Гб памяти FPM parity со временем доступа от 100 до 50нс (8 банков) и до 16Мб двухпортовой VRAM (1 банк) для поддержки опционального буфера видеокадра. Поддержка шины ISA или EISA могла быть реализована посредством стандартного моста, такого как Intel 82378IB (ISA) или 82378EB (EISA). Использовался в материнских платах EB64+ и AlphaPC 64 (кодовое имя Cabriolet).
»» Нажмите, для закрытия спойлера | Press to close the spoiler «« Alpha 21164 (EV5, EV56) и 21164PC (PCA56, PCA57)
» Нажмите, для открытия спойлера | Press to open the spoiler «
Первая информация о архитектуре своего Alpha-процессора 2-го поколения была опубликована DEC на конференции Hot Chips, которая состоялась 14 августа 1994 в Пало-Альто (Калифорния, США), хотя официальным анонсом 21164 (EV5) следует считать пресс-релиз DEC от 7 сентября 1994. Процессор основывался на ядре EV45 и содержал изменения скорее эволюционного характера, чем революционного. По сравнению с EV4 или EV45, ядро включало удвоенное количество конвейеров для целочисленной и вещественной математики, причём количество стадий вещественных конвейеров сократилось с 10 до 9. В то же время целочисленные конвейеры были неодинаковы: хотя оба могли выполнять элементарные арифметические и логические операции, но только в компетенцию 1-го входило выполнение команд умножения и смещения, и только по 2-му могли быть направлены команды условных/безусловных переходов. Оба целочисленных конвейера также могли вычислять виртуальные адреса для команд загрузки, однако только 1-й — для команд сохранения. Вещественные конвейеры были также неоднородны: 1-й мог выполнять любой код с плавающей запятой, кроме инструкций умножения, которые были теми единственными командами, что мог выполнять 2-й конвейер. Чтобы обеспечить эффективную загрузку функциональных устройств, I-box мог производить выборку и декодирование до 4 команд за такт. EV5 производился по тому же собственному 4-слойному 0,5µ CMOS5 техпроцессу, что и EV45, поэтому также был рассчитан на напряжение питания в те же 3,3В. Состоял из 9,3 млн. транзисторов (из них 7,8 млн. в виде интегрированных кэшей), обладал площадью ядра в 299мм², что было близко к теоретическому пределу для данного техпроцесса. Выпускался с тактовыми частотами от 266МГц до 333МГц (TDP от 46Вт до 56Вт). Форм-фактор: IPGA-499 (Interstitial Pin Grid Array).
Размеры I-cache и D-cache остались как у EV4, то есть по 8Кб каждый со сквозной записью. Всё же D-cache теперь стал двухпортовым по чтению, то есть за 1 такт он мог поставить данные для 2 команд загрузки. Жертвуя транзисторами во имя быстродействия, D-cache физически был составлен из 2 одинаковых по содержанию частей размером в 8Кб каждая. Таким образом, чтение шло из любой части, а запись — одновременно в обе. Так как процессор обладал 96Кб интегрированной кэш-памяти L2 (S-cache, secondary cache) с обратной записью и 3-канальной ассоциативностью, то в структуру C-box была добавлена его поддержка. Доступ к S-cache осуществлялся через независимую 128-битную шину данных. B-cache всё ещё оставался опциональным, но обычно присутствовал и набирался на микросхемах синхронной статической памяти общим размером до 64Мб, хотя обычно составлял от 1Мб до 4Мб. 128-битная шина данных к B-cache по-прежнему мультиплексировалась с системной шиной данных. Таким образом, EV5 поддерживал 3 уровня кэш-памяти и был первым процессором с подобной иерархией.
Доступ к S-cache был организован по принципу 4-стадийного конвейера: 2 такта на просмотр тэга и активацию банка плюс 2 такта на доступ к данным и доставку (16 байт за такт), хотя дополнительный такт требовался на транспортировку данных от C-box к D-cache и E-box или F-box. Инженеры, проектировавшие EV5, рассматривали возможность организации работы S-cache с параллельным просмотром тэга и доступом к данным, так что все 3 банка доставляли бы данные, нужные из которых затем отбирались бы. Это позволило бы сократить количество стадий до 3, но привело бы к значительному увеличению энергопотребления процессора (+40% ориентировочно). Однако, D-cache работал именно таким образом, хотя там был только 1 банк на 8Кб, а не 3 банка по 32Кб каждый. Более того, задержки на чтение из D-cache были уменьшены с 3 до 2 тактов. Каждая строка S-cache была размером в 64 байта с одним тэгом на строку, хотя имелась возможность адресации строк с разделением каждой на две подстроки размером по 32 байта, поскольку I-cache и D-cache работали с 32-байтными строками. S-cache был включающим по отношению к D-cache, а B-cache — по отношению к S-cache, несмотря на политику обратной записи последнего и разницу в ассоциативностях. Размер I-TLB был увеличен до 48 записей (для страниц размером от 8Кб до 4Мб), а D-TLB — до 64 записей (для 8Кб страниц), причём он стал двухпортовым при чтении (по аналогии с D-cache). Системная шина данных имела фиксированную ширину в 128 бит с дополнительными 16 битами для ECC и всё так же мультиплексировалась с шиной данных к B-cache, но поскольку уже использовался протокол с поддержкой разделяемых трасакций (split-transaction protocol), то её эффективность возросла. Системная шина адреса была 40-битной, управления — 10-битной.
В октябре 1995 на Microprocessor Forum был представлен 21164А (EV56), незначительно модифицированная версия EV5, производимая по собственному 4-слойному 0,35µ CMOS6 техпроцессу на всё той же фабрике в Хадсоне (Массачусетс, США). Между прочим, для запуска этого техпроцесса DEC пришлось инвестировать в модернизацию фабрики около 450 млн. USD. Наиболее существенным архитектурным отличием можно считать BWX (Byte-Word Extension) — набор из 6 дополнительных команд для загрузки/сохранения данных размером в 8 или 16 бит (LDBU, LDWU, STB, STW, SEXTB, SEXTW). Изначально архитектура Alpha поддерживала загрузку/сохранение данных квантами исключительно по 32 или 64 бита, что создавало определённые сложности при портировании или эмуляции кода других процессорных архитектур, например, i386 или MIPS. Предложение о внедрении BWX в базовый набор команд Alpha появилось в июне 1994 с подачи Ричарда Сайтса и было утверждено в июне 1995. Правда, для успешной работы BWX требовалась поддержка как со стороны процессора, так и со стороны системной логики. Тактовые частоты 21164А составили от 366МГц до 666МГц (TDP от 31Вт до 55Вт), а производился он начиная с лета 1996. Согласно лицензионному соглашению с DEC от июня 1996, Samsung также выпускал EV56, причём 666МГц версию производил только он. Процессор состоял из 9,66 млн. транзисторов, обладал площадью ядра в 209мм² и требовал двойное напряжение питания (2,5В на основную логику и 3,3В на входные/выходные цепи).
17 марта 1997 был представлен 21164PC (PCA56), недорогой вариант EV56, спроектированный совместно DEC и Mitsubishi. В нём отсутствовал S-cache и соответствующая обслуживающая логика, зато размер I-cache был увеличен с 8Кб до 16Кб. Производился посредством того же CMOS5 техпроцесса и требовал 2,5В/3,3В напряжения питания. Состоял из 3,5 млн. транзисторов, обладал площадью ядра в 141 мм². 21164PC (PCA56) выпускался с тактовыми частотами от 400МГц до 533МГц (TDP от 26Вт до 35Вт). Форм-фактор процессора был изменён в пользу IPGA-413. В будущем, на производственных мощностях Samsung, также выпускался 0,28µ вариант 21164PC (PCA57), характеризовавшийся удвоенными размерами I-cache и D-cache, причём первый использовал 2-канальную политику ассоциативности. Количество транзисторов в его ядре увеличилось до 5,7 млн., а его площадь уменьшилась до 101 мм². Он также требовал пониженное напряжение питания (2,0В на основную логику и 2,5В на входные/выходные цепи). Тактовые частоты 21164PC (PCA57) составили от 533МГц до 666МГц (TDP от 18Вт до 23Вт).
Кроме унаследованных от EV56 инструкций BWX, PCA56 и PCA57 поддерживали новый набор из 13 SIMD-команд (Single Instruction, Multiple Data) под названием MVI (Motion Video Instructions): упаковывающих (PACKWB, PACKLB), распаковывающих (UNPKBW, UNPKBL), выбирающих минимум (MINUB8, MINSB8, MINUW4, MINSW4) или максимум (MAXUB8, MAXSB8, MAXUW4, MAXSW4) и определяющей движение (PERR). Наиболее интересной являлась последняя, Pixel ERRor, которая обрабатывала 8 пикселов одновременно. В отличие от набора команд MMX для процессоров i386, который использовал вещественные регистры для хранения данных, MVI предпочитал целочисленные для этой же цели.
Первым стандартным набором системной логики, разработанным для EV5, был DEC Alcor (21171). Он поддерживал 33МГц системную шину, до 16Мб ECC B-cache, до 8Гб FPM или EDO DRAM ECC с использованием 256-битного канала данных, а также одну 64-битную 33МГц шину PCI. Поддержка шины ISA или EISA могла быть реализована посредством стандартного моста, такого как i82378IB (ISA) или i82378EB (EISA). Встроенного контроллера IDE также не было, но он мог устанавливаться отдельной микросхемой другого производителя. Физически DEC Alcor состоял из 5 микросхем: 1 универсального контроллера с поддержкой шины PCI (Control, I/O and Address — CIA) и 4 коммутаторов данных (Data Switch — DSW). Новая редакция этого набора системной логики с добавлением поддержки BWX получила название DEC Alcor 2 (21172). Вскоре был выпущен и одномикросхемный DEC Pyxis (21174), который поддерживал 66МГц системную шину и до 1,5Гб 66МГц SDRAM ECC или parity, правда, используя уже 128-битный канал данных. Поддержка 64-битной 33МГц шины PCI сохранилась. Для конфигураций на основе 21164PC (PCA57) был разработан набор системной логики VLSI Polaris.
»» Нажмите, для закрытия спойлера | Press to close the spoiler «« Крах DEC
» Нажмите, для открытия спойлера | Press to open the spoiler «
26 января 1998 компьютерный мир обошла новость, что находящаяся в критическом финансовом положении DEC была куплена Compaq Computer Corporation и что сделка находится в процессе утверждения собраниями акционеров обеих компаний. Акционеры DEC ратифицировали соглашение 2 февраля 1998. Сумма сделки составила 9,6 млрд. USD, что было значительно выше рыночной капитализации компании до продажи — приблизительно 7 млрд. USD. Начавшийся вскоре процесс интеграции подразделений DEC в структуры Compaq привёл к тому, что уже через полгода DEC окончательно прекратила своё существование, когда 11 июня 1998 её акции перестали котироваться на Нью-Йоркской фондовой бирже. Стоит отметить, что переговоры между DEC и Compaq велись ещё с 1995, но сорвались в 1996 из-за позиции высшего менеджента DEC, настаивавшего именно на слиянии компаний, а не на поглощении. Тем не менее, вполне закономерен вопрос: как могло так случиться, что огромная компания (по состоянию на 1989: почти 130 тыс. человек персонала, общий объём продаж около 14 млрд. USD в год, то есть второй показатель по отрасли после IBM), с очень высоким исследовательским потенциалом и значительной производственной базой, была вынуждена продать себя крупному сборщику компьютерной техники из Техаса? Однозначный ответ на этот вопрос никто так и не дал, хотя причины назывались всякие и разные.
Давным-давно Кеннет Ольсен, основатель, президент и главный исполнительный менеджер DEC почти до самого её конца, сказал, что хорошие с инженерной точки зрения продукты продают себя сами. Следовательно, в рекламе или ином продвижении не нуждаются. Ему также принадлежит изречение, что нет причины, по которой каждый захотел бы иметь компьютер у себя дома. Возможно, эти мысли оправдывали себя в "добрые старые времена", когда компьютерная техника производилась в небольших количествах профессионалами для профессионалов и стоила немалых денег, но не в конце 20-го века, когда её продавали миллионами штук в год и когда самый обыкновенный компьютер можно было собрать максимум за час свободного времени при помощи отвёртки и комплектующих из ближайшей компьютерной лавки, причём за сумму, на порядок меньшую выплачивавшейся за шкафообразный агрегат из тех самых "добрых старых времён". В конце концов, можно было купить его целиком в том же магазине, да ещё и с бесплатной доставкой на дом. А если учесть, что покупать такой компьютер будет не профессиональный менеджер, прекрасно осознающий глубину смысла термина TCO (Total Cost of Ownership, совокупная стоимость владения), а некая тётя Маша или представитель подрастающего поколения Вовочка, в принципе не отличающие транзистор от резистора, то таких покупателей следует мотивировать явно не инженерными достоинствами потенциального приобретения.
Ещё в самом начале развития архитектуры Alpha высшим руководством DEC был допущен большой стратегический просчёт. Первые прототипы EV4 были продемонстрированы DEC на компьютерной конференции в феврале 1991. Среди присутствующих были инженеры Apple Computer, которые в то время занимались поиском новой процессорной архитектуры для будущих компьютеров компании. Ничего удивительного, что возможности EV4 произвели на них впечатление. В июне того же года Джон Скалли (John Sculley), в то время главный исполнительный менеджер Apple, встретился с Кеннетом Ольсеном и предложил ему использовать новый процессор DEC в будущих Маках. Ольсен отказался, мотивируя тем, что процессор пока не готов для рынка, а архитектура VAX ещё не исчерпала своих возможностей. Через несколько месяцев было объявлено, что новые Маки будут использовать процессоры PowerPC от альянса Apple, IBM и Motorola. Таким образом, DEC упустила отличную возможность достижения хороших продаж Alpha-комплектующих в долговременной перспективе и продвижения архитектуры на рынке обычных компьютеров, а заполучила ещё одного конкурента. Позже Вильям Деммер (William Demmer), бывший вице-президент подразделений VAX и Alpha, ушедший в отставку в 1995, заявил в интервью Business Week от 28 апреля 1997: "Кен не хотел, чтобы будущее компании зависело от Alpha."
DEC сама производила как процессоры Alpha, так и наборы системной логики для них на своей фабрике в Хадсоне (Массачусетс, США), а также многочисленную периферию. Она также разрабатывала и изготовляла материнские платы для обычных компьютеров и рабочих станций под названием "Evaluation Board" ("EB") или "AlphaPC", доступные по оптовым каналам, хотя и в довольно ограниченном ассортименте. Несмотря на то, что почти все Alpha сервера DEC за исключением некоторых моделей начального уровня были многопроцессорными, ни одна из этих материнских плат возможность установки 2 и более процессоров не поддерживала. Тем не менее, все материнские платы были выполнены на высоком техническом уровне, хотя и стоили недёшево, впрочем, как и процессоры Alpha. Документация по изготовлению этих плат была в свободном доступе, поэтому некоторые компании (Aspen, Polywell, Enorex, др.) производили их клоны. Единственной компанией, разработавшей и производившей свои платы, была DeskStation. В целом, можно смело утверждать, что приоритетом для DEC была продажа собственных рабочих станций и серверов, а не наполнение рынка основными комплектующими для их сборки. Конечно, такой подход к делу позволял добиться более высоких доходов в кратковременной перспективе, но шансы на завоевание большой доли рынка обычных компьютеров и рабочих станций можно было считать равными нолю.
Несмотря на все попытки, DEC так и не смогла сделать цены на свою продукцию (в первую очередь, на процессоры, наборы системной логики и материнские платы) доступными большинству потенциальных покупателей. Например, 266МГц и 300МГц EV5 по состоянию на начало 1995 стоили соответственно 2052 и 2937 USD в партиях по 1000 шт. — непомерные цены, даже учитывая среднюю стоимость производства приблизительно в 430 USD за шт. В расчёте на один "попугай" SPECint92, EV5 стоил приблизительно в 2 раза дороже альтернативных RISC-процессоров других производителей. При этом стандартный набор системной логики к нему, DEC Alcor, продавался не в пример дешевле — 295 USD за каждый в партиях по 5000 шт. В то же время, материнская плата на его основе, EB164 с 1Мб B-cache, вместе с процессором и 16Мб оперативной памяти (чего, кстати, было явно недостаточно для многих задач того времени на Alpha), предлагалась по цене около 7500 USD.
Хотя Alpha и была изначально объявлена открытой архитектурой, консорциум по её развитию так и не был создан. Разработки велись усилиями DEC, иногда сообща с Mitsubishi. Получалось, что хотя собственно архитектура и была свободной де-юре, её основные разработки являлись очень даже закрытыми де-факто и подлежали платному лицензированию (если вообще подлежали). Естественно, это мало способствовало успешному продвижению на рынке. Например, если бы DEC оставила EV4 и EV5 за собой, а LCA4 сделала открытой разработкой безо всяких дополнительных лицензионных отчислений или прочих обязательств, то этот ход мог бы серьёзно изменить расстановку сил на рынке обычных компьютеров. Стоит отметить, что вскоре после выпуска EV4 руководство DEC предлагало лицензировать производство процессора Intel, Motorola, NEC и Texas Instruments. Но эти компании имели собственные разработки и перспектива играть второстепенную роль в чужом театре их мало интересовала, а потому они отказались. Не исключено, что условия могли быть неприемлемы или что-нибудь ещё.
Далее, даже самый быстрый компьютер без операционной системы и нужного программного обеспечения является всего лишь дорогим источником шума и обогрева окружающей среды. Свою Alpha-продукцию DEC позиционировала для Windows NT, Digital UNIX и OpenVMS, причём именно в таком порядке приоритетности. Оно бы и ничего, но...
Windows NT — это операционная система, изначально ориентированная на пользователя, а не на программиста, так как не поставлялась с какими-либо средствами для разработки программного обеспечения, а поэтому сильно зависела от откомпилированного для неё добра, в первую очередь, коммерческого. Если смотреть фактам в лицо, то количество программ, доступных для Alpha, отличалось в разы от аналогичного показателя для i386. В некоторой мере положение смягчал FX!32, выпущенный в 1996 командой Антона Чернова (Anton Chernoff), отличный эмулятор и транслятор кода x86 в код Alpha. В среднем, от падения производительности на 40% по сравнению с изначально откомпилированным под Alpha исходным кодом он всё же избавить не мог. Далее, если рассматривать драйвера, то тут FX!32 вовсе ничем помочь не мог, поэтому дела обстояли ещё хуже — очень немногие производители сочли выпуск версий для Alpha целесообразным, поэтому приходилось рассчитывать, в основном, на милость Microsoft и DEC. В конце концов, Windows NT (как 3.51, так и 4.0) была 32-битной ОС, a поэтому была не в состоянии полностью раскрыть потенциал 64-битной архитектуры Alpha. Тем не менее, все эти оказии не мешали DEC продвигать свои Alpha-системы под рекламным лозунгом "Рождены для работы с Windows NT" ("Born to run Windows NT"). В общем, такая ОС не должна была позиционироваться как основная для архитектуры Alpha, хотя собственно факт её существования был большим плюсом на рынке рабочих станций.
OpenVMS для Alpha произошла от 32-битной VAX/VMS ОС, разрабатываемой с 1976 для машин DEC VAX. В 1990 программисты DEC начали работу над проектом по портированию VAX/VMS 5.4-2 на Alpha, и эта задача была завершена к ноябрю 1992 с выпуском OpenVMS AXP 1.0, за которой в июне 1993 последовала OpenVMS VAX 6.0. Имела место небольшая путаница с номерацией, так как следующий выпуск OpenVMS в апреле-мае 1994 был 6.1 как для VMS, так и для Alpha. Следующий концептуальный выпуск — 7.0 — состоялся в декабре 1995. Среди многочисленных усовершенствований наконец-то появилась возможность использовать 64-битное виртуальное адресное пространство на Alpha. Compaq начала портировать OpenVMS с Alpha на Itanium в 2001, а основной объём работ был завершён к выпуску 8.0 в июне 2003. Первым унифицированным выпуском OpenVMS для архитектур Alpha и Itanium был 8.2 (февраль 2005). Compaq заявила об окончании активной поддержки VAX в августе 2000, поэтому разработка OpenVMS для VAX не продвинулась далее выпуска 7.3, хотя обычная поддержка всё ещё доступна от Hewlett-Packard по состоянию на 2011. OpenVMS 8.4 для Alpha и Itanium (дата выпуска: июнь 2010) является текущей версией, которая разрабатывается, продвигается и поддерживается Hewlett-Packard.
Digital UNIX имеет иные корни. Первые UNIX рабочие станции от DEC работали под управлением Ultrix, собственной ОС, произошедшей от 4.2BSD с некоторыми функциями AT&T System V. Она была изначально выпущена в июне 1984 для архитектур VAX и PDP-11, но позже была портирована на MIPS (1988) и стала основной ОС для первых RISC рабочих станций компании: DECstation 2100, DECstation 3100 и DECstation 5000. Они выпускались до 1994, когда были окончательно вытеснены рабочими станциями на основе архитектуры Alpha. Часть кода Ultrix была собственностью AT&T, поэтому DEC была ограничена условиями соответствующего лицензионного соглашения. Это были времена судебных баталий в мире UNIX, поэтому DEC вместе с IBM, Hewlett-Packard и другими ведущими корпорациями в 1988 основала Open Software Foundation (OSF) для противодействия AT&T и Sun Microsystems. Эта организация выпустила UNIX-подобную ОС под названием OSF/1 в декабре 1991, которая была лишена какого-либо кода AT&T. DEC предлагала эту ОС почти для полного ряда рабочих станций и серверов Alpha под названием OSF/1 AXP. Стоит отметить, что некоторые модели всё же позиционировались только с Windows NT, так как их прошивки не позволяли запускать OpenVMS или какую-либо другую производную UNIX. OSF прекратила разработку этой ОС в 1994, поэтому DEC её продолжила самостоятельно и переименовала ОС в Digital UNIX с версией 3.2 в 1995. Название ОС подверглось изменению ещё раз благодаря Compaq, которая предпочла иметь Tru64 UNIX начиная с версии 4.0E (апрель 1999). Текущая версия 5.1B-6 (дата выпуска: октябрь 2010) разрабатывается, продвигается и поддерживается Hewlett-Packard.
Итак, что же в итоге? OpenVMS и Digital UNIX — это надёжные и масштабируемые коммерческие ОС, которые так и не обрели действительно широкой популярности из-за высоких цен. В частности, одна 2-пользовательская лицензия на Digital UNIX 4.0 стоила 795 USD в 1996. Естественно, исходный код этих ОС был закрытым. Хотя с ними были связаны и другие сложности, такие как ещё более ограниченная поддержка аппаратной базы, чем у Windows NT, но получи хотя бы одна из этих ОС свободу вместе с теми отличными инструментами для разработки программного обеспечения от DEC, то это могло серьёзно укрепить рыночные позиции архитектуры Alpha.
DEC никак не поддерживала бесплатные операционные системы с открытым кодом, хотя первая из них, NetBSD, была портирована на Alpha в 1995, а вслед за ней — Linux, OpenBSD и FreeBSD. Это было как-то странно, поскольку и по сей день эти ОС популярны в мире Alpha, а их потенциал был очевиден даже на то время, постоянно увеличиваясь. Кроме того, эти ОС обеспечивали не худшее быстродействие по сравнению с коммерческими Digital UNIX и OpenVMS, сопоставимую с Windows NT поддержку аппаратного обеспечения (намного лучшую сегодня), а также многие другие преимущества, которые можно ожидать от программного обеспечения с открытым кодом.
FreeBSD прекратила поддержку архитектуры Alpha с выпуском 7.0 версии в феврале 2008. NetBSD, OpenBSD и Linux продолжают поддерживать эту архитектуру.
Этот список больших ошибок DEC можно продолжить, но остальные не так важны или не относятся непосредственно к архитектуре Alpha. В любом случае, с точки зрения автора,
DEC приложила множество усилий, чтобы заработать как можно больше денег при помощи архитектуры Alpha, но не приложила почти никаких усилий, чтобы помочь собственно архитектуре. Совет директоров, мотивированный многочисленными неудачами DEC в конце 1980-х и начале 1990-х, отстранил Ольсена в июле 1992 от руководства компанией и назначил на его место Роберта Палмера (Robert Palmer). В 1994 по его инициативе была проведена полная реорганизация бизнес-модели компании, которая из матричной (когда функционально разные отделы компании тесно взаимодействовали между собой при принятии решений) трансформировалась в традиционную вертикальную (когда полномочия и обязанности чётко определялись от самого верха компании и до самого её низа). Чистые убытки DEC за период с 1991 по 1994 составили свыше 4 млрд. USD, из них 2,16 млрд. только с июля 1993 по июль 1994, в основном, благодаря потраченным на реструктуризацию 1,2 млрд., которая предусматривала сокращение около 20 тыс. человек персонала. Таким образом, общее количество работающих на DEC было уменьшено до до 85 тыс. человек. Согласно программе Палмера, следовало избавиться от подразделений, не являющихся приоритетными для компании, и с этого момента началась глобальная распродажа.
В июле 1994 за 348 млн. USD было продано Quantum подразделение по разработке и производству дисковых и ленточных накопителей (Storage Business Unit). Стоит отметить, что это подразделение не пользовалось благосклонностью руководства из-за провала на рынке первых жёстких дисков компании с тонкоплёночным (thin film) покрытием пластин (DEC RA90 и RA92 — 1.22GB/3600rpm и 1.51GB/3400rpm соответственно, DSA/SDI интерфейс). Они должны были выйти на рынок к концу 1988, но из-за недоработок при проектировке это произошло только летом 1990. В результате DEC утратила лидерство в бизнесе жёстких дисков, которое перешло к Imprimis, дочерней компании Control Data Corp. (CDC). Она анонсировала свой тонкоплёночный жёсткий диск Wren VII (1.05GB/3600rpm 5.25" full height, SCSI интерфейс) в ноябре 1988 и вывела его на рынок в следующем году как Seagate ST41200N/ST41200ND (Imprimis была продана Seagate в июне 1989 примерно за 450 млн. USD в деньгах и ценных бумагах). Следовательно, Seagate оказалась первой компании в отрасли, которая пересекла 1ГБ барьер для жёстких дисков, за ней последовала Maxtor, а DEC подсчитывала убытки. Что касается Quantum, то у неё был довольно успешный бизнес жёстких дисков в то время, но её продукты никогда не попадали в сегмент high end, хотя были очень популярны среди низкобюджетных покупателей (модельный ряд жёстких дисков Quantum Bigfoot, который производился с 1996 в в 5.25" конструктиве и с 3600rpm скоростью вращения, был тому отличным примером). Quantum хотела расширить свой бизнес на прибыльный рынок SCSI, а у DEC было в этом немало опыта. Продукты DEC из семейства StorageWorks основывались на SCSI жёстких дисках RZ серий. Некоторые из них заказывались у Micropolis, Conner, Quantum и других, но некоторые DEC производила сама благодаря команде разработчиков в Шрусбери (Массачусеттс, США). Там же c 1984 проектировались и производились успешные стримеры семейства DLT (digital linear tape drives), которые были ещё одной целью для Quantum. Если не вдаваться в подробности, то благодаря бывшим технологиям и персоналу DEC у Quantum получилось выпустить на рынок семейство Atlas жёстких дисков с интерфейсом SCSI и 7200rpm, которое было позже расширено 10K и 15K rpm моделями. Это семейство продолжало расширяться после 50%/50% слияния бизнеса жёстких дисков Quantum со всей компанией Maxtor в октябре 2000, но было свёрнуто вскоре после 16%/84% поглощения Maxtor лидером отрасли Seagate в декабре 2005, поскольку у последней имелось собственное семейство высокоскоростных SCSI дисков, Cheetah.
В августе 1994 было продано Oracle подразделение баз данных (Database Software Unit) за 108 млн. USD в деньгах. Сделка включала продажу DEC Rdb реляционной системы управления базами данных (relational data base management system, RDBMS), а также программного обеспечения CDD/Repository и DBA WorkCenter. В то же время программное обеспечение с функциями управления базами данных DEC RMS (Record Management Services) было исключено из сделки, так как оно являлось неотъемлемым интегрированным компонентом OpenVMS. DEC поддерживала Rdb 6.0 на OSF/1 AXP, OpenVMS (VAX и Alpha), Windows NT (i386 и Alpha). С выпуском Rdb 7.0, Oracle прекратила поддержку Rdb на всех ОС, кроме OpenVMS, и позже вытеснила версию для VAX версией для Itanium.
В 1992 DEC вступила в альянс с Olivetti, итальянским компьютерным вендором, с целью взаимного продвижения продуктов. DEC также приобрела 7,8% долю в Olivetti за 287 mln. USD. 24 августа 1994 DEC продала эти акции за 150 mln. USD, то есть, почти за половину цены, уплаченной 2 года назад. Явно не лучшее капиталовложение. Тем не менее, обе компании продолжали сотрудничество вплоть до 1997, когда Olivetti закрыла свой компьютерный бизнес.
В ноябре 1997 была подписана сделка о продаже подразделения сетевых решений (Network Product Business Unit) Cabletron примерно за 430 млн. USD в деньгах, ценных бумагах и товарном кредите. Впридачу к материальным активам, Cabletron получила около 250 патентов в сетевой сфере и 900 новых работников, не включая тех 200, которым повезло сохранить свои должности в DEC. Размер этого самого товарного кредита не разглашался, поэтому было проблематично определить реальную цену продажи подразделения. Кстати, в следующем месяце Cabletron уволила около 600 человек собственного персонала и закрыл 2 фабрики, а также потеряла примерно половину рыночной капитализации в течение только одного месяца с момента подписания сделки с DEC. Фактически, Cabletron не была заинтересована ни в приобретаемых сетевых продуктах, ни технологиях, ни даже персонале. Ей была нужна инфраструктура для продаж сетевого оборудования. Однако же, не сложилось. Компанию постигали неудачи одна за другой на протяжении следующих лет. В конце концов остатки бывшего сетевого подразделения DEC вместе со 130 работниками были проданы Gores Technology Group в мае 2000.
Kонец DEC был довольно громким. В мае 1997 она подала в суд на Intel, обвиняя последнюю в нарушении 10 своих патентов на архитектуру Alpha при проектировании процессоров Pentium, Pentium Pro и Pentium II. В сентябре 1997 Intel ответила встречным иском, обвиняя DEC в нарушении 14 патентов при разработке процессоров Alpha. В конце концов, 27 октября 1997 был подписан мир и обе компании отозвали свои претензии. DEC предоставила Intel производственные права на весь спектр своей продукции, кроме разработок в области архитектуры Alpha, и согласилась поддерживать будущую архитектуру IA-64. Взамен Intel выкупила у неё за 625 млн. USD фабрику в Хадсоне вместе с проектными центрами в Иерусалиме (Израиль) и Остине (Техас, США), а также обязалась в будущем производить для DEC процессоры Alpha. Кроме того, был подписан договор о взаимном кросс-лицензировании патентов сроком на 10 лет. Сделка была завершена 18 мая 1998, когда Compaq уже была в процессе интеграции в свои структуры основных подразделений DEC, в которых было занято 38 тыс. сотрудников. Значительная часть их всё же была сокращена в самом ближайшем будущем. Между прочим, у самой Compaq до поглощения числилось 32 тыс. работников.