ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Среда
10 июля
308857
Evgeny_CD, Архитектор (20.02.2012 10:01 - 10:06, просмотров: 6412)
Hand made AI: продолжение темы персонального суперкомпьютера. Рассмотрим замечательный DIMM KVR1066D3Q4R7S/16G 16GB 2048M x 72-Bit PC3-8500 CL7 Registered w/Parity 240-Pin DIMM. Его можно купить на складе в России по цене 7270 р. ДШ вложен. 8 шт таких DIMM дадут нам 128G памяти, и будут стоить $1938. Неприятность этого модуля состоит в том, что он стандартной высоты, 30 мм. Это неприятно потому, что такой модуль не удастся поставить вертикально на двухслотовой PCIe карте. Но будем считать, что будущее наступило, количество чипов уполовинилось, или мы достали наклонные DIMMовницы, и оно влезло в 2 слота. Теперь мы берем многоядерный чипчик Tilera http://caxapa.ru/281914.html Kalray http://caxapa.ru/308148.html или что-то похожее. Все их объединяет несколько фич, и стоит такой чип 1-5k$ * DDR 2...4 канала с ECC * PCIex8 как минимум, где-то есть x 16 Пусть у нас будет супер-плата 16 слоев, контроль импеданса, слепые и глухие. - 1 k$ хоть в какой-то партии. И получаем эа 5k$ BOM вполне себе законченное решение. ЧТо с него можно получить? Напрашивается что-то типа EMS 2.0 http://en.wikipedi …g/wiki/Expanded_memory (классический EMS) Чтобы Win7 получила RAM DRIVE на 128 гигов. Или in memory DB. В общем, вполне себе практическая штука - представьте себе, что все данные для серьезного CAD|компилера живут на RAM DRIVE, и оно при этом не сбрасывается при reset! Вау! Можно, конечно, что-то повычислять, но это мало интересно - если вычислителю надо 128Г памяти, то и процики нужны очень взрослые, PCIe карта - это что-то типа 200 Вт макс, не канает. А если памяти надо меньше - то берем видюху и вперед. Но есть и гораздо более интересные задачи, о них ниже. 128Г - это вся переписка конторы 100 чел за год (оценка). Даже меньше - если файлы аттачей хранить отдельно. Иными словами, 128Г - это некий оперативный объем данных, которыми фирма средних размеров, которая может выложить 10 k$ за нечто реально полезное, оперировала в течении года. А теперь поставим задачу при помощи AI выявить некие закономерности в этих 128G данных. Например, разработать криетрии быстрой классификации юзеров. Например, звонить узер в call центр, и оператор, вместо того, чтобы заплнять простыню на 10 экранов, отвечает на 10 вопросов, и каждый новый вопос зависит от предыдущего. И получает подсказки для оптимального ведения диалога с юзером. Почему - да потому, что такая система высилила множество характерных юзеров, и быстро определяет, кто звонит. [Я спейциально пытаюсь найти "простую", но массовую задачу. Что даст эта штука в части автоматичекого анализа кода больших проектов - думаю, никому говорить не надо.] А теперерь главное. Никто не сказал, что процики указанных фирм оптимальны с точки зрения решаемой задачи. Ведь у нас есть взрослые FPGA. Virtex, например. Например, XC6VLX195T-1FFG1156C. Стоит от $1300 - оказывается, не так и много - см выше. 640 DSP блоков, 344 4Kb блоков блочной памяти, 600 IO. 1156-FCBGA (35x35). Пару такиух корпусов на плату влезет, каждый корпус 2 контроллера DDR3 точно потянет... Самый простой из грядущих Virtex 7 - XC7VX330T - 1,120 DSP блоков 1,500 2Kb блоков блочной памяти и 750 4Kb блоков блочной памяти. Смотрим на MicroBlaze http://www.xilinx. …m/tools/microblaze.htm 3820 LUTs 298 MHz – 354 DMIPs Не быстро, но и LE мало. Я бы сказал, что в такую плиску 64 софткора, скорее всего, влезет :) DSP блоки там не простые. Это готовые 48 ALU с MAC. 600 Мгц Virtex 6, 740 Мгц Virtex 7. Each DSP slice fundamentally consists of a dedicated 25 × 18 bit two's complement multiplier and a 48-bit accumulator, both capable of operating up to 741 MHz. The multiplier can be dynamically bypassed, and two 48-bit inputs can feed a single-instruction-multiple-data (SIMD) arithmetic unit (dual 24-bit add/subtract/accumulate or quad 12-bit add/subtract/accumulate), or a logic unit that can generate any one of ten different logic functions of the two operands. PCI Express х 8 Gen2 (5 Gb/s), and Gen3 (8 Gb/s) есть у Virtex 7, 6-ка имеет х 8 второго поколения - тоже неплохо так. AI на микроблейзах - это обкур, а вот микроблейз как контроллер кластера неких "решателей" - это куда перспективее. В общем, если кто-то придумает некий аппаратнй блок, который сильно ускоряет задачи AI, то у него естьвсе шансы реализовать его металле и получить на этом бабла. P.S. Вот смотрите - когда в наш мир пришел PC, он ничего кардинально нового с точки зрения CS не принес - все было и до него, и даже гораздо лучше. PDP-11... А уж теория CS к тому моменту цвела и пахла. Просто раньше это был шкаф за 20k$, а тут настольная коробка за 2k$. И понеслось... В части AI сейчас уже есть много "многошкафных" реализаций, и теория более-менее проработана. Осталось все "поставить на стол", а еще лучше сделать плату расширения - на корпусе и БП сэкономим :)