Число типа double (float64). Само это число имеет смысл меры
подобия между пространственными структурами любой пары белкой из
ГенБанка. Рассчитывается сложным способом и допускает вариации, но
в вычислительном отношении не трудно (рассчитается за 5 минут).
Затем эта мера подобия трактуется как расстояние (полное
подобие/совпадение = нулевое расстояние, при неполном расстояние
растет). Получаем на том же месте матрицу расстояний, которую
преобразуем в матрицу координат (матрицу Грама) - это тоже быстрая операция. А вот теперь ей надо делать сингулярное разложение, чтобы выделить 3 старших собственных вектора (время счета в сутках!). Тем самым 100000-мерное пространство окажется урезанным до трехмерного (для наглядности!), в котором каждый белок будет выглядеть точкой, а локальные скопления таких точек - кластерами структурно подобных белков, среди которых можно выбирать самые вкусные :).