ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Вторник
23 июля
1224486 Топик полностью
Kceния (18.07.2022 13:16, просмотров: 244) ответил Kpoк на Что представляет собой одна ячейка матрицы данных из ГенБанка? Число, вектор, строка?
Число типа double (float64). Само это число имеет смысл меры подобия между пространственными структурами любой пары белкой из ГенБанка. Рассчитывается сложным способом и допускает вариации, но в вычислительном отношении не трудно (рассчитается за 5 минут). Затем эта мера подобия трактуется как расстояние (полное подобие/совпадение = нулевое расстояние, при неполном расстояние растет). Получаем на том же месте матрицу расстояний, которую преобразуем в матрицу координат 

(матрицу Грама) - это тоже быстрая операция. А вот теперь ей надо делать сингулярное разложение, чтобы выделить 3 старших собственных вектора (время счета в сутках!). Тем самым 100000-мерное пространство окажется урезанным до трехмерного (для наглядности!), в котором каждый белок будет выглядеть точкой, а локальные скопления таких точек - кластерами структурно подобных белков, среди которых можно выбирать самые вкусные :).