ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Суббота
23 ноября
1119428 Топик полностью
Kceния (24.07.2021 20:47, просмотров: 512) ответил Evgeny_CD на Конструктор для Ксении. Скоро новые вирусы на GitHub! ИИ Google готов представить форму всех известных науке белков. Как-то не смешно на самом деле.
Это информация была мне известна раньше. К сожалению предсказательная сила математических методов не превышает 70%, а с увеличением размера белка еще сильнее падает. Поэтому, если для науки так уж важна пространственная конформация какого-то белка, то ее не вычисляют, а измеряют рентгеноструктурным методом или на худой случай методом двумерного ЯМР. К настоящему времени число белков, у которых уставлена пространственная структура, быстро растет. А у того генбанка, к 

базе которого я имею прямой доступ, уже накоплено почти 180 тыс. таких белков (у других банков скачать базу мне не удается, а впрочем их содержимое во многом перекрывается).

На счет способностей ИИ к этому дело я иллюзий не питаю, полагая их очень скромными. Ведь в конце концов обучать ИИ приходится именно так - скармливать ему содержимое всей базы, надеясь на то, что он найдет в этой куче данных скрытые закономерности, позволяющие ему в дальнейшем предсказывать пространственную структуру белков, не входящих в базу. Вместо этого я предпочитаю прямой метод - поиск в базе данных белков, имеющих сходство по первичной структуре (т.е. по аминокислотной последовательности) с интересующим меня белком, излечение из базы информации о том, какие конформации имеют похожие участки, а затем стыковка этих участков друг с другом в том же порядке, что и в нужном мне белке. Фактически ИИ не с мог бы сделать лучше, поскольку закономерности, которые он выявляет, основаны на том же критерии сходства фрагментов друг с другом. К сожалению, для прямого метода нужно строить в памяти матрицу с поперечником, равным числу белков в базе, а для этого памяти нужно слишком много. Пока же, взяв взаймы 2 палки памяти по 8 GB и увеличив память до 32 GB, достигла обработки 90000 белков из базы (т.е. ровно половину), да и то, матрицу пришлось урезать до нижнего треугольника, чтобы памяти занимала меньше.